アメリエフのブログ

バイオインフォマティクスの紹介と社員の日々
ASHG2016でgnomADが公開

10/18~22はアメリカ人類遺伝学会(ASHG)2016がバンクーバーで開催されていました。


その中でBroad Institueから発表されたGenome Aggregation Database (gnomAD)について紹介したいと思います。


次世代シーケンサー(NGS)を使っている人にはお馴染みの図ですが、NGSの技術の発展と普及によりDNAのシーケンスコストがどんどん下がっています。




 そのため、NGSを使った大規模なヒトゲノムの解析が世界中で行われています。例えばイギリスでは今まさに1万人分のゲノムを解析するUK10Kプロジェクトが行われていたり、日本では東北メディカルメガバンクから日本人2,049人の全ゲノム解析の結果がiJGVDで公開されていたりします。  最も大規模なものとしては、Exome Aggregation Consortium (ExAC)による60,706人のエクソームのデータベースが公開されており、今年の8月にNature誌で発表されました。


 今回発表されたgnomADは、ExACのversion 1からエクソームのデータが約2倍の126,216人分になり、 15,136 人の全ゲノム解析の結果も追加されています!




gnomADのブラウザでは、WESとWGSを合わせたSNPとINDELの頻度が閲覧可能ですが、今後CNVの解析もして閲覧できるようになるようです。まだβ版でフィルタリングの条件を検討している段階ということです。また、変異詳細のページではPhenotypeの情報を報告できるようになっており、情報が集まってくれば変異との関連付けもされていきそうです。
ちなみに、gnomADは"ノマド"と発音するみたいです。


gnomADでは、全部で40テラバイトの変異データをパースすることで作成しているそうで、解析にはScalaで実装されたhailというソフトウェアを使っています。このソフトについてはまた別の機会に紹介できればと思います。


 gnomADは、疾患関連変異の探索に強力なツールとして使えると思いますが、インハウスデータの頻度情報と比較して閲覧ができると便利ですね。


| onouek | 次世代シーケンサー解析 | 13:43 | comments(0) | - |
データ解析トレンド
現在、アメリエフはNGSデータを中心に解析を行っています。
しかし、もともと起業した社長は遺伝統計学のバックグラウンドがあり、最初はSNPアレイデータ解析の会社でした(そもそも、創業当時はNGSが今ほど普及していませんでした)。

とはいえ、ここ数年ずっとNGSデータ解析のお問い合わせが主でした。
ところが、今年に入ったころくらいから、GWAS解析、CNV解析などのSNPデータ解析のお問い合わせを立て続けにいただきました。
NGSは網羅性、データ量では勝りますが、安価さと精度ではSNPアレイのほうがまだ勝っていることもあり、大規模な集団の解析ではSNPアレイの需要は高いということでしょうか。
東北大ToMMoと東芝が開発した日本人SNPを反映したSNPアレイも販売されており、SNPアレイの活用はますます進むのではないかと思います。

アメリエフでは、SNPデータ解析受託、SNPアレイデータ解析で一般的に使われるソフトウェアをプリインストールしたサーバの販売、ソフトウェアを使用するためのLinuxコマンド基礎を含めたトレーニングの提供を行っております。
ご興味のある方は、弊社HPお問い合わせフォームよりお問い合わせください。
| kubo | バイオインフォマティクス | 12:12 | comments(0) | - |
誰でもわかる(と思う!)LTR解析 その1
〜前置き〜

だんまりを決め込んでいました。
どうもmisawatです。

たまにはInputだけではなくOutputせねば!と謎の義務感にかられたので記事を書きにきました。

テーマは「LTR (Long Terminal Repeat)」の解析です。

・・・。

はい。


「繰り返し〜」とか「リピート〜」とか言うと遺伝子解析屋さんは「むぇ〜(´・ω・`)」ってなるかもしれませんね。


ただこのLTR、解析出来ると色々おもしろいことがわかってきます。
そこで、「LTRとは何か」から始まり「LTRの解析方法」までを解析する記事を連載していこうと思います。


今回は第一回として「LTRとは何か」を書いていきます。





〜本編〜

さて、LTRとは上述したとおりLong Terminal Repeatの頭文字をとった単語です。

LTRはレトロウイルスやLTR型レトロトランスポゾンのRNAの両端に存在する数百〜数千の長い長〜い繰り返し配列です。特徴的ですね。



・・・特徴的ですね!!


そう"特徴的"なんです。

つまり宿主への感染を感会えた時に、このLTRを目印に感染が確認出来ます。

更にこのLTRにはプロモータとしての機能があったりもするのでウイルス関連の研究をされている方には魅力的な研究対象かもしれませんね!


次回はLTRに関する研究について書こうと思います。


以上、misawatがお送りしました!





〜つぶやき〜
「頭文字」って単語を見ると無性に峠を攻めたくなるのは私だけじゃないはず・・・。
| misawat | バイオインフォマティクス | 14:44 | comments(0) | - |
第46回バイオインフォマティクス勉強会「10x Genomicsによるロングリード解析@東京」開催のお知らせ
9月9日(金)に開かれるバイオインフォマティクス勉強会のご案内です。

《内容》

10x Genomicsが開発したGemCodeシステムは、ショートリードから擬似的にロングリードを生成する革新的な技術です。
本勉強会では、日本で10x Genomicsのサービスを提供する3社をお招きし、実験から解析までトータルにご紹介いたします。

  • 10x Genomics社のChromiumシステムのご紹介 株式会社スクラム社 掛谷 知志 様
  • Chromium向けターゲットエンリッチメント試薬のご紹介 アジレント社 吉崎 史子 様
  • 受託解析サービスのご紹介 受託解析会社 ご担当者 様
  • データ解析のご紹介 アメリエフ 山口 昌雄

10x Genomicsの技術にご興味のある方、お試しされたい方、導入をご検討されている方などご参加をお待ちしております。

             記

【日時】2016年9月9日(金) 15:30-16:45 (受付開始 15:00〜)
【場所】東京都港区芝四丁目1-17 三田いきいきプラザ 集会室A(洋室)
【アクセス】
・地下鉄三田線・浅草線 三田駅 A9番出口 徒歩1分
・JR山手線・京浜東北線 田町駅 西口 徒歩8分
【定員】 30名
【対象】
・これからNGSを用いたロングリード解析をラボまたは委託で始めたい方
・10x Genomics社製品に興味がある方
・NGSを使ったロングリード解析に興味がある方
【お申込みフォーム】こちら
【お申込み締切】 9月8日(木)正午まで

プロジェクターで投影しながら進行していきます。
電源やネット環境のご準備はございませので、予めご了承ください。
参加をご希望の方は、上記URLからお早めにお申し込みください。

勉強会の後には、近くの飲食店にて情報交換会(実費 3,000〜4,000円)を
企画しております。講師も参加いたしますので、情報交換や横のつながりを
作る機会として、お楽しみいただければと思います。
| kubo | 勉強会 | 09:57 | comments(0) | - |
ヒトデータのセキュリティ
今夏は慎重に行動していたおかげでほとんど蚊に刺されていなかったのですが、お盆休みで実家に帰ったところ、寝ている間に10箇所も刺されてしまいました。
せっかく気を付けていたのに、台無しです。

無理やりこじつけますが、気を付けるといえば、ヒトのシーケンスデータを扱うときに、セキュリティはどれくらい気にするものなのか、ご質問をたびたびいただきます。
弊社がヒトシーケンスデータを扱う際のセキュリティルールは、NBDCヒトデータ取扱いセキュリティガイドラインを参考にしています。

NBDCヒトデータ取扱いセキュリティガイドライン
こちらは、NBDCで提供しているNBDCヒトデータベースの共有データを利用する際のセキュリティルールです。
セキュリティレベルには標準レベル(Type-I)とハイレベル(Type-II)があり、弊社では標準レベルの基準と同等のセキュリティを適用したサーバでヒトデータの解析を行っています。

ひとつの指針として、ご参考になりましたら幸いです。
| kubo | バイオインフォマティクス | 15:14 | comments(0) | - |
  12345
6789101112
13141516171819
20212223242526
27282930   
<< November 2016 >>

このページの先頭へ