アメリエフのブログ

バイオインフォマティクスの紹介と社員の日々
Next Generation Sequencing Platforms「第三・四世代シーケンサー」
今週は、第三世代シーケンサーについて少し調べて書いていこうと思います。

3つのテクノロジー革新でSingle Molecule Real Time sequencingを実現したPacific BiosciencesのPACBIO RSや、
PostLight sequencing技術で期待を集めているIon Torrent Systemsに焦点を当てていきます。

【参考】
・Pacific Biosciences
http://www.pacificbiosciences.com/
・Ion Torrent Systems
http://www.iontorrent.com/
| きむ | 次世代シーケンサー解析 | 18:04 | comments(0) | trackbacks(0) |
プライマー設計ソフト「Primer3」のGUIインターフェース
先々週の金曜日にアナウンスしました「Windows版 Primer3のGUIフロントエンド」について、多数のお問い合わせをいただいております。
この場を借りてお礼申し上げます。

Web版やコマンドライン版、有償のプライマー設計ソフトはいくつか存在しますし、バクテリアや特殊な条件など特化型のプライマー設計ソフトもいくつか存在します。

その中で「Primer3」は業界標準といっても過言ではないほど一般的な「オープンソース」のプライマー設計ソフトで、Web版とコマンドライン版が公開されています。

私自身、10年余り前にこの業界(SNPやバイオインフォマティクス分野)に入ってからの最初の5年間は、ABIのキャピラリーシーケンサーでヒトゲノムをリシーケンシングしながらSNPを探索するプロジェクトにも携わっていました。

サンガー法によるシーケンシングですので、PCRでの増幅とシーケンシングにプライマーの設計が欠かせません。しかも長い領域(数百kbp)を連続してシーケンシングするため、プライマー設計だけで何千ペア以上も設計することが度々ありました。

近年でも、SNPによるGWAS解析におけるReplication解析(2段階目や3段階目のSNP関連解析)の際に、SNP周辺をPCR増幅するためのプライマー設計で数千〜数万ペアを設計することもあります。

そんな事情もありましたので、Primer3には以前から大変お世話になってきました。Web版のPrimer3では1ペアずつしか設計できませんので、プログラミングをして、コマンドライン版のPrimer3で大量のプライマーを設計するノウハウを積み上げてきました。
(余談ですが、未公開ながらこれで論文を1本書いたこともあります。全ゲノムにBLASTして単一であることを確認したプライマーペアなので、実験成功率が10%ほど上昇しました。)

大量にプライマーを設計する理由として、、
1.連続した領域をシーケンシングする
2.SNPなどマーカーを起点としてPCRする
と考えましたので、そのようなプライマー設計をする際に便利になるであろうというGUIソフト(Windows版のPrimer3のGUIインターフェース)を開発しました。

開発は終わっているため、現在は公開に向けて準備中です。
公開までもう少々お待ちください。

ご意見やご要望などがございましたら、お問い合わせまでご連絡ください。
| 社長 | プライマー設計 | 23:41 | comments(0) | trackbacks(0) |
Next Generation Sequencing Platforms「第二世代シーケンサー4」
今週は、第二世代シーケンサーを比較する際のポイントについて、とりとめなく書いてきたので、そろそろまとめたいと思います。

・データ量(リード長、目標リード長、タグ数)
・コスト(サイズ、導入、維持、ランニング)
・時間(ハンズオンタイム、ランニングタイム)
・精度
・データ解析(ソフト、パイプライン)
・データ管理/保管
・テクニカルサポート/コミュニティー

特にデータ解析に関しては、かなり苦労しているというお話をよく伺います。
今、大きな変革期を迎えているこの業界でお仕事をさせていただいているのは、本当に幸せなことだなとつくづく思います。今週は、のんきなつぶやきで締めくくらせていただきます〜てれちゃうポッイヒヒ



| きむ | 次世代シーケンサー解析 | 18:32 | comments(0) | trackbacks(0) |
Next Generation Sequencing Platforms「第二世代シーケンサー3」
今日も第二世代シーケンサーに関して書きたいと思います。

Complete Genomics社のサービスが、とても興味深いので触れておこうと思います。CGA™ Service (Complete Genomics Analysis Service) は、包括的な受託サービスを目指しています。
つまり、
・シーケンシング装置や試薬を販売
・解析サーバを案内
・解析ソフトを提供/紹介
・トレーニング/テクニカルサポート/コミュニティーの場を提供
などを行う「シーケンシング装置と試薬の開発・販売」を主体とした機器メーカーさんとは異なり、
・サンプル調整
・シーケンシング
・データ解析
・データ管理/保管
(amazon web services)
を組み合わせたまさに「次世代シーケンシンサー研究の包括的支援サービス」を目指しているのです。

対象はヒトゲノム、アプリケーションは下記の4つなので、
かなり特化(限定?)したメニューを提供しています。
・Cancer Research
・Mendelian Disease Research
・Rare Variant Disease Research
・Clinical Trial Optimization
HPを見ただけなので、他にもメニューがあるかもしれません。
ご興味がある方はチェックしてみてください。

【参考】
・Complete Genomics
http://www.completegenomics.com/
・amazon web services
http://aws.amazon.com/jp/
| きむ | 次世代シーケンサー解析 | 14:49 | comments(0) | trackbacks(0) |
Next Generation Sequencing Platforms「第二世代シーケンサー2」
第二世代シーケンサーに関して書きたいと思います。
各社ともにリード長を延ばす努力を行っています。
今年の目標は
Roche 454 1000base
Illumina 150base
ABI SOLiD 100baseでした。
他にも、
GS Junior Bench Top System
SOLiD PI Systemなど、
ベンチトップサイズへの小型化も盛んですね。

以前、比較するポイントとして
・データ量(リード長、タグ数)
・コスト(導入、維持、ランニング)
・時間(ハンズオンタイム、ランニングタイム)
・精度
を挙げました。
これらのテーマはいわば「シーケンサー開発の必須課題」
なのかなと思います。

一方、
・目標リード長
・ベンチトップ型の有無
は、研究用途やその市場まで視野に入れた問題であり、
最適化されていく中で定着したり淘汰されるのだと思います。

さて、私個人的にとても楽しみなのはPolonatorです。
かずさDNA研究所が導入したことで話題になりましたが、プロトコルとソフトウェアがオープンソース(!)、試薬も低価格で販売するそうです。
しかも、ユーザーが自社製品以外の試薬を使うのも大歓迎。低価格でより良い試薬があるのならば、むしろ情報を共有しましょうというのです。
Open evolution is the accelerant that will drive this platform forward.Please join us!
とHPにも力強い言葉がありますから、ユーザーコミュニティーが育てば爆発的に普及しそうな予感がします。
| きむ | 次世代シーケンサー解析 | 19:04 | comments(0) | trackbacks(0) |
SNP解析パッケージ「PLINK」のGUIインターフェース
先週の金曜日にアナウンスしました「Windows版 PLINKのフロントエンド」についてご質問をいただいております。

マイクロアレイがそうであったように、SNP解析も一般的な技術になってきておりますが、マイクロアレイほどにはデータ解析ソフトが普及していないようにおもいます。やはり遺伝統計解析は少々特殊であることと、GUIベースでオープンソース(フリー)のソフトが少ないことも要因の一つではないかと考えています。
(PLINKにはGUIインターフェースである「gPLINK」が存在します)

弊社では、「QuickGWAS Online」というWebベースのSNP解析サービスをご提供させていただいていますが、みなさんにSNPデータ解析を広く利用していただくため、Windows版のPLINKを利用したGUIのラッパーに、統計解析パッケージ「R」で「マンハッタンプロット」と「Q-Qプロット」を作成する機能を追加したフリーソフト(アカデミック用)をご提供予定です。

現在は、リリースの最終準備(ソフトは完成しています)をしています。もう少々お待ちください。
| 社長 | SNP解析 | 23:41 | comments(0) | trackbacks(0) |
新サービスに向けて準備中です
現在社内では、新サービスのご提供に向けて準備中です。
そのうちの2つは、フリーソフトとして公開させていただく予定です。

1つめは、Windows版PLINKのフロントエンド(GUIインターフェース)で、2つめは、Windows版Primer3のフロントエンド(GUIインターフェース)です。

注)PLINKはSNPによるGWAS解析を行う統計解析パッケージソフトです。Primer3はプライマー設計をするソフトです。両者ともオープンソースとして公開されています。


どちらも、コマンドラインのアプリケーションなので、GUIのラッパーソフトを用意し、付加機能(公開されてからのお楽しみ)を加えました。通常はLinux等で動作させますが、Windows版でご利用いただけるようにしました。


公開までもう少々お待ちください。
| 社長 | 会社のこと | 22:05 | comments(0) | trackbacks(0) |
Next Generation Sequencing Platforms「第二世代シーケンサー1」
第二世代シーケンサーと呼ばれる
Roche 454
Illumina
ABI SOLiD
を比較する際のポイントを挙げてみます。

・1ランあたりのデータ量(リード長、タグ数)
・コスト(導入、維持、ランニング)
・時間(ハンズオンタイム、ランニングタイム)
・精度
でしょうか。

| きむ | 次世代シーケンサー解析 | 15:06 | comments(0) | trackbacks(0) |
Next Generation Sequencing Platforms
社長のリクエストにお応えして、まずはPlatformごとに書いていこうと思います。

Roche 454
Illumina HiSeq 2000
ABI SOLiD
Helicos
Complete Genomics
Polonator
Pacific Biosciences SMRT
Ion Torrent

ざっと書いてみました。
次世代シーケンサーも多様になりましたね。

明日から、少しずつ見ていきたいと思います。
| きむ | 次世代シーケンサー解析 | 20:17 | comments(0) | trackbacks(0) |
次世代シーケンサーのデータ解析
私の探し方が悪いのかもしれませんが、次世代シーケンサーのデータ解析について、日本語で網羅的に記述されたものが無いように感じます。

弊社でも次世代シーケンサーのデータ解析や、二次解析・三次解析用のパイプラインを構築しているので、社内でまとめた文章をブログ記事にまとめていきたいとおもいます。
| 社長 | 次世代シーケンサー解析 | 23:09 | comments(0) | trackbacks(0) |
ゲノムブラウザについて(番外編)
弊社のキムが連載している「ゲノムブラウザ」についてのブログ記事が
ご好評をいただいております。
たくさんのアクセスを頂き、本当に嬉しいです。
ありがとうございます。


ゲノムマップを閲覧するビューアーのニーズは10年以上前からありましたが、ヒトゲノムのドラフト配列が決まった2000年ごろから特に必要性が高まっています。

全ゲノム領域を対象とした研究・解析が進展し、ゲノムのアノテーションが充実してきている今日では、その重要性は益々高まるばかりです。


そうした背景があるため、UCSCが公開している「Genome Browser」は多くの研究者の支持を集めて、業界標準ビューアーの一つになっています。

他にも、遺伝子発現を測定するマイクロアレイチップで有名なAffymetrix社が自社チップのユーザー向けに提供し始め、今ではオープンソースになっているIGBが、以前からのユーザーの根強い支持を集めています。

最近では、Broad Instituteが公開するIGVにも注目が集まり、幅広い入力ファイル形式に対応することで、支持を集めています。

サーバー組み込み用途では、GBrowseやJBrowseなどのオープンソースが存在し、メジャー・マイナー・特定用途など多くの種類のゲノムブラウザが世に出ています。


商用ソフトも多く、オープンソースには無い機能を追加するなど、各社がしのぎを削っているのが現状です。


弊社としては、オープンソースのビューアーを第一候補としてお客様(メインは公的研究機関の研究者)にご提案していますが、用途に応じて研究室内でのサーバー構築や、商用ソフトのご紹介をさせていただいております。

今回のブログ記事が、少しでもみなさまのお役に立てましたら幸いです。
| 社長 | ゲノムブラウザ | 21:41 | comments(0) | trackbacks(0) |
ゲノムブラウザのご紹介「IGV(Integrative Genomics Viewer)」
今日は、IGV(Integrative Genomics Viewer)をご紹介したいと思います。
IGVは、米Broad Instituteによって作成されたゲノムブラウザです。
Javaで作成されているので、使用する際はJavaをインストールしておく必要があります。サイトはこちらです。


画面はこんな感じです。


魅力的な点は、
1.複数のファーマットに対応
2.インターフェースが直感的
3.クローズドの環境で使える
でしょうか。

1.複数のファーマットに対応
GFF,WIG,BED,FASTAなど、なんと26種類ほどのファーマットに対応しています。

2.インターフェースが直感的
染色体のアウトラインを、マウスでがしがしスピーディーに動かせるのでストレスフリーです。

3.クローズドの環境で使える
データが流出する心配がないので、セキュリティの面では安心かと思います。
あらかじめいくつかのアノテーションが登録されています。
あとは、必要なアノテーションを準備すれば快適にご使用いただけると思います。


| きむ | ゲノムブラウザ | 18:35 | comments(0) | trackbacks(0) |
UCSC Genome Browser「続・CNVデータのカスタムトラックを作成する2」
一昨日は、UCSC GenomeBrowserでCNVデータのカスタムトラックを作成しました。今日は、図を少しアレンジしたいと思います。

通常ヒトの細胞には、父由来と母由来の2コピーの遺伝子があると考えられていますが、実際は遺伝子のコピー数が、1コピー以下に減ったり、3コピー以上に増えたりしていることがわかっています。このように、個人によってコピー数の違うゲノム領域のことを、CNV(Copy Number Variation:コピー数多型)と呼んでいます。疾患に関与するCNVもありますが、健康なヒト同士の細胞を比較しても、CNVに違いがあることから、個人差に関与する遺伝的要因のひとつとしても注目されています。


上の図では、1サンプルのデータを、2種類のカスタムトラックで表示しました。
「Tsp1_dup」トラックが重複、「Tsp1_del」トラックが欠失を示しています。2コピーを基準にして、+1だと3コピー、-1だと1コピーと考えてください。


次に、2サンプル分を並べて、共通する部分のカバレージを表示しました。

さらに、表示を工夫してみます。
Custom Tracksで、重複はhide、欠失はdenseを、クリックメニューから選択します。各トラックの名前をクリックすると詳細な設定もできます。
refreshボタンをクリック

さっぱりしましたね。
manage custom tracksボタンをクリックすると、一括削除も簡単に行えます。

特定の遺伝子にフォーカスしたい時や、コントロールやデータベースと比較したい時には、多様なアノテーション情報を活用できるUCSC GenomeBrowserはやはり魅力的だなと思います。
| きむ | ゲノムブラウザ | 09:11 | comments(0) | trackbacks(0) |
UCSC Genome Browser「続・CNVデータのカスタムトラックを作成する1」
昨日は、CNVデータのカスタムトラックを作成しました。
bedGraphフォーマットでデータを入力しましたね。
track type=bedGraph name="Tsp1_dup" yLineOnOff=on yLineMark=0.0 description=" " visibility=full color=200,100,0 altColor=200,50,0
chr7 68270187 68554976 1
chr7 69651527 69890581 1
chr7 69978722 70178645 1
track type=bedGraph name="Tsp1_del" yLineOnOff=on yLineMark=0.0 description=" " visibility=full color=0,100,200 altColor=0,50,200 alwaysZero=on
chr7 67496309 67572164 -1
chr7 67668947 68117798 -1
chr7 69361800 69562000 -1
browser position chr7:67495000-70179700
1行のヘッダと4列のデータのシンプルなフォーマットですね。
最後の1行はこのポジションに飛んで!!という意味です。
browser position chr7:67495000-70179700

入力しない場合は、データ部分1行目のポジションに飛ぶようです。

書かなくても問題ありませんが、見たい範囲が決まっている場合は便利です。
遺伝子名で指定することもできます。
browser position AUTS2

すばらしい!!
| きむ | ゲノムブラウザ | 10:18 | comments(0) | trackbacks(0) |
UCSC Genome Browser「CNVデータのカスタムトラックを作成する」
1.UCSC のサイトにアクセスして、Genome Browserに移動
Genome Browserボタンをクリック


2.カスタムトラックを作成
manage custom tracksボタンをクリック


3.ゲノム情報を選択
clade、genome、assemblyをクリックメニューから選択


4.データを入力
track type=bedGraph name="Tsp1_dup" yLineOnOff=on yLineMark=0.0 description=" " visibility=full color=200,100,0 altColor=200,50,0
chr7 68270187 68554976 1
chr7 69651527 69890581 1
chr7 69978722 70178645 1
track type=bedGraph name="Tsp1_del" yLineOnOff=on yLineMark=0.0 description=" " visibility=full color=0,100,200 altColor=0,50,200 alwaysZero=on
chr7 67496309 67572164 -1
chr7 67668947 68117798 -1
chr7 69361800 69562000 -1
browser position chr7:67495000-70179700
bedGraphフォーマットを使用します。
コピー&ペーストして試す際は、最後の行末の改行を削除してください。

submitボタンをクリックすると、カスタムトラックの情報が表示されます。

go to genome browserボタンをクリック

5.結果表示


みなさん、上手くカスタムトラックが表示されましたか??
| きむ | ゲノムブラウザ | 18:49 | comments(0) | trackbacks(0) |
ゲノムブラウザのご紹介「UCSC Genome Browser」
今日は、米国カリフォルニア大学サンタクルーズ校(UCSC)のBioinformatics Teamによって開発・運用されている「UCSC Genome Browser」について、簡単にご紹介したいと思います。

魅力的な点は、
1.検索が高速
2.多様なアノテーション
3.データベースと連携したコンテンツ

でしょうか。

2.多様なアノテーション
多岐にわたるアノテーションが準備されており、目的に応じてカスタマイズできるので便利です。
リファレンス配列も充実していて、ヒトゲノムだけで4種類ありますので
GRCh37/hg19 (2009)
NCBI 36/hg18 (2006)
NCBI 35/hg17 (2004)
NCBI 34/hg16 (2003)
過去のデータを見る時は、特に頼もしい存在かと思います。

3.データベースと連携したコンテンツ
BLAT :高速アライメント
VisiGene :in situ ハイブリダイゼーションの画像閲覧
Gene Sorter :遺伝子発現パターン、アミノ酸配列、GO(Gene Ontology)等の類似度に基づいてソート
Genome Graphs :ゲノムワイドなデータのセットを複数アップロードして表示
など、思わず試してみたくなるコンテンツが勢ぞろいです。
使い方は、ライフサイエンス統合データベースセンター(DBCLS)が発信している統合TVをご覧いただくと、理解しやすいかと思います。

明日は、「CNVデータのカスタムトラックを作成する」作業に焦点を絞ってお話します。
| きむ | ゲノムブラウザ | 18:14 | comments(0) | trackbacks(0) |
ゲノムブラウザのご紹介
キムです。
お久しぶりです。

明日から、「UCSC GenomeBrowser」と「IGV(Integrative Genomics Viewer)」を使って、いろいろなデータを表示していきたいと思います。

・UCSC GenomeBrowser
http://genome.ucsc.edu/

・IGV(Integrative Genomics Viewer)
http://www.broadinstitute.org/igv/

目標は、「直観的かつ正確な理解の手助けとなるように表示方法を工夫する」です。

至らない点などございましたら、ご指摘いただけますと大変助かります。
どうぞよろしくお願いします!!
| きむ | ゲノムブラウザ | 17:19 | comments(0) | trackbacks(0) |
【勉強会のお知らせ】12/4(土)バイオ研究のためのLinux入門
アメリエフ株式会社の山口です。

12月4日(土)に開かれるバイオインフォマティクス勉強会のお知らせです。

今回のテーマは、「バイオ研究者のためのLinux入門」です。
Linuxのインストールから、BLAST、Primer3などのフリーソフトのセットアップとデータベースの配置や簡単な実行方法までご紹介します。

取り上げて欲しいオープンソースソフトがありましたらご一報ください。検討させていただきます。
また、ラボの同僚やお友達とのご参加も歓迎です。


              記
日時: 2010年12月4日(土) 15時〜17時
場所:文京区シビックセンター5階 区民会議室D
地図:http://www.city.bunkyo.lg.jp/sosiki_busyo_shisetsukanri_shisetsu_civic.html
定員:20名
予算:お一人500円

プロジェクターで投影しながら進行していきます。
WindowsにインストールしたVMware PlayerにLinuxをインストールます。
ノートPCの持ち込みは可能ですが、ネット環境の準備はございません。


また例によって、勉強会後に懇親会を開きたいとおもいます。
予算は5000円です。
いろいろな研究分野の方と情報交換できるチャンスですので、ぜひご検討ください。


どちらかの参加、もしくは両方の参加をご希望の方は、
11/29(月)までにお問い合わせフォームからご連絡をお願いいたします。

勉強会(15時〜17時)   ○
懇親会(17時半〜)    ○

みなさまとお会いできることを楽しみにしています。
| 社長 | 勉強会 | 18:51 | comments(0) | trackbacks(0) |
次世代シーケンサーSOLiDのデータ解析
次世代シーケンサーの一つ、ライフテクノロジーズのSOLiDのデータ解析をしています。

オープンソースの解析ソフトは多数公開されていますので、そのソフトをつなぎ合わせて目的の解析をするパイプラインを構築するのですが、そのパイプラインの途中に組み込む解析ソフトやファイル書式のコンバーターなどが存在しない場合は(存在しない場合が多数ですが・・・)、ソフトウェアを自前で作成しています。

今日は作成したソフトウェアをお客様にプレゼンしました。数千万のデータから目的の情報を抽出することは通常のパソコンでは困難なので、専用ソフトを作成しているわけですが、お客様は抽出された結果(統計処理した結果)を初めて見て、予想外の結果に驚いていました。

研究上は新たな課題の出現ですが、ソフトを作成した弊社としては研究に貢献できた喜びを味わっています。(笑)
| 社長 | 次世代シーケンサー解析 | 23:26 | comments(0) | trackbacks(0) |
会社HPの一部リニューアルを準備中です
会社HPの一部リニューアルを準備しています。

サービスの構成を整理し、わかりやすくまとめたページを準備しておりますので、公開まで数日ほどお待ちください。

弊社のサービス・製品紹介は、まずチラシを作成し、そのデザインをベースにHPを作成しています。チラシ作成は、ブログにも度々登場する「きむ」が担当し、HP作成は経理担当者がHP作成ソフトを使って作成しています。

(初期のHPをご覧になってご存知の方も多いと思いますが)私はデザインのセンスは全く無いので、センスのある2人にまかせています。
| 社長 | よもやま話 | 18:01 | comments(0) | trackbacks(0) |
無事「日本人類遺伝学会 第55回大会」が終了しました
先週末の土曜日に、無事「日本人類遺伝学会 第55回大会」が終了しました。

最終日はあいにく台風が近づいているせいもあって、来場者はあまり多くはなかったようにおもいます。
企業展示ブースはポスター発表会場と同じ場所なのですが、ポスター発表が2日目までて終わってしまっているためでしょうか。

どちらにせよ、大変実りの多い学会展示でした。
ありがとうございました。
| 社長 | 学会出展 | 22:10 | comments(0) | trackbacks(0) |
 123456
78910111213
14151617181920
21222324252627
282930    
<< November 2010 >>

このページの先頭へ