アメリエフのブログ

バイオインフォマティクスの紹介と社員の日々
IGVから配列を取得する
IGVのちょっと便利な機能に気づいたのでご紹介します。
ゲノム上の目的の領域の配列を、IGVだけを使って取得してみましょう。
IGVのバージョンは2.3.3で確認しました。

1. BEDで指定したfeatureの配列を取得する

ChIP-seq解析で出力したピーク(BED形式)上の配列を取得したいときの方法です。下図のように、feature上を右クリックし、表示されたメニューから「Copy Sequence」を選択します。

クリップボードに配列情報が保存されますので、使っているワープロソフトやテキストエディタ等にペーストして使用できます。
こちらはわかりやすいので、ご存じの方も多いのではないでしょうか。

2. 任意の領域の配列を取得する

IGVで変異やピークなどのfeatureを眺めながら、「ここからここまでの配列が欲しい!」と思った時。
IGVのツール一覧にあるこちらのアイコンをクリックします。

カーソルが十字になりますので、配列を取り出したい範囲の開始ポジションと終了ポジションをクリックします。これで目的の領域が赤く表示され、選択できたことになります。

複数個所の配列情報を取り出したい場合は、続けて別の場所を選択できます。
(誤った箇所を選択した場合、赤い部分を右クリックし、メニューから「Delete」を選択することで領域の選択を解除できます)
取り出したい場所を選択し終わったら、ツールバーから「Regions」 > 「Export Regions ...」を選択し、選択した領域を保存します。保存したファイルを、Peakと同じようにIGVで開くことができますので、以降は上記の(1)と同じ方法で配列情報を取り出します。
参考

この2番目の方法、最近まで方法を知りませんでした。目視した領域の情報が取得できるので便利です。
(もし、もっと簡単に配列取れる方法あるじゃない! と思った方はぜひ教えてください。情報お待ちしています)
| kubo | ゲノムブラウザ | 16:58 | comments(0) | - |
RepeatMaskerViz.トラックがかっこいい
UCSC Genome Browserの「GRCh38/hg38」にかっこいいトラックを見つけたのでご紹介します。
「RepeatMasker Viz.」というトラックです。

下図の上がRepeatMaskerトラック、下がRepeatMasker Viz.トラックです。

RepeatMasker Viz.はRepeatMaskerを視覚的に表示したトラックです。

矩形の部分はゲノムにマップできる部分、破線の部分はマップできない部分で、リピート中のInDelも表示できます。

Repeatの様子が理解しやすくていいですし、数字の入れ方など見た目がなんかかっこいいです。

詳しくは Repeats -> RepeatMasker Viz. のヘルプをご覧ください。
| hat | ゲノムブラウザ | 17:33 | comments(0) | - |
samtools tview
マッピング結果(BAMやBEDなど)を表示するビューアはいろいろありますが、最近はBroad InstituteのIGV(Integrative Genomics Viewer)が主流のようです。

おなじみsamtoolsにもtviewというCUIベースのビューアがあるのをご存知でしょうか。
今日はこのsamtoolsのビューア機能についてご紹介します。

早速起動してみましょう。

$ samtools tview BAMファイル


黒い画面が出てきました。
いきなり心が折れそうになりますが、ここで負けてはいけません。
「Shift」+「?」をタイプするとヘルプが出ます。


いろいろなスクロール方法があるようです。しかし、第一番染色体の先頭からスクロールしてマッピング箇所を探すのは、砂漠で手がかりもなしにオアシスを探すような無謀な行動です。

「g」または「?」をタイプしてみましょう。


「Go to:」の後ろにポジション(chr1:1000000など)をタイプして「Enter」をタイプすると、その場所にジャンプすることができます。


リードがありました!

塩基に色をつけることもできます。


お世辞にも使いやすいとはいえず、これで解析するのは現実的ではないと思います。
イースターエッグ的な位置づけなのでしょうか。

それでもリードが表示されるとなんだかうれしいので、samtoolsが使える環境の方は一度はお試しください。
| hat | ゲノムブラウザ | 17:24 | comments(0) | trackbacks(0) |
BEDフォーマット完全解説
BEDフォーマットはゲノム上のポジションを示すのに使われているフォーマットで、遺伝子や結合部位などを示すのに広く使われています。
元々はUCSC Genome Browserで使われていたフォーマットですが、最近は様々な解析ソフトウェアでも読み書きできるようです。

BEDフォーマットは最大12列からなるフォーマットで、最初の3列が必須です。
後半は使わないことも多いのですが、知っていると、UCSC Genome Browserにカスタムトラックを作る際に便利です。
今日はBEDフォーマットについて詳しく解説したいと思います。

(1)chrom:染色体名(chr1など)
(2)chromStart:スタート位置(数値)
 0スタート(染色体の左端を0と数える)である点にご注意ください。
 他のフォーマット(例えばVCF)には1スタートのものもあります。
 フォーマット間の変換の際は気を付けましょう。
(3)chromEnd:エンド位置(数値)

---↑この3列は必須。この3列だけのものをbed3と呼びます。

 bed3の例:chr1 0 100
 =染色体chr1の先頭から100bpの領域を指す

 項目間はタブかスペースで区切ります。

(4)name:名前(文字列)
 遺伝子名や任意の文字列を指定します。特に必要ない場合は空文字列を入れます。
(5)score:スコア(0-1000の間の数値)
 遺伝子らしさ(新規遺伝子候補の場合など)や類似度(比較ゲノムの場合など)など、0-1000間の数値を何でも入れることができます。特に必要ない場合は一律で0などを入れます。
 UCSC Genome Browserでは、スコアに応じて濃淡をつけることができます。その場合、BEDファイルの先頭に次の1行を記載します(nameやdescriptionは適当な文字列に変更してください)。
 
track name=myTrack1 description="myTrack1 score" useScore=1


(6)strand:ストランド(+ または -)
 ゲノム配列に対して5'→3'の向きなら+、3'→5'の向きなら-です。

---↑(1)-(6)まであるものをbed6と呼びます。

 bed6の例:chr1 1000 2000 foo 100 -
 =染色体chr1の1000塩基目から2000塩基目にゲノムと逆向きである、スコア100の「foo」という領域を指す


(7)thickStart:CDSの開始位置(数値)
(8)thickEnd:CDSの終了位置(数値)
 UCSC Genome Browser上で、(7)-(8)の領域は太い線で表示されます。数値的に(2)<=(7)<(8)<=(3)になっていないと怒られます。
 元々はCDS用の列ですが、遺伝子以外のデータの場合で、部分領域を強調するのに使えます。

(9)itemRgb:色をRGBで指定(数値,数値,数値)
 これは完全にUCSC Genome Browserで表示するためだけの情報なので、他のソフトウェアで開く場合には関係ないことが多いです。使わない場合は0などを入れておきます。
 例えば赤で表示したい場合はここを「255,0,0」とし、BEDの先頭にTrack行をつけ、itemRgb Onと指定します。
track name=myTrack1 description="myTrack1 with color" itemRgb="On"


(10)blockCount:エキソンのブロック数(数値)
(11)blockSizes:ブロックサイズ(数値をコンマ区切りで)
(12)blockStarts:エキソンの「転写開始位置からみた」スタート位置(数値をコンマ区切りで)

---↑(1)-(12)まであるものをbed12と呼びます。

 bed12の例:chr1 100 300 bar 0 + 110 220 0 2 30,60, 10,60,
 =転写領域が「chr1:100-300」、1つ目のエキソンが「chr1:110-140」、2つ目のエキソンが「chr1:160-220」である遺伝子「bar」を示す


以上、ちょっと細かいBEDフォーマットのお話でした。
itemRgbやスコアによる濃淡を使うと、カラフルなトラックを使うことができますよ!

【参考】UCSC Genome BrowserのHelp

| hat | ゲノムブラウザ | 16:42 | comments(4) | trackbacks(0) |
BEDTools 4
BEDファイルを作成してIGVで表示してみましょう。
1.下記の一行を書き込みtest.bedとして保存します。
chr22 1000 5000 cloneA 1000 + 1000 5000 255,0,0 2 500,250 0,3500
2.IGVを起動します。メニューバーの「File」をクリックして「Load from File..」を選択します。test.bedを選択して「ok」をクリックします。

太い部分をblockと呼びます。
10列目のblockCountは2つ。
11列目のblockSizesは、それぞれ500と250。
12列目のblockStartsは、それぞれ0と3500です。chromStartを0した時の相対的な位置で指定します。
| きむ | ゲノムブラウザ | 18:11 | comments(0) | trackbacks(0) |
BEDTools 3
以前、BEDToolsについて簡単にご紹介しました。
「BEDファイル」とはどんなファイルなのか、続きを書きたいと思います。

ファイルに記入できる情報以下の通りです。
1.chrom
2.chromStart
3.chromEnd
4.name
5.score
6.strand
7.thickStart
8.thickEnd
9.itemRgb
10.blockCount
11.blockSizes
12.blockStarts

最初の3列は必須の情報です。
向きを指定したい場合は6列目まで、色を指定したい場合は9列目まで入力する必要があります。
| きむ | ゲノムブラウザ | 17:46 | comments(0) | trackbacks(0) |
UCSC Table Browser 2
昨日は、UCSC Table Browserの簡単な紹介をしました。
UCSC:http://genome.ucsc.edu/cgi-bin/hgTables

お手元のゲノムブラウザで、特定のデータをアノテーションとして表示させたい場合は、BEDというファイル形式でダウンロードすると良いかもしれません。
BEDはBrowser Extensible Dataの略です。
IGV(Integrative Genomics Viewer)では表示可能でした。
| きむ | ゲノムブラウザ | 09:11 | comments(0) | trackbacks(0) |
UCSC Table Browser 1
ゲノムのアノテーションデータを、お手元にダウンロードしたい時は、
UCSC Table Browserが便利です。
UCSC:http://genome.ucsc.edu/cgi-bin/hgTables
ファイル形式も、8種類から選択できます。
| きむ | ゲノムブラウザ | 18:04 | comments(0) | trackbacks(0) |
IGV 2.0 beta版
以前何度か紹介させていただいたBroad InstituteのゲノムブラウザIGV(Integrative Genomics Viewer)が3月にバージョンアップしていました。
IGV 2.0 beta版です。
ダウンロードはこちらからどうぞ
http://www.broadinstitute.org/software/igv/EarlyAccessGuide
| きむ | ゲノムブラウザ | 17:59 | comments(0) | trackbacks(0) |
NGS対応ビューワ2
次世代シーケンサー対応ビューワが続々と公開されています。
ここ
http://lh3lh3.users.sourceforge.net/NGSalnview.shtml
によく耳にするビューワ7個の機能一覧があります。
フリーのビューワをお探しの方は、是非ご参考にどうぞ。
| きむ | ゲノムブラウザ | 18:07 | comments(0) | trackbacks(0) |
NGS対応ビューワ
次世代対応ビューワが続々と公開されていますね。
ここ
https://ngslib.i-med.ac.at/node/57
の一覧だけでも18個もあります。
果たして、求めている機能を持ったビューワがこの中にあるのだろうか‥
便利なビューワを見つけたらどんどん紹介していきすね。
| きむ | ゲノムブラウザ | 18:01 | comments(0) | trackbacks(0) |
IGV「igvtools 6」
今週も、IGV(Integrative Genomics Viewer)のigvtoolsについてご紹介したいと思います。
今日は、index機能を使います。
IGVでBAM file(.bam)やSAM file(.sam)を表示するには
・positionでsortする
・indexを付ける
必要があります。
index情報は、BAM index file(.bai)やSAM index file(.sai)などのindex fileに保存されます。
元fileとindex fileは、同じフォルダに配置する必要があります。

対応しているファイルは下記の通りです。
.sam, .aligned, .vcf, .psl, and .bed

| きむ | ゲノムブラウザ | 09:41 | comments(0) | trackbacks(0) |
IGV「igvtools 5」
今日は、IGV(Integrative Genomics Viewer)のigvtoolsについてご紹介したいと思います。
Tile機能を使って、大きなサイズのファイルをバイナリファイル(.tdf)に変換します。
IGVで表示するときに拡大や画面移動がスムーズになります。
対応しているファイルは下記の通りです。
.wig, .cn, .snp, .igv, .res and .gct
IGVからigvtoolsを起動させます。
Commandから「Tile」を選択します。
Input Fileの「Browse」をクリックしてファイルを選択します。
すると自動的に、Output File欄にファイルの場所と名前が入力されます。
良ければ、「Run」をクリックします。

Messagesに「Done」と表示されれば完了です。
手順は、Option以外はSort機能とほぼ同じです。
| きむ | ゲノムブラウザ | 19:51 | comments(0) | trackbacks(0) |
IGV「igvtools 4」
今日は、IGV(Integrative Genomics Viewer)のigvtoolsについてご紹介したいと思います。
まず、sort機能を使って、start positionで並び変えます。
対応しているファイルは下記の通りです。
.cn, .igv, .sam, .aligned, .psl, .bed, and .vcf
IGVからigvtoolsを起動させます。
Commandから「Sort」を選択します。
Input Fileの「Browse」をクリックしてファイルを選択します。
すると自動的に、Output File欄にファイルの場所と名前が入力されます。
良ければ「Run」をクリックします。

Messagesに「Done」と表示されれば完了です。
| きむ | ゲノムブラウザ | 09:44 | comments(0) | trackbacks(0) |
IGV「igvtools 3」
キムです。お久しぶりです。
今週は、IGV(Integrative Genomics Viewer)のigvtoolsについてご紹介したいと思います。
以前、「igvtools単体を起動させる」方法と「IGVからigvtoolsを起動させる」方法についてお話ししました。
機能についてはこちらをご参照ください。
明日から使い方のご紹介を行います。


| きむ | ゲノムブラウザ | 17:39 | comments(0) | trackbacks(0) |
IGV「igvtools 2」
IGV(Integrative Genomics Viewer)のigvtoolsについてご紹介したいと思います。
igvtoolsは、IGVに入力する前にデータの前処理を行うツールです。
■sort
start positionで並び変えます。
ソート済みのファイルを入力するように求められた場合、この機能を使います。
■tile
大きなサイズのファイル(wigやcnなど)をIGVで表示しようとすると、バイナリファイル(.tdf)に変換するように勧められます。
■count
bamなどのファイルを、計算してwigに変換します。
■index
大きなファイル(samなど)をIGVで表示しようとすると、indexを付けるように勧められます。
| きむ | ゲノムブラウザ | 10:57 | comments(0) | trackbacks(0) |
IGV「igvtools」
キムです。
今週は、IGV(Integrative Genomics Viewer)のigvtoolsについてご紹介したいと思います。
今日は、起動方法についてお話します。

起動方法1「igvtools単体を起動させる」
igvtools_nogenomes_(バージョン番号)/IGVTools/igvtools_gui.batをクリックします。ウィンドウが立ち上がります。


起動方法2「IGVからigvtoolsを起動させる」
IGVの起動方法はこちらをご覧ください。
メニューバーの「File」をクリックして「Run igvtools...」を選択します。

ウィンドウが立ち上がります。


| きむ | ゲノムブラウザ | 09:40 | comments(0) | trackbacks(0) |
IGV「表示 5」
IGV(Integrative Genomics Viewer)の表示機能をご紹介します。

データパネル
■フィルタ
メニューバーの「Tracks」をクリックします。「Filter Tracks...」をクリックすると、「Filter Tracks」ウィンドウが立ち上がります。
条件を設定します。
「+」をクリックすると、条件を増やすことが出来ます。


「Show All Tracks」をチェックすると、設定した条件は保持したまま、すべてのサンプルを表示することが出来ます。
| きむ | ゲノムブラウザ | 09:20 | comments(0) | trackbacks(0) |
IGV「セッションの保存」
IGV(Integrative Genomics Viewer)の保存機能についてご紹介します。

xmlで保存する
メニューバーの「File」をクリックします。「Save Session...」をクリックすると、「Save Session」ウィンドウが立ち上がります。
お好きな名前(デフォルトはigv_session.xml)で保存します。

開くには、「Open Session...」をクリックして、xmlを選択します。
続けて編集を行えます。

pngで保存する
画像として保存もできます。
メニューバーの「File」をクリックします。「Save Image...」をクリックすると、「Snapshot File」ウィンドウが立ち上がります。
お好きな名前(デフォルトはigv_snapshot.png)で保存します。
| きむ | ゲノムブラウザ | 09:58 | comments(2) | trackbacks(0) |
IGV「リファレンスゲノム」
今日は、IGV(Integrative Genomics Viewer)のリファレンスゲノムについてお話します。
用意されている配列はこちらです。
http://www.broadinstitute.org/software/igv/Genomes

ツールバーでゲノムを選択します。
まず、Human hg18を選択しました。

遺伝子名(KCNQ1)を入力しましょう。
「Go」をクリックすると、遺伝子に飛びます。
自動的に、遺伝子名から位置情報に変わります。
KCNQ1 → chr11:2,422,797-2,826,916


もちろん位置情報から飛ぶこともできます。
RefSeq genesトラックに遺伝子名が表示されています。
カーソルをエクソン上で停止させると、エクソンの情報が表れます。

次に、E.coli K12 MG1655 U00096.2を選択します。

Geneトラックに遺伝子名が表示されませんね。
Humanと違って、このままでは遺伝子名から飛ぶことはできないようです。
位置情報から飛ぶことは出来ます。
U00096.2:421,739-423,556

| きむ | ゲノムブラウザ | 12:32 | comments(0) | trackbacks(0) |
IGV「表示 4」
IGV(Integrative Genomics Viewer)の表示機能をご紹介します。
第4回目になりました。

データパネル
■グループで束ねる
メニューバーの「Tracks」をクリックします。「Group Tracks...」をクリックすると、「Group By Attribute」ウィンドウが立ち上がります。
束ねる基準を選びます。



■ラインを引く
メニューバーの「View」をクリックして、「Preferences...」を選択します。「Charts」タブの「Draw Top Border」および「Draw Bottom Border」をチェックします。



これまでの表示機能紹介はこちらです。
IGV「表示 」:データ入力、グラフの種類、Yラベル
IGV「表示 2」:トラックの高さ、属性パネル
IGV「表示 3」:サンプルパネル
| きむ | ゲノムブラウザ | 09:43 | comments(0) | trackbacks(0) |
IGV「表示 3」
前回に引き続き少し脱線して、私がよく使うIGVの表示機能をご紹介します。

サンプルパネル
■移動する
サンプルをクリックする。
ドラッグ&ドロップで移動する。
■ソートする
メニューバーの「Tracks」をクリックします。「Sort Tracks...」をクリックすると、「Sort」ウィンドウが立ち上がります。
ソートする基準を選びます。昇順または降順をチェックします。
| きむ | ゲノムブラウザ | 18:09 | comments(0) | trackbacks(0) |
IGV「表示 2」
今回のテーマは「GWASの解析結果をIGVで見ましょう」です。
入力したCNファイル(mynah.sorted.cn)は、縦に238304SNP、横に2つの解析結果(SNPごとのP値)が並ぶファイルです。

今日は少し脱線して、私がよく使う表示機能をご紹介します。

トラックの高さ
■指定する
属性パネルのカラーバーを右クリックします。「Change Track Height...」をクリックすると、ウィンドウが立ち上がります。数字を入力します。

■画面いっぱいにする
メニューバーの「Tracks」をクリックして、「Fit Data to Window」をクリックします。


属性パネル
■表示しない
メニューバーの「View」をクリックして、「Show Attribute Display」のチェックをはずします。
■一部を表示しない
メニューバーの「View」をクリックして、「Show Attribute Display」をチェックをします。「Select Attributes to Show...」をクリックすると、ウィンドウが立ち上がります。表示しない項目のチェックをはずします。
| きむ | ゲノムブラウザ | 11:06 | comments(0) | trackbacks(0) |
IGV「表示」
今回のテーマは「GWASの解析結果をIGVで見ましょう」です。
これまで、
1.ダウンロード

2.起動

3.CNファイル入力

を行いました。
入力したファイル(mynah.sorted.cn)は、縦に238304SNP、横に2つの解析結果(SNPごとのP値)が並ぶファイルでした。

今日は、データを見やすく表示させたいと思います。
画面操作については、こちらをご覧ください。

step1
対象を選択します。
ふたつのサンプルを選択するには、
・サンプルパネルのサンプルを「Ctrl」+クリック
・属性パネルのカラーバーを右クリック
する方法があります。選択されたサンプルは灰色になります。
step2
設定を行います。
対象を選択した状態で右クリックします。

下記の図の通り、チェックや設定を変更します。

さらに、メニューバーの「View」をクリックして、「Preferences...」を選択します。
「Charts」タブの「Label Y Axis」をチェックします。

このように表示されました。

お好みで調節してください。
| きむ | ゲノムブラウザ | 11:29 | comments(0) | trackbacks(0) |
IGV「画面操作 2」

と屬データパネルです。
オプションを指定しない場合は、Default Displayが表示されます。
今回のファイルは、「CN」フォーマットなので、データタイプは「Copy number」です。データタイプが「Copy number」の場合、デフォルトのオプションは
Default Graph Type :Heatmap
Default Data Range : -1.5 to 1.5
Default Colors : Blue to red
です。
詳細は「IGV Default Display」をご覧ください。downdown
http://www.broadinstitute.org/software/igv/DefaultDisplay

オプションをファイルから指定したい場合は、ファイルにTrack Lineを書き加えます。
詳細は「IGV Track Line」をご覧ください。downdown
http://www.broadinstitute.org/software/igv/TrackLine
| きむ | ゲノムブラウザ | 11:34 | comments(0) | trackbacks(0) |
IGV「画面操作」
今回のテーマは「GWASの解析結果をIGVで見ましょう」です。
先週は、下記URLのCNファイルを、IGVに入力しました。
http://www.broadinstitute.org/cancer/software/genepattern/tutorial/gp_fileformats.html
mynah.sorted.cnは、縦に238304SNP、横に2つの解析結果(SNPごとのP値)が並ぶファイルでした。

今日は、操作画面を見ます。

.肇薀奪
拡大すると見ている部分が赤枠で表示されます。
▲汽鵐廛襯僖優
ドラッグ&ドロップで順番を変えることもできます。
B粟パネル
「DATA FILE」はファイル名
「DATA TYPE」はデータフォーマット
カラーバー上で静止すると表示されます。サンプルを属性ごとに選択したい時は、カラーバーを選択すると便利です。
ぅ如璽織僖優
データパネルの説明は、次回に持ちこします。

詳細は「IGV Quick Start」をご覧ください。downdown
http://www.broadinstitute.org/software/igv/LoadTutorialData
| きむ | ゲノムブラウザ | 17:12 | comments(0) | trackbacks(0) |
IGV「ファイル入力」
今日は、下記URLのサンプルデータをIGVで表示します。
http://www.broadinstitute.org/cancer/software/genepattern/tutorial/gp_fileformats.html
CN File Format欄のmynah.sorted.cn(8.55MB)をダウンロードして保存します。
ファイルの中身を見ます。
SNP Chromosome PhysicalPosition MYNAH_p_Affy_plate_9_Mapping250K_Sty_A02_49084 MYNAH_p_Affy_plate_9_Mapping250K_Sty_A04_49116
SNP_A-1909444 1 792429 2.524 2.792
SNP_A-2237149 1 817376 2.104 2.238
SNP_A-4303947 1 819185 2.448 1.472
SNP_A-2236359 1 832343 2.145 1.869
SNP_A-2205441 1 839326 2.197 1.941
SNP_A-2116190 1 1043552 2.464 1.602
縦に238304SNP、横に2つの解析結果(SNPごとのP値)が並んでいます。

step1
igv_win.batをクリックしてIGVを起動します。
step2
メニューバーの「File」をクリックして、「Load from File」を選択します。

Select Filesウィンドウが立ち上がるので、ファイルを選択します。

step3
データが表示されました。


来週に続きます。
| きむ | ゲノムブラウザ | 09:53 | comments(0) | trackbacks(0) |
IGV「CNファイル作成」
今週は、IGV(Integrative Genomics Viewer)のダウンロード起動について
書きました。

今回のテーマは「GWASの解析結果をIGVで見てみましょう」です。
フォーマットは、シンプルな「CN File Format」を使用します。
タブ区切りのファイルです。
SNP(tab)Chromosome(tab)PhysicalPosition(tab)Study1(tab)Study2(tab)‥
rs9442372(tab)1(tab)1008567(tab)0.5(tab)0.12(tab)‥
rs6687776 (tab)1(tab)1020428(tab)0.6(tab)0.2(tab)‥
縦にSNP、横に解析結果(SNPごとのP値)を並べます。

詳しくはこちら
http://www.broadinstitute.org/cancer/software/genepattern/tutorial/gp_fileformats.html
| きむ | ゲノムブラウザ | 17:49 | comments(0) | trackbacks(0) |
IGV「起動」
今日は、IGV(Integrative Genomics Viewer)の起動方法についてお話します。

step1
Windowsの場合は、IGV_(バージョン番号)フォルダのigv_win.batをクリックします。cmd.exeが立ち上がり、ステータスバーが表示されます。

step2
十数秒待っていると、IGVのウィンドウが立ち上がります。


うまく起動しない場合は、以下のURLで、Javaのバージョンと、コンピュータで動作しているかを確認しましょう。
http://www.java.com/ja/download/help/testvm.xml

おまけ「ショートカット作成」
IGV_(バージョン番号)フォルダのigv_win.batを右クリックして、「ショートカットの作成」を選択します。赤枠のショートカットをデスクトップに移動しましょう。

これでスムーズに起動できるようになります。
| きむ | ゲノムブラウザ | 09:46 | comments(0) | trackbacks(0) |
IGV「ダウンロード」
今日は、IGV(Integrative Genomics Viewer)のダウンロード方法についてお話します。

step1
Broad InstituteのIGVページを開きます。
http://www.broadinstitute.org/software/igv/
step2
赤枠の部分から登録して、ダウンロードします。
IGV_(バージョン番号).zipを展開して、任意の場所に配置してください。

step3
Java5.0以上が必要なので、インストールします。
Windowsの場合は、IGV_(バージョン番号)フォルダのigv_win.batをクリックすると起動します。
詳細は、IGV_(バージョン番号)フォルダのreadme.txtをご覧ください。
| きむ | ゲノムブラウザ | 18:48 | comments(0) | trackbacks(0) |
ゲノムブラウザのご紹介「IGV 2」
以前IGVについて、少しだけ紹介しました。
今日からは、GWASの解析結果をIGVで見てみましょうというテーマで書いていきます。
次世代のデータに関しては、おいおい説明させていただくということで・・・
大まかな流れは下記のとおりです。

■IGV(Integrative Genomics Viewer)
IGVをダウンロード
http://www.broadinstitute.org/software/igv/
■Java
Javaをインストール
http://www.java.com/ja/
■入力ファイル作成
使用したフォーマットは「CN File Format」
http://www.broadinstitute.org/cancer/software/genepattern/tutorial/gp_fileformats.html
■IGVで表示
| きむ | ゲノムブラウザ | 19:41 | comments(0) | trackbacks(0) |
ゲノムブラウザについて(番外編)
弊社のキムが連載している「ゲノムブラウザ」についてのブログ記事が
ご好評をいただいております。
たくさんのアクセスを頂き、本当に嬉しいです。
ありがとうございます。


ゲノムマップを閲覧するビューアーのニーズは10年以上前からありましたが、ヒトゲノムのドラフト配列が決まった2000年ごろから特に必要性が高まっています。

全ゲノム領域を対象とした研究・解析が進展し、ゲノムのアノテーションが充実してきている今日では、その重要性は益々高まるばかりです。


そうした背景があるため、UCSCが公開している「Genome Browser」は多くの研究者の支持を集めて、業界標準ビューアーの一つになっています。

他にも、遺伝子発現を測定するマイクロアレイチップで有名なAffymetrix社が自社チップのユーザー向けに提供し始め、今ではオープンソースになっているIGBが、以前からのユーザーの根強い支持を集めています。

最近では、Broad Instituteが公開するIGVにも注目が集まり、幅広い入力ファイル形式に対応することで、支持を集めています。

サーバー組み込み用途では、GBrowseやJBrowseなどのオープンソースが存在し、メジャー・マイナー・特定用途など多くの種類のゲノムブラウザが世に出ています。


商用ソフトも多く、オープンソースには無い機能を追加するなど、各社がしのぎを削っているのが現状です。


弊社としては、オープンソースのビューアーを第一候補としてお客様(メインは公的研究機関の研究者)にご提案していますが、用途に応じて研究室内でのサーバー構築や、商用ソフトのご紹介をさせていただいております。

今回のブログ記事が、少しでもみなさまのお役に立てましたら幸いです。
| 社長 | ゲノムブラウザ | 21:41 | comments(0) | trackbacks(0) |
ゲノムブラウザのご紹介「IGV(Integrative Genomics Viewer)」
今日は、IGV(Integrative Genomics Viewer)をご紹介したいと思います。
IGVは、米Broad Instituteによって作成されたゲノムブラウザです。
Javaで作成されているので、使用する際はJavaをインストールしておく必要があります。サイトはこちらです。


画面はこんな感じです。


魅力的な点は、
1.複数のファーマットに対応
2.インターフェースが直感的
3.クローズドの環境で使える
でしょうか。

1.複数のファーマットに対応
GFF,WIG,BED,FASTAなど、なんと26種類ほどのファーマットに対応しています。

2.インターフェースが直感的
染色体のアウトラインを、マウスでがしがしスピーディーに動かせるのでストレスフリーです。

3.クローズドの環境で使える
データが流出する心配がないので、セキュリティの面では安心かと思います。
あらかじめいくつかのアノテーションが登録されています。
あとは、必要なアノテーションを準備すれば快適にご使用いただけると思います。


| きむ | ゲノムブラウザ | 18:35 | comments(0) | trackbacks(0) |
UCSC Genome Browser「続・CNVデータのカスタムトラックを作成する2」
一昨日は、UCSC GenomeBrowserでCNVデータのカスタムトラックを作成しました。今日は、図を少しアレンジしたいと思います。

通常ヒトの細胞には、父由来と母由来の2コピーの遺伝子があると考えられていますが、実際は遺伝子のコピー数が、1コピー以下に減ったり、3コピー以上に増えたりしていることがわかっています。このように、個人によってコピー数の違うゲノム領域のことを、CNV(Copy Number Variation:コピー数多型)と呼んでいます。疾患に関与するCNVもありますが、健康なヒト同士の細胞を比較しても、CNVに違いがあることから、個人差に関与する遺伝的要因のひとつとしても注目されています。


上の図では、1サンプルのデータを、2種類のカスタムトラックで表示しました。
「Tsp1_dup」トラックが重複、「Tsp1_del」トラックが欠失を示しています。2コピーを基準にして、+1だと3コピー、-1だと1コピーと考えてください。


次に、2サンプル分を並べて、共通する部分のカバレージを表示しました。

さらに、表示を工夫してみます。
Custom Tracksで、重複はhide、欠失はdenseを、クリックメニューから選択します。各トラックの名前をクリックすると詳細な設定もできます。
refreshボタンをクリック

さっぱりしましたね。
manage custom tracksボタンをクリックすると、一括削除も簡単に行えます。

特定の遺伝子にフォーカスしたい時や、コントロールやデータベースと比較したい時には、多様なアノテーション情報を活用できるUCSC GenomeBrowserはやはり魅力的だなと思います。
| きむ | ゲノムブラウザ | 09:11 | comments(0) | trackbacks(0) |
UCSC Genome Browser「続・CNVデータのカスタムトラックを作成する1」
昨日は、CNVデータのカスタムトラックを作成しました。
bedGraphフォーマットでデータを入力しましたね。
track type=bedGraph name="Tsp1_dup" yLineOnOff=on yLineMark=0.0 description=" " visibility=full color=200,100,0 altColor=200,50,0
chr7 68270187 68554976 1
chr7 69651527 69890581 1
chr7 69978722 70178645 1
track type=bedGraph name="Tsp1_del" yLineOnOff=on yLineMark=0.0 description=" " visibility=full color=0,100,200 altColor=0,50,200 alwaysZero=on
chr7 67496309 67572164 -1
chr7 67668947 68117798 -1
chr7 69361800 69562000 -1
browser position chr7:67495000-70179700
1行のヘッダと4列のデータのシンプルなフォーマットですね。
最後の1行はこのポジションに飛んで!!という意味です。
browser position chr7:67495000-70179700

入力しない場合は、データ部分1行目のポジションに飛ぶようです。

書かなくても問題ありませんが、見たい範囲が決まっている場合は便利です。
遺伝子名で指定することもできます。
browser position AUTS2

すばらしい!!
| きむ | ゲノムブラウザ | 10:18 | comments(0) | trackbacks(0) |
UCSC Genome Browser「CNVデータのカスタムトラックを作成する」
1.UCSC のサイトにアクセスして、Genome Browserに移動
Genome Browserボタンをクリック


2.カスタムトラックを作成
manage custom tracksボタンをクリック


3.ゲノム情報を選択
clade、genome、assemblyをクリックメニューから選択


4.データを入力
track type=bedGraph name="Tsp1_dup" yLineOnOff=on yLineMark=0.0 description=" " visibility=full color=200,100,0 altColor=200,50,0
chr7 68270187 68554976 1
chr7 69651527 69890581 1
chr7 69978722 70178645 1
track type=bedGraph name="Tsp1_del" yLineOnOff=on yLineMark=0.0 description=" " visibility=full color=0,100,200 altColor=0,50,200 alwaysZero=on
chr7 67496309 67572164 -1
chr7 67668947 68117798 -1
chr7 69361800 69562000 -1
browser position chr7:67495000-70179700
bedGraphフォーマットを使用します。
コピー&ペーストして試す際は、最後の行末の改行を削除してください。

submitボタンをクリックすると、カスタムトラックの情報が表示されます。

go to genome browserボタンをクリック

5.結果表示


みなさん、上手くカスタムトラックが表示されましたか??
| きむ | ゲノムブラウザ | 18:49 | comments(0) | trackbacks(0) |
ゲノムブラウザのご紹介「UCSC Genome Browser」
今日は、米国カリフォルニア大学サンタクルーズ校(UCSC)のBioinformatics Teamによって開発・運用されている「UCSC Genome Browser」について、簡単にご紹介したいと思います。

魅力的な点は、
1.検索が高速
2.多様なアノテーション
3.データベースと連携したコンテンツ

でしょうか。

2.多様なアノテーション
多岐にわたるアノテーションが準備されており、目的に応じてカスタマイズできるので便利です。
リファレンス配列も充実していて、ヒトゲノムだけで4種類ありますので
GRCh37/hg19 (2009)
NCBI 36/hg18 (2006)
NCBI 35/hg17 (2004)
NCBI 34/hg16 (2003)
過去のデータを見る時は、特に頼もしい存在かと思います。

3.データベースと連携したコンテンツ
BLAT :高速アライメント
VisiGene :in situ ハイブリダイゼーションの画像閲覧
Gene Sorter :遺伝子発現パターン、アミノ酸配列、GO(Gene Ontology)等の類似度に基づいてソート
Genome Graphs :ゲノムワイドなデータのセットを複数アップロードして表示
など、思わず試してみたくなるコンテンツが勢ぞろいです。
使い方は、ライフサイエンス統合データベースセンター(DBCLS)が発信している統合TVをご覧いただくと、理解しやすいかと思います。

明日は、「CNVデータのカスタムトラックを作成する」作業に焦点を絞ってお話します。
| きむ | ゲノムブラウザ | 18:14 | comments(0) | trackbacks(0) |
ゲノムブラウザのご紹介
キムです。
お久しぶりです。

明日から、「UCSC GenomeBrowser」と「IGV(Integrative Genomics Viewer)」を使って、いろいろなデータを表示していきたいと思います。

・UCSC GenomeBrowser
http://genome.ucsc.edu/

・IGV(Integrative Genomics Viewer)
http://www.broadinstitute.org/igv/

目標は、「直観的かつ正確な理解の手助けとなるように表示方法を工夫する」です。

至らない点などございましたら、ご指摘いただけますと大変助かります。
どうぞよろしくお願いします!!
| きむ | ゲノムブラウザ | 17:19 | comments(0) | trackbacks(0) |
1234567
891011121314
15161718192021
22232425262728
293031    
<< January 2017 >>

このページの先頭へ