アメリエフのブログ

バイオインフォマティクスの紹介と社員の日々
GISTIC解析
きむです。
本日は、GISTIC解析についてご紹介します。

GISTICとは、ヒトのがん細胞における Somatic Copy-Number Alterations( SCNAs )を検出するためのツールです。

論文はこちらです。
GISTIC2.0 facilitates sensitive and confident localization of the targets of focal somatic copy-number alteration in human cancers.

結果として、下記のような図や、アノテーション付けされたファイルが出力されます。
GISTIC

GISTIC
| きむ | CNV解析 | 09:55 | comments(0) | trackbacks(0) |
DNAcopy
tokunagaです。

前回はgenoCNというパッケージについてご紹介させていただきましたが、
本日もSNPジェノタイピングアレイを用いたCNV検出ツールにつきまして簡単にご紹介をしたいと思います。

RのBioconductorのパッケージのDNAcopyです。

genoCNはHidden Markov Model(HMM)でしたが、今回はCircular Binary Segmentation(CBS)というアルゴリズムを使ってDNAのコピー数異常を検出するツールです。
下記のようなプロット図を作成することが出来ます。



染色体ごとのプロット図



また機会がありましたらCNV解析ツールのご紹介いたします。
| tokunaga | CNV解析 | 09:19 | comments(0) | trackbacks(0) |
CNV検出ツールのご紹介
tokunagayです。

本日はSNPジェノタイピングアレイを用いたCNV検出ツールのご紹介をしたいと思います。
RのBioconductorのパッケージのgenoCNです。

genoCNに関する論文では、以前ブログでご紹介したことのあるPennCNVとの比較も行われています。

個々のcopy number variants(CNVs)の検出だけでなく、ケース・コントロールがある場合はコントロールのジェノタイプを考慮したcopy number aberrations (CNAs)の検出も出来るのが特徴です。
下記のような図も出力することが出来ます。



Illumina、Affymetrix、どちらのSNPジェノタイピングアレイにも対応しているようです。
また機会がありましたら詳しい使い方などをご紹介したいと思います。
| tokunaga | CNV解析 | 11:46 | comments(0) | trackbacks(0) |
PennCNVがマイナーバージョンアップしてます
弊社でCNV解析に主に利用している「PennCNV」ですが、頻繁にバージョンアップ(マイナーな機能追加)がされています。

8月のバージョンアップでは、画像の出力がフォローされたようです。
加えて、イルミナ社のアレイチップ「HumanCytoSNP12 V1」と「HumanOmni1 QuadV1」という人気のチップに最適化した設定ファイルも用意されたようです。

ある程度の頻度できちんとメンテナンスされているプログラムというのは信頼できますね。
| 社長 | CNV解析 | 23:39 | comments(0) | trackbacks(0) |
CNV解析 -CNVデータの比較-
先週から、100検体のSNPジェノタイピングアレイデータをCNV解析する方法について、少しずつ紹介してきました。
50人の患者さんから、100検体(腫瘍細胞50検体+正常細胞50検体)をそれぞれ採取したと想定して、まずサンプル99HI0698C(腫瘍細胞)のジェノタイピング結果について解析を行いました。

無事にデータが得られましたでしょうか??
3 37957465 37961253 1 99HI0698C.txt rs9837352 rs9844203 NA 3
3 75511365 75650909 1 99HI0698C.txt rs4677005 rs2004089 NA 7
3 153830172 153837935 1 99HI0698C.txt rs2203686 rs1517241 NA 6
(上の例は、「CNV解析 -ファイルの形式-」で紹介した「99HI0698C.cnv.txt」の中身です)

問題はここからですね。

第一に、今はまだひとつのサンプルしか解析していませんので、残りの99検体をどう処理するかです。
複数のファイルを同時に扱うこともできるのでしょうか??
「99HI0698C.txt」と「99HI0698T.txt」の解析結果を、「99HI0698.rawcnv」に出力します。
detect_cnv.pl -test -hmm /Users/penncnv/lib/hh550.hmm -pfb /Users/penncnv/lib/hh550.hg18.pfb -log /Users/CNV/99HI0698.log -out /Users/CNV/99HI0698.rawcnv -gcmodel /Users/penncnv/lib/hhall.hg18.gcmodel 99HI0698C.txt 99HI0698T.txt

実際のデータによっては「WARNING」が表示される(99HI0698.logにも記録されます)サンプルもあると思いますので、上記の方法で一気に行うのが効率が良いかと言われると、そうでもない気がします・・。

第二に、出力されたCNVデータをどう比較するかです。
正常細胞と腫瘍細胞を比較したり、サンプル間で比較したりと、いろいろ試したいですね。

アメリエフではこれらの問題を、自動化したり独自のアルゴリズムを作成することで解決しています。

アメリエフのサービスページはこちらです。


【参考】
・PennCNV
http://www.openbioinformatics.org/penncnv/

ブログランキングに参加しています。
花の金曜日に予定のない私に、お恵みの一票をお願いします♪
   downdowndown
医学人気ブログランキング
| きむ | CNV解析 | 11:39 | comments(0) | trackbacks(0) |
CNV解析 -フィルタ機能-
CNV解析 -CNV領域を決定する1-で、腫瘍細胞から得たサンプル99HI0698Cのジェノタイピング結果について解析を行いました。

今日はフィルタ機能を使います。
$ filter_cnv.pl
と入力しEnterキーを押すと、Usageが表示されます。
一通りのオプションを設定できるようなので、さっそく試してみたいと思います。

まずはじめに、出力されたデータ「99HI0698C.rawcnv」から、numsnpが10以上でlengthが50k以上のCNVのみを抽出して、「filter99HI0698C.rawcnv」に出力します。
$ filter_cnv.pl -numsnp 10 -length 50k 99HI0698C.rawcnv -output filter99HI0698C.rawcnv
うまく「filter99HI0698C.rawcnv」ファイルが作成されましたか??

次に、下のコマンドを実行してみます。
$ filter_cnv.pl 99HI0698C.rawcnv -qclogfile 99HI0698C.log -qclrrsd 0.35 -qcpassout filter99HI0698C.qcpass -qcsumout filter99HI0698C.qcsum -output filter99HI0698C.goodcnv

NOTICE: the --qcbafdrift argument is set as 0.01 by default
NOTICE: the --qcwf argument is set as 0.05 by default
            :
と表示されます。
ちなみに、「-qclrrsd 」を指定しなかった場合は、
NOTICE: the --qclrrsd argument is set as 0.3
となります。

「-qcpassout」により出力されたデータ「filter99HI0698C.qcpass」は、
カラム数は1つで
File
です。

「-qcsumout」により出力されたデータ「filter99HI0698C.qcsum」は、
カラム数は10で
File
LRR_mean, LRR_median, LRR_SD
BAF_mean, BAF_median, BAF_SD, BAF_drift
WF
NumCNV
です。

明日は、さらに解析を進めたいと思います。

【参考】
・PennCNV
http://www.openbioinformatics.org/penncnv/

ブログランキングに参加しています。
ポチっと押していただけると、明日はニコニコで出社できそうです!
   downdowndown
医学人気ブログランキング
| きむ | CNV解析 | 17:03 | comments(0) | trackbacks(0) |
CNV解析 -ファイルの形式-
CNV解析 -CNV領域を決定する1-で、腫瘍細胞から得たサンプル99HI0698Cのジェノタイピング結果について解析を行いました。

出力されたデータ「99HI0698C.rawcnv」を見ていきます。

chr3:37957465-37961253 numsnp=3 length=3,789 state2,cn=1 99HI0698C.txt startsnp=rs9837352 endsnp=rs9844203
chr3:75511365-75650909 numsnp=7 length=139,545 state2,cn=1 99HI0698C.txt startsnp=rs4677005 endsnp=rs2004089
chr3:153830172-153837935 numsnp=6 length=7,764 state2,cn=1 99HI0698C.txt startsnp=rs2203686 endsnp=rs1517241
chr11:81181640-81194909 numsnp=9 length=13,270 state2,cn=1 99HI0698C.txt startsnp=rs7947005 endsnp=rs12293984
         :
         :
見にくいので、ファイルの内容を書き出してみます。
Chr, Start, end
numsnp
length
state, Copy number
txt
start SNP
End SNP

出力されたデータ「99HI0698C.rawcnv」を、テキストファイルに変更することもできます。
$ convert_cnv.pl -intype penncnv -outtype tab 99HI0698C.rawcnv > 99HI0698C.cnv.txt
タブ区切りのファイル「99HI0698C.cnv.txt」が作成されましたか??

3 37957465 37961253 1 99HI0698C.txt rs9837352 rs9844203 NA 3
3 75511365 75650909 1 99HI0698C.txt rs4677005 rs2004089 NA 7
3 153830172 153837935 1 99HI0698C.txt rs2203686 rs1517241 NA 6
内容を書き出してみます。
Chr
Start
end
length
Copy number
txt
start SNP
End SNP
Confidence score
numsnp

作成されない場合や他の形式で作りたい場合は、
$ convert_cnv.pl
と入力しEnterキーを押すと、Usageが表示されます。


【参考】
・PennCNV
http://www.openbioinformatics.org/penncnv/

ブログランキングに参加しています。
ポチっと押していただけると、ジメジメ気分が吹っ飛びます!
   downdowndown
医学人気ブログランキング

| きむ | CNV解析 | 10:01 | comments(0) | trackbacks(0) |
CNV解析 -CNV領域を決定する2-
CNV解析 -CNV領域を決定する1-で、腫瘍細胞から得たサンプル99HI0698Cのジェノタイピング結果について解析を行いました。

入力したコマンドを詳しく見ていきます。

detect_cnv.pl -test -hmm /Users/penncnv/lib/hh550.hmm -pfb /Users/penncnv/lib/hh550.hg18.pfb -log /Users/CNV/99HI0698C.log -out /Users/CNV/99HI0698C.rawcnv -gcmodel /Users/penncnv/lib/hh550.hg18.gcmodel 99HI0698C.txt


HMM fileのHMMは「Hidden Markov Model」の略で、CNVのCopy numberを推定するためのモデルです。
詳しくはこちらをご覧ください。

PFB fileのPFBは「Population frequency of B allele」の略で、その名の通りmarkerのBアレル頻度や位置情報のファイルです。

GCModel fileは、markerの前後500kbのGC含有量情報を含んだファイルです。genomic waveの影響の補正を行います。詳しくはこちらをご覧ください。
算出されたWF(wave factor) valueとGCWF valueは、「99HI0698C.log」で確認することができます。

3つのファイルは、それぞれ2種類があります。

hh550.hmm
hh550.hg18.pfb
hh550.hg18.gcmodel

hhall.hmm
hhall.hmm.pfb
hhall.hmm.gcmodel

お使いのジェノタイピングアレイに合わせて選択してください。

明日は、出力されたファイル「99HI0698C.rawcnv」を見ていきます。

【参考】
・PennCNV
http://www.openbioinformatics.org/penncnv/

ブログランキングに参加しています。
もしよろしければ、どうぞ一押しお願いします。
   downdowndown
医学人気ブログランキング


| きむ | CNV解析 | 15:26 | comments(0) | trackbacks(0) |
CNV解析 -CNV領域を決定する1-
100検体のSNPジェノタイピングアレイデータを、CNV統計解析ソフト「PennCNV」を使って、解析していきたいと思います。
50人の患者さんから、100検体(腫瘍細胞50検体+正常細胞50検体)をそれぞれ採取したと考えます。
まず、サンプル99HI0698C(腫瘍細胞)のジェノタイピング結果について解析を行います。

細かい流れは、こちらの図をご覧ください。

1.入力するデータファイル「signal intensity file」の作成
ファイル名は「99HI0698C.txt」で、CNVフォルダに配置しました。
Name Chr Position 99HI0698C.GType 99HI0698C.Log R Ratio 99HI0698C.B Allele Freq
rs13072188 3 38411 AA 0.1042794 0
rs9681213 3 41894 BB 0.07361082 0.9804617
rs1516321 3 57010 AA 0.06956207 0.01255646
rs1400176 3 70973 BB -0.2123737 0.9924203
         :
         :
(上の例はexampleフォルダのfather.txtの中身です)

2.CNV解析の実行
以下のコマンドを入力します。
$ detect_cnv.pl -test -hmm /Users/penncnv/lib/hh550.hmm -pfb /Users/penncnv/lib/hh550.hg18.pfb -log /Users/CNV/99HI0698C.log -out /Users/CNV/99HI0698C.rawcnv -gcmodel /Users/penncnv/lib/hh550.hg18.gcmodel 99HI0698C.txt


3.出力されるデータ
プログラムを実行したフォルダに、「99HI0698C.log」と「99HI0698C.rawcnv」がちゃんと作成されましたか??
chr3:37957465-37961253 numsnp=3 length=3,789 state2,cn=1 99HI0698C.txt startsnp=rs9837352 endsnp=rs9844203
chr3:75511365-75650909 numsnp=7 length=139,545 state2,cn=1 99HI0698C.txt startsnp=rs4677005 endsnp=rs2004089
chr3:153830172-153837935 numsnp=6 length=7,764 state2,cn=1 99HI0698C.txt startsnp=rs2203686 endsnp=rs1517241
chr11:81181640-81194909 numsnp=9 length=13,270 state2,cn=1 99HI0698C.txt startsnp=rs7947005 endsnp=rs12293984
         :
         :

来週は、コマンドの内容と、出力結果を詳しく見ていきます。
| きむ | CNV解析 | 18:10 | comments(0) | trackbacks(0) |
CNV解析 -PennCNVの使い方2-
今日は、スタートガイドを見ながら、CNV統計解析ソフト「PennCNV」を使用していきます。

ここでは、Linux(CentOS 5.4 64bit)を使用して、コマンドラインで行います。

サンプルデータを見ていきましょう。
exampleフォルダの中に「runex.pl」プログラムがあります。
$ perl runex.pl

と入力しEnterキーを押すと以下のように表示されます。
Usage:
runex.pl <1|2|3|4|5|6|7|8|9|10|11|12>

Optional arguments:
-v, --verbose use verbose output
-h, --help print help message
-m, --man print complete documentation
--path_detect_cnv path to detect_cnv.pl
--path_visualize_cnv path to visualize_cnv.pl
--path_convert_cnv path to convert_cnv.pl
--path_filter_cnv path to filter_cnv.pl
--path_compare_cnv path to compare_cnv.pl

Function: test-drive PennCNV and related scripts in your system

Example: runex.pl 1 (run PennCNV to call CNV on three signal files)
runex.pl 2 (run posterior CNV calling algorithm on a trio)
runex.pl 3 (run PennCNV with GCmodel adjustment of signal intensity)
runex.pl 4 (validation-based CNV calling on a candidate region)
runex.pl 5 (validation-based CNV calling on all candidate regions in a file)
runex.pl 6 (run joint CNV calling on a trio)
runex.pl 7 (convert CNV call to BED format)
runex.pl 8 (convert CNV call to tab-delimited format)
runex.pl 9 (convert tab-delimited calls to PennCNV format)
runex.pl 10 (filter CNV and print out a subset of calls)
runex.pl 11 (compare CNV calls on duplicated samples)
runex.pl 12 (compare CNV calls on same sample called by different algorithms)
runex.pl 13 (generate CNV-based genotype calls)
runex.pl 14 (validate de novo CNV calls and assign a P-value)
是非、興味のある例をお試しください。
下のように入力すると、コマンドの例など詳しい情報が表示されます。
$ perl runex.pl 1

実際には、実験系(BeadStudio等)から出力されるデータを入力用に変換する必要があります。変換する方法はここに書いてありますのでご参考になさってください。

入力用ファイルは検体ごとに作成する必要があり、
カラムは5つで
Name
Chr
Position
GType
Log R Ratio
B Allele Freq
です。

では、明日は実際の解析を想定してPennCNVを使用していきたいと思います。


ブログランキングに参加しています。
もしよろしければ、ぽちっとお願いします。
医学人気ブログランキング



| きむ | CNV解析 | 18:10 | comments(0) | trackbacks(0) |
CNV解析 -PennCNVの使い方1-
今日からは、CNV統計解析ソフト「PennCNV」を使用します。

PennCNVは、SNPジェノタイピングアレイからコピー数多型(CNV:copy number variation)解析を行えるフリーのソフトウェアツールです。
Illumina社とAffymetrix社の各種アレイデータの解析が行えます。



まず、こちらから圧縮されたプログラムをダウンロードします。
新しいバージョンが2010年5月1日に公開されたようですね。

次に、インストールします。
ご使用のOSに合った方法を参照してください。

明日は、スタートガイドを見ながら試してみます。


ブログランキングに参加しています。
もしよろしければ、どうぞ一押しお願いします。
   downdowndown
医学人気ブログランキング

| きむ | CNV解析 | 15:54 | comments(0) | trackbacks(0) |
  12345
6789101112
13141516171819
20212223242526
27282930   
<< April 2014 >>

このページの先頭へ