アメリエフのブログ

バイオインフォマティクスの紹介と社員の日々
夏バテ予防
キムです。
お久しぶりです。

専門的なお話を、ひと休みもふた休みもさせていただいておりますが、
今日はまさかの食べ物のお話です。

我が家の、夏の料理の定番と言えば「レングッ」です。
「レングッ」とは朝鮮語で「冷たいスープ」という意味です。
涼しげなガラスの器に、きゅうりとワカメと氷が浮いてる光景を見ると、
なんだかノスタルジーを感じます。

粗びき唐辛子が一面に浮いていますが、怖気づくことはありません!!
勇気を出して飲んでしまえば、ピリリと辛くて爽快です。
ちなみに、具がニラだったり、唐辛子が控えめだったり、ご家庭によっていろいろ個性があるようです。

外食先で「レングッ」というメニューを見つけたら、是非頼んでみてくださね。

みなさま、今月もおつかれさまでした。
明日から7月!夏本番ですね。
モリモリ食べて元気に乗り切りましょう!!

ブログランキングに参加しています。
是非一票お願いします。
  downdowndown
医学人気ブログランキング

| きむ | よもやま話 | 16:46 | comments(0) | trackbacks(0) |
もしドラ
キムです。

アメリエフの書籍棚に今うわさの「もしドラ」がやってきました!!

ビジネスコーナーに平置きされている少女アニメっぽい表紙の本。
電子版も大人気!という電車の広告。
そりゃもう気になってました。

「もし高校野球の女子マネージャーがドラッカーの『マネジメント』を読んだら」(通称:もしドラ)は出版不況と言われる中、すでに80万部も売り上げているというビジネス書です。

内容はまさにタイトルの通り、P.F.ドラッカーの「マネジメント」を読みながら、高校野球の女子マネージャーが奮闘する物語です。
「マネジメント」と「女子マネージャー」という不自然な組み合わせが、「マネジメント」が語っている真理を際立たせるところが、なんとも面白い。

最近手に入れたエコポイントで、P.F.ドラッカーの「マネジメント」を購入しようかなと考えています。
もちろん、感謝を込めてダイヤモンド社のものをと思っています 笑。


ブログランキングに参加しています。
もしよろしければ、どうぞ一押しお願いします。
   downdowndown
医学人気ブログランキング

| きむ | 書籍の紹介 | 10:55 | comments(0) | trackbacks(0) |
医療情報のデータマイニング
今日は、統計解析パッケージソフト「SPSS」の年に一度のセミナー「SPSS Data Mining Day 2010」が渋谷であったので参加してきました。

仕事の都合もあって、午前のセッションしか聞けなかったのですが、その午前のセッションの一つに「データマイニングの医療への応用」(武蔵野赤十字病院 消化器科 部長 黒崎雅之先生)という講演がありました。


内容は、まさに私たちが取り組んでいるエビデンスにもとづく個別化医療(Personalized Medicine、オーダーメイド医療)の実施がテーマで、
1.病気の情報
2.患者さんの情報
3.治療の方法
について、それぞれデータマイニングした結果を発表されていました。

具体的には、1.の病気の情報では、ある病気の進行度合いは年齢や性別で異なることが知られているが、生化学データやその他の臨床情報も加味したデータマイニングを行うことで、どういう場合に症状が進行しやすいのかエビデンスが得られている、という発表内容でした。

SNPタイピングによるGWAS解析で、C型肝炎ウイルス除去におけるインターフェロンの効果の度合いに、ある遺伝子が関わっていることが昨年発表されたので、その情報も含めたデータマイニングをされていました。

まだまだ国内の医療は、IT化やデータ解析によるエビデンス形成に遅れをとっている分野ですので、私たちもより一層がんばって社会に貢献していきたいと、気持ちを新たにしました。


【参考】
SPSS
Genome-wide association of IL28B with response to pegylated interferon-alpha and ribavirin therapy for chronic hepatitis C
| 社長 | バイオインフォマティクス | 15:46 | comments(0) | trackbacks(0) |
梅雨入りです
キムです。

とうとう関東甲信地方も梅雨入りしましたね。
今日は専門的なお話はひと休みして、思い出話をひとつ・・・。

大学時代、友人が「キッパリ!―たった5分間で自分を変える方法」 という本を愛読していました。
自分を変えられるちょっとした行動や心がけが、4コマ漫画と短い文で説明されているお手軽な自己啓発本です。

テーマのひとつに「天気に気分を左右されない」(記憶があいまいなので、正確ではないかもしれません・・)というものがあり、心当たりがあるねとふたりで納得。
ちょうどその日は、食堂が残念な献立なのに、外は台風の影響でどしゃぶりの大雨。
すっかり啓発されたふたりは、大雨の中大笑いしながら近所の定食屋さんに走って行き、全身びしょびしょで美味しいロースかつ定食を食べました。
(おばちゃん、イスを濡らしてしまってごめんなさい)

今年の梅雨入りは、気象庁のホームページから見られます。

梅雨明けは、平年だと7月20日で、昨年は7月14日ごろだったそうです。
ちなみに、「平年」は2000年までの過去30年の日付の平均だそうです。
雨の日が、あと1カ月はつづきそうですね。

今年も、元気に梅雨を乗り切りたいと思います。

【参考】
・気象庁
http://www.jma.go.jp/jma/index.html
| きむ | 書籍の紹介 | 17:57 | comments(0) | trackbacks(0) |
CNV解析 -CNVデータの比較-
先週から、100検体のSNPジェノタイピングアレイデータをCNV解析する方法について、少しずつ紹介してきました。
50人の患者さんから、100検体(腫瘍細胞50検体+正常細胞50検体)をそれぞれ採取したと想定して、まずサンプル99HI0698C(腫瘍細胞)のジェノタイピング結果について解析を行いました。

無事にデータが得られましたでしょうか??
3 37957465 37961253 1 99HI0698C.txt rs9837352 rs9844203 NA 3
3 75511365 75650909 1 99HI0698C.txt rs4677005 rs2004089 NA 7
3 153830172 153837935 1 99HI0698C.txt rs2203686 rs1517241 NA 6
(上の例は、「CNV解析 -ファイルの形式-」で紹介した「99HI0698C.cnv.txt」の中身です)

問題はここからですね。

第一に、今はまだひとつのサンプルしか解析していませんので、残りの99検体をどう処理するかです。
複数のファイルを同時に扱うこともできるのでしょうか??
「99HI0698C.txt」と「99HI0698T.txt」の解析結果を、「99HI0698.rawcnv」に出力します。
detect_cnv.pl -test -hmm /Users/penncnv/lib/hh550.hmm -pfb /Users/penncnv/lib/hh550.hg18.pfb -log /Users/CNV/99HI0698.log -out /Users/CNV/99HI0698.rawcnv -gcmodel /Users/penncnv/lib/hhall.hg18.gcmodel 99HI0698C.txt 99HI0698T.txt

実際のデータによっては「WARNING」が表示される(99HI0698.logにも記録されます)サンプルもあると思いますので、上記の方法で一気に行うのが効率が良いかと言われると、そうでもない気がします・・。

第二に、出力されたCNVデータをどう比較するかです。
正常細胞と腫瘍細胞を比較したり、サンプル間で比較したりと、いろいろ試したいですね。

アメリエフではこれらの問題を、自動化したり独自のアルゴリズムを作成することで解決しています。

アメリエフのサービスページはこちらです。


【参考】
・PennCNV
http://www.openbioinformatics.org/penncnv/

ブログランキングに参加しています。
花の金曜日に予定のない私に、お恵みの一票をお願いします♪
   downdowndown
医学人気ブログランキング
| きむ | CNV解析 | 11:39 | comments(0) | trackbacks(0) |
CNV解析 -フィルタ機能-
CNV解析 -CNV領域を決定する1-で、腫瘍細胞から得たサンプル99HI0698Cのジェノタイピング結果について解析を行いました。

今日はフィルタ機能を使います。
$ filter_cnv.pl
と入力しEnterキーを押すと、Usageが表示されます。
一通りのオプションを設定できるようなので、さっそく試してみたいと思います。

まずはじめに、出力されたデータ「99HI0698C.rawcnv」から、numsnpが10以上でlengthが50k以上のCNVのみを抽出して、「filter99HI0698C.rawcnv」に出力します。
$ filter_cnv.pl -numsnp 10 -length 50k 99HI0698C.rawcnv -output filter99HI0698C.rawcnv
うまく「filter99HI0698C.rawcnv」ファイルが作成されましたか??

次に、下のコマンドを実行してみます。
$ filter_cnv.pl 99HI0698C.rawcnv -qclogfile 99HI0698C.log -qclrrsd 0.35 -qcpassout filter99HI0698C.qcpass -qcsumout filter99HI0698C.qcsum -output filter99HI0698C.goodcnv

NOTICE: the --qcbafdrift argument is set as 0.01 by default
NOTICE: the --qcwf argument is set as 0.05 by default
            :
と表示されます。
ちなみに、「-qclrrsd 」を指定しなかった場合は、
NOTICE: the --qclrrsd argument is set as 0.3
となります。

「-qcpassout」により出力されたデータ「filter99HI0698C.qcpass」は、
カラム数は1つで
File
です。

「-qcsumout」により出力されたデータ「filter99HI0698C.qcsum」は、
カラム数は10で
File
LRR_mean, LRR_median, LRR_SD
BAF_mean, BAF_median, BAF_SD, BAF_drift
WF
NumCNV
です。

明日は、さらに解析を進めたいと思います。

【参考】
・PennCNV
http://www.openbioinformatics.org/penncnv/

ブログランキングに参加しています。
ポチっと押していただけると、明日はニコニコで出社できそうです!
   downdowndown
医学人気ブログランキング
| きむ | CNV解析 | 17:03 | comments(0) | trackbacks(0) |
CNV解析 -ファイルの形式-
CNV解析 -CNV領域を決定する1-で、腫瘍細胞から得たサンプル99HI0698Cのジェノタイピング結果について解析を行いました。

出力されたデータ「99HI0698C.rawcnv」を見ていきます。

chr3:37957465-37961253 numsnp=3 length=3,789 state2,cn=1 99HI0698C.txt startsnp=rs9837352 endsnp=rs9844203
chr3:75511365-75650909 numsnp=7 length=139,545 state2,cn=1 99HI0698C.txt startsnp=rs4677005 endsnp=rs2004089
chr3:153830172-153837935 numsnp=6 length=7,764 state2,cn=1 99HI0698C.txt startsnp=rs2203686 endsnp=rs1517241
chr11:81181640-81194909 numsnp=9 length=13,270 state2,cn=1 99HI0698C.txt startsnp=rs7947005 endsnp=rs12293984
         :
         :
見にくいので、ファイルの内容を書き出してみます。
Chr, Start, end
numsnp
length
state, Copy number
txt
start SNP
End SNP

出力されたデータ「99HI0698C.rawcnv」を、テキストファイルに変更することもできます。
$ convert_cnv.pl -intype penncnv -outtype tab 99HI0698C.rawcnv > 99HI0698C.cnv.txt
タブ区切りのファイル「99HI0698C.cnv.txt」が作成されましたか??

3 37957465 37961253 1 99HI0698C.txt rs9837352 rs9844203 NA 3
3 75511365 75650909 1 99HI0698C.txt rs4677005 rs2004089 NA 7
3 153830172 153837935 1 99HI0698C.txt rs2203686 rs1517241 NA 6
内容を書き出してみます。
Chr
Start
end
length
Copy number
txt
start SNP
End SNP
Confidence score
numsnp

作成されない場合や他の形式で作りたい場合は、
$ convert_cnv.pl
と入力しEnterキーを押すと、Usageが表示されます。


【参考】
・PennCNV
http://www.openbioinformatics.org/penncnv/

ブログランキングに参加しています。
ポチっと押していただけると、ジメジメ気分が吹っ飛びます!
   downdowndown
医学人気ブログランキング

| きむ | CNV解析 | 10:01 | comments(0) | trackbacks(0) |
CNV解析 -CNV領域を決定する2-
CNV解析 -CNV領域を決定する1-で、腫瘍細胞から得たサンプル99HI0698Cのジェノタイピング結果について解析を行いました。

入力したコマンドを詳しく見ていきます。

detect_cnv.pl -test -hmm /Users/penncnv/lib/hh550.hmm -pfb /Users/penncnv/lib/hh550.hg18.pfb -log /Users/CNV/99HI0698C.log -out /Users/CNV/99HI0698C.rawcnv -gcmodel /Users/penncnv/lib/hh550.hg18.gcmodel 99HI0698C.txt


HMM fileのHMMは「Hidden Markov Model」の略で、CNVのCopy numberを推定するためのモデルです。
詳しくはこちらをご覧ください。

PFB fileのPFBは「Population frequency of B allele」の略で、その名の通りmarkerのBアレル頻度や位置情報のファイルです。

GCModel fileは、markerの前後500kbのGC含有量情報を含んだファイルです。genomic waveの影響の補正を行います。詳しくはこちらをご覧ください。
算出されたWF(wave factor) valueとGCWF valueは、「99HI0698C.log」で確認することができます。

3つのファイルは、それぞれ2種類があります。

hh550.hmm
hh550.hg18.pfb
hh550.hg18.gcmodel

hhall.hmm
hhall.hmm.pfb
hhall.hmm.gcmodel

お使いのジェノタイピングアレイに合わせて選択してください。

明日は、出力されたファイル「99HI0698C.rawcnv」を見ていきます。

【参考】
・PennCNV
http://www.openbioinformatics.org/penncnv/

ブログランキングに参加しています。
もしよろしければ、どうぞ一押しお願いします。
   downdowndown
医学人気ブログランキング


| きむ | CNV解析 | 15:26 | comments(0) | trackbacks(0) |
CNV解析 -CNV領域を決定する1-
100検体のSNPジェノタイピングアレイデータを、CNV統計解析ソフト「PennCNV」を使って、解析していきたいと思います。
50人の患者さんから、100検体(腫瘍細胞50検体+正常細胞50検体)をそれぞれ採取したと考えます。
まず、サンプル99HI0698C(腫瘍細胞)のジェノタイピング結果について解析を行います。

細かい流れは、こちらの図をご覧ください。

1.入力するデータファイル「signal intensity file」の作成
ファイル名は「99HI0698C.txt」で、CNVフォルダに配置しました。
Name Chr Position 99HI0698C.GType 99HI0698C.Log R Ratio 99HI0698C.B Allele Freq
rs13072188 3 38411 AA 0.1042794 0
rs9681213 3 41894 BB 0.07361082 0.9804617
rs1516321 3 57010 AA 0.06956207 0.01255646
rs1400176 3 70973 BB -0.2123737 0.9924203
         :
         :
(上の例はexampleフォルダのfather.txtの中身です)

2.CNV解析の実行
以下のコマンドを入力します。
$ detect_cnv.pl -test -hmm /Users/penncnv/lib/hh550.hmm -pfb /Users/penncnv/lib/hh550.hg18.pfb -log /Users/CNV/99HI0698C.log -out /Users/CNV/99HI0698C.rawcnv -gcmodel /Users/penncnv/lib/hh550.hg18.gcmodel 99HI0698C.txt


3.出力されるデータ
プログラムを実行したフォルダに、「99HI0698C.log」と「99HI0698C.rawcnv」がちゃんと作成されましたか??
chr3:37957465-37961253 numsnp=3 length=3,789 state2,cn=1 99HI0698C.txt startsnp=rs9837352 endsnp=rs9844203
chr3:75511365-75650909 numsnp=7 length=139,545 state2,cn=1 99HI0698C.txt startsnp=rs4677005 endsnp=rs2004089
chr3:153830172-153837935 numsnp=6 length=7,764 state2,cn=1 99HI0698C.txt startsnp=rs2203686 endsnp=rs1517241
chr11:81181640-81194909 numsnp=9 length=13,270 state2,cn=1 99HI0698C.txt startsnp=rs7947005 endsnp=rs12293984
         :
         :

来週は、コマンドの内容と、出力結果を詳しく見ていきます。
| きむ | CNV解析 | 18:10 | comments(0) | trackbacks(0) |
CNV解析 -PennCNVの使い方2-
今日は、スタートガイドを見ながら、CNV統計解析ソフト「PennCNV」を使用していきます。

ここでは、Linux(CentOS 5.4 64bit)を使用して、コマンドラインで行います。

サンプルデータを見ていきましょう。
exampleフォルダの中に「runex.pl」プログラムがあります。
$ perl runex.pl

と入力しEnterキーを押すと以下のように表示されます。
Usage:
runex.pl <1|2|3|4|5|6|7|8|9|10|11|12>

Optional arguments:
-v, --verbose use verbose output
-h, --help print help message
-m, --man print complete documentation
--path_detect_cnv path to detect_cnv.pl
--path_visualize_cnv path to visualize_cnv.pl
--path_convert_cnv path to convert_cnv.pl
--path_filter_cnv path to filter_cnv.pl
--path_compare_cnv path to compare_cnv.pl

Function: test-drive PennCNV and related scripts in your system

Example: runex.pl 1 (run PennCNV to call CNV on three signal files)
runex.pl 2 (run posterior CNV calling algorithm on a trio)
runex.pl 3 (run PennCNV with GCmodel adjustment of signal intensity)
runex.pl 4 (validation-based CNV calling on a candidate region)
runex.pl 5 (validation-based CNV calling on all candidate regions in a file)
runex.pl 6 (run joint CNV calling on a trio)
runex.pl 7 (convert CNV call to BED format)
runex.pl 8 (convert CNV call to tab-delimited format)
runex.pl 9 (convert tab-delimited calls to PennCNV format)
runex.pl 10 (filter CNV and print out a subset of calls)
runex.pl 11 (compare CNV calls on duplicated samples)
runex.pl 12 (compare CNV calls on same sample called by different algorithms)
runex.pl 13 (generate CNV-based genotype calls)
runex.pl 14 (validate de novo CNV calls and assign a P-value)
是非、興味のある例をお試しください。
下のように入力すると、コマンドの例など詳しい情報が表示されます。
$ perl runex.pl 1

実際には、実験系(BeadStudio等)から出力されるデータを入力用に変換する必要があります。変換する方法はここに書いてありますのでご参考になさってください。

入力用ファイルは検体ごとに作成する必要があり、
カラムは5つで
Name
Chr
Position
GType
Log R Ratio
B Allele Freq
です。

では、明日は実際の解析を想定してPennCNVを使用していきたいと思います。


ブログランキングに参加しています。
もしよろしければ、ぽちっとお願いします。
医学人気ブログランキング



| きむ | CNV解析 | 18:10 | comments(0) | trackbacks(0) |
CNV解析 -PennCNVの使い方1-
今日からは、CNV統計解析ソフト「PennCNV」を使用します。

PennCNVは、SNPジェノタイピングアレイからコピー数多型(CNV:copy number variation)解析を行えるフリーのソフトウェアツールです。
Illumina社とAffymetrix社の各種アレイデータの解析が行えます。



まず、こちらから圧縮されたプログラムをダウンロードします。
新しいバージョンが2010年5月1日に公開されたようですね。

次に、インストールします。
ご使用のOSに合った方法を参照してください。

明日は、スタートガイドを見ながら試してみます。


ブログランキングに参加しています。
もしよろしければ、どうぞ一押しお願いします。
   downdowndown
医学人気ブログランキング

| きむ | CNV解析 | 15:54 | comments(0) | trackbacks(0) |
  12345
6789101112
13141516171819
20212223242526
27282930   
<< June 2010 >>

このページの先頭へ