アメリエフのブログ

バイオインフォマティクスの紹介と社員の日々
<< MacBookにUbuntu | main | 関西から改めまして >>
ソフトウェア結果比較【BAMソート編・1】
NGS解析では、同じ処理を行うのにいくつものソフトウェアがあって、どれを使ったらいいのか迷うことがあります。

例えばBAMファイルをゲノムポジションでソートする場合、以下の選択肢があります。
1. samtools sortを使う
2. picard toolsのSortSam.jarを使う

同じBAMファイルを異なるソフトウェアでソートしても、結果は同じになるのでしょうか?

テストデータとして、NCBI SRAのSRR077861の先頭1000リードをhg19にBWAでマッピングした結果のBAMを使いました。

・テストデータ
sample.bam(222,146 bytes)


【samtools sortでソート】
・実行コマンド
samtools sort sample.bam sort_samt

・結果BAM
sort_samt.bam(219,312 bytes)


【SortSam.jarでソート】
・実行コマンド
java -jar /usr/local/src/java/picard-tools-1.75/SortSam.jar I=sample.bam O=sort_pica.bam SO=coordinate

・結果BAM
sort_pica.bam(221,293 bytes)


結果BAMが異なりました!
いったいどこが異なるのでしょうか。

比較結果は次回で。
| hat | バイオインフォマティクス | 10:42 | comments(0) | trackbacks(0) |









http://blog.amelieff.jp/trackback/202107
   1234
567891011
12131415161718
19202122232425
262728293031 
<< March 2017 >>

このページの先頭へ