アメリエフのブログ

バイオインフォマティクスの紹介と社員の日々
<< scp stalled | main | 神戸開講・バイオインフォマティクス・スクール追加募集行います >>
テスト用Fastqファイルを作る
マッピングソフトウェアの性能比較をする際に、
正解がわかっているデータを使いたい場合があります。

そんな時に便利な、ゲノム配列からFastqファイルを作成できる
ArtificialFastqGeneratorというソフトウェアをご紹介します。

例えばヒトゲノムhg19から150bp Paired-EndのFastqを作成するには
以下のようなコマンドを実行します。
$ java -jar ArtificialFastqGenerator.jar -R hg19.fa -O OUTNAME -RCNF 2 -S ">chr1" -E ">" -RL 150

パラメータの意味です。
・-R:ゲノム配列のMultiFastaファイル
・-O:出力ファイル名
(この例では、OUTNANE.1.fastq, OUTNANE.2.fastqができます)
・-RCNF:N入り配列を許すか
(0:N入りを許す、1:全部Nの配列は除く、
 2:1つでもNが入っている配列は除く)
・-S、-E:-Rで指定したFastaのどの配列を使うか(この例ではchr1)
・-RL:リード長

エラーを入れたり、実際のFastqを参照してリアルなクオリティスコアを
入れたりすることもできます。

とても便利なソフトウェアです。
| hat | バイオインフォマティクス | 14:14 | comments(0) | - |









   1234
567891011
12131415161718
19202122232425
262728293031 
<< March 2017 >>

このページの先頭へ