アメリエフのブログ

バイオインフォマティクスの紹介と社員の日々
<< VCF format | main | SAM format >>
fastq format
tokunagaです。

少し1回目と間が空いてしまいましたが、
本日はfastq formatの2回目です。
各リードの4行目に記されているqualityについて説明したいと思います。

・Quality value
3行目に使われているquality valueは以下のように計算されています。




・ASCIIコード
各塩基ごとのquality valueを一文字で表すためにASCIIコードが使われています。




・比較
S - Sanger Phred+33, raw reads typically (0, 40)
X - Solexa Solexa+64, raw reads typically (-5, 40)
I - Illumina 1.3+ Phred+64, raw reads typically (0, 40)
J - Illumina 1.5+ Phred+64, raw reads typically (3, 40)
L - Illumina 1.8+ Phred+33, raw reads typically (0, 41)

()の中はquality valueの最大値と最小値です。
現行のIllumina formatでは、実際に使われているquality valueの最大値は41です。

参考URL
http://en.wikipedia.org/wiki/FASTQ_format

| tokunaga | 次世代シーケンサー解析 | 09:32 | comments(0) | trackbacks(0) |









http://blog.amelieff.jp/trackback/178151
   1234
567891011
12131415161718
19202122232425
262728293031 
<< March 2017 >>

このページの先頭へ