アメリエフのブログ

バイオインフォマティクスの紹介と社員の日々
<< 明日はいよいよ | main | 疾患感受性遺伝子の発見 >>
アライメントのアルゴリズム
次世代シーケンサの解析を行う際、アライメントという作業を行います。

本日は、アライメントツールとしてbwaを例にとり、アライメントのアルゴリズムに関して記述していきます。
よろしくお願いします。


bwaのInformationでは、Burrows-Wheeler Transform (BWT)をベースとしたアルゴリズムが組まれています(コチラを参照)。

さらに、bwaでアライメントを行うと、“calculate SA coordinate”と表示されます。

BWTって・・・?
SA(Suffix Array)とは・・・?

ということで下記のHPを参考にし、ゲノム配列に置き換えて考えてみました。

wiki ブロックソート
Burrows Wheeler TransformとSuffix Array
Suffix Arrayの概念

大量のデータを用いて検索を行う際に、用いられる方法のようです。
DNA断片の配列を繰り返し並列で並べ、印を付ける(index化)。
その後、ソートを行うことで、SAを作成することができるようです。



今日はここまでです!
| | 次世代シーケンサー解析 | 19:05 | comments(0) | trackbacks(0) |









http://blog.amelieff.jp/trackback/162795
   1234
567891011
12131415161718
19202122232425
262728293031 
<< March 2017 >>

このページの先頭へ