アメリエフのブログ

バイオインフォマティクスの紹介と社員の日々
Yet Another Bioinformatics Library
バイオ分野で使われているプログラミング言語には、バイオインフォマティクス向けのライブラリが用意されており、BioPerlBioPythonなどをご存知の方は多いかもしれません。

最近注目されているGoogleによって開発されたGO言語にも、バイオインフォマティクス用のライブラリであるbiogoというものがあります。

今回はそのbiogoを使用している例として、Lariatというアライメントツールのご紹介をしたいと思います。

Lariatは10x Genomicsが開発したGemCodeシステムに対応したアライメントツールです。GemCodeシステムはバーコード配列を利用してショートリードから合成的にロングリードを生成する革新的なシステムです。

入力はFASTQ-likeなフォーマットで、入力ファイルに以下の情報が必要になります。
read header
read1 sequence
read1 quals
read2 sequence
read2 quals
10X barcode string
10X barcode quals
sample index sequence
sample index quals

Lariatの最初のステップでは、BWAのAPIを使ってアライメントを行っていきます。

次のステップでバーコードの情報を使って反復領域などのマッピングが難しい領域のリードを繋げていき、最終的なマッピングのポジションなどを決定します。
これにより、segmental duplicationなどの反復領域などへのリードのマッピングの正確性が向上すると考えられています。

ちなみに、biogoはBAMやSAMファイルのハンドリングに使われています。

Lariatの入力ファイルはFASTQ-likeなフォーマットが必要と書きましたが、Lariat自体はLong Rangerというパイプラインに組みこまれているので、自分で用意することはないと思います。
| onouek | バイオインフォマティクス | 14:02 | comments(0) | - |
フリーソフトで始める融合遺伝子解析入門
2016年5月20日に開催した第44回、および27日に開催した第45回バイオインフォマティクス勉強会の
「フリーソフトではじめるNGS融合遺伝子解析入門」の資料を、一部修正してSlideShareに公開いたしました。
RNA-seqの基本的な解析方法にはじまり、融合遺伝子解析ソフトのTopHat-Fusionの使い方をコマンドを交えてご紹介しています。

弊社へ解析の依頼を検討されている方は弊社Webサイトの受託解析のページを、ご自身で解析したい方はトレーニングNGS解析サーバのページを、ぜひ一度ご覧ください!
| onouek | 勉強会 | 14:24 | comments(0) | - |
新入社員のmisawatです。
2016年4月18日より、こっそり入社していましたmisawatと言います。
出身は神奈川ですが、相模原に住んでいるのでアメリエフのオフィスは少し遠いです。

大学では医療、大学院では分析科学をやってきました。

最近の分析機器は高性能なので簡単にビッグデータを得ることができます。
それらのデータを扱うためにデータサイエンスの世界に参入しました。
使ってきた分析機器の中にはNGS(illumina, Miseq)もあったので、その経験を活かし、

"個性的なバイオインフォマティシャン"

を目指していきます。

よろしくお願いいたします。
| misawat | 会社のこと | 15:33 | comments(0) | - |
1234567
891011121314
15161718192021
22232425262728
293031    
<< May 2016 >>

このページの先頭へ