アメリエフのブログ

バイオインフォマティクスの紹介と社員の日々
OSX Mountain Lion
先日、OSX 10.8「Mountain Lion」が販売開始されましたね。

iCloudとの連携強化などいろいろな新機能があるようですが、私が一番気になっているのが音声入力機能です。
iPhoneのSiri日本語版は、最初のうちこそ面白がっていろいろ話しかけたものですが、自分の滑舌の悪さによる認識率の悪さに落ち込み、だんだん使わなくなってしまいました。
Mountain Lionではどのくらい認識してくれるようになっているか、楽しみです。

ところでOSXはコードネームがネコ科しばりのようですが、そのうちネタが尽きるのではないかと他人事ながら心配しています。

もしアップルが128ビットOSを出すことになった暁には、ぜひネコ科で体が最も大きいと言われる「Liger(ライガー)」をコードネームに使っていただきたいと思います(どのくらい大きいか、画像検索してみてください)。

「Liger」は、ライオン(オス)とトラ(メス)の間に生まれた交雑種で、基本的には繁殖力がありません。そして、ライオンよりも体が大きくなるというのが不思議です。
トラ(オス)とライオン(メス)の間の雑種も可能で、こちらは「Tigon(タイゴン)」と呼ばれるそうです。

ちなみに今回のOSX 10.8ですが、クラウド()を前面に押し出すならコードネーム「ウンピョウ(雲豹)」のほうがよかったんじゃないかと個人的に思っています。
| hat | システム | 11:40 | comments(0) | trackbacks(0) |
移動する脂肪
こんにちは、detです。

先週のakbさんの記事で、ダイエットの話がありました。
何を隠そう、昼食抜きダイエットを試みていているのは私、detです。

この4月からお酒を飲む機会が増えたせいか、私が怠惰なだけなのか
わかりませんが、ズボンのウエストがどうにもきつくなってきています。

そこで、弊社社長のアドバイスに従い、昼食抜きダイエットを試みることにしました。まずは先週一週間お昼ご飯を抜きました。最初は辛かったのですが、慣れると案外平気なものですね。
そして、一週間後、体重を量りました…その結果は!!

増減なし!!あれ。

しかし、ウエストは明らかに細くなりました。ズボンがきつくありません。減った分の脂肪がどこに行ったのかわかりませんが、効果はあるようです。
今後も昼食抜きダイエットを継続したいと思っています。

それでは、detでした。
| deda | よもやま話 | 18:07 | comments(0) | trackbacks(0) |
明日はLinux基礎・第二回
暑い日が続きますね。hatです。

明日はバイオインフォマティクス・スクール「Linux基礎」の第二回です。

前回はLinuxの基本概念(CUIでの作業、ディレクトリ構造、アクセス権限など)についてご説明しました。

復習として、受講生の方に「作業ディレクトリのJapanディレクトリ内に好きな県/市のディレクトリを作成する」という課題を実施していただいたのですが、いろいろな地名が出てきて楽しませていただきました。

今回はコマンドを使ってテキストデータを操作する方法についてご説明します。
「世界の高い建物100」というテストデータをご用意しました。楽しみながら実習していただけるといいなと思います。

それでは暑い中申し訳ありませんが、浜松町でお待ちしております!
| hat | スクール | 16:45 | comments(0) | trackbacks(0) |
BWA v0.5.xとv0.6.xの比較(2)
hatです。前回から随分開いてしまいましたが、BWA v0.5.xとv0.6.xの比較(1)のつづきです。

bwa v0.5.x系とv0.6.x系のマッピング結果の違いを、公開データを使って比較してみました。
それぞれhg19に対してマッピングして、samtools flagstatでマッピング結果を出しました。

■使用したデータ
ERR034601(日本人女性Exome)

■bwa v0.5.9のマッピング結果
118495810 + 0 in total (QC-passed reads + QC-failed reads)
0 + 0 duplicates
117074076 + 0 mapped (98.80%:-nan%)
118495810 + 0 paired in sequencing
59247905 + 0 read1
59247905 + 0 read2
116292908 + 0 properly paired (98.14%:-nan%)
116571052 + 0 with itself and mate mapped
503024 + 0 singletons (0.42%:-nan%)
234772 + 0 with mate mapped to a different chr
217456 + 0 with mate mapped to a different chr (mapQ>=5)

■bwa v0.6.1のマッピング結果(減:青字、増:赤字
118495810 + 0 in total (QC-passed reads + QC-failed reads)
0 + 0 duplicates
117071517 + 0 mapped (98.80%:-nan%)
118495810 + 0 paired in sequencing
59247905 + 0 read1
59247905 + 0 read2
116287794 + 0 properly paired (98.14%:-nan%)
116565920 + 0 with itself and mate mapped
505597 + 0 singletons (0.43%:-nan%)
234930 + 0 with mate mapped to a different chr
217494 + 0 with mate mapped to a different chr (mapQ>=5)

bwa v0.6.1では、若干マッピング率が下がりました。ペアエンドのマッピング数が減ってシングルトンのマッピング数が増えています。

しかし、個々のマッピング箇所を並べて見ていると、下図のような例もありました。

bwa v0.5.9ではペアエンドが別々の染色体にマッピングされていたものが、bwa v0.6.1ではペアエンドでマッピングできるようになった例です。ミスマッチは入ってしまっていますが、これくらいのミスマッチであればbwa v0.6.1の結果のほうを採用してもいい気がします。

bwa v0.5.x系とv0.6.x系の差はWebで調べてもまだあまり情報がないようです。微妙な違いなのでしょうか。なにか見つけましたら、またブログに書かせていただきます。
| hat | 次世代シーケンサー解析 | 14:33 | comments(0) | trackbacks(0) |
世界は分けてもわからない
tokunagaです。
本日は書籍のご紹介を致します。

「世界は分けてもわからない」 
福岡伸一

ベストセラーとなった「生物と無生物のあいだ」の著者である福岡伸一さんの本です。
ランゲルハンス島やES細胞から、それとはまったく関係のないようなヒトの性格の差や、有名絵画まで幅広く話題に出てきますが、最後はタイトルにもある「世界は分けてもわからない」という言葉につながるという話の展開が非常に面白かったです。確かに実際には存在しない境界線を見ようとしているのかもしれない、と著者の意見に納得しました。

個人的には学生時代によく行っていたSDS-PAGEというタンパク質を分離させる実験の様子をとても事細かに描写している部分を読んで、その表現力に感動しました。

広い視野で物事を見て考えるって大事ですね。
生命科学の分野以外の方にもこの本をお勧めいたします。
| tokunaga | 書籍の紹介 | 10:25 | comments(0) | trackbacks(0) |
昼ごはん抜き
akbです。

最近、弊社の男性社員の間でダイエットが話題になっています。
お昼ごはんを抜くとダイエット効果があるのだそうです。
近日、"昼ごはん抜き"の効果をお知らせしてくれることでしょう。
ちなみに私は、帰宅時に一駅区間だけ歩いて帰ることにしています。

ライフサイエンス新着論文レビューに本日付けで、肥満に関する論文が紹介されていました。
タイトル:肥満にともなう高レプチン血症は肝臓において少量のエンドトキシンに過剰な反応をきたし非アルコール性脂肪肝炎の進展に関与する
©  2012 今城健人・中島 淳 Licensed under CC 表示 2.1 日本

日本をはじめとする先進国では、カロリーの高い食事と運動不足により肥満になる人が増加しています。本論文では、糖尿病、高血圧、高脂血症など複数の疾患(メタボリックシンドローム)と非アルコール性脂肪性肝炎の関連性ついて新たな可能性を報告しています。

"カロリーの高い食事と運動不足により肥満になる人"とは、まさに自分のことを言われているようです。健康管理に気を付けて、暑い夏を乗り切りたいと思います。
| akb | よもやま話 | 16:39 | comments(0) | trackbacks(0) |
cmpfastq と cmpfastq_pe
以前の記事cmpfastqというfastqファイルのペアエンドリードを揃えるツールをご紹介いたしました。本日は、cmpfastqの改良版である
cmpfastq_peとの相違についてご紹介いたします。

cmpfastq_peはcmpfastqから以下の点を改良したバージョンのようです。

1. Illumina CASAVA v1.8の出力に対応
2. メモリ使用量を削減

ペアエンドリードを揃えるアルゴリズム自体は、cmpfastqおよびcmpfastq_peで同一であり、片方のfastqファイルの各リードのIDをハッシュに保存し、そのハッシュに保存されたIDがもう片方のfastqファイルに含まれるかどうかでペアエンドリードを揃えています。
cmpfastq_peでは、そのIDを抜き出す際の正規表現を工夫することで、CASAVA v1.7 以前と v1.8 に対応しています。
また、cmpfastq_peでは、ハッシュの処理等に工夫があり、メモリ使用量・処理時間などのコストがかなり削減されています。

cmpfastqが重くて動かないときは、cmpfastq_peを使用してみるのもいいかもしれません。
| deda | バイオインフォマティクス | 15:37 | comments(0) | trackbacks(0) |
祝・3周年
おかげさまで、この7月をもちましてアメリエフ株式会社は3周年を迎えました。
これもひとえに皆様のご指導とお力添えのおかげと深く感謝しております。
今後とも、なにとぞご支援ご愛顧を賜りますようお願い申し上げます。

今日は社員でお祝いをしました!

3周年
| hat | 会社のこと | 21:12 | comments(0) | trackbacks(0) |
夏バテ
tokunagaです。

本格的な暑さになってまいりましたね。
外でお弁当を食べただけなのに顔が真っ赤になりました。
東京の夏は暑いと噂に聞いておりますので、暑さに少し抵抗のある九州出身とはいえ、夏バテには気をつけたいと思います。
夏バテしないためには日々の食事の栄養バランスが大切なようです。

しかし、夏バテになるのはヒトだけではないようですね。
日本経済新聞にこのような記事を見つけました。
PCもスマホも“夏バテ”に注意
私もよくノートパソコンの吸気口付近につい物を置いてしまい、空気循環が出来ずにバテさせてしまったことがありました。
そしてスマートフォンには熱を逃すシステムがないようなので、これからの時期、機械も夏バテしないよう気配りが必要ですね。
| tokunaga | - | 16:38 | comments(0) | trackbacks(0) |
仕事と余暇のバランス
なぜ、あの部門は「残業なし」で「好成績」なのか? 6時に帰る チーム術
なぜ、あの部門は「残業なし」で「好成績」なのか? 6時に帰る チーム術
小室 淑恵

akbです。
本日は最近読んだ書籍のご紹介です。
筆者の小室淑恵さんは、大手メーカー企業を退職後、(株)ワーク・ライフバランスを設立され、現在までに600社以上のコンサルティング事業を手掛けてられています。
"ワーク(仕事)ライフ(私生活・余暇)バランスの視点を社内に取り入れることが、付加価値で勝負しなければならない現代の企業に求められる"ということが良く理解できる一冊です。
私も仕事の成果が上がるように、余暇の時間を大切に使っていきたいと思います。残業が多いビジネスパーソンは是非一度、ご覧になってみて下さい。
| akb | 書籍の紹介 | 16:48 | comments(0) | trackbacks(0) |
仕事は体が資本
こんにちは。detです。

以前から料理を作るのにはまっています。
自炊のメリットとしては、以下の項目があげられるでしょう。

1.緑黄色野菜などを多めに摂取することで健康に配慮できる
2.自分の好きなものを食べられる
3.外食より安い

デメリットとしては、外食より時間コストがかかる点でしょうか。

個人的にはこのデメリットはあまり考えなくても良いと思っています。
その理由は、調理方法の工夫や、調理そのものに慣れることで時間の短縮が可能なことが挙げられます。また保存可能な料理を作れば、冷蔵庫に保存しておいて、電子レンジで温めるだけでいつでも食べられます。
私は休日に、いくつか野菜料理を作って冷蔵庫に保存し、毎日それを食べています。(最近はラタトゥユ、温野菜サラダ、きんぴらごぼうなどをよく作ります。)

また、栄養バランスに配慮した食事をすることで、健康を維持する助けにもなるでしょう。いい仕事のためには健康であることが何よりも大切です。そのためにも、自炊を今後も続けていこうと思っています。

一人暮らしの方は、ぜひ自炊してみてはいかがでしょうか?
出来れば野菜多めがよろしいかと思われます。

それではdetでした。
| deda | よもやま話 | 18:06 | comments(0) | trackbacks(0) |
人材募集のお知らせ
アメリエフは、新卒および経験者を募集しています。
今後の、アメリエフを創りあげていく社員として、下記のような人材像を求めています。
1.バイオインフォマティクスにチャレンジしたい人
2.休日や余暇の時間に自己研鑽に取り組むことができる人
3.ビジネスを通して自己成長と社会貢献をしたい人
4.ベンチャー企業でいろいろな分野にチャレンジしたい人
5.喫煙しない人
アメリエフの仕事や会社をもっと知りたい方は、弊社ホームページをご覧ください。会社理念に共感していただけましたら、履歴書と自己PRをご郵送ください。

募集要項などの詳細につきましては、こちらをご覧ください。
皆さまにお会いできることを、スタッフ一同楽しみにしております。
| きむ | 会社のこと | 15:33 | comments(0) | trackbacks(0) |
Linux基礎7月期スタート
tokunagaです。
明日はいよいよバイオインフォマティクス・スクールの7月期がスタートいたします。

お申込みいただきました受講者の方々へこの場を借りて深く御礼を申し上げます。
この講義を通しまして、実際の解析で「つかえる技術」を身につけていただけますよう努めてまいりますので、この3か月間どうぞよろしくお願いいたします。

それでは明日、会場までお気をつけてお越しくださいませ。
| tokunaga | スクール | 11:16 | comments(0) | trackbacks(0) |
フルーツゲノム解読
akbです。
今日は気になるニュースのご紹介です。
「メロンのゲノム解読」
メロンの全遺伝情報(ゲノム)を解読したと、スペイン農業ゲノミクス研究センターなどの欧米チームが11日までに米科学アカデミー紀要電子版に発表した。
「バナナ原種のゲノム解読」
食用に栽培されるバナナの原種の全遺伝情報(ゲノム)を解読したと、フランス農業研究開発国際協力センターなどの国際研究チームが11日付の英科学誌ネイチャー電子版に発表した。
私が特に興味を持ったのは、「メロンのゲノム解読」のニュースです。
これまでメロンの起源はアフリカと考えられてきましたが、ドイツ・ミュンヘン大の研究チームによる遺伝子比較解析の結果によれば、アジア原産の可能性があるそうです。
身近な食べ物の起源や謎の解明は、とても興味深いです。今後、どんな生物のゲノムが解読され、どのような謎が明らかになっていくのか、楽しみですね。
| akb | バイオ | 10:32 | comments(0) | trackbacks(0) |
シーケンサーとしての私
こんにちは、hatです。
趣味で1年ほど前から三味線教室に通っています。

先日お稽古をしていて、楽器の演奏はシーケンシングに通じるものがあるなあと思いました。
シーケンサーが塩基を読んで結果データを出すように、私は楽譜を読んでメロディーを出している!

そう考えると、シーケンサーとしての私の性能は酷いもので、

・シーケンスエラーが多い(間違える、すっとばす)
・シーケンス速度が遅い(速く弾けない)
・ロングリードは読めない(楽譜をめくる時止まる)
・Depthが薄い(稽古不足)

と、とても使い物にならないレベルです。

今度複数名で弾く演奏会があるのですが、一曲通して弾くのは難しそうです。
そこで、せめてお気に入りのフレーズだけはちゃんとに弾こう!と目的をターゲットリシーケンシングに切り替えることにしました。

普段からシーケンサーの性能について好き勝手な文句ばかり言っている私ですが、シーケンサーの中の人もきっと大変なんだろうなあと思います。

| hat | バイオインフォマティクス | 13:42 | comments(0) | trackbacks(0) |
QCの道 その6
こんにちは。detです。
今日は前回のQCの道 その5の続きです。

FASTX-Toolkitの使い方について、引き続き紹介いたします。

・fastx_quality_stats
FASTA/Q ファイルのリードに含まれる塩基のポジション毎の統計量を算出し、表形式で出力してくれます。FASTA形式の入力を与えたときは、クオリティに関する項目は出力されません。

【出力される各項目の説明】
column: 5'末端から数えた塩基の位置
count: そのポジションの塩基数
min: そのポジションで最も低いqv
max: そのポジションで最も高いqv
sum: そのポジションのqvを全て足した値
mean: そのポジションのqvの平均値
Q1: そのポジションのqvの第1四分位数
med: そのポジションのqvの中央値
Q3: そのポジションのqvの第3四分位数
IQR: そのポジションのqvの四分位数範囲
lW: そのポジションのqvの統計量を箱ひげ図で表した時の最小値
RW: そのポジションのqvの統計量を箱ひげ図で表した時の最大値
A_Count: そのポジションに含まれるA塩基の数
T_Count: そのポジションに含まれるT塩基の数
G_Count: そのポジションに含まれるG塩基の数
C_Count: そのポジションに含まれるC塩基の数
N_Count: そのポジションに含まれるN塩基の数
max-count: 全てのポジションで最も塩基数が多いポジションの塩基数

【optionの説明】
-h: ヘルプを表示します。
-i: 入力ファイルを指定します。
-o: 出力ファイルを指定します。指定しない場合は標準出力に出力されます。

【実行例: FASTA/Qファイルの統計量計算】
$ fastx_quality_stats -i test.fastq -o out.text -Q33


・fastq_quality_boxplot_graph.sh
FASTQファイルのリードに含まれる塩基のポジション毎のクオリティ図を箱ひげ図の形式で作成します。inputに、上記 fastx_quality_stats の出力を必要とします。

【optionの説明】
-i: 入力ファイルには fastx_quality_stats の出力ファイルを指定します。
-o: 出力ファイルを指定します。デフォルトでpng形式で出力されます。指定しない場合は、バイナリを無理やり標準出力しようとするので、必ず指定してください。
-p: 出力ファイル形式を PostScript に変更します。
-t: 出力される図に記載されるタイトルを指定できます。

【実行例: FASTQファイルのクオリティ図作成】
$ fastq_quality_boxplot_graph.sh -i out.txt -t hogehoge -o boxplot.png

【実行結果例】



・fastx_nucleotide_distribution_graph.sh
FASTQファイルのリードに含まれる塩基のポジション毎に、塩基の種類の分布図を作成します。inputに、上記 fastx_quality_stats の出力を必要とします。

【optionの説明】
-i: 入力ファイルには fastx_quality_stats の出力ファイルを指定します。
-o: 出力ファイルを指定します。デフォルトでpng形式で出力されます。指定しない場合は、バイナリを無理やり標準出力しようとするので、必ず指定してください。
-p: 出力ファイル形式を PostScript に変更します。
-t: 出力される図に記載されるタイトルを指定できます。

【実行例: FASTQファイルのクオリティ図作成】
$ fastx_nucleotide_distribution_graph.sh -i out.txt -t hogehoge -o boxplot.png

【実行結果例】


それでは、また次回に。


---これまでの記事へのリンク---
QCの道 その1
QCの道 その2
QCの道 その3
QCの道 その4
QCの道 その5
| deda | バイオインフォマティクス | 17:29 | comments(0) | trackbacks(0) |
アノーテーションツール
tokunagaです。
本日も、変異を検出した後のアノーテーションに役立つサイトのご紹介をしたいと思います。
前回の記事(MutationaTaster)はこちらです。

【Likelihood Ratio Test Query:LRT】
http://www.genetics.wustl.edu/jflab/lrt_query.html
コドンの保存性から、変異の影響の度合を尤度比検定で計算してくれます。


下記の情報を入力すると、結果が表で出力されます。

・染色体番号
・変異の入ったポジション
・変異の入った塩基
(例)chr1:1377627:G/A

またファイルをアップロードすることも出来るようです。

LRT_PとLRT_Predictionで変異の影響の度合を示します。LRT_PredictionがDだと変異が有害であるということを示します。
その他に変化したコドンやアミノ酸などの情報も表に出力されます。

前回のMutationaTasterと同じく、LJB(dbNSFP)などのデータベースや、Annovarなどのアノーテーションツールにも使用されているデータベースです。
| tokunaga | SNP解析 | 16:07 | comments(0) | trackbacks(0) |
気分転換
こんにちは、detです。
FASTX-Toolkitの連載は一回休憩を頂きまして、
気分転換のお話をさせて頂けたらと思います。

皆様の中には、お仕事や研究で忙しい日々を送られている方も
多いかと思いますが、お休みは取られていますでしょうか。

やはり、日々集中していい仕事をするためには、定期的な
気分転換、リフレッシュが必要であると私は思っています。

その方法は、趣味に打ち込む、お酒を飲んでワイワイする、
旅行に出かけるなど様々でしょう。

私もお酒を飲んだり、ちょっとお出かけしたりといった
気分転換は定期的に行っています。

先日は、高尾山に行ってまいりました。
リフトに乗って、山の中腹まで一気に登り、そのあとは、
徒歩でゆっくりと頂上を目指します。

リフトや山からの眺めは素晴らしく、東京都内のビルを遠くに
眺めながら周囲の自然を感じることができ、非常に爽快でした。

近年ワークライフバランスが重要視されていますが、
ライフの部分を充実させることによって、
さらにワークに打ち込めるようになると思います。

お仕事が多忙を極めていらっしゃる方も多いかとは思いますが、
あえて、気分転換に出かけるのもいいことではないかと考えます。
きっと仕事にもプラスになることでしょう。

それでは、detでした。
| deda | よもやま話 | 13:27 | comments(0) | trackbacks(0) |
多読のすすめ
レバレッジ・リーディング
レバレッジ・リーディング
本田 直之

akbです。

本日は最近読んだ書籍のご紹介です。

著者である本田直之さんは、複数の企業の取締役を務めながら、年間400冊以上の本を読まれています。

本書には、『なぜ"速読"ではなく"多読"なのか』『なぜ多忙でありながら、これほど読書ができるのか、また必要なのか』が、
ビジネス書を効率的・戦略的に読みこなす読書法としてまとめられています。

私は『本を読む時間がない』と言葉にすることがはずかしくなりました。

ビジネスで成功したい方は是非ご覧になって下さい。
またすばらしい本に出会ったらご紹介したいと思います。
| akb | 書籍の紹介 | 10:56 | comments(0) | trackbacks(0) |
意外と知らない?FastQCの便利オプション
hatです。

次世代シーケンシングデータのQCツールとして、一番使われているのがFastQCだと思います。

FastQCは非常に高機能なツールなのですが、「ポジションごとのクオリティスコア分布図」で、ポジション10bp以降の領域がグループ化されてしまうのだけが残念だと思っていました。
100bpくらいのリードだと、リードの後ろのほうでどのくらいクオリティが低下するかディテールが見えづらくなってしまうのです。

ところが、今日FastQCのUsageを見ていて、FastQCに--nogroup オプションを付けて実行すると、グループ化を無効にできることを知りました。


このオプションは実は結構前(Version 0.9.1)から実装されていたようです。

今日の教訓:
使い慣れていると思っているツールこそ、Usageをよく読もう。


もしかしたら世間では常識かもしれないのですが、社内で最初にこれを発見したのが嬉しくて、ドヤ顔しています。
| hat | 次世代シーケンサー解析 | 17:55 | comments(0) | trackbacks(0) |
アノーテーションツール
tokunagaです。
本日は、変異を検出した後のアノーテーションに役立つサイトのご紹介をしたいと思います。

【MutationTaster】
http://www.mutationtaster.org/
・論文
http://www.nature.com/nmeth/journal/v7/n8/abs/nmeth0810-575.html

配列上の変異が疾患を引き起こすポテンシャルを予測してくれます。



下記の情報を入力すると、変異の種類によって分類され、どのような変化をもたらすかをsummeryで出力します。

・HGNC gene symbol、NCBI Gene ID、またはEnsembl gene ID
・Ensembl transcript ID(geneの項目を入力すると自動で予測)
・変異の入ったポジション
・変異した塩基

その他にもアミノ酸変化やフレームシフトなどの情報も出力されます。
これまでHapmapで報告されているものは「無害」、ナンセンス変異依存分解(NMD)を引き起こすものは自動的に「疾患を引き起こす」と予測されます。

LJB(dbNSFP)などのデータベースや、Annovarなどのアノーテーションツールにも使用されているデータベースです。
| tokunaga | SNP解析 | 16:20 | comments(0) | trackbacks(0) |
QCの道 その5
こんにちは。detです。
今日は前回のQCの道 その4の続きです。

FASTX-Toolkitが持つ機能について、引き続き紹介いたします。

・fastx_artifacts_filter
FASTA/Q の各リードにおいて、塩基が特定の種類に偏っている場合にそのリードを除去してくれます。他の塩基を四個以上含んでいる場合は、許容されます。

【optionの説明】
-h: ヘルプを表示します。
-z: 出力をgzip形式で圧縮します。
-i: 入力ファイルを指定します。
-o: 出力ファイルを指定します。指定しない場合は標準出力に出力されます。
-v: 処理前後でのリード数などを出力してくれます。

【実行例: 塩基の偏りをチェック】
$ fastx_artifacts_filter -v -i test.fastq -o out.fastq -Q 33


・fasta_nucleotide_changer
FASTA/FASTQ ファイルの、U塩基をT塩基へ、もしくはT塩基をU塩基へ置換してくれるツールです。出力は全てFASTA形式へ変換されます。

【optionの説明】
-h: ヘルプを表示します。
-r: T塩基をU塩基へ置換します。
-d: U塩基をT塩基へ置換します。
-z: 出力をgzip形式で圧縮します。
-i: 入力ファイルを指定します。
-o: 出力ファイルを指定します。指定しない場合は標準出力に出力されます。

【実行例: T塩基からU塩基へ置換】
$ fasta_nucleotide_changer -d -i test.fastq -o out.fastq -Q 33

それでは、また次回に。


---これまでの記事へのリンク---
QCの道 その1
QCの道 その2
QCの道 その3
QCの道 その4
| deda | バイオインフォマティクス | 09:37 | comments(1) | trackbacks(0) |
1234567
891011121314
15161718192021
22232425262728
293031    
<< July 2012 >>

このページの先頭へ