アメリエフのブログ

バイオインフォマティクスの紹介と社員の日々
バイオインフォマティクス人材育成カリキュラム 速習コース
バイオインフォマティクス人材育成カリキュラム(次世代シークエンサ)速習コース にて一部の講義を担当させていただきました。

シェルスクリプト・Perl
・日時:2014年9/3(水)・9/4(木)
・講師:服部

次世代シークエンサ実習
・日時:2014年9/10(水)・9/12(金)
・講師:山口

講義の資料などは、オーガナイザーの門田先生のページでご覧いただけます。

弊社の通常のトレーニングは少人数なので受講生の様子を見ながらペースや難易度を調節できるのですが、今回は大人数(70名〜)ということで、初心者の方に合わせることに決めて、やさしめ・ゆっくりめの内容とさせていただきました。
既にご自身で勉強されている方には物足りないのではないかと心配していましたが、「改めて網羅的に学べて良かった」というご意見もいただけたので、ひとまずほっとしています。

VirtualBoxの設定や、難しい質問が出た時などにはTAや受講生の方々がすぐ調べて代わりに答えてくださったので、非常に助かりました(笑)。私もとても勉強になりました。

ありがとうございました。
| hat | スクール | 15:56 | comments(0) | - |
OR条件でgrep
Rでgrep

続・Rでgrep

grepのこんなオプション

grepを数えるオプション

普段解析でよく使うコマンドのためか、このブログはgrepネタが多い気がします。
ということでまたgrepネタです。

grepで特定の文字列を含む行を抜き出す場合、文字列を¥|でつなげることで「OR」にすることができます。

例:「ABC」または「DEF」を含む行を抜き出す
$ grep 'ABC¥|DEF' ファイル

例:SAMファイルから「ヘッダー行」または「XT:A:U」を含む行を抜き出す
$ grep '^@¥|XT:A:U' SAM | samtools view -Sb - > BAM

複数のgrepコマンドをパイプでつないで「AND」にするのはよくやっていたのですが、「OR」ができることは今日ふと気になって調べて初めて知りました!
| hat | バイオインフォマティクス | 14:19 | comments(0) | - |
snpEffバージョンアップ
アノテーションソフトsnpEffが1.4.0にバージョンアップしました。
GRCh38/hg38に対応しています。待ってました。

まだ安定ではないようで、頻繁にマイナーバージョンアップを繰り返しています(2014-09-25現在、最新バージョンは1.4.0 Eです)が、早く新しいゲノムバージョンのアノテーションを行ってみたいものです。

その他、西アフリカで大流行を引き起こしているエボラウイルスに対応しているのが時事を反映していますね。
早く収まるといいのですが……。
| kubo | バイオインフォマティクス | 15:58 | comments(0) | - |
初めてのClinVar
だんだん肌寒くなってきましたね。kitanoです。
私が入社して3週間になろうとしていますが、今回はその中で私が初めて知った言葉をひとつピックアップして解説していこうかと思います。

その言葉とは「ClinVar」です。
ヒトの研究に携わっていらっしゃる方々には馴染みのある言葉だと存じます。しかし、植物を扱っていた私にとっては初めての言葉でした。

「ClinVar」(http://www.ncbi.nlm.nih.gov/clinvar/)とはNCBIでサービス運営されているデータベースです。
データベースの内容としては、NCBI、National Library of Medicine(NLM)、National Institutes of Health(NIH)が主体となって作った、「医学的に重要なヒトの変異と表現型に関連した報告を提供する無料で入手可能なアーカイブ」です。
 データソースは、ヒトの変異位置情報としてdbSNP、dbVarと密接に連携し、表現型の記述としてはMedGenをベースにしています。
 ClinVarに投稿されたそれぞれの報告には投稿者・変異・表現型、またSCV000000000.0のフォーマットで割り当てられたアクセッション番号が記載され記述されています。しかし、臨床的な解釈が相反する場合には、個別にRCV000000000.0のフォーマットでアクセッション番号が割り当てられ、各変異の医学的な重要性を評価するために、同じ変異と表現型の組み合わせの報告、さらに他のNCBIのデータベースを集約し評価しています。
 また、ClinVar内のデータはXML、VCF、タブ切り替えをセットとしてHTMLやダウンロード含む複数のフォーマットで利用できます。

 このようにClinVarはヒトの変異と表現型に焦点を当てたデータベースであり、臨床医学の発展のためにも重要なデータベースの一つであると考えられます。


【参照】
CliVar:http://www.ncbi.nlm.nih.gov/clinvar/
NCBI:http://www.ncbi.nlm.nih.gov/
National Library of Medicine(NLM):http://www.nlm.nih.gov/
National Institutes of Health(NIH):http://www.nih.gov/
dbSNP:http://www.ncbi.nlm.nih.gov/snp/
dbVar:http://www.ncbi.nlm.nih.gov/dbvar/
MedGen:http://www.ncbi.nlm.nih.gov/medgen
| kitanog | バイオインフォマティクス | 15:28 | comments(0) | - |
STAR(1)
RNA-seqデータを高速にマッピングするソフトウェアSTARについて
ご紹介します。

A. Dobin et al, Bioinformatics 2012;
doi: 10.1093/bioinformatics/bts635
"STAR: ultrafast universal RNA-seq aligner"

◆STARのインストール
$ wget http://STAR.googlecode.com/files/STAR_2.3.0e.Linux_x86_64.tgz
$ tar zxvf STAR_2.3.0e.Linux_x86_64.tgz


◆ゲノムのダウンロード
$ wget ftp://ftp2.cshl.edu/gingeraslab/tracks/STARrelease/STARgenomes/hg19_Gencode19.tgz
$ tar zxvf hg19_Gencode19.tgz


◆STAR実行
$ STAR --genomeDir hg19_Gencode19 --readFilesIn FASTQ1 FASTQ2 --runThreadsN 3


ヒトRNA-seqデータ(※1)をTophat(※2)でマッピングした結果と
比較してみました。
続きを読む >>
| hat | バイオインフォマティクス | 10:24 | comments(0) | - |
ログの残し方
ソフトウェアによっては、実行時に非常に詳細なログをずらーっと出力してくれます。
なぜか解析がうまくいかないときなど、解析時の実行内容を確認するため、このログを後から見返すと役に立つことも度々あります。
しかし、ログを流しっぱなしにしては、後から見返す際に不便です。
そこで、そのログをファイルに書き出して残す方法をご紹介します。

$ command > log.txt

> はリダイレクトと呼び、コマンドの標準出力をファイル(ここではlog.txt)に書き込む記号です。

コマンドの出力には標準出力だけでなく標準エラー出力もあります。
標準出力と標準エラー出力を分けて残したい場合は以下のようにします。

$ command > log.txt 2> log_error.txt

標準出力と標準エラー出力を、一緒にログに残すためには、 2>&1 と付け加えます。>と&の順番に注意してください。

$ command > log.txt 2>&1

【FastQCでの使用例】
$ fastqc --nogroup test_1.fastq > log.txt 2>&1

log.txtの中身を確認してみると、普段は画面上に出力されるFastQCの進行状況が書き込まれていることがわかります。
| kubo | システム | 15:01 | comments(0) | - |
9月22日開催「次世代シーケンス解析 大勉強会」のお知らせ
2009年の創業以来、「実践的な学びと人のつながりを生み出す場」を目指し開催して参りました、バイオインフォマティクス勉強会も、みなさまに支えられ37回を数えるまでになりました。

今回の"大"勉強会では、これまでの勉強会とは趣向を変え、4名の先生をお招きし、次世代シーケンサーを用いた研究事例を、WetとDryそれぞれの視点でご紹介いただきます
また、みなさまの交流の時間も設けておりますので、情報交換や横のつながりを作る機会として、お楽しみいただければと思います。社員一同お会いできることを楽しみにしています。
ご意見・ご質問・リクエスト等がございましたら、遠慮無くご連絡ください。

開催日:2014年9月22日(月)10:30〜16:45(受付開始 9:30)
場 所:関東ITソフトウェア健康保険組合 山王健保会館・会議室(東京都港区赤坂2-5-6)
参加費:無料(お弁当付き)


☆詳細はこちら⇒「次世代シーケンス解析 大勉強会」開催のお知らせ
☆お申込みはこちら⇒ http://goo.gl/SFdkwL
【お申込み締切:9月17日(水)正午まで】
| akb | 勉強会 | 12:15 | comments(0) | - |
徳島大学でPerlを講義させていただきました
2014年8/6(水)〜7(木)、徳島大学 蔵本キャンパス図書館にて、「Perl入門」を講義させていただきました。

実習では「ここはこうしたらいいんじゃないか」と活発なアイデアが飛び交い、早速Perlを使いこなしていただいているのが嬉しく、講師冥利につきる想いでした。
ご受講いただいた皆様、ありがとうございました。

阿波踊りの前の週だったため、ほうぼうから三味線の音が聞こえ、祭りの前のわくわくした雰囲気が伝わってきました。
夜は、徳島のおいしい地酒と新鮮なお魚や鶏を堪能し、徳島が大好きになりました。

今度はぜひプライベートで阿波踊りを見に行きたいです。
| hat | スクール | 16:59 | comments(0) | - |
はじめまして
2014年9月に入社いたしましたkitanoと申します。

初めてのブログ投稿なのでkitanoの自己紹介をしたいと思います。

生まれは九州、熊本県熊本市。海の近くで育った野生児です。
高校までは熊本で過ごし、格闘技と合唱に青春時代を費やしました。
大学は滋賀県の琵琶湖のほとりでバイオテクノロジーを学びました。
大学院も同様に琵琶湖のほとりで高等植物イネについての研究をしていました。
大学院卒業後は、1年半をキノコ会社でキノコの栽培技術開発をしながら長野で過ごし、現在は人生2社目の会社であるアメリエフ株式会社に入社させていただきました。

初めての業界・分野ではありますが、先輩方に追いつき追い越すためにも日々精進していきます。


今後ともよろしくお願いいたします。
| kitanog | 会社のこと | 15:56 | comments(0) | - |
 123456
78910111213
14151617181920
21222324252627
282930    
<< September 2014 >>

このページの先頭へ