アメリエフのブログ

バイオインフォマティクスの紹介と社員の日々
『バイオインフォマティシャン養成プログラム』開催のお知らせ
ライフサイエンスを学ぶ学生の方を対象に、バイオインフォマティシャン養成プログラムを開催いたします。
必修科目では、バイオインフォマティクスの基本となるLinux操作や、プログラミング言語perlを用いた簡単なプログラミングを学びます。
さらに選択科目を通して、より実践的な解析手法を学ぶことができます。
みなさまの研究を効率よく行うためのスキルアップをサポートいたします。

■開講時間
月に1度、1コマ90分の講義を2コマ行います。

■科目・価格一覧


■お申込み方法
参加をご希望の方は、弊社ホームページのお問い合わせより、次の項目をご記入の上、お申し込みください。
(1) お名前(よみがな)
(2) 現住所
(3) 連絡先 
(4) 学校名、学部名、専攻名など

詳細は弊社ホームページでもご覧いただけます。

ご検討よろしくお願い申し上げます。
| akb | スクール | 09:40 | comments(0) | trackbacks(0) |
キモカワ好きに捧げる3冊
1冊目は、独自の進化により鼻で歩行するようになった
「鼻行類」という哺乳類について、まじめな雰囲気で書かれた本です。

鼻行類―新しく発見された哺乳類の構造と生活 (平凡社ライブラリー)
鼻行類―新しく発見された哺乳類の構造と生活 (平凡社ライブラリー)
Harard Stumpke,日高 敏隆,羽田 節子

大学生の時、学部の先輩に「生物学を学ぶ者、必読の書」と
騙されて(?)読みました。
「鼻行類」には大きいのから小さいのまで多様な種がいて、
彼らの生態が図を交えて説明されています。
最近人気のこびとづかんの元祖といってもいいかもしれません。


次の2冊は、いずれも人類滅亡後の地球において、
生物がどのような進化を遂げるかを予測した本です。
CGによるカラフルな図が豪華です。
現存の生物と比べると見た目がグロテスクなものも多く、
この本を小さい子供に見せるとトラウマになるか、
無類の生物好きになるかのどちらかでしょう。
こちらも生態が詳しく考察されており、
お好きな方にはたまらないものがあります。

アフターマン 人類滅亡後の地球を支配する動物世界
アフターマン 人類滅亡後の地球を支配する動物世界
ドゥーガル・ディクソン,今泉 吉典

フューチャー・イズ・ワイルド
フューチャー・イズ・ワイルド
ドゥーガル・ディクソン,ジョン・アダムス,松井 孝典,土屋 晶子

「フューチャー・イズ・ワイルド」によると、
2億年後の地球では巨大な陸生のイカが繁栄しているそうです。

人生にちょっと疲れたとき、イカになって森の中を
のっしのっしと歩いている自分を想像してみてはいかがでしょうか。
ちょっと体の力が抜けると思います。
| hat | 書籍の紹介 | 17:31 | comments(0) | trackbacks(0) |
その数学が戦略を決める
その数学が戦略を決める
その数学が戦略を決める
山形 浩生


 世の中には専門家と呼ばれる人たちがいます。ワインの価値を決める専門家、政府の政策決定の専門家、映画の脚本家、病院で患者を診察する先生、裁判所で判決を言い渡す裁判官…。我々が、何か情報を得たい時は彼ら専門家の意見を参考にすることが多いでしょう。ところが、専門家に聞くよりも、正確な判断が得られる方法があるとしたらどうでしょうか。しかも、まだ起こっていない事象に対してまで正確な判断が下せるとしたら。
 この本は、様々なデータの蓄積を利用し、回帰分析等の統計的手法(本書では絶対計算と呼びます)を駆使することで、専門家の予測よりも確実な結果を下せることを示す衝撃的な本です。
 例えば、冒頭にはその年のワインの味を「飲む前に」絶対計算を用いて予測した結果が、実際の評価とよく一致する話が書かれます。それ以外にも、次から次へと専門家を圧倒するデータが示されます。
 私はこの本を読んで、大量のデータと統計の力を持つものが世界を制することになるだろうと感じました。日本でもビッグデータの活用が叫ばれて久しいです。統計の圧倒的な力を見せつけられる本書を読んでおくことは、この時代を生きるビジネスパーソンにとって必須事項ではないかと思います。
| deda | 書籍の紹介 | 09:45 | comments(0) | trackbacks(0) |
メリークリスマス
Merry-Christmas!

この時期、私が毎年楽しみにしているのが、
クレイグ・ベンター研究所による
カビで描かれたクリスマスアートです。

Twas the night before Christmas

2012年も残り1週間になりました。
みなさま風邪に気を付けて、よい年越しを!
| hat | よもやま話 | 17:05 | comments(0) | trackbacks(0) |
スクールDay6
akbです。

明日は、バイオインフォマティクス・スクール「Linux基礎」の最終回です。

第五回では第四回の解析結果を考察し、Fastx-toolkitを用いてトリミングを行っていただきました。
講義の後半では「解析の自動化」を行うためのシェルスクリプトの実行方法を学びました。
次世代シーケンスデータの解析は、複数の解析ツールを組み合わせて行います。これまでの講義で解析結果の集計や解釈、また必要に応じた解析ツールの使用方法を習得していただけましたら幸いです。

今回は、プログラミング言語perlを学びます。
前回の講義で作成していただいたVCFファイルを任意に定めた基準でフィルタリングを行うプログラムを作成していただきます。
プログラミングを習得することで、様々なファイルの加工が可能になります。

それでは最終回も頑張っていきましょう。
浜松町でお待ちしております。
| akb | スクール | 09:18 | comments(0) | trackbacks(0) |
samtools tview
マッピング結果(BAMやBEDなど)を表示するビューアはいろいろありますが、最近はBroad InstituteのIGV(Integrative Genomics Viewer)が主流のようです。

おなじみsamtoolsにもtviewというCUIベースのビューアがあるのをご存知でしょうか。
今日はこのsamtoolsのビューア機能についてご紹介します。

早速起動してみましょう。

$ samtools tview BAMファイル


黒い画面が出てきました。
いきなり心が折れそうになりますが、ここで負けてはいけません。
「Shift」+「?」をタイプするとヘルプが出ます。


いろいろなスクロール方法があるようです。しかし、第一番染色体の先頭からスクロールしてマッピング箇所を探すのは、砂漠で手がかりもなしにオアシスを探すような無謀な行動です。

「g」または「?」をタイプしてみましょう。


「Go to:」の後ろにポジション(chr1:1000000など)をタイプして「Enter」をタイプすると、その場所にジャンプすることができます。


リードがありました!

塩基に色をつけることもできます。


お世辞にも使いやすいとはいえず、これで解析するのは現実的ではないと思います。
イースターエッグ的な位置づけなのでしょうか。

それでもリードが表示されるとなんだかうれしいので、samtoolsが使える環境の方は一度はお試しください。
| hat | ゲノムブラウザ | 17:24 | comments(0) | trackbacks(0) |
年末年始休業のお知らせ
平素はアメリエフ株式会社のサービスをご利用頂きまして、誠にありがとうございます。年末年始の休業および営業日についてお知らせいたします。

【休業期間】
2012年12月29日から2013年1月6日まで
【営業開始】
2013年は1月7日(月)より通常営業

年末年始のお問い合わせにつきましては、7日以降に順次対応させていただきます。
ご不便をおかけ致しますが、何卒ご了承くださいますよう宜しくお願いいたします。

また、この一年のご愛顧に心より感謝とお礼を申し上げます。
来年も皆様にとって、すばらしい年になることを社員一同お祈り申し上げます。

アメリエフ株式会社 社員一同
| きむ | 会社のこと | 09:05 | comments(0) | trackbacks(0) |
DNAcopy
tokunagaです。

前回はgenoCNというパッケージについてご紹介させていただきましたが、
本日もSNPジェノタイピングアレイを用いたCNV検出ツールにつきまして簡単にご紹介をしたいと思います。

RのBioconductorのパッケージのDNAcopyです。

genoCNはHidden Markov Model(HMM)でしたが、今回はCircular Binary Segmentation(CBS)というアルゴリズムを使ってDNAのコピー数異常を検出するツールです。
下記のようなプロット図を作成することが出来ます。



染色体ごとのプロット図



また機会がありましたらCNV解析ツールのご紹介いたします。
| tokunaga | CNV解析 | 09:19 | comments(0) | trackbacks(0) |
「SNPデータ解析入門」 本日14:45〜 On Air
本日12/15(土)のバイオインフォマティクス勉強会を
以下のURLからUstream配信します。
http://www.ustream.tv/channel/amelieff

使用スライドをSlideShareにUpしましたので、
小さい字が見づらい場合はこちらもご覧ください。

14:45-15:15
「はじめてのLinux〜コンパウンドヘテロを探してみよう〜」
 →SlideShare

15:30-17:00
「SNPデータ解析入門」
 →SlideShare

あいにくの雨模様ですので、会場にお越しになる方は
どうぞお気をつけてお越しください。
| hat | 勉強会 | 13:34 | comments(0) | trackbacks(0) |
「SNPデータ解析入門」 満員御礼
明日開催の第19回バイオインフォマティクス勉強会「SNPデータ解析入門」はお申込みが定員に達しましたのでキャンセル待ちとさせていただいております。

たくさんのお申込み、ありがとうございました!
| hat | 勉強会 | 15:03 | comments(0) | trackbacks(0) |
intersectBedの使い方
bedtoolsBEDフォーマットのファイルを扱うのに便利なツール群です。

今回はその中の1つ、intersectBedについてご紹介します。
intersectBedを使うと、複数BED間で重複している領域を簡単に抽出することができます。

テストデータとして、2つのBEDファイルを用意しました。

==> A.bed <==
chr1 10 30 A_1
chr1 40 50 A_2
chr1 70 80 A_3

==> B.bed <==
chr1 10 15 B_1
chr1 20 25 B_2
chr1 30 40 B_3
chr1 60 90 B_4

A.bedとB.bedの位置関係は次のようになります。


-aで指定したBED中の要素のうち、-bで指定したBED中の要素にオーバーラップするものだけを抽出するには、-waオプションをつけます。

$ intersectBed -a A.bed -b B.bed -wa
chr1 10 30 A_1
chr1 10 30 A_1
chr1 70 80 A_3

→A_1とA_3だけが出力されました。
 A_1が2回出力されるのは、2回オーバーラップしているためです。

-uオプションをつけると、重複した結果がマージされます。

$ intersectBed -a A.bed -b B.bed -wa -u
chr1 10 30 A_1
chr1 70 80 A_3

→A_1の出力が1回だけになりました。

-waの代わりに-wbを使うと、bの情報も出力されます。

$ intersectBed -a A.bed -b B.bed -wb
chr1 10 15 A_1 chr1 10 15 B_1
chr1 20 25 A_1 chr1 20 25 B_2
chr1 70 80 A_3 chr1 60 90 B_4

→左4列は「a中のオーバーラップ領域」、
 右4列は「オーバーラップしたbの情報」です。

-fオプションを使うと、オーバーラップの割合を指定できます。
 例えば、全長の3割以上がbにオーバーラップされるものだけを抽出するには、-f 0.3と指定します。


$ intersectBed -a A.bed -b B.bed -wa -f 0.3
chr1 70 80 A_3

→A_3だけが出力されました。
 A_1(20bp)は、B_1によって5bp、B_2によって5bpで計10bpオーバーラップしているのですが、出力されません。おそらく積算ではなく、1要素によるオーバーラップ領域長で見ているのだと思われます。


-vオプションをつけると、オーバーラップ「しなかった」ものが出力されます。
$ intersectBed -a A.bed -b B.bed -wa -v
chr1 40 50 A_2

-cオプションをつけると、オーバーラップしたbの数も出力されます。
$ intersectBed -a A.bed -b B.bed -wa -c
chr1 10 30 A_1 2
chr1 40 50 A_2 0
chr1 70 80 A_3 1

-waoオプションをつけると、オーバーラップしたbの情報と、オーバーラップした塩基数が出力されます。
$ intersectBed -a A.bed -b B.bed -wao
chr1 10 30 A_1 chr1 10 15 B_1 5
chr1 10 30 A_1 chr1 20 25 B_2 5
chr1 40 50 A_2 . -1 -1 . 0
chr1 70 80 A_3 chr1 60 90 B_4 10

以上、A.bedを主体にした結果を出しましたが、Bを主体にした結果を出したい場合は、-a B.bed -b A.bedのように、-aと-bの指定をひっくり返せばOKです。

また、今回のテストBEDにはストランド情報がないので実行していませんが、-sオプションで「同じ向きに限定」、-Sで「逆の向きに限定」することができます。

すごいのはこのintersectBed、BAM・VCF・GFFにも使えることです(※BAMの場合は-aの代わりに-abamでファイルを指定してください)。
マッピング結果への簡単なアノテーション付けくらいならこれだけで行えてしまうくらいなので、まだ使ったことがない方はぜひお試しください。

| hat | バイオインフォマティクス | 11:23 | comments(0) | trackbacks(0) |
「SNPデータ解析入門」 空席僅かです
既にアナウンスさせていただいておりますが、
今週末12/15(土)に
第19回 バイオインフォマティクス勉強会「SNPデータ解析入門」
を開催します。

たくさんの方にお申し込みをいただきありがとうございました。
あと2〜3名はお席をご用意できますので、
ご検討中の方はお早めにお申込みください。

今回初の試みとして、勉強会の内容をUstream配信します。
会場にはお越しになれないがご興味はあるという方に
ぜひご視聴いただきたいです。

配信URLはこちらです。
http://www.ustream.tv/channel/amelieff

※スライドは開始前に弊社のSlideShareページにも
 Upさせていただく予定です。
 スライドが見づらい場合は、こちらも併せてご覧ください。

また、一般公開したくない情報や質疑応答中などは
配信を中断させていただくことがございますので、
ご了承ください。

社内でテストしたところ、パソコンによっては
IEで映像が表示されない場合がありました。
視聴がうまくいかない場合は、他のブラウザも
試していただけますと幸いです。

それではみなさまのご来場(&ご視聴)をお待ちしています。
| hat | 勉強会 | 09:45 | comments(0) | trackbacks(0) |
学会出展中
tokunagaです。

本日から福岡で開催されている日本分子生物学会にブースを出展しております。ちなみに、ブースはこのような感じです。



学会に参加されている方は、是非弊社のブースまでお気軽に足をお運びくださいませ。
そして、解析のことでお困りの方、解析スキルを身につけたいという方がいらっしゃいましたら是非ご相談ください。

また、会場内にて13日(木)に会社説明会も予定しておりますので、そちらも合わせてよろしくお願いいたします。

皆様にお会いできますこと心よりお待ちしております。
| tokunaga | 学会出展 | 18:22 | comments(0) | trackbacks(0) |
1000 人ゲノムプロジェクトJPT データの活用
 皆様、こんにちは。detです。今回は、前回に引き続きまして、日本人全ゲノムシーケンスデータの解析についてご紹介いたします。

 解析には、弊社製の Reseq パイプラインを用いました。前回は、データのクリーニング結果について、ご紹介しました。今回は、マッピングとSNV/Indel検出の結果を、簡単にご紹介いたします。
 まず、ヒトゲノム(UCSC hg19 + Scaffold )およびデコイ配列(version5)に対して、BWAを用いてアライメントを行いました。その結果、92.77%のリードがマッピングされました。
 次に、CCDS(consensus coding sequence)について集計を行った結果を以下の表に示します。



表より、CCDS の 97.80% を平均カバレージ28でシーケンスできていることが分かります。ゲノム全体としては、89.15% (2,765,146,564 base)を、10以上のカバレージでシーケンスすることができました。前回のクリーニング結果でもそうでしたが、この日本人全ゲノムのシーケンシングは高い精度で行われたことが分かります。
 また、GATKを用いてリアライメント・SNV/Indel検出を行った結果を下の図に示します。



 SNV/Indel検出の結果、3,413,445個のSNVと311,413個のIndelを検出しました。そのうち、1000人ゲノムプロジェクト及びdbSNP135に登録されていない多型は375,656個ありました。さらに、BreakDancerを用いて、ペアリードの情報から構造多型を検出した結果、361個の逆位、800個の染色体内転座、215個の染色体間転座などの候補が検出されました。

 次回は、1000人ゲノムプロジェクトJPTサンプルの解析結果と、日本人全ゲノムシーケンスデータを簡単に比較してみたいと思います。

-----関連記事-----
1000 人ゲノムプロジェクトJPT データの活用
1000 人ゲノムプロジェクトJPT データの活用
1000 人ゲノムプロジェクトJPT データの活用
1000 人ゲノムプロジェクトJPT データの活用
1000 人ゲノムプロジェクトJPT データの活用
1000 人ゲノムプロジェクトJPT データの活用
| deda | 次世代シーケンサー解析 | 18:17 | comments(2) | trackbacks(0) |
スクールDay5
akbです。

今週土曜日はバイオインフォマティクス・スクール「Linux基礎」の第五回です。スクール10月期も残すところ2回となりました。

前回はFastQC、BWA、SAMtoolsなどのツールを用いた次世代シーケンスデータの解析を行いました。
結果をFastqcのレポートファイルやIGVによる可視化から考察していただきました。
今回は、前回の解析結果の考察を考慮して解析を進めていきます。
「解析結果の違い」に着目していただけると幸いです。
講義の後半では「解析の自動化」を行うためのシェルスクリプトが登場します。
内容が盛り沢山の第五回ですが、少しでも理解を深める事が出来ますよう努めてまいります。
それでは浜松町でお待ちしております。
| akb | スクール | 12:45 | comments(0) | trackbacks(0) |
Rユーザ会に参加してきました
hatです。

先週土曜日、2012年度統計数理研究所共同研究集会「データ解析環境Rの整備と利用」の「国内ユーザーによる報告」に参加してきました。

普段はバイオの話ばかりなので、疫学やTwitter解析や感染症シミュレーションなど、他分野のお話がたくさん伺えておもしろかったです。

どこでも大容量データの取り扱いがネックになっていて、読み込み方法の工夫や並列化などで対処されているようです。

RはコマンドラインかWindowsのRGuiで使うものだと思っていたのですが、RStudioのような優れた開発環境や、ef-prime社のR Analytic Flowのような使い勝手のいいフロー管理ソフトがあることを知ったのも大きな収穫の一つです。
今後はぜひこのようなソフトを活用して、Rを使いこなしていきたいと思います。
| hat | 統計解析ソフトR | 09:16 | comments(0) | trackbacks(0) |
人材募集中!
久しぶりの登場になります、山口です。

12/3の分子生物学会@福岡出展のブログにもありますが、2014年3月卒者向け会社説明会を分生会場内で行います。

新卒に限らず、第二新卒や中途採用も行っていますので、
ご興味のある方はぜひ足をお運びください。


仲間として一緒に働く以上、価値観を共有してチームワークを発揮したいので、どんな価値観で仕事をしているのか、どのような仲間を求めているのか、をご紹介したいとおもいます。


第一に「好奇心をもって、自ら動き出すことができる人」。
云われたことをこなすだけ、の人はベンチャーではやっていけません。仕事に慣れてきたら、積極的にアイデアを出せる人。なおかつそれを実現するため、勉強や調査、準備に実行と結果の分析まで一貫してできれば一人前です。入社して2〜3年でこの水準に到達してもらいます。


第二に「チームワークを大事にする人」。
個人プレイヤーでは、組織として一緒に働く意味がありません。個人事業主の集団ではないのですから。独りの人間が全てのタスクをこなすことはできません。人には向き不向きがありますし、私自身も事務作業が苦手なので、優秀な事務スタッフのおかげで業務が廻っています。
苦手なことは他人に任せて、自分の強みをより強くすることが大事です。

第三に「インプットとアウトプットのバランスを取れる人」。
1日24時間を三等分し、8時間は寝食などの生命維持、8時間は業務を通した社会へのアウトプット、その他の8時間は勉強や情報収集などのインプットにあてることで、人として大きく成長できると考えています。
インプット(=情報収集)ばかりでは社会への還元ができなくて自己満足で終わってしまいます。アウトプット(=仕事)ばかりでは、学生時代までに溜め込んだインプットを出し切った途端、抜け殻みたいになってしまって、結局はその後のアウトプットができなくなります。

継続して仕事で成果を出しつつ人生も満喫するためには、インプットとアウトプットのバランスが大事だとおもいます。


以上のことから、スピード感をもって能率よく仕事もプライベートも充実させたい人のご応募お待ちしています!

山口

PS. 冷静に読み返してみると、研究の話題に全く触れていませんね。つまり大事なことは、現時点での専門知識や専攻分野、技術力は関係ないということですね。
| 社長 | 会社のこと | 10:52 | comments(0) | trackbacks(0) |
CNV検出ツールのご紹介
tokunagayです。

本日はSNPジェノタイピングアレイを用いたCNV検出ツールのご紹介をしたいと思います。
RのBioconductorのパッケージのgenoCNです。

genoCNに関する論文では、以前ブログでご紹介したことのあるPennCNVとの比較も行われています。

個々のcopy number variants(CNVs)の検出だけでなく、ケース・コントロールがある場合はコントロールのジェノタイプを考慮したcopy number aberrations (CNAs)の検出も出来るのが特徴です。
下記のような図も出力することが出来ます。



Illumina、Affymetrix、どちらのSNPジェノタイピングアレイにも対応しているようです。
また機会がありましたら詳しい使い方などをご紹介したいと思います。
| tokunaga | CNV解析 | 11:46 | comments(0) | trackbacks(0) |
「第35回 日本分子生物学会」出展のご案内
アメリエフ株式会社は、2012年12月11日(火)〜14日(金)に福岡で開催される、「第35回 日本分子生物学会」に出展いたします。
皆さまのご来場をお待ち申し上げます。

■ 学会名
・第35回 日本分子生物学会
 ホームページ:http://www2.convention.co.jp/mbsj2012/

■ 開催期間
・2012年 12月 11日(火)〜 14日(金)

■ 会場
・マリンメッセ福岡(福岡市博多区沖浜町 7-1)

■交通アクセス
・福岡空港から地下鉄/バス利用の場合はこちらをご参照ください。
・JR 博多駅から タクシー約10分
・福岡空港から タクシー約15分

■ 展示内容
・次世代シーケンスデータ解析サービスのご紹介

・出張サポートサービスのご紹介
 *解析オペレーション
 *公開ツール導入
 *ソフトウェア作成

・バイオインフォマティクス・スクールのご紹介
 *Linux基礎
 *NGS基礎(Exome、RNA-Seq、ChIP-Seq他)
 *R入門バイオ統計
ブースにお越しいただいた皆様に
・はじめてのLinux 〜Primer3を用いてプライマー設計しよう〜
・コマンド早見表付きカレンダー                                   をプレゼントいたします!

■ 会社説明会
・2014年度新卒および経験者の皆様をお持ちしております
 日時:12月13日(木) 11:00〜11:30
 場所:マリンメッセ福岡 2階会議室
| akb | 学会出展 | 12:38 | comments(0) | trackbacks(0) |
      1
2345678
9101112131415
16171819202122
23242526272829
3031     
<< December 2012 >>

このページの先頭へ