アメリエフのブログ

バイオインフォマティクスの紹介と社員の日々
HGVDについて (3) 平均depth編
HGVDについて (1)
HGVDについて (2) サンプル数編

※※ 前回の記事まで、データベースの名称を誤っておりました。ブログをご覧くださった皆様、並びに関係者様各位にご迷惑をおかけしてしまい申し訳ございません。

前の記事に引き続き、Human Genetic Variation Databaseで公開している日本人ゲノムデータの、データの確からしさの判断に使えそうな項目を見てみます。
データベースに含まれている項目の詳細については、前の記事をご参照ください。

今回は、Mean_depthについて調べてみます。
まず全SNPのMean_depthの分布のグラフを書いてみます。
HGVDのdepth(all)

depthが1〜200xのSNPが多いようです。
基本統計量を求めてみると、Mean_depthが浅いSNPもあります。
もう少し、Mean_depthの浅いSNPに注目してみるため、Mean_depthが50以下のSNPでMean_depthの分布を調べてみました。

HGVDのdepth(50以下)

全体における割合は少ないですが(2.81%)、Mean_depthが10未満のSNPが13,534個ありました。
もちろん、これはそのSNPをシーケンスしたサンプル全体における平均なので、ただdepthが浅いと判断するのではなく、サンプル数や、depthの標準偏差も見ながら判断するする必要があると思います。


以上でHGVD(Human Genetic Variation Database)についての紹介を終えたいと思います。
連載の最初にも書きましたが、人種特異的な遺伝情報のデータベースは、病気の遺伝子研究に役立つと考えられます。
これからも様々なデータベースが作られ、発達していくのが待ち遠しいですね。
| kubo | バイオインフォマティクス | 15:09 | comments(0) | - |
危険な道を選ぶ
安全な道と危険な道、どちらかで迷っている時、
「危険だ、という道は必ず、自分の行きたい道なのだ。」
著書『自分の中に毒をもて』の中で、岡本太郎氏はこう語っています。


自分の中に毒を持て―あなたは“常識人間”を捨てられるか

いつも危険な道を避けてしまう私は、読んでいてドキッとしました。
火事場の馬鹿力ともいうように、窮地に立つことで、隠れた能力を引き出せることは、経験的にわかりますが、それを理解していても、ストレスなく日々の生活を送りたい、という甘えが勝ってしまい、リスクの少ない場所に身を置いてしまいがちです。

自分の情熱に従いたとえ茨の道でも前進する人は、端から見ても非常に魅力的です。STAP細胞の小保方先生も、研究初期の頃は、共同研究者が見つからなかった等さまざまな困難にぶつかりながら研究に励んだという話を伺いました。研究者としてのキャリアに対するリスクを背負いながらも、ご自身のこだわりを貫いた姿勢がとてもかっこいいです。

私ももう少し自分自身のセキュリティーを緩めて、あえて危険な道を選んでみたいです。手始めに賞味期限切れの牛乳を飲んでみるとか。
| heshi | 書籍の紹介 | 14:15 | comments(0) | - |
保母の友人の話
保母の友人から聞いて、とても心に残っている話があります。

彼女が受けた研修に、次のようなグループワークがあったそうです。

1.一人が鬼になって部屋の外に出る。
 他の皆は相談して、一つのものを部屋のどこかに隠す。
2.鬼を部屋の中に入れて、隠したものを探させる。
3.他の人は言葉を使わずに鬼に場所のヒントを与える。

この遊びを2回行うのですが、1回目と2回目で「3」の
「ヒントの与え方」を変えます。
1回目は「鬼が隠し場所から遠ざかったらブーイング」し、
2回目は「鬼が隠し場所に近づいたら笑顔で大拍手」するように
したそうです。

保母の彼女は
2回目、拍手されて鬼はすごく嬉しそうだった。
正解がわからないから試行錯誤してるのに
ブーイングされるのは嫌だよね。
我々大人でもそうなんだから、
子供はもっとそうだよね

と言っていました。

それは、子供が失敗しても責めたり怒ったりせずに我慢強く見守り
良いことをしたときに思いっきりほめてあげようということを
理解するための研修だったようです。

そのような教え方は、すごく素敵だなあと思いました。
| hat | よもやま話 | 15:49 | comments(0) | - |
マルチタスク
hatです。

バイオインフォはデータサイズが大きいため、1つのコマンドの実行に
時間がかかります。
効率的に作業するために、複数の作業を並行して進めることが多いです。

作業はLinuxサーバにSSHクライアント(TeraTerm)で接続して行うので
デスクトップにはTeraTermのウィンドウが幾つも開いています。

こっちは受託解析の実行、
こっちは勉強会用のテストデータ作成、
こっちは新しいゲノムのインデックス作成、...
という風です。

こっちが実行中の時はこっちでプログラムを書いて...というように
ウィンドウを飛び回って作業するのですが、だんだんどれが実行中
なのかわからなくなってきます。

プロセスが終わったらTeraTermの色が変わってお知らせしてくれる
ような機能(アドオンでも)があるとすごく便利だと思うのですが、
ないものでしょうか。
どなたかご存知だったら教えてください。

今日はバレンタインデーなので、チョコを作ってきました!

| hat | よもやま話 | 10:00 | comments(0) | - |
Pythonでグラフを書こう その3
Pythonでグラフを書こう、の第3回です。
前回の記事では、matplotlibを使用して円グラフを描いてみました。今回はそのプログラムのソースを見ていきたいと思います。

前回の記事でダウンロードした pie_chart.py をテキストエディタなどで開くと以下のように表示されます。

===========================================
import matplotlib.pyplot as plt

# The slices will be ordered and plotted counter-clockwise.
labels = 'Frogs', 'Hogs', 'Dogs', 'Logs'
sizes = [15, 30, 45, 10]
colors = ['yellowgreen', 'gold', 'lightskyblue', 'lightcoral']
explode = (0, 0.1, 0, 0) # only "explode" the 2nd slice (i.e. 'Hogs')

plt.pie(sizes, explode=explode, labels=labels, colors=colors,
autopct='%1.1f%%', shadow=True, startangle=90)
# Set aspect ratio to be equal so that pie is drawn as a circle.
plt.axis('equal')
plt.show()


===========================================

最初のimport行は、matplotlibを使用するためのおまじないです。
labelsでグラフの各項目のラベル、sizesで各項目の割合、colorsで各項目の色を決定します。またexplodeは円グラフの該当する項目を円から離す設定を書き込みます。explodeの次の行の plt.pie() で、円グラフに上記の設定を反映させます。

これらの設定を変更することで多様な円グラフを書くことができます。次回は、別の種類のグラフを書いてみたいと思います。
| deda | システム | 14:44 | comments(0) | - |
第29回バイオインフォマティクス勉強会「フリーソフトではじめるRNA-seq解析入門@東京」開催のお知らせ
2月15日(土)に開かれる第29回バイオインフォマティクス勉強会のご案内です。

お手持ちのPC(Mac/Linux)でNGS解析(特にRNA-seq)を始めたい方を対象に、公開データを用いたデータ解析手法をご紹介します。また、精度の高い解析結果を出すためにポイントとなる、フリーソフトの使い方やコマンド操作など実例を交えてご紹介いたします。なお、本セミナーでご紹介する主なソフトウェアはTopHat、Cufflinks、Rなどです。ご紹介したコマンドはお配りする資料にすべて記載してありますので、お持ち帰りいただき、ぜひNGS解析を始めていただきたいと思います。
勉強会後には情報交換会、会場にはささやかですがソフトドリンクとお菓子のコーナーをご用意しております。ご質問などございましたら、お近くのスタッフまでいつでもお気軽にご相談ください。みなさまにとって、貴重な情報交換の場となりましたら幸いです。

               記
日時 :2014年2月15日(土) 10:00〜11:30
場所 :文京区 区民センター (東京都文京区本郷4-15-14 3-D会議室)
地図 :http://www.city.bunkyo.lg.jp/gmap/detail.php?id=1754
定員 :30名

お申込み方法などの詳細はこちらをご参照ください。勉強会後に情報交換会を開きますので、ぜひ参加をご検討ください。

みなさまとお会いできることを楽しみにしています。ご意見・ご質問・リクエスト等ございましたら、遠慮無くご連絡ください。
| akb | 勉強会 | 16:01 | comments(0) | - |
スクールの楽しみ
hatです。

2月、3月はバイオインフォマティクス・スクールが続きます。

2/6-7「Linux基礎」、2/13-14「Perl基礎」は
弊社が加入している健康保険組合の市ヶ谷の会議室をお借りして
行うことになりました。

お申込みいただいた方には地図をお送りしておりますが、
最寄駅は、新宿線「曙橋駅」、大江戸線「牛込柳町駅」または
丸ノ内線「四谷三丁目駅」になります。

私のスクールの楽しみの一つが、参加していただいたみなさんと
一緒にお昼を食べることなのですが、今回は、同じビルに
リストランテ アル・ファーロという、格安でおいしいイタリアンが
ありますので、こちらにお誘いしようかなあと考えています。

組合員同伴でないと入れないお店ですので、この機会にぜひ。
| hat | スクール | 13:29 | comments(0) | - |
      1
2345678
9101112131415
16171819202122
232425262728 
<< February 2014 >>

このページの先頭へ