アメリエフのブログ

バイオインフォマティクスの紹介と社員の日々
Rの勉強会に行ってきます!
先週は、フリーの統計解析ソフトウェアRで、シンプルな図を描く作業を行いました。

今日は個人的なお話になりますが・・
私はRの初心者で、統計計算やグラフィック機能を自由に活用できるようになるために目下勉強中です。

今週末は、社長が主催するRの勉強会に参加する予定です。
10名ほどで少しずつお金を出し合って、会議室を借りて行われるそうです。
大変ありがたいことに、プロジェクターで投影しながら進行していくそうなので、ノートPCを持っていない私でも勉強できそうです。

社会人勉強会に参加するのは初めてなのでドキドキしますが、
しっかり勉強してブログにも還元していきたいなと思っています。

明日からは、フリーのCNV統計解析ソフト「PennCNV」の使い方を紹介していこうと思いますので、どうぞよろしくお願いいたします♪

ブログランキングに参加しています。
ポチっと押していただけますと、元気100倍です。
   downdowndown
医学人気ブログランキング



| きむ | よもやま話 | 16:51 | comments(0) | trackbacks(0) |
Rを使って図を描こう5
今日は、研究対象の集団の特性を見ていきたいと思います。
ここでの臨床データは、測定数値などの連続変数を対象にします。

臨床データのファイル名は「clinical.txt」にしました。
number Age HT BW BMI Waist HbA1c Adiponectin IL.6 Leptin
1 51 169.5 52.8 18.37784 72.5 5.2 19.6 1.9 1.3
2 54 167.0 59.2 21.22701 NA 6.3 8.4 22.6 1.2
3 55 170.5 59.4 20.43326 79.0 6.5 5.5 1.9 3.4
4 52 182.8 61.3 18.34459 70.2 5.5 6.9 0.9 2.2
:
:
単語と単語をタブで区切ったファイルです。
(上のデモでは、スペース区切りになってしまっているようです)

では、Rで作業を行います。
作業ディレクトリをファイル「clinical.txt」を置いたフォルダに変更します。
> setwd("/Users/document/study")
データフレーム「clinical」に格納します。
> clinical <- read.table("clinical.txt", header = TRUE)
前回と同じように、データフレーム「clinical」にデータファイルの中身がちゃんと入っているかどうか確認してください。

summary関数を使うと、データの統計的な要約を見るこでができます。
データフレーム名「clinical」を入力し、Enterキーを押します。
> summary(clinical)
Age HT
Min. :42.00   Min. :149.0
1st Qu.:54.00   1st Qu.:156.6
Median :60.00   Median :165.0 ‥‥
Mean :58.06   Mean :164.2
3rd Qu.:62.00   3rd Qu.:169.5
Max. :69.00   Max. :182.8

次に、臨床データのうちBMIのヒストグラムを描いてみます。
PNG形式の画像ファイル「BMI_hist.png」に出力します。
hist関数を使用します。BMIの列を指定するには、「clinical$BMI」と書いてください。
> png('BMI_hist.png')
> hist(clinical$BMI, breaks=10, main="Histogram of BMI", xlab="BMI")
> dev.off()

作業ディレクトリに「BMI_hist.png」ファイルが作成されたか確認してみましょう。


オプションの数値やラベルを変えて、お好みの図を作成してください。


お問い合わせページ
http://amelieff.jp/enquiry/index.html



| きむ | 統計解析ソフトR | 14:06 | comments(0) | trackbacks(0) |
Rを使って図を描こう4
昨日は、Rで図を描くために
1.データファイルの準備
2.データファイルの読み込み
の2ステップを行いました。

今日は、3ステップ目の「グラフの描画」です。

作図ドライバを起動して、PNG形式の画像ファイルに書き込んでいきます。
「''」の中でファイル名を「rs100.png」に指定しています。
png関数を使用します。
> png('rs100.png')

次に、boxplot関数で箱ひげ図を書いていきます。
発現量のような連続変数は縦軸、遺伝型のようなグループを表す変数は横軸になります。
> boxplot(expression~genotype, data=rs100)
最後に作図ドライバを閉じます。
> dev.off()
無事に、作業ディレクトリに「rs100.png」ファイルが作成されたか確認してみましょう。

ちょっとそっけないですね。

では、オプションを設定して見やすい図を作成してみます。
> png(filename="rs100deco.png", width = 400, height = 400)
> boxplot(expression~genotype, data=rs100, main="rs100", xlab="genotype", ylab="expression", cex.main=2, cex.axis=1.3)
>dev.off()


いかがでしょうか。
他にもいろいろ設定できますのでお試しください。

お問い合わせページ
http://amelieff.jp/enquiry/index.html


| きむ | 統計解析ソフトR | 13:10 | comments(0) | trackbacks(0) |
Rを使って図を描こう3
ここでは、Expression-QTL解析により示唆された複数のeQTL候補のうち、ひとつだけを選び出して、図を作成し保存すると想定して作業していきたいと思います。

Rで図を描くための簡単な手順は以下の通りです。
1.データファイルの準備
2.データファイルの読み込み
3.グラフの描画

1.データファイルを準備します。
ファイル名は「rs100.txt」にしました。
Name genotype expression
1 AB 41.11
2 AB 35.431565
3 AB 40.74666
4 AA 65.08612
5 AA 48.581745
6 BB 11.8881965
7 AA 56.56106
:
:

単語と単語をタブで区切ったファイルです。
(上のデモでは、スペース区切りになってしまっているようです)
私は秀丸エディタで作成しましたが、ウィンドウズのメモ帳でも作成できます。
一行目は、列固有のデータ名(変数名)を入力します。
空白には「NA」と入力してください。

2.データファイルを読み込みます。
Rでは特定の作業ディレクトリ(フォルダ)に対して、ファイルの出入力を行います。
まず、getwd関数で現在の作業ディレクトリを表示させます。
> getwd()
次に、setwd関数で作業ディレクトリを、データファイル「rs100.txt」を置いたフォルダに変更します。「""」の中でフォルダを指定しています。下では、documentフォルダ内のeQTLフォルダに変更しています。
> setwd("/Users/document/eQTL")

read.table関数でデータファイル「rs100.txt」を読み込み、データフレーム「rs100」に格納します。
> rs100 <- read.table("rs100.txt", header = TRUE)

では、データフレーム「rs100」にデータファイルの中身がちゃんと入っているかどうかチェックします。
データフレームの中身を表示させるには、データフレーム名「rs100」を入力し、Enterキーを押します。
> rs100
Name genotype expression
1 1 AB 41.11000
2 2 AB 35.43156
3 3 AB 40.74666
4 4 AA 65.08612
5 5 AA 48.58174
6 6 BB 11.88820
7 7 AA 56.56106
:
:
と表示されました。

大きいデータのチェックを行う場合はtable関数を用いると便利です。
変数ごとに、どのような値を持つかチェックすることができますが、ここでは割愛させていただきます。

次回は、3ステップ目の「グラフの描画」です。


お問い合わせページ
http://amelieff.jp/enquiry/index.html

| きむ | 統計解析ソフトR | 17:08 | comments(0) | trackbacks(0) |
Rを使って図を描こう2 -Rの準備-
RをCRAN(The Comprehensive R Archive Network)からダウンロードします。日本からですと、筑波大学のミラーサイトからダウンロードするのがよいと思います。OSによってダウンロードするファイルが違うのでご注意ください。

次に、インストールします。
Macintosh の場合は、http://aoki2.si.gunma-u.ac.jp/R/begin.html
Windows・Linux の場合は、http://stat.sm.u-tokai.ac.jp/~yama/R/install.html
に詳しく紹介されています。

Rを起動します。
Rのアイコンをダブルクリックするとウィンドウが開きます。

ウィンドウの一番下の
>

はプロンプトと呼ばれ、この後ろに指示を記述します。
さっそくRを電卓のように使ってみます。
> 1+2

と入力し、Enterキーを押すと
> 1+2
[1] 3

と計算結果を出力してくれます。
[1]は「1番目の要素」という意味です。
[ ]内には、行頭の要素が何番目の要素にあたるかが表示されます。

Rを終了するときは
> q()

と入力しEnterキーを押すと、「作業スペースを保存しますか」と質問されます。次回に引き継いで作業を行う場合は保存を選択してください。

では、明日はRにファイルを取り込む作業まで行います。


【参考】
・筑波大学のCRANミラーサイト
http://cran.md.tsukuba.ac.jp/index.html

・R による統計処理
http://aoki2.si.gunma-u.ac.jp/R/

・R - 統計解析とグラフィックスの環境
http://stat.sm.u-tokai.ac.jp/~yama/R/
| きむ | 統計解析ソフトR | 12:56 | comments(0) | trackbacks(0) |
Rを使って図を描こう1
キムです。

先週は、PLINKを用いたQTL解析やGWAS、Expression QTL解析を紹介してきました。

今日からは、ExpressionQTL解析で有意差が確認されたSNPのデータから、
Rを使って箱ひげ図を作成する作業をしていきたいと思います。

Rは統計計算とグラフィック機能を兼ね備えたフリーの統計解析ソフトウェアです。

Rによる統計解析については、私はオーム社から出版されている
「Rによる統計解析」という本を愛読させていただいております。
ryamadaの遺伝学・遺伝統計学メモというサイトも大変参考になります。

ここでは、解析結果の可視化に焦点を絞りお話していきたいと思います。

Rについてはまだまだ勉強中の身ですので、至らない点などございましたら、
ご指摘いただけますと幸いでございます。

では、次回へ続きます。


【参考】
・PLINK
http://pngu.mgh.harvard.edu/~purcell/plink/index.shtml

・ryamadaの遺伝学・遺伝統計学メモ
http://d.hatena.ne.jp/ryamada22/

| きむ | 統計解析ソフトR | 17:01 | comments(0) | trackbacks(0) |
ブログランキングに参加してます
ブログの右側にある「LINKS」内に、会社関連へのリンクの他に医学の人気ブログランキングと、自然科学の人気ブログランキングへのリンクが貼ってあります。

そのものズバリの名前ですが、人気ブログランキングというブログのランキングサイトに登録しているためです。

ぽちっと押していただけるとランキング(現在、医学のランキングで17位!)が上がって嬉しいのですが、やはり上位にランキングされている方のブログは本当に面白いです。

タイトルに惹かれて(笑)見に行ってみたブログもありましたが、内容もしっかり魅力的で、ブロガーさんの個性が表れていたり業界の話が読めたりと勉強になりました。

お時間があるときには、他のブログもぜひ見に行ってみてください。
| 社長 | よもやま話 | 23:05 | comments(0) | trackbacks(0) |
eQTL解析
今週はPLINKを用いたQTL解析やGWASを紹介してきました。

今日は、SNPジェノタイピングとマイクロアレイを結合させるExpression-QTL解析(eQTL)を行います。

1.サンプルデータを用意します
遺伝子発現量が一定レベル以上の発現マーカーを対象に解析を行います。

2.MAPファイルを作成します
発現マーカーごとのMAPファイルを作成します。
発現マーカーの前後数kbの領域に含まれるSNP一覧のファイルです。

3.PEDファイルを作成します
発現マーカーごとのPEDファイルを作成します。
QTL解析では、affection statusカラムにコントロールorケースの情報を入力しました。
eQTL解析では、affection statusカラムに遺伝子発現量を入力します。
縦にサンプル、横に発現マーカーのSNPが並びます。

4.いよいよ解析です
plink --file exp --assoc --out arg

画面にファイルデータの詳細が表示されますので、意図どおりに認識されているかチェックしてください。
arg.qassocというファイルが出来上がります。
カラム数は9つで
Chr   Chromosome number
SNP   SNP identifier
BP    Physical position (base-pair)
NMISS  Number of non-missing genotypes
BETA  Regression coefficient
SE    Standard error
R2    Regression r-squared
T    Wald test (based on t-distribtion)
P    Wald test asymptotic p-value
です。

4ステップで、1つの発現マーカーに対する解析を行いました。

実際には、複数の発現マーカー(約2万)を対象に解析を行うことになるので、Perlでプログラミングすることで自動化しています。

すべてのマーカーを対象にMAPファイルを作成しeQTL解析する方法もありますが、膨大な計算時間がかかります。
例えば、計算時間20秒/マーカー → 2万マーカーで約111時間の計算時間がかかります。(弊社サーバーの場合)

事前に全ゲノムのeQTL解析をしておき、データベース化することで必要に応じて検索することもできます。

【参考】
・PLINKマニュアル(Quantitative trait association)
http://pngu.mgh.harvard.edu/~purcell/plink/anal.shtml#qt

| きむ | SNP解析 | 11:09 | comments(0) | trackbacks(0) |
PLINKの使い方1
これまでQTL解析のお話をしてきました。
今日はPLINKを使って基本的なSNPのデータ解析(GWAS:ゲノムワイド関連解析)を行います。

1.サンプルデータを用意します
NCBI Gene Expression Omnibus (GEO)に登録されているデータが整理されている「遺伝子発現バンク(GEO)目次」という大変便利なサイトがあります。
では、イルミナ社が公開しているHuman610-Quad v1.0ビーズチップでHapMapサンプルを解析したデータをダウンロードして使用します。
CHBとJPT(75サンプル)をコントロール、CEU(73サンプル)をケースにします。

2.MAPファイルを作成します
MAPファイルの名前はhapmap.mapにしました。
マーカー数が約62万なので、62万行4列の縦長の形になります。

3.PEDファイルを作成します
まずasia.pedおよびceu.pedのふたつのPEDファイルを作成します。
affection statusカラムには、コントロールは「1」、ケースは「2」を入力します。つまり、asia.pedの6列目はすべて「1」、ceu.pedの6列目はすべて「2」となります。
ふたつのファイルを合体させると、縦がサンプル数・横がSNP数の、
148行62万列の横長の形になります。
(イルミナ社のゲノムブラウザーをご使用の方は、pedファイル作成のプラグインがございますのでご活用ください)

cat asia.ped ceu.ped > hapmap.ped


拡張子より前の部分はMAPファイルと同じ名前にする必要があるので、PEDファイルの名前はhapmap.pedにしました。

ふたつのファイルを作成するときに大切なのは、MAPファイルとPEDファイルのSNPの順番を一致させることです。

同じ要領で、HapMapのデータをコントロール、自分の実験データをケースとしてGWASをすることも可能です。

次のステップです。

4.MAPとPEDの書式を確認します
plink --file hapmap

画面に、マーカー数・サンプル数・ケースとコントロールそれぞれの数・性別などの情報が表示されますので、意図どおりに認識されているかチェックしてください。

5.PEDファイルとMAPファイルから、binary PEDファイルを作成します
plink --file hapmap --make-bed --out hapmap

6.いよいよ解析です
・Basic association analysis
plink --bfile hapmap --assoc --out as1

as1.assocというファイルが出来上がります。
カラム数は9つで
Chromosome
SNP identifier
Code for allele 1 (the minor, rare allele based on the entire sample frequencies)
The frequency of this variant in cases
The frequency of this variant in controls
Code for the other allele
The chi-squared statistic for this test (1 df)
The asymptotic significance value for this test
The odds ratio for this test
です。

・補正をするための「adjust」(ボンフェローニ補正など)
plink --bfile hapmap --assoc --adjust --out as2

カラム数は10で
Chromosome
SNP identifier
Unadjusted, asymptotic significance value
Genomic control adjusted significance value
Bonferroni adjusted significance value
Holm step-down adjusted significance value
Sidak single-step adjusted significance value
Sidak step-down adjusted significance value
Benjamini & Hochberg (1995) step-up FDR control
Benjamini & Yekutieli (2001) step-up FDR control
です。
補正前(as2.assoc)と補正後(as2.assoc.adjust)のふたつのファイルが作成されます。

【参考】
・遺伝子発現バンク(GEO)目次
http://lifesciencedb.jp/geo/

・PLINK
http://pngu.mgh.harvard.edu/~purcell/plink/index.shtml

| きむ | SNP解析 | 16:04 | comments(0) | trackbacks(0) |
QTL解析3

前回は3種類のファイルを作成しました。

ファイル名は
PEDファイル    :study1.ped
MAPファイル    :study1.map
Phenotypeファイル :qt.phe
ということで説明していきます。

ある遺伝子型と臨床情報の関係を調べるため、
PLINKでQTL解析を行っていきます。

Linuxを使用して、コマンドラインで行います。

1.PEDファイルとMAPファイルから、binary PEDファイルを作成します。
plink --file study1 --make-bed --out study1

2.QTL解析を行います。
plink --bfile study1 --assoc --pheno qt.phe --out quant1

quant1.qassocというファイルが出来上がります。

カラム数は9つで
Chr   Chromosome number
SNP   SNP identifier
BP    Physical position (base-pair)
NMISS  Number of non-missing genotypes
BETA  Regression coefficient
SE    Standard error
R2    Regression r-squared
T    Wald test (based on t-distribtion)
P    Wald test asymptotic p-value
です。

いくつかの臨床情報と比較したい場合には、
Phenotypeファイルをその数だけ作る必要があるのでちょっと不便です。

社内では、Perlでプログラミングすることで複数のPhenotypeファイルに対応させています。

明日はPLINKの使い方を紹介したいと思います。

【参考】
・PLINK
http://pngu.mgh.harvard.edu/~purcell/plink/index.shtml


| きむ | SNP解析 | 17:28 | comments(0) | trackbacks(0) |
東京スカイツリー
キムです。

今日は東京スカイツリーの話題で盛り上がりました。

下町育ちの私としてはとても気になる存在で、
HPで公開されているすごーく可愛い
デスクトップツール(現在の高さも表示される!)をダウンロードして、日々の成長を楽しんでいます。

経理のスタッフさんは、お子さんと建設中の東京スカイツリーを見に行かれたそうです!うらやましい!!
「子供のころに建設中の東京スカイツリーを見た!」という経験は、
いい思い出になりそうですね♪
そのときのお写真ですdowndowndown



高さは、3月末に東京タワーを越えて日本一になり、
すでに379m(2010年05月15日現在)だそうです。

建設中でも日本一。

私も休日に遊びに行きたいと思います。


【参考】
・東京スカイツリーホームページ
http://www.tokyo-skytree.jp/
| きむ | よもやま話 | 16:30 | comments(0) | trackbacks(0) |
QTL解析2
今日は、フリーのSNP統計解析ソフトPLINKを使用してQTL解析を行いたいと思います!

PLINKのDownloadページからプログラムをダウンロードします。

tutorialに従って一通りの作業していくと、
徐々に使い方が分かってきました。
では、さっそく解析の準備を始めたいと思います。

QTL解析の下準備として、以下の3種類のファイルを作成します。
1.PEDファイル
2.MAPファイル
3.phenotypeファイル

1.PEDファイル作成
拡張子を「.ped」で設定します。
縦にサンプル情報、横にSNPごとのGenotypeが並ぶファイルです。

カラム数は7つで
Family ID
Individual ID
Paternal ID
Maternal ID
SEX
affection status
Genotype

血縁関係にないサンプルの場合には、
Family ID = サンプル名
Individual ID = 1
Paternal ID = 0
Maternal ID = 0
と、設定して良いようです。

2.MAPファイル作成
拡張子を「.map」で設定します。
SNP一覧のファイルです。

カラム数は4つで
Chrmosome
SNP identifier
Genetic distance
Base-Pair position

3.phenoファイルの作成
拡張子を「.phe」で設定します。

カラム数は3つで
Family ID
Individual ID
Phenotype
Phenotypeカラムには、臨床情報などを入力します。


次回は、実際の解析をイメージしながら実行していきます。


【参考】
・PLINK
http://pngu.mgh.harvard.edu/~purcell/plink/index.shtml

| きむ | SNP解析 | 16:11 | comments(0) | trackbacks(0) |
QTL解析1
アメリエフに新しいメンバーがひとり加わりました。
いっそうにぎやかで楽しくなりそうです♪

本日からは、QTL解析についてお話していこうと思います。

身長や腹囲など連続的な形質(量的形質)を規定する座位を
量的形質座位(Quantitative Traits Loci:QTL)と言います。

QTL解析によって、QTLの染色体上の位置を知ることができます。

ここでは統計学的な詳しい解説は省略してしまいますが、
羊土社から出版されている「実感と納得の統計学」という本が大変参考になります。実例が多く、イメージしながら統計学の基礎を学べるおススメの一冊です。

次回からは、フリーのSNP統計解析ソフトPLINKを使用して解析していこうと思います。

入力するファイルの形式など、
解析の方法を簡単に紹介していきます。

次回へ続きます。


| きむ | SNP解析 | 16:41 | comments(0) | trackbacks(0) |
Primer3の使い方
こちらのブログでも紹介しているプライマー設計ソフト
「Primer3」ですが、セットアップ方法や使い方についての
お問い合わせをいくつか頂いております。


Windows版も公開されていますが、
基本的にはCUI(コマンドライン)上で動作させるプログラムなので、
少々敷居が高くなっています。

使い勝手が良いのは、Mac OS X
Linux上で動作させることですので、
私たちはLinux(CentOS 5.4 64bit)で動作させています。

そこで、私たちが利用しているLinuxサーバーで使用する方法を
簡単にご説明したいとおもいます。



大まかな流れは以下になります。
(用語がわからなくても、とりあえず無視してください)
1.ソフトをダウンロードする
2.コンパイルする
3.適切な場所(ディレクトリ)に配置する
4.コマンドラインから実行して動作確認する


1.ソフトをダウンロード
Primer3の「Downloadページ」から、
圧縮されたプログラムをダウンロード。
ここでは、安定版であるRelease 1.1.4 (Apr 28, 2008)
「primer3-1.1.4.tar.gz」をダウンロードしました。


2.ダウンロードしたファイルを展開し、コンパイルします
※)root権限が必要な操作もありますので、
rootユーザーで実行することをオススメします
# mkdir /usr/local/primer3 # Primer3用のディレクトリを作成(ディレクトリ名は一例です)
$ cd /usr/local/primer3 # そのディレクトリ内に移動
$ tar zxf primer3-1.1.4.tar.gz # 展開
$ cd src # プログラムが収められているフォルダに移動
$ make # コンパイル

無事に、primer3_coreというファイルが
出来上がっていることを確認します。


3.適切な場所に配置
使い勝手を良くするため、
以下のようにリンク(ショートカット)を作成しました。
# cd /usr/local/bin # パスが通っているフォルダに移動
# ln -s /usr/local/primer3/src/primer3_core primer3 # primer3というリンクを作成


4.動作確認
Primer3を展開したディレクトリにサンプルファイル
「example」がありますので、これで動作確認します。
$ primer3 < example

すぐに大量の情報が画面に流れてきましたか?

それぞれの項目の意味は、Readmeファイルを参照いただくとして、
最低限利用する項目だけ以下にリストします。
・PRIMER_SEQUENCE_ID=example
・PRIMER_LEFT_SEQUENCE=TGACNACTGACGATGCAGA
・PRIMER_RIGHT_SEQUENCE=ATCGATTTGGGTCGGGAT
・PRIMER_LEFT=15,19
・PRIMER_RIGHT=94,18
・PRIMER_LEFT_TM=57.619
・PRIMER_RIGHT_TM=60.096

特に設定をしないと通常は複数のプライマー候補が設計されますので、
「PRIMER_LEFT_2」などと番号が付いた項目となります。


【まとめ】
はっきりいいまして、
このままだと不便で使い物になりません


プログラムを組んで自動的に大量のプライマー設計をする用途には向いていますが、一つ一つのプライマーを設計する場合は用意されているWebインターフェースを利用した方が便利です。

大量にプライマーを設計する場合は、プログラムを作成して自動化するか、
外注するかになるとおもいます。

この状況は実験をするうえで大変不便ですので、Webインターフェース上で大量にプライマーを設計するSaaS型サービスを準備中です。

現在でもプライマー設計サービス(ヒト・マウス・酵母・大腸菌など)はアメリエフで受注していますが、
わざわざ注文しなくてもWeb上で自身で何度でもプライマー設計できるようになる予定です。

詳しくはお問い合わせください。
お問い合わせ

| 社長 | プライマー設計 | 16:39 | comments(0) | trackbacks(0) |
プライマー設計ツール -目的に合ったプライマーを設計したい!2-
前回は、Primer3を用いて
複数のプライマー設計を一気に行いました。

条件を設定するだけで、
自動的に、
配列情報を探して
Primer3にかけて
結果から必要な情報だけを取り出して
一覧表にしてくれる。

そんなツールを作れないだろうかと考えています。

ゲノムワイド連鎖解析やゲノムワイド関連解析(GWAS)によって
検出された特定の領域あるいは関連が予想される遺伝子の
SNPを網羅的に解析したりシーケンシングするときに、

webページを開いて、
SNP名(rs ID)の一覧を入力して条件を設定すると、
Primerが設計されて一覧が出来上がる
というイメージです。

SNP名だけでなく、
位置情報からもプライマー設計できたり、

ある領域を網羅的に解析するための
連続的な(contiguous)なプライマー設計もできるように

ツールを開発しています。


他にもアイデアがございましたら、
是非お聞かせください。


お問い合わせページ
http://amelieff.jp/enquiry/index.html


| きむ | プライマー設計 | 11:02 | comments(0) | trackbacks(0) |
水道橋は大賑わいです
会社はJR水道橋駅の駅前にあります。

水道橋駅は、東京ドームに向かう人で大変混み合う場所なのですが、昨日はプロ野球の交流戦「巨人vs西武」の試合があって、それはもう恐ろしいほどの人混みでした。

今日も「巨人vs西武」の試合があるようで、水道橋の駅前はテキ屋さんも出てお祭りのような賑わいです。

野球にしてもサッカーにしても、何万人もの人が数千円ものお金を出して観に来るわけですから、エンターテイメントのパワーはすごいですね。


【参考】
巨人戦のスケジュール
| 社長 | よもやま話 | 17:09 | comments(0) | trackbacks(0) |
プライマー設計ツール -目的に合ったプライマーを設計したい!1-
今回と次回は、実際の研究を想定してprimer3を使ってみます。


ある病気の原因遺伝子を探索する研究を考えます。

まず、ゲノム全域を探索する(ゲノムワイド関連解析 = GWAS)ため、
100万SNPのジェノタイピングアレイを行いました。
統計的な検定を行うと、
病気と関連がありそうな新規候補SNPがいくつか見つかりました。

新規候補SNPの近傍の遺伝子を詳しく調べたい!!

ということになると、
新規候補SNPや遺伝子近傍のSNPを複数探してきて、
SNPタイピングを行うことになります。

TaqMan PCR法
Invader法
MALDI-TOF/MS法
方法はいろいろありますが鋳型DNAが必要になりますね。

この鋳型DNAを作成するためのプライマー設計を
Primer3でやってみます。

前置きがだいぶ長くなりましたが、
このとき何セットくらいのプライマーが必要でしょうか??
標的を絞ったとはいえ、かなりの量になりそうです。

まずは、web上で行ってみます。
ひとつずつ、配列を入力して、条件を設定します。
ちょっとした手間でも、
何度も繰り返すのは負担ですね・・。

次に、コマンドラインで試してみます。

$ primer3
PRIMER_SEQUENCE_ID=123
SEQUENCE=GAACTTGG(省略)AAG
TARGET=81,100
PRIMER_PRODUCT_SIZE_RANGE=100-260
PRIMER_MIN_SIZE=18
PRIMER_MAX_SIZE=24
PRIMER_MIN_TM=59
PRIMER_MAX_TM=61
PRIMER_NUM_RETURN=2
=
PRIMER_SEQUENCE_ID=1234
SEQUENCE=tcccagct(省略)cta
TARGET=81,100
PRIMER_PRODUCT_SIZE_RANGE=100-260
PRIMER_MIN_SIZE=18
PRIMER_MAX_SIZE=24
PRIMER_MIN_TM=59
PRIMER_MAX_TM=61
PRIMER_NUM_RETURN=2
=
PRIMER_SEQUENCE_ID=12345
SEQUENCE=gacataaa(省略)AGC
TARGET=81,100
PRIMER_PRODUCT_SIZE_RANGE=100-260
PRIMER_MIN_SIZE=18
PRIMER_MAX_SIZE=24
PRIMER_MIN_TM=59
PRIMER_MAX_TM=61
PRIMER_NUM_RETURN=2
=


Enter keyを押すと結果が表示されました。

だいぶ楽になりました。
PRIMER_SEQUENCE_IDとSEQUENCEはそれぞれ違いますが、
条件は同じ文章ですね。

こうなると、SEQUENCEを探してくる作業を自動化するだけで
かなりのスピードアップができそうです。

次回へ♪


【参考】
・Primer3
http://primer3.sourceforge.net/




| きむ | プライマー設計 | 14:44 | comments(0) | trackbacks(0) |
プライマー設計ツール -Primer3-
今日は、プライマー設計のお話です。

PCRでDNAを増幅させるとき、プライマーが必要ですね。

私は、
ターゲットとなる配列を眺めながら、
塩基の偏りがなさそうな領域を見つけ出し、
反復配列や相補的配列に気を配りながら、
GC含量やTmを計算して、
おっと!3'末端がTなのはよろしくないなぁ・・
なんて言いながら設計をしていました。

10セットのプライマーを作ろうとするだけでも結構な時間がかかりました。


そこで、フリーのプライマー設計ツールを探したところ、
ゲノム解析リンク集に行きつきました。

その中でも、よく耳にするPrimer3
プライマー設計のお手伝いしてもらいましょう。

まず、web上で試してみます。



1.配列を入力
ターゲットの配列だけでなく前後の配列も入力します。

2.Targetsを入力
「ターゲットの配列は、さっき入力した配列の81番目の塩基から100塩基分なんです」
というときは、"81, 100"と入力します。
つまり、"スタートの位置, 長さ"ですね。

3.Pick Primersをクリック
結果が表示されます。
プライマーの基本情報はもちろん、
プライマー間の距離(Product Size)も表示されます。

Number To Returnで表示させるプライマーの数も増やせそうです。
いろいろな条件を設定できますね。


次に、コマンドラインでも試してみます。

ソースコードが公開されているのでダウンロードして、
READMEを読んだら、さっそく使ってみましょう。
Linuxを使用しています。

$ primer3
PRIMER_SEQUENCE_ID=123
SEQUENCE=GAACTTGG(省略)AAG
TARGET=81,100
PRIMER_PRODUCT_SIZE_RANGE=100-260
PRIMER_MIN_SIZE=18
PRIMER_MAX_SIZE=24
PRIMER_MIN_TM=59
PRIMER_MAX_TM=61
PRIMER_NUM_RETURN=2
=


Enter keyを押すとあっというまに結果が表示されました。

条件を増やしたりきつくするには、
前後の配列を広くとる必要がありそうです。

次回に続きます♪


【参考】
・ゲノム解析リンク集
http://www-btls.jst.go.jp/Links/

・Primer3
http://primer3.sourceforge.net/

| きむ | プライマー設計 | 10:30 | comments(0) | trackbacks(0) |
社名の由来
指名されてしまったので、出てきました。社長の山口です。

そもそも、社員なのに社名の由来をちゃんと覚えていないことに激しくツッコミたいところですが、だいたいの由来は覚えているようですので、スルーしておきましょう。

さて社名「アメリエフ」の由来ですが、フランス語からの造語です。

日本語で「効率をあげる」をフランス語でいうと「améliorer l'efficacité」(あめりおーる れふぃかして)となるので、これをもじって「amelieff」(あめりえふ)としました。


最初は英語からの造語にしようとおもって試行錯誤したのですが、以前少し勉強したフランス語で調べてみるとちょうど良い単語が見つかったので、フランス語から造語をつくってみたわけです。


「フランスかぶれ」と云われても、開き直っています。きのこレッド
| 社長 | よもやま話 | 18:54 | comments(1) | trackbacks(0) |
はじめまして
はじめまして。
バイオインフォマティクス事業部のキムです。

拙い文章ですが、どんどん更新していきますので、
よろしくお願いします。

今回は、自己紹介を交えつつ、
アメリエフという会社を紹介したいと思います。


さて、私は、バイオインフォマティクスの世界に飛び込んだばかりの
社会人1年生です。
専攻は分子遺伝学で、大学と大学院では大腸菌の遺伝子と
日々格闘していました。

試験管をキーボードに持ち替えて奮闘したこの4カ月間。

Rで統計処理してみたり、
Perlでプログラムを書いてみたり、
Illustratorで名刺を作ってみたり、
まさにめまぐるしい日々でした。

wetの実験をしてきた私にとっては、
聞いたこともない新しいツールがてんこもりです。

バイオ研究とITの両方に関われるところが、
アメリエフで働く魅力かなと感じています。

アメリエフは、バイオ・医療分野の研究を
ITの力で効率化するお手伝いする会社です。

社名の「アメリエフ」もそんな想いから、
付けられたとか付けられてないとか??

社名の由来についてはうろ覚えなので、
説明を社長にお任せしたいと思います〜♪

では、着実に成長して、徐々に皆様のお役にたてる内容を
提供できるように精進していきたいと思います。


| きむ | よもやま話 | 18:01 | comments(0) | trackbacks(0) |
会社ブログ始めました
アメリエフ株式会社 代表取締役社長の山口昌雄です。

会社としてのブログを始めました。

全社員が書き込みを担当しますので、個性あふれるブログにしていきたいと思います。

テーマとしては、バイオインフォマティクスや日々の業務で感じたことなどを、雑多に書いていく予定です。

データ解析などのノウハウも書いていきますので、少しでもみなさんの研究・仕事の参考になれば嬉しく思います。

山口
| 社長 | よもやま話 | 17:34 | comments(0) | trackbacks(0) |
      1
2345678
9101112131415
16171819202122
23242526272829
3031     
<< May 2010 >>

このページの先頭へ