アメリエフのブログ

バイオインフォマティクスの紹介と社員の日々
SAM format
tokunagaです。

第一回目はSAM formatの概要について
第二回目はSAM formatのヘッダー部分についてお話ししました。
本日はSAM formatのアライメント部分についての説明をしたいと思います。

アライメント部分の形式は


というように
「QNAME」から「QUAL」までの11項目の必須フィールドと、その後ろに使ったツールや条件等で異なってくるオプショナルフィールドがあります。

・必須フィールドの項目




・オプショナルフィールド



オプショナルフィールドは、使用したツール等でタグの名前が決められていることがあるので詳しくはマッピングに使用したツールのwebページ等をご参照ください。

*参考URL
http://samtools.sourceforge.net/SAM1.pdf
| tokunaga | 次世代シーケンサー解析 | 13:27 | comments(0) | trackbacks(0) |
SAM format
tokunagaです。

前回はSAM formatの概要についてお話ししました。
本日はSAM formatのヘッダーについて説明します。

ヘッダーには、シーケンスやリードグループなどのタグ情報が記述されており、以下のような形式で書かれています。
@<TAG>   <TYPE>:<VALUE> <TYPE>:<VALUE>

(例)
@SQ SN:gi|49175990|ref|NC_000913.2| LN:4639675

@マークの次にアルファベット2文字でタグが記され、
その後ろに「タイプ(アルファベット2文字):バリュー」のセットが並んでいます。

そして、各タグおよびタイプの簡単な説明を下記の表にまとめました。



このタグとタイプの内容がバリューの部分に記されています。
これらの情報でヘッダー行以下のアライメント部分の定義をしています。

次はアライメント部分について説明したいと思います。

*参考URL
http://samtools.sourceforge.net/SAM1.pdf
| tokunaga | 次世代シーケンサー解析 | 17:47 | comments(0) | trackbacks(0) |
SAM format
tokunagaです。
本日からはSAM formatについてです。

SAMとはSequence Alignment/Mapの略で、
次世代シーケンサー解析に用いられるformatの一つで、マッピングの結果が書かれています。
BAM formatは、このSAMファイルをバイナリ化したものです。

SAM formatの中身は
@SQ SN:gi|49175990|ref|NC_000913.2| LN:4639675
@PG ID:bwa PN:bwa VN:0.6.1-r104
SRR022885.1 16 gi|49175990|ref|NC_000913.2| 2966086 25 36M * 0 0 ACATGAAGCAACTGGCGACGTTGAATAATTGGTACG /+&I0I53>I+I.IIII@IIIIIII>IIIIIIIIII XT:A:U NM:i:2 X0:i:1 X1:i:0 XM:i:2 XO:i:0 XG:i:0 MD:Z:3C0C31
SRR022885.2 4 * 0 0 * * 0 0 AGATTTTTTCCTGTAACGCTGCCAGTTGGTGGGCTC IIIIIIIIIIIIIIIIIIIIIII SRR022885.3 0 gi|49175990|ref|NC_000913.2| 1766166 25 36M * 0 0 AGCGTACGCCAAGTACGTGATCTGACGTTTTGCCCT IIIIIIIIIIIIIIIII2IIIIII7IE,III1(%(4 XT:A:U NM:i:2 X0:i:1 X1:i:0 XM:i:2 XO:i:0 XG:i:0 MD:Z:0C33A1
SRR022885.4 16 gi|49175990|ref|NC_000913.2| 3182924 37 36M * 0 0 AATCAGGGAGTTCGGGGAAGATGTGGAGAAAAAAAG I796II+IIII+IIIIIIIIIIIIIIIIIIIIIIII XT:A:U NM:i:1 X0:i:1 X1:i:0 XM:i:1 XO:i:0 XG:i:0 MD:Z:35T0
・・・・・・・・・・(続く)

という形式になっています。
基本的にタブで区切られています。

@から始まっている行はヘッダー部分で、ここではヘッダー部分以降のファイルの中身を定義しています。
それ以外の行はアライメント部分で、各リードのマッピング情報について書かれています。

次回はヘッダー部分の形式について書きたいと思います。
| tokunaga | 次世代シーケンサー解析 | 09:30 | comments(0) | trackbacks(0) |
fastq format
tokunagaです。

少し1回目と間が空いてしまいましたが、
本日はfastq formatの2回目です。
各リードの4行目に記されているqualityについて説明したいと思います。

・Quality value
3行目に使われているquality valueは以下のように計算されています。




・ASCIIコード
各塩基ごとのquality valueを一文字で表すためにASCIIコードが使われています。




・比較
S - Sanger Phred+33, raw reads typically (0, 40)
X - Solexa Solexa+64, raw reads typically (-5, 40)
I - Illumina 1.3+ Phred+64, raw reads typically (0, 40)
J - Illumina 1.5+ Phred+64, raw reads typically (3, 40)
L - Illumina 1.8+ Phred+33, raw reads typically (0, 41)

()の中はquality valueの最大値と最小値です。
現行のIllumina formatでは、実際に使われているquality valueの最大値は41です。

参考URL
http://en.wikipedia.org/wiki/FASTQ_format

| tokunaga | 次世代シーケンサー解析 | 09:32 | comments(0) | trackbacks(0) |
VCF format
どうもakbです。
VCF formatの連載三日目です。
今日は、FORMATの"PL"について説明しようと思います。

まず、前回の復習ですが、FORMATの"GT"はGenotypeの略で
0:reference 1:alternate(sample1)のように数字に意味を持たせており、
0/0,0/1,1/1はそれぞれREFのホモ、REFとALTのヘテロ、ALTのホモを示します。

まず図をご覧ください。
(例)

--------------------------------------------
REF = A ALT = G GT:PL 0/1:191,0,255
--------------------------------------------
"PL"に対応する値は"191,0,255"のようにカンマ区切りで示されています。
なぜ三つあるかというと"REF = A ALT = G"から考えられるGenotypeごとに phred-scaledの尤度計算をしているからです。

つまり、REF = A ALT = G の場合

AA AG GG
191 0 255

この数字は小さいほど信頼性が高くなりますので、
AG = 0が採用され、0/1、REFとALTのヘテロとなるわけです。

では、REF=T  ALT=A,GのようにALTの候補が2つある場合です。

--------------------------------------------
REF=T  ALT=A,G   GT:PL 1/1:178,82,76,104,0,98
--------------------------------------------
この場合、"REF=T  ALT=A,G"から考えられるGenotypeは

TT TA AA TG AG GG (←この順番になります)
178 82 76 104 0 98

AG = 0が採用され、REFとALTのヘテロ、つまりA/Gのように見えます。
しかし、ここは注意が必要です。
なぜならGTは1/1を示しており、ALTのホモを表しているからです。
この場合、ALT同士の組み合わせになっているため
"1/1"という表記になっていますが、ALTのヘテロです。

(2014年11月14日訂正)


三回にわたってVCF formatについて連載してきました。
今回、ご紹介できなかったID等は、下記URLをご参照下さい。
http://www.1000genomes.org/wiki/Analysis/Variant%20Call%20Format/
vcf-variant-call-format-version-41

---------------------------------------------------
(2014年11月14日追記)
【訂正】
上記のGTの説明につきまして、誤りがあるとご指摘をいただきました。
ありがとうございます。
当ブログをご覧のみなさまには、ご迷惑をおかけしまして申し訳ありません。

GTの数字の意味は、以下の通りになります。
0: REFアリル
1: ALTの1つめのアリル
2: ALTの2つめのアリル
:
(以下同)

そのため、GTが1/1ということは、ここではA/Aのホモということになります。

GATKのガイドによりますと、PLは、GTで示したジェノタイプの確率を1.0(PLでは0と示す)とし、それをもとに他のジェノタイプの尤度を相対的に算出しているため、上記の例のようなケース(GTとPLでジェノタイプが食い違うケース)は実際にはないと考えられます。

一例ですが、下記のような組み合わせがあると考えられます。

【ジェノタイプがAAの場合】
--------------------------------------------------------
REF=T  ALT=A,G   GT:PL 1/1:178,82,0,104,76,98
--------------------------------------------------------

【ジェノタイプがAGの場合】
--------------------------------------------------------
REF=T  ALT=A,G   GT:PL 1/2:178,82,76,104,0,98
--------------------------------------------------------
| akb | 次世代シーケンサー解析 | 12:49 | comments(0) | trackbacks(0) |
VCF format

どうもakbです。
VCF formatの連載二日目です。

今日は、INFOカラムのIDとFORMATのIDの説明をします。

まずは、INFOカラムの説明です。

(例)





(例)


FORMATの"GT"はGenotypeの略で
0:reference 1:alternate(sample1)のように数字に意味を持たせており、
0/0,0/1,1/1はそれぞれREFのホモ、REFとALTのヘテロ、ALTのホモを示します。
REF = A ALT = G  GT = 0/1

これは、GenotypeがAGのヘテロであることを表しています。

次回は、FORMATの"PL"について説明しようと思います。
| akb | 次世代シーケンサー解析 | 18:07 | comments(0) | trackbacks(0) |
VCF format

どうもakbです。
今日からVCF formatの連載が始まります。

さて、VCFとは (Variant Call Format)の略で、次世代シーケンサー解析に用いられるformatの一つです。
samtoolsを用いて抽出した多型情報が、VCFファイルに格納されて出力されます。

まず、VCFファイルの中身を見てみます。



ファイルのメタデータは、"##"の文字列の後に記載されています。
例えば、最初の行には、VCFのバージョンが次のように示されます。
(例)
##fileformat = VCFv4.1

次にVCFファイルの本体で使用されるフィルタ(INFO)とFORMATが、
メタデータセクションに含まれます。
(例)
##INFO = <ID=DP,Number=1,Type=Integer,Description="Total Depth">

"##"から始まる行(メタデータ)の後の構造は、"#"から始まるヘッダー行と、そのヘッダー行のカラムに対応したデータ行から成ります。


ヘッダ行には9個のカラム+SAMPLEカラムがあります。これらのカラムは次のとおりです。





次回のブログでは、各カラムに対応するデータ行の説明をしたいと思います。
| akb | 次世代シーケンサー解析 | 09:16 | comments(0) | trackbacks(0) |
Perl デバッグ
さて、あなたがPerlでプログラムを作成し、use strict や use warnings で怒られないところまで進んだとします。
次に、やることはプログラムを実際に動かすところですね。
ところが、実は、ここでも上手くいかないことが多々あります。
出るはずのない数字、結果、エラー・・・。
そのプログラムにはバグが潜んでいるのです。

バグとは、コンピュータプログラムの製造(コーディング)上の誤りや欠陥を表します。(wikipediaより)

プログラムが長くなればなるほど、バグを含む確率は上がります。
どこでおかしな値が出ているのか、どこで動作がおかしくなっているのか、それを突き止めるのは大変な時もあります。

そこで、お勧めするのが、デバッガと呼ばれる、バグ修正を助けてくれるツールです。
perlを実行するときに、以下のように -d をつけて実行してみましょう。そうすると、そのプログラムはデバッグモードで実行することができます。

$ perl -d hoge.pl

すると、実際の命令行の冒頭が表示されます。そこで、以下のコマンドを用いながら、プログラムの動作を確認していきます。

n: 一行実行
n と一回打ち込んで enter を押すと一行ずつ実行されます。ソースの内容がそのまま表示されるので、どの行を実行しているのかもよくわかります。ちなみに、n の場合はサブルーチンは飛ばして進みます。

s: ステップイン
基本は上の n と同じで一行ずつ実行していきますが、s を使った場合は、サブルーチンの中も辿っていきます。

enter: 直前の s か n を繰り返す
一回 s か n を実行した後は、enterキーを押すだけでその処理を繰り返すことができます。

r: サブルーチンから抜け出す
s でサブルーチンに入ったのはいいけど、同じ繰り返しが何回もあって、早く元のルーチンに戻りたい・・・という時に、r コマンドでサブルーチンを脱出できます。

c: 指定行まで実行
例えば、c 300 とすれば、300行目まで一気に実行し、そこで止まってくれます。また、プログラム中にブレークポイントを設定しておけば、c と打つだけでそのブレークポイントの次まで一気に実行できます。

ちなみにブレークポイントはソースの中に次の一文を追加すると設定できます。
$DB::single = 1;

p: 変数を表示
p $hoge とすれば、$hoge の中身を表示してくれます。これはとても便利で、450行目の時の $hoge の中身が知りたい時は、c 450 と打った後、p $hoge と打つとその中身がわかります。

q: 終了
q と打てば、デバッガは終了します。

他にも色々なコマンドがありますので、興味がある方は是非ネットでいろいろ調べてみてください。

あなたのバグが早くとれますように・・・。
| deda | バイオインフォマティクス | 17:21 | comments(0) | trackbacks(0) |
第13回バイオインフォマティクス勉強会「RNA-seqデータ解析入門」は定員に達しました
第13回バイオインフォマティクス勉強会「RNA-seqデータ解析入門」は
お申込みが定員に達したため、現在キャンセル待ちとさせていただいております。

たくさんのお申込み、ありがとうございました!
| hat | 勉強会 | 16:07 | comments(0) | trackbacks(0) |
5/18(金)は全社員研修のため営業は休止させていただきます
本日5月18日(金)は、全社員研修のため営業はお休みをさせていただいております。

伊豆のホテルに缶詰になって、新入社員もベテランも一緒になって知的ワークに励んでおります。

週明けからは、よりスキルがアップした状態で業務に取り組んで参りますので、よろしくお願い申し上げます。

代表取締役社長 山口 昌雄



補足ですが、ネットが繋がりにくい環境のため、どうにか低速な回線につなげて、ブログをアップしています。

ネットが無いと不安になってしまうというのは、ある意味で中毒症状かもしれませんね。
| 社長 | 会社のこと | 12:25 | comments(0) | trackbacks(0) |
fastq format
今日から次世代シーケンサー解析で使われているformatについて書いていきたいと思います。
まず、今回はfastq formatについてです。

・構成
塩基配列と各塩基に対するquality valueの情報が書かれているテキストファイルです。各リードは4行で構成されています。


[例]
 @SRR022885.1 BI:080102_SL-XAR_0001_
  FC201E9AAXX:6:1:752:593
◆CGTACCAATTATTCAACGTCGCCAGTTGCTTCATGT
 +
ぁIIIIIIIIII>IIIIIII@IIII.I+I>35I0I&+/

次回に続きます。
| tokunaga | バイオインフォマティクス | 14:49 | comments(0) | trackbacks(0) |
【バイオインフォマティクス勉強会】RNA-seqデータ解析入門
バイオインフォマティクス勉強会のお知らせです。

6月2日(土)に第13回バイオインフォマティクス勉強会
RNA-seqデータ解析入門」を開催します。

ご要望の大変多かったRNA-seqデータ解析につきまして、
データ解析の手法やノウハウをご紹介したいとおもいます。

詳細は、ニュースをご覧ください。

みなさまとお会いできることを楽しみにしています。
| hat | 勉強会 | 15:09 | comments(0) | trackbacks(0) |
仕事の効率化
仕事の効率化

akbです。

通勤電車でよく目にするのは英会話やパソコンスキル向上の広告です。
インターネットで"仕事の効率化"を検索しても、やはり、コミュニケーション能力やパソコンスキルの向上が上位にヒットします。
限られた時間の中で高い成果を出すには、仕事以外の時間の使い方も大切ですが、やはりこれらの能力を向上させる必要があると肌で感じでいます。

・・というわけで、本日は『キーボード操作におけるショートカットキー windows版』と題しまして、ドキュメント作成で使える代表的な例をいくつかご紹介したいと思います。


【Ctrl + C】 選択した項目をコピーします。

【Ctrl + X】 選択した項目を切り取ります。

【Ctrl + V】 選択した項目を貼り付けます。

【Ctrl + Z】 操作を元に戻します。

【Ctrl + S】 ドキュメントを保存します。

【Ctrl + A】 すべての項目を選択します。

【F10】 日本語入力からアルファベット入力に切り替えができます。
(例)日本語入力でperlと打った場合
『ぺrl』→『perl』→『PERL』→『Perl』→『perl』→『PERL』・・・

【Alt + Tab】 開いている別のプログラムまたはウィンドウに切り替えます。
Altを押したまま、Tabキーを押すことで別のプログラムやウィンドウを切り替えることができます。

【Home】 行の先頭やWeb ページの最上部にカーソルを移動します。

【End】 行の末尾やWeb ページの最下部にカーソルを移動します。

【Ctrl + Home】 ドキュメントの一番上へ移動します。

【Ctrl + End】 ドキュメントの一番下へ移動します。

【PageUp】 カーソルまたはページを 1 画面上へ移動します。

【PageDown】 カーソルまたはページを 1 画面下へ移動します。



参考URL
http://windows.microsoft.com/ja-JP/windows-vista/Using-your-keyboard
| akb | よもやま話 | 08:55 | comments(0) | trackbacks(0) |
Perl プログラムの性能解析(NYTProf)
こんにちは。detです。

少々複雑なPerlプログラムを組んだ時に、
どの部分にどれだけ時間がかかっているか、
知りたいことがあると思います。

そんな時は、プログラムの各処理ごとに時間や実行回数などを計測し、
出力してくれるプロファイラを使うと便利です。

いくつか種類がありますが、今回はソースコードを見ながら、
html形式のGUIでプロファイル結果が確認できるDevel::NYTProfという
Perlプロファイラを簡単にご紹介いたします。

まず、CPANから、Devel-NYTProf-4.06.tar.gz をダウンロードします。
http://search.cpan.org/~timb/Devel-NYTProf-4.06/lib/Devel/NYTProf.pm

次は、READMEの指示通りに、

$ perl Makefile.PL
$ make
$ make test
$ make install


として、インストールします。

インストールできれば、あとは簡単です。
hoge.plのプロファイリングをしたい時は、以下のように実行します。

$ perl -d:NYTProf hoge.pl
$ nytprofhtml

とすれば、nytprof/index.html ができるので、
そのhtmlをウェブブラウザで開くと、以下のようになります。



それぞれどのサブルーチンが何回呼ばれて、
どのくらい時間がかかっているかが表示されます。
さらにそのサブルーチンをクリックすると、以下のように、
ソースコードを見ながら確認ができます。



かなり見やすいので、うまく使えば、
かなり便利なのではないでしょうか?

ちなみに、NYTProfのNYTはアメリカの有名な新聞社、
NewYorkTimes社のことです。社内のエンジニアの方が、
このプロファイラを作成したとか。
新聞社からこういうものが産まれてくるのが面白いですね。

それでは、detでした。
| deda | バイオインフォマティクス | 09:38 | comments(0) | trackbacks(0) |
意外なモデル生物
tokunagaです。

前回のhatさんに続いて
私の大好きなゼブラフィッシュについて紹介します。
大学の研究で使用していました。

ペットとしてもお馴染みですね。

実験魚としても有名で、
世代交代が早く、大量飼育が可能、飼育が簡単、そしてすでにゲノムが読まれているという利点があります。
また、近年では魚類のモデルだけでなく、ヒトの疾患モデルとしても使えるのではないかと検討されているようで、最近では論文も出されていますね。あの小さな体で、しかも水産生物でヒトのモデルとは・・・意外ですよね!

私も水産生物を用いた解析をする機会がもしかしたらあるかも?
| tokunaga | よもやま話 | 11:59 | comments(0) | trackbacks(0) |
小さな彼らの恋愛事情
卒業研究のテーマが「ショウジョウバエの求愛行動」だったhatです。

ショウジョウバエの仲間には多数の近縁種がいますが、それぞれオスの求愛行動が微妙に異なります。
この求愛行動の違いが種分化に関係していると考えられています。
「交尾をしなくなる」→「だんだん遺伝的に遠くなる」→「別の種になる」という説です。

先日、ショウジョウバエの求愛行動がRNA-editingにより調節されているという論文が発表されました。

Savva YA, et.al
Auto-regulatory RNA editing fine-tunes mRNA re-coding and complex behaviour in Drosophila.
Nat Commun. 2012 Apr 24;3:790. doi: 10.1038/ncomms1789.


RNA-editing(RNAエディティング)とは、mRNA上の塩基を酵素が編集することによって、ゲノムに書かれていたのとは違うアミノ酸がコードされるようになるしくみです。
ショウジョウバエのゲノムサイズは200Mbpもありませんので、限られた遺伝子の中で求愛行動を複雑化するには、RNA-editingのような付加的なしくみが必要なのかもしれません。よくできているものだと感心します。

ところでショウジョウバエの求愛行動はどのようなものだと思いますか?

オスがメスを追い掛け回した後、オスが羽を震わせて求愛歌と呼ばれる旋律を奏で、それを聞いてメスが「いいな」と思うと交尾に至ります。
音楽で愛をささやくなんてロマンチックですね!

ちなみに、ショウジョウバエの性行動を支配しているfruitlessという遺伝子に、ある種の変異が起きたオスは、メスに興味を示さなくなり、オスに求愛するようになるそうです。satori(悟り)変異体という名前がついています。

そのうち、「さなぎにしか興奮しない」とか「2次元にしか関心がない」とかいった変異体も出てくるかもしれないですね。
| hat | バイオ | 10:59 | comments(0) | trackbacks(0) |
ゆとりの時間
誰も教えてくれない 一流になれる仕事術 (アスカビジネス)
誰も教えてくれない 一流になれる仕事術 (アスカビジネス)
浜口 直太

akbです。

本日は最近読んだ書籍のご紹介です。

著者である浜口直太さんは、経営コンサルタントでありながらビジネス作家でもあり、100冊以上の本を執筆されています。

本書には、仕事に対しての基本姿勢や目標設定などが50項目にまとめられています。
その項目の中に『忙しいときこそ、目的観を忘れずに』、『反省と決意を日々更新する』があります。著者は約1時間の"ゆとりの時間"を設け、いま抱えている仕事の優先順位を再確認したり、就寝前には、その日の反省し、また翌日頑張るための決意を行っているそうです。

私は、活用できないのでは・・と思い始めていた超満員電車での通勤時間をこの"ゆとりの時間"にあてようと思います。

ビジネス書には、様々な角度から良いビジネスパーソンになるためのアドバイスが書かれています。またすばらしい本に出会ったらご紹介したいと思います。
皆さまも是非ご覧下さい。
| akb | 書籍の紹介 | 19:11 | comments(0) | trackbacks(0) |
いとおかし
こんにちは。detです。

少し、プログラムから離れて会社のことでも書いてみましょう。

弊社内ではお菓子がよく出没します。

社員数が少ないにもかかわらず、
謎のお土産が毎日のように出現し、
その消費に追われる毎日です。
(もちろんうれしい悲鳴です)

この四月から体重が3キロも増えてしまいました。

ただし、頭を使うと、甘いものが欲しくなると言われます。
脳が糖分を欲しがるとか。
その割に、私の体重が増加の一途を辿っているということは、
頭を使っていないということでしょうか?

そんなことはないと思うのですが。

このお菓子戦略は社員にもっと頭を使うようにという
会社からの無言の圧力なのかもしれません。
「さあ、もっと頭を使え・・・使わないと太るぞ・・・・」

ごめんなさい。もっと頭を使うように、頑張ります。

それでは、detでした。
| deda | よもやま話 | 18:47 | comments(0) | trackbacks(0) |
Microarray解析
tokunagaです。
今回は、遺伝子発現変動を網羅的に調べたいときに使われているmicroarrayのデータ解析について流れを簡単にご紹介します。

生データ
 発光強度をスキャナーの画像から数値化する
   ↓
バックグラウンド補正
 出力された時点で補正されている場合もある
   ↓
正規化
 サンプル別のバラつきを揃える
   ↓
フィルタリングによる絞込み
 群間の有意差、p-value、FC、シグナル強度etc.の情報を基に絞り込む
   ↓   
クラスタリング、ヒートマップ作成
   ↓
アノーテーション付け
 遺伝子、GO etc.の情報を付与する

後半は目的によって変化してくると思います。
今はRのパッケージが色々とそろっているようですね!
| tokunaga | バイオインフォマティクス | 18:21 | comments(0) | trackbacks(0) |
「環境変数PATH」と「アクセス権限」
以前、Linux入門者がとまどいがちなものの一つが「ディレクトリ間の移動」であると書きましたが、今回は残りの二つ「環境変数 PATH」と「アクセス権限」について書きます。

先週の土曜日は、弊社のバイオインフォマティクス・スクール「Linux基礎」第二回でした。
その中で「環境変数 PATH」の説明もあったのですが、やはり最初は「?」という顔をされている方が多かったようです。


「環境変数 PATH」は「みんなが使う道具を置く場所」である

突然ですが、みなさんの家では「つめきり」や「TVのリモコン」をどこに置いていますか?「ドライヤー」や「ヘアブラシ」は?
家族で共有して使うものは、「リビングのカゴ」や「洗面所の棚」など、
みんなが知っている場所に置くことが多いのではないでしょうか。
「環境変数 PATH」はこの「リビングのカゴ」や「洗面所の棚」にあたります。

「環境変数 PATH」には最初から/usr/local/binや/binや/usr/binなどが設定されており、
基本的なコマンドは大体このどこかに置いてあるので、Linuxをインストールした直後からcdやlsが実行できるのです。
お使いのLinuxの「環境変数 PATH」に何が設定されているかは以下のコマンドで確認できます。
$ echo $PATH

また、道具本体を必ずしも「環境変数 PATH」に置いておく必要はなく、
「リビングのカゴ」に「包丁は台所にあります」というメモを貼っておけば、誰でも包丁を見つけることができます。
Linuxでもこのようなことができて、これを「シンボリックリンク」と呼びます。
シンボリックリンクは次のように張ります。
$ ln -s 実体のパス シンボリックリンク先のパス


「環境変数 PATH」はユーザごとに変更できる

「うちは大体なんでもトイレに置いています」というお宅もあるかもしれません。
「環境変数 PATH」には、新しい場所を追加することもできます。
「環境変数 PATH」は、ユーザのホームディレクトリにある.bashrcや.bash_profileといった設定ファイルで変更します。

トイレがメインのお宅なら、家族それぞれの「環境変数 PATH」に「トイレ」を、お父さんが書斎にゴルフ用具を置いているなら、お父さんの「環境変数 PATH」に「書斎」を追加しましょう。


実行権限は読み・書き・実行

思春期の娘さんがいると「パパ!私のお気に入りのブラシを使わないで」などと言い出すこともあるでしょう。
花子のブラシを使っていいのは花子と妹だけ、というように制限することができます。
$ chmod 754 花子のブラシ
とした場合、7・5・4は左から1文字ずつ「花子(所有者)」「花子の属すグループ」「その他の人」の実行権限を指します。
花子はブラシを見ることも改造することも使うこともでき(=7)、
妹(花子と同じグループ)はブラシを見ることと使うことができ(=5)
他の家族は「ブラシがあるなあ」と見ることだけができます(=4)。
※4が読み、2が書き、1が実行権限なので、読み+書き+実行だと4+2+1=7、読み+実行だと4+1=5、読みだけだと4、などとなります。

また、花子の机の引き出しには秘密の日記帳が入っているので、
引き出しおよびその中にある日記帳は花子しかいじってはいけないように設定することもできます。
$ chmod -R 700 花子の引き出し
他の人は引き出しの中に何があるのかすら見ることすらできません(=0)。-Rは「引き出しの中にあるものすべて」の意味です。

ただし、実はお父さんがこっそり花子の日記帳を読んでしまうことができる場合があります。
他のユーザの権限でコマンドを実行できる、sudoコマンドというものがあります。
$ sudo hanako less 花子の引き出し/日記帳

sudoコマンドについてはまたいずれ。
| hat | システム | 10:07 | comments(0) | trackbacks(0) |
BIO tech2012
akbです。
4/25〜27の日程で『BIO tech2012』が開催されました。
今回、弊社は特別な出展を行いませんでしたが、勉強のために参加してきました。
興味深い研究や企業ブースを拝見することができ、また社会人として初めて参加したイベントということもあって大変勉強になりました。

現在は、特に第3世代、第4世代のシーケンサーについて調べていますが、まだまだ学ぶことが多いと実感しています。
これら、シーケンサー周辺についても徐々にブログへ更新していきたいと思います。
| akb | よもやま話 | 09:02 | comments(0) | trackbacks(0) |
  12345
6789101112
13141516171819
20212223242526
2728293031  
<< May 2012 >>

このページの先頭へ