アメリエフのブログ

バイオインフォマティクスの紹介と社員の日々
headとtail
会社(神田)の近くにおいしい鯛焼屋さんが二軒あります。
どちらも餡がたくさん詰まっていて、熱々の焼き立てをほうばると
小麦粉と重曹の香ばしい香りが鼻に抜け、たまらぬおいしさです。
会社が神田に移転して良かったと思うひとときです。

ところで、みなさん鯛焼は頭から食べる派でしょうか?
尾から食べる派でしょうか?

ということで、本日はLinuxのheadコマンドとtailコマンドの話です。
続きを読む >>
| hat | バイオインフォマティクス | 16:54 | comments(0) | - |
維持してコピー
Linux上でファイルをコピーする際に、「cp」というコマンドを使用します。
$ cp hoge.txt ../
このコマンドでは hoge.txt を一つ上の階層のディレクトリにコピーしていますね。またディレクトリをコピーする際は、以下のオプションを付けます。
$ cp -r hogedir/ ../
「-r」オプションを付けることでディレクトリもコピーできます。しかし、これらの方法では、シンボリックリンクなどはリンク先の実体ファイルがコピーされてしまいます。実体ファイルのサイズが巨大な場合は困ったことになります。そこで、以下のオプションをつけてみましょう!
$ cp -ar hogedir/ ../
「-a」オプションで、ファイルの属性情報を維持したまま、また、シンボリックリンクをリンクのままコピーすることができます。
また余談ですが、「rsync」コマンドでデータをバックアップする場合は「-av」オプションで同じ目的が達成できます。
なかなか使えるコマンドですよ。ではでは。
| deda | システム | 16:53 | comments(0) | - |
ディレクトリ内のファイル数を知りたい
ディレクトリ内のファイル数をカウントしたいことがありますが、大量のファイルが存在する場合、一つ一つ数えるのはとても面倒です。

そんなときは以下のコマンドを試してください。
$ find ./ -type f | wc -l
25

カレントディレクトリ以下に存在するファイルの総数をカウントします。つまり、サブディレクトリ内のファイルを含みます。

カレントディレクトリ上に絞ってファイルの総数を得るには、lsコマンドを使います。
$ ls -1 | wc -l
11

この場合、カレントディレクトリに存在するディレクトリとファイルの総数が得られます。

カレントディレクトリ上のファイルのみ(ディレクトリを除く)の総数を得るには、以下のコマンドを試してください。
$ ls -1F | grep -v / | wc -l
10

ディレクトリ上のファイル数をカウントできます。
| heshi | システム | 15:22 | comments(0) | - |
Rでgrep
Rのオブジェクトから、特定のキーワードを含む要素だけ抜き出したいときはどうしたらいいでしょうか。

ベクトルの場合はgrep()関数が使用できます(grepの仲間にgrepl、regexpr、gregexpr、regexec、検索後に置換を行うsub、gsubがあります)。
このgrepは文字列からなるベクトルのみに使用できます。

たとえば、Rで図を作成するときに色名指定に使用できる色名の一覧を返してくれるcolors()関数というのがあります。
> iro <- colors()
> head(iro)

[1] "white" "alicered" "antiquewhite" "antiquewhite1" "antiquewhite2" "antiquewhite3"
> is.vector(iro)
[1] TRUE
> class(iro)
[1] "character"
データ構造は文字列から成るベクトルなので、これでgrepを試してみます。
続きを読む >>
| kubo | 統計解析ソフトR | 14:43 | comments(0) | - |
どこにあるの?
Linux上でファイルを検索する場合は以下のコマンドを使用します。
$ find /home -name hoge.txt
このコマンドでは、/home ディレクトリ以下で hoge.txt を検索します。ファイル名の一部しかわかっていない時は、以下のようにワイルドカードを使用できます。
$ find /home -name *.txt
では、ある特定の文字列を含むファイルを検索したい場合はどうすればいいでしょうか。その場合は以下のコマンドを入力します。
$ find /home | xargs grep "hoge12345"
このコマンドでは、"hoge12345" という文字列を含むファイルを検索することができます。また、システムにパスが通っているコマンドのファイル本体がどこにあるか知りたい時は以下のコマンドを打ちます。
$ which bwa
この例では、bwaコマンドのファイル本体へのパスが表示されます。
これらのコマンド使うと検索が便利になりますよ。
| deda | システム | 15:32 | comments(0) | - |
バイオインフォマティクス勉強会「フリーソフトではじめるRNA-seq解析、ChIP-seq解析入門」開催のお知らせ
3/28(金)に開かれる、バイオインフォマティクス勉強会「フリーソフトではじめるRNA-seq解析、ChIP-seq解析入門」のご案内です。今回の勉強会は、理化学研究所 情報基盤センター バイオインフォマティクス研究開発ユニットの二階堂 愛 先生のご協力をいただいて開催いたします。

《構成》
 第一部:13:00〜14:30 RNA-seq解析
 第二部:15:00〜16:30 ChIP-seq解析

《講師》
 山口 昌雄 (アメリエフ株式会社 代表取締役社長)

《内容》
Linux PCでNGS解析(特にRNA-seq、ChIP-seq)を始めたい方を対象に、公開データを用いたデータ解析手法をご紹介します。また、精度の高い解析結果を出すためにポイントとなる、フリーソフトの使い方やコマンド操作など実例を交えてご紹介いたします。ご紹介したコマンドはお配りする資料にすべて記載してありますので、お持ち帰りいただき、ぜひNGS解析を始めていただきたいと思います。ご質問などございましたら、お近くのスタッフまでいつでもお気軽にご相談ください。みなさまにとって、貴重な情報交換の場となりましたら幸いです。

               記
日時 :2014年3月28日(金) 13:00〜16:30
   (受付開始 12:30〜)
場所 :理化学研究所和光キャンパス BSI池の端研究棟3階大会議室
地図 :http://www.riken.jp/access/wako-map/#anchor2
定員 :120名

お申込み方法などの詳細はこちらをご参照ください。勉強会後に情報交換会を開きますので、ぜひ参加をご検討ください。

みなさまとお会いできることを楽しみにしています。ご意見・ご質問・リクエスト等ございましたら、遠慮無くご連絡ください。
| akb | 勉強会 | 14:46 | comments(0) | - |
ファイルの更新日時を詳細に確認する
Linux上でファイルの一覧を取得する際のコマンドである、「ls」にはいろんなオプションがあります。
例えば、以下のオプションでは、日付や権限も分かるリスト形式でファイルの一覧を取得できます。
$ ls -l
ところで、通常の「ls -l」では更新時間の最小単位は分になっています。秒単位で時間を確認したい場合はどうすればいいでしょうか。
そんな時には、以下のオプションを打ってみましょう。
$ ls -l --time-style=full-iso
少々長いですが、このコマンドを打つことで秒単位で更新日時を確認することができます。
| deda | システム | 14:37 | comments(0) | - |
ハエの話
以前も書きましたが、大学の卒論テーマがショウジョウバエだったhatです。

最近、ショウジョウバエを扱ったご経験のある先生とお話しする機会があり
「ハエは吸虫管(ストローのような器具)で吸って移動させる」
「エサを作ったり瓶を洗ったりするのも当時は自分たちでやっていた
(今は業者さんに頼むことも多いとか)」
などの、興味のない方には全くおもしろくないであろう
「ショウジョウバエあるあるネタ」で盛り上がり、とても懐かしかったです。

私が卒論で扱ったのは、キイロショウジョウバエ(D. melanogaster)の
亜種である、オナジショウジョウバエ(D. simulans)と
モーリシャスショウジョウバエ(D. mauritiana)というハエでした。

オナジショウジョウバエは国内でも採集されますが、
モーリシャスショウジョウバエはインド洋の島国、モーリシャスで
捕れたハエだそうです。
島という物理的に隔離された環境で進化したため、他の亜種と交尾しづらくなっていたり、交尾しても子供が育たなくなったりしています。

卒論に向けて実験を追い込む中、どんなところかもしらないまま
「遠いモーリシャスに行ってのんびりバカンスしたいなあ」とぼんやり
妄想していたのを思い出します。
調べてみたところ、モーリシャスは海の綺麗なリゾート地だそうです。
一生のうち一度はモーリシャスに行ってみたいです。そしてハエを見つけて、「本場のD. mauritianaだ!」と悦に入ってみたいです。
| hat | よもやま話 | 15:02 | comments(0) | - |
再帰的
recursive:再帰的な
という英語があります。
再帰というのは説明が難しいのですが、wikipediaによると「あるものについて記述する際に、記述しているものそれ自身への参照が、その記述中にあらわれることをいう」のだそうです。
わかりませんね。
「Aについての定義の中に「Aを参照」と書いてある」というようなことです。

Linuxのコマンドのオプションに、このrecursiveが頻出します。
作業ディレクトリの下層のディレクトリにまで下ってコマンドを実行することを「再帰的に」●●(コマンド)する、と表現するのです。

例として /home/amelieff/hoge/moge というディレクトリがあり、作業ディレクトリが /home/amelieff/ だったとします。
amelieff/ディレクトリの下にはhoge/ディレクトリがあり、さらにその下にmoge/ディレクトリがあります。
一番下のmoge/ディレクトリごとhoge/ディレクトリをどこかへコピーしたいときのコマンドは
$ cp -r hoge/ [コピー先]
となります。 -r オプションは、ディレクトリの中のディレクトリも再帰的にコピーする、という指示です。

cpコマンド以外にもrecursiveオプションを指定できるコマンドはたくさんあります(rは大文字だったり、小文字だったりします)。
主に使うものを紹介すると、

$ cp -r [ファイル/ディレクトリ] [コピー先]
ディレクトリの内容を再帰的にコピー
(ディレクトリの中のディレクトリにまで下ってすべてコピー)

$ ls -R
ディレクトリの内容を再帰的に表示する
(下層のディレクトリの内容まですべて表示)

$ grep -r [パターン] [ディレクトリ]
ディレクトリの内容を再帰的に文字列検索する
(下層のディレクトリの内容もすべて検索して表示)

$ chmod -R [モード] [ディレクトリ]
ディレクトリの内容を再帰的にアクセス権限を変更する

ちなみにrecursiveの名詞形はrecursionですが、Googleの検索ボックスで"recursion"と入れて検索すると……?
(大したことのない小ネタなので、お暇な時にどうぞ)
| kubo | システム | 15:16 | comments(0) | - |
第30回バイオインフォマティクス勉強会「フリーソフトではじめるRNA-seq解析入門@神戸」開催のお知らせ
3月15日(土)に開かれる第30回バイオインフォマティクス勉強会のご案内です。
好評につきまして、東京会場でご紹介いたしました「フリーソフトではじめるRNA-seq解析入門」を神戸会場にて開催いたします。

Linux PCでNGS解析(特にRNA-seq)を始めたい方を対象に、公開データを用いたデータ解析手法をご紹介します。また、精度の高い解析結果を出すためにポイントとなる、フリーソフトの使い方やコマンド操作など実例を交えてご紹介いたします。なお、本セミナーでご紹介する主なソフトウェアはTopHat、Cufflinks、Rなどです。ご紹介したコマンドはお配りする資料にすべて記載してありますので、お持ち帰りいただき、ぜひNGS解析を始めていただきたいと思います。ご質問などございましたら、お近くのスタッフまでいつでもお気軽にご相談ください。
勉強会後には情報交換会も予定しております。みなさまにとって、貴重な情報交換の場となりましたら幸いです。

               記
日時 :2014年3月15日(土) 15:30〜17:00
場所 :関西事業所 (兵庫県神戸市中央区港島中町2-1-12北埠頭ビル 3階)
地図 :http://www.om-kobe.co.jp/office_kitafuto.html
定員 :30名

お申込み方法などの詳細はこちらをご参照ください。勉強会後に情報交換会を開きますので、ぜひ参加をご検討ください。

みなさまとお会いできることを楽しみにしています。ご意見・ご質問・リクエスト等ございましたら、遠慮無くご連絡ください。
| akb | 勉強会 | 16:13 | comments(0) | - |
最新のファイルを知りたい時
Linuxのコマンドで
$ ls -l
というのがあります。このコマンドを実行すると、ファイルとディレクトリの一覧をアルファベット順で取得できます。ですがファイルの更新日時順に並べたい時も結構あります。そんな時には以下のオプションを使ってみましょう!
$ ls -lt
すると、更新日時が新しい順に上から下までソートされて出てきます。便利ですね。
また、ファイルの数が多すぎて、このコマンドを実行しても実行結果の上部が隠れてしまい、最新のファイルがどれかわからなくなる時があります。
そんな時は、以下のオプションを使ってみましょう!
$ ls -ltr
すると、今度は更新日が新しい順に、下から上までソートされて出てきます。一番下に表示されたファイルが最新ということですね。
このコマンドはたまに使えるので覚えておくと便利かもしれません。
| deda | システム | 14:55 | comments(0) | - |
第8回日本ゲノム微生物学会年会 出展のお知らせ
アメリエフ株式会社は、2014年3月7日(金)〜9日(日)に東京農業大学で開催される、「第8回日本ゲノム微生物学会年会」に出展いたします。皆さまのご来場をお待ち申し上げます。

■ 学会名
第8回日本ゲノム微生物学会年会

■ 開催期間
・2014年3月7日(金)〜9日(日)
※ブースの展示は7日13:00〜となります

■ 会場
・東京農業大学 世田谷キャンパス

■交通アクセス
こちらをご参照ください。

■ 展示内容
・受託解析サービスのご紹介
 超高速シーケンスデータ解析の実例
・バイオインフォマティクス・スクールのご紹介
 Linux基礎
 NGS基礎(Resequence、RNA-Seq、ChIP-Seq他)
 R基礎
 Perl基礎
・NGSデータ解析サーバ チラシの配布
・NGS受託解析キャンペーン チラシの配布
・Denovoアセンブリングソフトウェアの比較 レポートの配布
| akb | 学会出展 | 15:13 | comments(0) | - |
VCFのアノテーション
SnpSiftを使うと、VCFにdbSNPや1000Genomesのアノテーションをつけることができます。

(1)アノテーション用のデータを以下からダウンロードして解凍します。
ftp://ftp.ncbi.nih.gov/snp/organisms/human_9606/VCF/00-All.vcf.gz

(2)SnpSiftを実行します。

$ java -jar SnpSift.jar annotate 00-All.vcf X.vcf > X_anno.vcf
※「X.vcf」はアノテーションをつけたいVCFファイルを指定します。

デフォルトではたくさんの項目がつきますので、例えばdbSNPのバージョンと1000Genomesのアリル頻度だけつけたい場合は、以下のように指定します。
$ java -jar SnpSift.jar annotate -info dbSNPBuildID,CAF 00-All.vcf X.vcf > X_anno.vcf

デフォルトではVCFのID列とINFO列に情報が入りますが、例えばdbSNPのIDだけをID列だけにつけたい場合は、以下のように指定します。
$ java -jar SnpSift.jar annotate -id 00-All.vcf X.vcf > X_anno.vcf

この他、VCFであれば(おそらく)なんでもアノテーションに使うことができます。
遺伝子アノテーションソフトのSnpEffは弊社内でもよく使っているのですが、一緒にこんなに便利なソフトが提供されていたとは...。
| hat | バイオインフォマティクス | 14:33 | comments(0) | - |
風邪をひいておりました
先々週の日曜、家族と辛いカレーを食べに行きました。カレーはとてもおいしかったのですが、あまりの辛さに大量の汗をかいた後、そのまま外をうろついて体を冷やしたのが悪かったのか、風邪をひいてしまいました。
先週の頭ごろから咳が出るようになり、週の半ばには鼻も詰まるようになりました。

悪化する一方だったので、とうとうお休みをいただいて病院にいき、処方された薬で症状は一気に軽減しました。まだちょっと鼻声ですが。
とはいえ、お医者さまいわく、今年の風邪は咳が長引くタイプが流行っているそうで、まだしばらくマスクとのど飴が手放せなさそうです。

余談ですが、口内炎はなりやすい人となりにくい人に分かれるそうですが、私はなりやすいタイプでして、風邪をひくと必ず口内炎を発症します(風邪以外の時でも発症しますが)。
今回も律儀に口内炎が発症しまして、それも一度に2つもできてしまいました。
結構痛みでいらいらさせられるもので、集中力も散漫になりますし、個人的には下手な咳や鼻づまりよりも厄介です。
風邪とともに治りつつありますが、さっさと完治してほしいものです。
| kubo | よもやま話 | 15:03 | comments(0) | - |
さんぴん茶
沖縄ではジャスミン茶のことをさんぴん茶と呼び、日本茶よりもよく飲まれています。私も幼いころから日常的にさんぴん茶を飲んでいました。食事中、部活中、勉強中に。

最近は東京でも「ジャスミン茶」としてどこにでも売っているので、とても助かります。緊張感が高まる仕事中は、ジャスミンの香りを嗅いで気持ちを落ち着かせています。とくに、寒い季節はホットで飲むことが多いので香りも広がりやすいです。

私のお茶好きを知る友人から、ベトナム産のジャスミン茶のティーバッグをお土産にもらったので、ただいまハイペースで消費中です。日本産・中国産との香りの違いを楽しんでいます。

ただ、お茶やコーヒーを飲む頻度が増えると、すぐに歯が黄ばんでしまうのが悩みです。。
| heshi | よもやま話 | 14:53 | comments(0) | - |
      1
2345678
9101112131415
16171819202122
23242526272829
3031     
<< March 2014 >>

このページの先頭へ