AGBT2015参加記(4): あとがき

他のこまごまとしたトピックとしては、私が生クレイグ=ベンターをはじめて見た話、リニアな参照ゲノムでは限界があるのでグラフ型参照ゲノムを解析できるツールとエコシステムを作ろうという GRC などのグループからの提案、米国の Precision Medicine の宣…

AGBT2015参加記(3): ロングリード時代の到来

AGBT2015 は PacBio がゴールドスポンサーでした。それは PacBio にとって今が経営的に勝負時であり、かつ、PacBio の有用性が大きく高まったタイミングでもあるからです。Oxford Nanopore のようなその他の1分子ロングリードシークエンサー、BioNano Irys …

AGBT2015参加記(2): 10X Genomics の新製品 GemCode

さて、肝心の発表内容に触れたいと思いますが、今年はここ数年の中で最もビッグニュースの少ない年でした。これは、Illumina が新製品の発表を AGBT ではなく、1月の JP モルガンヘルスケアカンファレンスに持ってくるようになったことや、Oxford Nanopore …

AGBT2015参加記(1)

この記事は某所のニュースレターとクロスポストです。今年2月の下旬にアメリカ合衆国のフロリダ州マルコアイランドで開催されたAGBT2015に参加してきましたので、参加の感想を書きたいと思います。この会議は名前の通り、ゲノムやバイオテクノロジーに関す…

/etc/init.d から GlusterFS 3.4.x のファイルシステムをマウントする

起動時に GlusterFS を用いたファイルシステムをマウントしたい人は /etc/fstab に書いてね、ってドキュメントには書いてあるのだが、私の環境では諸事情によりその方法では動かない。(主に GlusterFS をイーサネット経由ではなく IPoIB 経由で使っているせ…

AGBT2014まとめ(その1:Oxford Nanopore編)

AGBT2014に参加してきました。AGBTでは様々なゲノムに関わるテクノロジーがよく新発表される会議です。新型のDNAシークエンサーなんかがよくこの会議で発表されています。AGBT2014のまとめは英語圏の blog では一杯ありますが、日本語のものはあまり無か…

Papers2 (Windows版) を日本語 Windows 上で動かすと MS-Word との連携時に MagicManuscript で余計な改行が入る不具合を抑制する方法

Papers2 を Windows で使おう、それも日本語の MS-Word 上で使おう、なんて人は凄く少ないのではないかとも思いますが、やってみたらいろいろバグって使い物にならなかったので、見つけた回避策を書いてみます。 本家には既にバグ報告してあちらで再現できた…

MegaCLI と DELL OMSA の rpm パッケージがコンフリクトする件

LSI の RAID カードをコントロールするコマンドラインユーティリティ MegaCLI とDELL の OMSA で rpm パッケージが衝突していて困った。どうやら別々の rpm パッケージで同じファイルを梱包しているのが問題らしい。ファイルをよく観察したところ、LibUtils …

Becky の bmf ファイルを eml ファイルに変換するスクリプト

メールボックスの Quota 溢れのためメールを IMAP サーバーからローカルに落としまくったのだが、ローカルで検索が速いソフトが無くて結構困っていた。検索できないならローカルに落としたくない。色々探したら MailStore というソフトが結構便利そうなんだ…

IPMIでサーバーの電源を遠隔でon/offをする方法

ほとんど自分用の備忘録だが書いておく。まず、大前提として IPMI を使ってリモートからサーバーの状態を確認orコントロールするためには BIOS の設定画面から IPMI 用に IP を振ったりユーザーやパスワードを予め登録しておく必要がある。これはもう済んで…

GlusterFS 3.3.x 以降で brick として使っていないはずのディレクトリに GlusterFS をマウントしようとしたら "brick として使っています" というエラーが出る問題

brick のディレクトリに誤って GlusterFS をマウントしてしまう人が跡を絶たないので、FUSE でマウントする時にそのマウントポイントが brick になっていないかどうかをチェックするという仕様になったのだそうだ。そして、brick かどうかのチェックには拡張…

GlusterFS 3.(2|3).x で transport-type を rdma から tcp に変更する方法

GlusterFS 3.2.x で "transport-type rdma" の設定をすると動作がおかしくなることが偶にあるようである。本家のフォーラムで、3.2.x あたりから rdma の設定はちゃんとテストされていないから動いていないかも、将来的には直すよ的な発言が出ていたので rdm…

GlusterFS 3.2.x から 3.3.x へのアップグレード方法

諸事情によりGlusterFS 3.2.x から 3.3.x へのアップグレード方法(英語)を実行することになったので日本語訳を作った。以下の段落は全て元 blog 記事の日本語訳です。日本語としてなるべく自然になるように意訳多めです。括弧()の中の内容は全て訳注です。…

X10雑感

IBMが作っている X10 という並列計算向けの言語があるんだけれども、これが結構面白い。MPIでガリガリ書くのと比べるとゲノム解析との相性がずいぶん良さそうだ。いくつか不満点があるのでメモがわりに並べておく。async の実装がタスクスチールではなくタス…

英語論文を書いているのに Papers2 (on Windows) で引用に日本語が混じる問題を解決する

Papers2 を日本語 Windows で使っていると Windows の言語設定に応じて引用スタイルを勝手に日本語に変換されてしまうことがある。例えば Foo et al. と書きたいときに (Foo 他 2012) とか、[Foo and Bar 2012] って書いて欲しいのに [Foo と Bar 2012] とか…

Excel のファイルからフォーマット情報を抜き出し

共同研究者から Excel でデータが来ても困らないようにPython で Excel のデータを読み込む系を昔作ったので参考までにメモ。https://gist.github.com/2359207:こんなコードでセルの色や右寄せ左寄せ、フォント情報などが得られるので、ありとあらゆる機械判…

Infiniband のスピード計測

Infiniband のスピードを計測しようと思い立って計測してみた。(以前にも測ってはいたんだけど結果を忘れたので。)マシンは Xeon 5650×2 に QDR のカードを挿してスイッチ1段経由で接続(メーカーは全部 Mellanox)、OS は Scientific Linux 6.1 です。 …

msgpack-idl を試す(改め msgpack-idl の開発環境を整える)

前回試してから時間が立ったので現状チェックのために msgpack-idl を試してみることにした。テストマシンにはそもそも Ruby が入っていなくて bootstrap スクリプトが実行できなかったのでまず Ruby をインストール。楽なのでLPMを使ってインストールしたが…

UT genome browser の開発を Windows/Cygwin で行う為の手順

UTGB 開発者向け解説は一応一通り読んでおくべき。シンボリックリンクその他を使う関係上、Windows では Cygwin が無いとちゃんと開発できない。(Javaベースなので本質的には必要ないんだろうけど周辺スクリプトが動かないのだ。)あと、Mercurial は既にシ…

GlusterFS をマウントしたいけど順序が・・・

GlusterFS を /etc/fstab に書いてマウントしようとするとなにげに面倒。 チュートリアルに書いてあるように /etc/fstab に記述すると glusterd が立ち上がるより先にマウントしようとしてコケてしまう。(Scientific Linux 6 (RHEL6クローン)使用。)ならば、…

Myrinet の tips

MX_RCACHE 環境変数でメモリ位置のキャッシュを使った高速化をするかどうか設定できる。 詳しい話はこのへんを見てください。 0 ... 高速化しない 1 ... 高速化する(mallocチェックあり、デフォルト) 2 ... 高速化する(mallocチェックなし)

Parallelized short read assembly of large genomes using de Bruijn graphs

Velvetをベースに色々並列化を頑張った論文。基本の並列化はMPIなのでノード間並列を使える。性能評価に 36bp の短いリードを使っていることと、Velvet は長いリードが(競合他社製品と比べて)不得意なので最近の HiSeq のデータでどれぐらい良いかは自分で…

GlusterFS を RHEL6 系に入れてみる

Red Hat Enterprise Linux 6, CentOS 6, Scientific Linux 6 などのいわゆる RHEL6 系の OS に GlusterFS を入れる手順を備忘録的に書いてみる。FUSEを使う人は(普通使うと思いますが)、fuse, fuse-libs を入れる。(私の場合には元から入っていた。) # yum i…

.screenrc を晒してみる

自分用の備忘録も兼ねて ~/.screenrc を晒してみる。 escape "^_^_" defc1 off defscrollback 2000

C/C++ で segmentation fault したときに自動で gdb を起動

C/C++のプログラムが segmentation fault を起こしたときに自動で gdb を attach してスタックトレースを表示したいなぁ、と思ったのでそんなことをするライブラリを作ってみた。使い方は簡単。stackdump.hをincludeして、mainの頭で GDB_On_SEGV hogehoge(a…

Structural variation in two human genomes mapped at single-nucleotide resolution by whole genome de novo assembly

構造多型を見るのになんで de novo assembly?という声が聞こえてきたので読んでみることにした。いや、参照ゲノムへのアラインメントって結構不完全だったりするので de novo assembly+アラインメントで比較、というパイプラインで動作するんだったらそっ…

An integrated semiconductor device enabling non-optical genome sequencing

言わずとしれた ION torrent の論文。論文には新しいことは何も書いてないよ、という話だったんですが、誰かに ION torrent を紹介するときに「あのデータはこのペーパーにあるよ」と言えると楽なので一応何が載ってるかは読んでみることにした。CMOSのISFET…

Computational methods for transcriptome annotation and quantification using RNA-seq

RNA-seq についてのレビュー。レビューのレビューを書いてもしょうがないのだが、メジャーな RNA-seq 解析ソフト一覧が載っているし、そこそこわかりやすい解説なので RNA-seq を始める人はこのペーパーから読んでも良いのだろう。出版時期の関係で Trinity …

Short RNA の deep sequencing substraction と assembly で病原体同定

何かの病原体に感染した細胞を直接ショットガンシークエンシングして直接病原体のRNA配列を検出しましょう、というお話。 血清と違って細胞を潰すとホストのRNAがバックグラウンドとしてガッツリ(9割以上とか)でてくるのでそれをどうやって減らすかが課題…

DELL OMSA を入れてみる

Scientific Linux 6 に DELL Open Manage Server Admin (Dell OMSA) を入れてみることにした。というか、いつも入れてるんだけどわやり方を忘れるからメモする。こっちの Wiki を参考にしながら、 # wget -q -O - http://linux.dell.com/repo/hardware/lates…