2011-01-01から1年間の記事一覧

msgpack-idl を試す(改め msgpack-idl の開発環境を整える)

前回試してから時間が立ったので現状チェックのために msgpack-idl を試してみることにした。テストマシンにはそもそも Ruby が入っていなくて bootstrap スクリプトが実行できなかったのでまず Ruby をインストール。楽なのでLPMを使ってインストールしたが…

UT genome browser の開発を Windows/Cygwin で行う為の手順

UTGB 開発者向け解説は一応一通り読んでおくべき。シンボリックリンクその他を使う関係上、Windows では Cygwin が無いとちゃんと開発できない。(Javaベースなので本質的には必要ないんだろうけど周辺スクリプトが動かないのだ。)あと、Mercurial は既にシ…

GlusterFS をマウントしたいけど順序が・・・

GlusterFS を /etc/fstab に書いてマウントしようとするとなにげに面倒。 チュートリアルに書いてあるように /etc/fstab に記述すると glusterd が立ち上がるより先にマウントしようとしてコケてしまう。(Scientific Linux 6 (RHEL6クローン)使用。)ならば、…

Myrinet の tips

MX_RCACHE 環境変数でメモリ位置のキャッシュを使った高速化をするかどうか設定できる。 詳しい話はこのへんを見てください。 0 ... 高速化しない 1 ... 高速化する(mallocチェックあり、デフォルト) 2 ... 高速化する(mallocチェックなし)

Parallelized short read assembly of large genomes using de Bruijn graphs

Velvetをベースに色々並列化を頑張った論文。基本の並列化はMPIなのでノード間並列を使える。性能評価に 36bp の短いリードを使っていることと、Velvet は長いリードが(競合他社製品と比べて)不得意なので最近の HiSeq のデータでどれぐらい良いかは自分で…

GlusterFS を RHEL6 系に入れてみる

Red Hat Enterprise Linux 6, CentOS 6, Scientific Linux 6 などのいわゆる RHEL6 系の OS に GlusterFS を入れる手順を備忘録的に書いてみる。FUSEを使う人は(普通使うと思いますが)、fuse, fuse-libs を入れる。(私の場合には元から入っていた。) # yum i…

.screenrc を晒してみる

自分用の備忘録も兼ねて ~/.screenrc を晒してみる。 escape "^_^_" defc1 off defscrollback 2000

C/C++ で segmentation fault したときに自動で gdb を起動

C/C++のプログラムが segmentation fault を起こしたときに自動で gdb を attach してスタックトレースを表示したいなぁ、と思ったのでそんなことをするライブラリを作ってみた。使い方は簡単。stackdump.hをincludeして、mainの頭で GDB_On_SEGV hogehoge(a…

Structural variation in two human genomes mapped at single-nucleotide resolution by whole genome de novo assembly

構造多型を見るのになんで de novo assembly?という声が聞こえてきたので読んでみることにした。いや、参照ゲノムへのアラインメントって結構不完全だったりするので de novo assembly+アラインメントで比較、というパイプラインで動作するんだったらそっ…

An integrated semiconductor device enabling non-optical genome sequencing

言わずとしれた ION torrent の論文。論文には新しいことは何も書いてないよ、という話だったんですが、誰かに ION torrent を紹介するときに「あのデータはこのペーパーにあるよ」と言えると楽なので一応何が載ってるかは読んでみることにした。CMOSのISFET…

Computational methods for transcriptome annotation and quantification using RNA-seq

RNA-seq についてのレビュー。レビューのレビューを書いてもしょうがないのだが、メジャーな RNA-seq 解析ソフト一覧が載っているし、そこそこわかりやすい解説なので RNA-seq を始める人はこのペーパーから読んでも良いのだろう。出版時期の関係で Trinity …

Short RNA の deep sequencing substraction と assembly で病原体同定

何かの病原体に感染した細胞を直接ショットガンシークエンシングして直接病原体のRNA配列を検出しましょう、というお話。 血清と違って細胞を潰すとホストのRNAがバックグラウンドとしてガッツリ(9割以上とか)でてくるのでそれをどうやって減らすかが課題…

DELL OMSA を入れてみる

Scientific Linux 6 に DELL Open Manage Server Admin (Dell OMSA) を入れてみることにした。というか、いつも入れてるんだけどわやり方を忘れるからメモする。こっちの Wiki を参考にしながら、 # wget -q -O - http://linux.dell.com/repo/hardware/lates…

PDMSマイクロリアクターを使ったシークエンシング

Fluorogenic DNA sequencing in PDMS microreactors をざっと流して読んでみた。シークエンサーの原理としては454にやや似ている。 DNA増幅:する(約5000分子/クラスター) 塩基検出手段:蛍光 色数:1色(A, C, G, T でサイクルさせる) 蛍光検出手段:CCD…

ICPC2011 World Finals

ICPC2011 World Finals問題をざっと読んで解法予想。 仕事山積みなので、各問題の制限時間は3分で考えてみた。 問題A 最短かつ lexicographically first を求めるのでおそらく iterative deepening。 問題B 3点の対応関係を 2 通り固定してごり押し。 問題…

Boost のコンパイルはまりどころ

Windows で Boost をビルドしていたんだけど、ビルドディレクトリーが深すぎるとエラーが発生してしまう。生成に失敗したと言われたファイル名を touch してみると作れないので、パス名の最大長に引っかかったんだろう。61文字のパスをビルドディレクトリに…

Boost.MPI を使うときに知っておきたいこと

BOOST_MPI_HOMOGENIUS を定義してシリアライズを高速化 クラスター内の CPU が全部同じアーキテクチャであれば、コンパイル時に -DBOOST_MPI_HOMOGENIUS オプションを付け加えてコンパイルすると MPI_PACK, MPI_UNPACK しないでバイナリイメージのまま送って…

HDDのベンチマーク

最近 I/O がクリティカルな計算が多いので、DELL PowerEdge C2100 (Xeon X5650×2, 96GB)に SATA ディスクを積めるだけ積めて I/O のスピードをがんばってみました。ずっと前にベンチマークを取ったのですが、忘れないようにメモを blog に上げておきます。LS…

最初の記事

blogを開設した割に何も書いていないじゃないか、何か発信しろ、というほうぼうからの圧力に負けて blog にちょこちょことメモを書いていきたいと思います。短いものは twitter に書いてしまうのでこっちには多少まとまった文章を書くことを想定してます。た…