Structural variation in two human genomes mapped at single-nucleotide resolution by whole genome de novo assembly

構造多型を見るのになんで de novo assembly?という声が聞こえてきたので読んでみることにした。いや、参照ゲノムへのアラインメントって結構不完全だったりするので de novo assembly+アラインメントで比較、というパイプラインで動作するんだったらそっちの方がおそらく精度は高いものが見えるのだろうとは思う。

と思って読んだら余りにも予想通りの結論で、正直読まなくても良かった。以下、短いまとめ。構造多型の検出感度は従来製品と同じぐらい、false positive は大きく減っている、単純でない(複数の構造変異が重なっている)構造多型に関しては従来製品では無理なのが de novo assembly + whole genome alignment だと見える。アセンブリが難しい反復配列をたくさん含む領域はそもそも無理。全ゲノムをいきなりアセンブリすると計算コストが高いんじゃないか、と思ったが計算コストについては何も書いてないのできっと高い。