AGBT2015参加記(3): ロングリード時代の到来

AGBT2015 は PacBio がゴールドスポンサーでした。それは PacBio にとって今が経営的に勝負時であり、かつ、PacBio の有用性が大きく高まったタイミングでもあるからです。Oxford Nanopore のようなその他の1分子ロングリードシークエンサー、BioNano Irys や 10X Genomics, Dovetail Genomics などのロングレンジリンク情報を提供する観測機器など、直接・間接的に PacBio 社のライバルとなる会社はたくさんありますが、P6-C4 試薬を発売した PacBio 社は今のところ頭1つか2つぐらい抜きん出ているのは間違いありません。

2014年末に PacBio 社が発表した P6-C4 試薬は、その前の P5-C3 試薬と比べてリード長が大きく伸びています。AGBT2015 では PacBio P6-C4 試薬を用いたゲノム de novo 解読の発表が相次ぎ、N50 コンティグ長は 1 Mbp を超えていて当たり前、ヒトゲノム(胞状奇胎を読んでいるのでハプロイド)のアセンブリで N50 コンティグ長が 10 Mbp を超えても会場からそれほど大きな驚きの声は上がりませんでした。反復配列が少ないゲノム配列はもう「1コンティグ=1染色体」で当たり前の時代となりました。ヒトのセントロメアのようなひどい反復配列で PacBio によるアセンブルだけでは繋がらない領域も、BioNano Irys システムを用いて繋がったり、アセンブルの誤りを訂正したとの報告が GRC のグループからありました。PacBio リードのみのヒトゲノム(乳がんアセンブルDNANexus 社が並列計算を用いて1日で終えたとの発表をしており、2〜3年後には PacBio のみによる全ヒトゲノムアセンブルを遺伝疾患のケース・コントロール研究で普通に用いるのだろうな、という予感がしました。いずれにせよ、アーリーアダプターの研究者コミュニティでは「ロングリードは使って当たり前」の時代が到来したのです。本来ならば BioNano Irys などのシステムについてもここで解説できると良いのですが、システムの仕組み自体は何年も前から公開されているのでここでは割愛します。