次世代シークエンス!

DNAの配列の読み方・第一世代として開発され、何気に今でも単純なシークエンシング反応としてめちゃくちゃ汎用されている、サンガー法についてここ何度か見ていました。

サンガー法の特徴というか欠点というか技術的な制限として、読みたい配列の上流に位置するプライマーを用いるため、既知のDNAしか読むことができない1種類の配列しか読むことができない、といった点が挙げられます。

関連して、これはこないだの「分かりやすい解説記事」のプライマーの話でも触れようと思っていた点ですが、プライマーは、確実に一箇所にのみ結合するものを用いなければなりません。

サンガー法で見ているシグナルは結局伸びたプライマー(伸長後、ddNTPを取り込んで止まったプライマー)でしかありませんから、これがもし複数の異なる場所から伸び始めてしまうと、もうしっちゃかめっちゃかで何も分からない結果になってしまうんですね(違う場所のDNAの配列は全然違うため、プライマーが伸びた1塩基目がAとT、2塩基目はTとC…みたいに、同じ長さで違う蛍光が出てきてしまい、判別がつかなくなる)。

ちょうどThermo Fisherのサイトにトラブル例のピークが載っていたので引用してみますが…

f:id:hit-us_con-cats:20210817062543p:plain

https://www.thermofisher.com/blog/learning-at-the-bench/troubleshoot_ce_gsd_ts_1/より

これぐらいならまだマシで、目視で頑張ればなんとか読めるような気もするものの(一番高いピークだけを拾っていけばなんとか……っても、明らかに微妙で判別できない部分もありますし、やっぱりこんな汚いピークでは信頼できませんから、やり直すべきですね)、もっと酷いパターンだと完全に2種類かそれ以上のピークが重なっていて、まるで意味をなさないゴミカスな結果が得られてしまうこともあります。

だから、プライマーは必ず一箇所に結合する配列じゃなければいけないし、かつ、読まれる方のDNAも完全に同一の配列のもの(例えば読んでいる途中で1塩基の欠けがあったら、その下流から、同じサイズの断片は「欠けなしで読まれたもの」「欠けていた結果、本来1塩基先で取り込まれるはずのものが取り込まれたもの」が混在し、完全にカオスになります)でなければいけないわけですね。

(なので、シーケンシング反応で使うプライマーは、「読みたいDNAの他の部分に似ている配列があって、意図せずそういった別の部位に結合してしまうことはないか?」ということをチェックする必要があります。)

似たようなDNA合成反応であるPCRではプライマーを2本用いるため、油断するとついついプライマーを2本加えてしまう間違いを犯していまいがちなのですが、シーケンシング反応はプライマーを2本混ぜた時点で全てが終わるので、要注意ポイントといえましょう。


まぁ「プライマーがテンプレートDNAの一箇所のみを認識することが重要」というのも触れておきたかった点ですが、それ以外にも、「既知の配列がないとDNAは読めないわけ?」「全く未知の、プライマーを用意できないようなDNAを読むにはどうすれば?」という点も、何となく気になる方もいらっしゃるであろう、触れておきたいポイントですね。

以前チラッと書いていた通り、それは余裕で可能でして、端的に一言でいうなら、「知ってる配列を持った短いDNA」を、読みたいDNAの端っこに連結してやる、というテクニックに尽きる感じです。

その連結させてやる短いDNAをアダプターと読んでいますが、読みたいDNAの端っこにアダプターをつなげて、その配列を認識するプライマーを使えば、端っこから限定ですが、強制的にどんなDNAでも読める形になるわけですね。

アダプターDNAの連結には、以前、「制限酵素処理したDNAを貼り付ける」というクローニングの話で出てきたDNAリガーゼを使うのが古典的なやり方ですが、長い時間を経て、様々な企業が色々な優れた手法を開発しています。

アダプターを用いて、どんなDNAでも配列を読むことができる……しかも従来のサンガー法のように1反応で1種類のDNAしか読めないという形ではない、凄まじい量を一気に処理できる方法こそが、今回のテーマ、次世代シークエンスと呼ばれるテクニックになります!

次世代シークエンスは、英語でそのままNext Generation Sequencingの頭文字を取って、NGSと呼ばれていますね。

…まぁ正直、NGSはアダプターを使うことが肝ではなく、大量のDNAを一括で処理して同時解析ができるという点が最大の特徴になるわけですが、NGSに関するまとめ記事(レビュー論文)を紐解いてみると…

f:id:hit-us_con-cats:20210817062652p:plain

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7122948/より

サンガーさんがDNA配列の研究を始めた1972年を皮切りに20世紀末まで「第一世代」のサンガーシークエンスが発展を続け、その後21世紀初頭、2005年には、初のNGSと呼ばれる解析技術が、454 Life Sciences社(その後、Roche(ロシュ)というスイスの超巨大製薬・バイオ・ヘルスケア企業に買収&吸収されます)によってリリースされた形ですね。

NGSとして有名な手法には3種類ありまして、1つがそのRocheパイロシーケンシング(454○○という名前で開発・販売されている手法ですね)、もう1つが恐らくNGSの中でも一番使われている印象がある、Illumina(イルミナ)社の合成シーケンシング(NovaSeqとかHiSeqとかMiSeqとかの名前で商品展開)、そしてこのNGS二大巨頭より、個人的に少し普及度の上では劣っている気がする(あくまで統計を取ったわけではない個人的な感触でしかないですが)、ABI (Applied Biosystems)社という、年表にもある通り第一世代のサンガーシークエンスを全自動で解析できる装置を初めて作った偉大なる企業(ABIは、その後Invitrogenというこれまた有能な試薬会社と合併しLife Technologiesという大企業となり、さらにその後、またまたしゃしゃり出てきたThermo Fisherに吸収されました)が開発したライゲーションシーケンシング(SOLiDという名前で知られる)の3つですね。

こないだ「実際のシーケンス結果です」と貼った、サンガー法で読んだピークレポートは、業者にDNAを送ったら翌日メールでファイルが送られてくるのですが、このファイルの拡張子は「.abi(またはab1)」であり、シーケンシング技術の開発にいかにABIが貢献したかが見て取れますね。

個人的には学生時代からお世話になってるし技術力も本当に高いのでABIは好きな企業ですけど、NGSに関しては、IlluminaとRocheの方が成功してるのかな、って印象がやっぱりあるかもしれません。

まぁそれはともかく、少なくとも他の有象無象のNGSよりは圧倒的に普及しており使われているのがこの3社の手法なのですが、分かりやすい解説記事を書いてくれることに定評のあるコスモバイオのサイトに、この3社のNGS手法の概略がまとめられていたので、パクリという名の引用をさせていただきましょう。

f:id:hit-us_con-cats:20210817062914p:plain

https://www.cosmobio.co.jp/support/technology/a/next-generation-sequencing-introduction-apb.aspより

結局似たような解析をするわけですから、多少の差異はあれ、どれも概ね同じことをしているテクニックになるわけですね。

詳しく見るのはちょっと入門編を逸脱しすぎているので見ませんが、ごくごく簡単にポイントだけさらってみると、まずは最初、上述の通りアダプターをDNAにつなげるんですけど、NGS共通の特徴として、DNAを断片化することが挙げられます。

ある程度の長さ(数百塩基ぐらい)で、ランダムにバシバシ切っちゃうんですね。

そして、その切断した両端にアダプターをつける…という流れなわけですが、「今から読もうとしているDNAを切っちゃうって、それ大丈夫なん?」って気もするかもしれませんけど、これは全く大丈夫です。

ざっくりいえば、例によって反応液の中には大量の分子が存在するため、でたらめに切っても、その断片を読んで生まれた配列を大量に並べることで元の配列が再現できる形になっていますし、さらにいうと、「未知のものも解析可能」とはいえ、大抵の場合はヒトの全遺伝子など既知の配列を見ることがほとんどですから、参照できるデータが既にこの世に存在するので、断片だけでもどこを読んでいるかは概ね分かるといえるからですね。
(相変わらず、「え?もうデータが存在する、既知のものを見て何の意味が?」と一瞬思うのですが、例えば「この病気の人は、知られている遺伝子データと比べて、ここが違うな!」みたいな比較をする…みたいな使い方が考えられますね。)

それには高速で処理できるコンピューターとビッグデータ解析のための演算アルゴリズムとが絶対に必要になってくるわけですが、そういったものが都合よく時を同じくして発達してきていたのも、NGS技術の発展に欠かせなかったというか、これだけ計算機が高度に発達してくれていたのは生命科学研究者にとってはラッキーだったといえる点かもしれませんね(蛍光分子の検出技術の発達なども、全く同じ)。


断片化してどうするのか、アダプターをつけた後どうするのか、とかも、ちょっとぐらい触れてみようかなと思いましたが、やっぱりあまりにも複雑すぎてドツボにはまりそうなので、やめておきましょう。

一言でいえば、PCRで大量に増やすというステップがあるのがサンガー法との大きな違いといえますが、それはあくまでシグナル強度を大きくするためだけのステップであって解析の本筋ではなく、細かい点は抜きにすると、「プライマーを伸ばすときに取り込まれる蛍光を見る」というのがポイントというか肝であり、これは何だかんだ、ほぼサンガー法と同じといえるんですけどね。
(検出の方法・規模や技術の高度さは段違いに違えど、結局のところは4種類の色を記録し続けている感じなわけです。)

上記コスモバイオの解説記事などは、よくまとまってはいますがこれを見ただけで細かい点まで理解することは絶対に不可能なので、きっちりと理解してみたい方がもしいらしたら、断然、各企業の出している製品マニュアルを見るのが圧倒的にオススメです。

例えばIlluminaなんかですと、各ステップについて全て日本語になったものが用意されているので、どなたでも時間をかければ理解可能といえましょう。

jp.support.illumina.com

…というか、僕はこれらの機器を使ったことがないので、マニュアル以上の説明ができない、ってだけともいえるんですけどね。

ただ、以前も書いた通り企業のマニュアルは本当に丁寧に素晴らしくできているので(まぁ、ユーザーに使ってもらうためだから当然ともいえるかもしれませんけど)、マニュアルを読めば原理がバッチリ理解できるのは間違いないように思います。


…で、結局NGSこと次世代シーケンシングで何ができるのか?…というと、正直ぶっちゃけ、技術の凄さの割に、まだあんまりこれといった成果は出ていないような…という気がしてしまうかも……というとこの技術に携わっている方や既に実験成果を出されている方にブチ切れられるかもしれませんが、まぁまさにこれまでがちょうど黎明期で、この先10年とかで、ガンガン素晴らしい応用がされていくことでしょう。

具体的には、1人の人の全DNAや全RNAをサクッと読むことも可能になっていくでしょうから、興味ある人は自分のゲノムをパパッと調べて、ガンや、その他遺伝子の変異が関わる疾患のリスク評価や診断、さらには適切な治療薬の提示なんかがサクッと行える……そんな未来が、その内やってくるかもしれませんね。

こんな記事もありました。

jp.techcrunch.com
昔はクソデカサイズでバカ高かった携帯電話が、今では超小型化されたものを1人1台もつぐらいにまでなったのと同じように、シーケンサーも近年尋常じゃない進化を遂げているということですね。

ちょうど、公開されていたIllumina社のセミナー資料に、画像でシーケンスコストの歴史が掲載されていました。

面白かったので、またまた抜粋させていただきましょう。

f:id:hit-us_con-cats:20210817064054p:plain

https://www.adres.ehime-u.ac.jp/news/NGS1.pdfより

20世紀末から新世紀にかけて、10年以上の月日をかけて、30億ドル(ざっくり、3000億円!)もの費用を投じて世界中の研究者の手により解読が完了したヒトの全遺伝子ですが……

f:id:hit-us_con-cats:20210817064019p:plain

https://www.adres.ehime-u.ac.jp/news/NGS1.pdfより

それからさらに10年以上経った現在、わずか10万円で、1日もあれば読み終わってしまうんですから、技術の発展ってのも大したものです。

なお、NGSセカンドジェネレーションの3社の装置は使ったことがないんですが、実は、上で挙げた年表に載っていた、第4世代とされるOxford Nanopore Technologies社の、MinIONと呼ばれる装置を使った「RNAシークエンス」は、実際自分の手でやったことがあります。

これはDNAではなく、RNAの配列を読むテクニックなんですが(しかも、装置自体は「ミニオン」という可愛らしい名前の通り、小型サイズのもので、自分のコンピューターにつなげて解析ができるという優れものです)、ナノポアという超ミクロサイズの穴が多数存在するチップにRNAを流して解析するという物凄いテクノロジーで、評判や研究者内での期待感も極めて高い手法なんですけど、僕は、あんまり上手くいきませんでした(笑)。

まぁちょっと特殊なサンプルの検出の試みで、チャレンジングな実験だったので失敗も仕方ない点ではあったんですが、特に期待するほどの結果が得られなかった立場上あまり大きなことはいえないものの、やっぱり、技術そのものは本当に素晴らしいものだと感じましたね。

バイスは今もデスクの横に置いてあるので、またちょっとアプローチを変えて、時間に余裕ができたら解析してみたいな、などと考えています。


…と、今回は表層をなぞるだけの、正直浅い感じの話しかありませんでしたが、NGSこと次世代シークエンス、多分生命科学研究の向こう10年ぐらいの花形になりそうではあるので、技術も日々発展し続けていますし、何となく興味がある方は追いかけてみるのも面白い対象かもしれませんね。

次回は、DNAの配列解読に続き、タンパク質の配列解析についても軽~く見てみようかな、と思っています。

にほんブログ村 恋愛ブログ 婚活・結婚活動(本人)へ
にほんブログ村