巨大なものも、折り畳まるよ

前回はDNAやRNAが一本鎖なのか二本鎖なのかといった大きな全体の構造について見始めていました。

続きに進む前に、ちょうど1点また元質問をいただいていたアンさんから追い質問を賜っていたので、簡単にそちらに触れさせていただくとしましょう。

Q.  RNAって、普通に単体であるもんなら?どがぁして聞いたらええか分からんのじゃが、折れ曲がって二重鎖やらになっとるってこたぁ、多分そがいなことじゃのぉ?
(例えば1本のRNAでも二重鎖になっとる部分が何箇所もある、ループも何箇所もあるような、くちゃくちゃになったみたいなのもあるってことかね?)

なんとなし、 RNAは、DNAがあって、そこから繋がっとるってイメージじゃった。

A. なるほど~、RNAとDNAが繋がってるってイメージですかぁ…!確かに、「DNA→RNA」とかよく書いてましたしね。しかし、こいつらは、全く別個の分子です。

本のコピーをしたら、大元の本とコピーして生まれた写し(コピーページ、1枚の紙)が全く別個のものであるのと同じことですね。

…もっとも、現実的には、DNAの複製はRNAプライマー(複製を始める取っ掛かりとなる短い分子…DNAを複製するのに、なぜかRNAがスターターとして使われるという感じです)が用いられることもあり、必ずしも「DNAとRNAは決してつながらない」ということでも全くないのですが、その辺は入門編では別に気にする必要がない(実際最終的にはDNAに置き換えられますし、とりあえず今は気にしない方が理解が進む)点と思うので、ひとまず「DNAとRNAは全く別物の、それぞれ独立した分子」と思っておくのがいいといえましょう。

 

という所で、前回の続きですが、前回は便利なRNA構造予測ソフトで、適当に考えた短いRNA分子がどういう構造を取るのかについて見ていました。

まぁそうなるような配列にしたので当たり前でしたが、そのRNA分子は、上手く折れ曲がって、二重鎖(ステム)ループをもつ構造になっていたことがご覧いただけてたと思うんですけど、改めて、RNAというのは、生体内でRNAポリメラーゼの力で合成されて(遺伝子であるDNAの一方の鎖を鋳型にして、他方の鎖と全く同じ配列をコピーするという形ですね。ちなみにこのステップは「転写」と呼ばれます。今まで触れてませんでしたが、分子生物学で最も重要な用語の1つかもしれませんね。なお、RNAからタンパク質を合成するステップは「翻訳」です。「DNA→(転写)→RNA→(翻訳)→タンパク質」という流れですね)…
…と、余談が長くなったので仕切りなおすと、RNARNAポリメラーゼによってDNAの情報をもとに合成されていく(=転写)ものですが、転写されるのはどちらか片方の鎖のみなので、出来上がるRNA分子は一本鎖として存在することが多いわけです。
(ここがDNAとの違いで、DNAの複製(コピー)は、二本鎖が両方同時に合成されます。なので、必ず相棒の鎖も存在するため、DNAは二本鎖を形成することになるんですね。)

だから、「RNAは一本鎖」とよく初学者向けの教材では書かれるわけですが、実際は、まぁ確かに一本鎖には違いがないんですけど、より詳しく見てみると、分子内で普通に二重鎖部分をもつ形になっているんですね。

それだけ、核酸分子というのは「二重鎖を形成することで落ち着くようにできている」というのは前回何度も強調していた点なわけですけど、例えば、生体内で最も大量に存在するRNAに、タンパク質の合成で働く実働部隊をタンパク質とともに形成しているrRNAという名の巨大RNA分子がいるのですが…
(ややこしすぎますが、以前書いていた通り、生体内の反応は基本全てタンパク質によって行われますから、「タンパク質の合成」も、当然タンパク質が担うわけです。
 ただ、タンパク質の合成はあまりにも複雑なステップなので、流石にタンパク質分子だけでは実現できず、RNAの力も借りているということですね。
 その、超スゴい巨大な「タンパク質合成マシーン(=タンパク質部とRNA部がある)」のRNA部を形成するのがコレ、ということですが……

 今回の話の本筋とはあまり関係がないものの、あまりにも重要な点なので改めて少しまとめておくと…

  • 生命活動の一番重要な反応はタンパク質を(アミノ酸をつなげ合わせて)合成すること(人間というか生命は、いわばタンパク質の塊だから。髪も目も筋肉も、食べ物の消化酵素も、特別な機能をもった大切なものはほとんどみんなタンパク質)
  • その「タンパク質合成」自体も、もちろん生体分子が担っている
  • これは、4種類の文字が3つ並んだコドンを、20種類のアミノ酸に変換するというめちゃくちゃ大変なステップなので、細胞の中でも一番巨大で複雑な分子がその役目を負っている
  • その巨大マシーンはリボソームと呼ばれるものだが、まぁ名前はともかく、こいつは、タンパク質とRNAからできている
  • そのリボソームRNA部のことを、rRNA(ribosomal RNA、日本語だとそのままリボソームRNA)と呼んでいる。リボソームが巨大なだけに、rRNAもかなりデカい!

…という話でした。)


…で、そのrRNAは、当然5'末端から始まり3'末端で終わる、一つながりの一本の鎖なんですけど、こいつの構造はどうなってるのでしょうか?

マサチューセッツ大学アマースト校のFournier研究室が、見やすい形のrRNA二次構造を公開してくれていたので、こちらをご紹介しましょう(まぁこの図は、構造もですが、それよりrRNAにおける塩基の修飾についての情報を教えてくれるのがメインの目的ではあるんですけどね)。

…さぁ食らいやがれ、これが、1542塩基にも及ぶ、大腸菌のrRNA(しかも、これが2種類ある内の、小さい方のrRNA)の二次構造だっ!

f:id:hit-us_con-cats:20211011060251p:plain

https://people.biochem.umass.edu/fournierlab/3dmodmap/ec2d16sframes.phpより

まま、中々のお手前でいらっしゃいますね。

あまりにも大きい図で、細部がかなり小さくなってしまった画像になっているので(多分、はてなブログでは勝手に縮小されてしまうので、拡大しても微妙かと思いますし)、真ん中の部分を拡大した状態でスクショもしておきましょう。

f:id:hit-us_con-cats:20211011060400p:plain

これこの通り、ちょうど真ん中あたりに位置する、先頭の5'末端AAA…に始まり、ぐる~っと一つながりのRNA鎖が延々と続いて、最後右下の方にある3'末端1542番目のAまで達して終わっているという感じですけど、極めて沢山のステムループ構造が形成されていることがお分かりになると思います。


これを一本鎖RNAと呼ぶのもどうなん?と思いますし、やはり、DNAもRNAも、基本的に二重鎖を形成するのがお好き、ってことなんですね。

(改めて、DNAは100%ぴったりマッチする相棒の鎖がいるから二本鎖を形成できるけど、RNAは相棒がいないので、独り寂しく自分で二重鎖部分を形成する、ってことですね。
 もちろんDNAも、相棒鎖がいない状況なら、RNAと同じように分子内で二次構造を取ります。でも、DNAは酸素原子が1つ少なくて電子の極性がうんたらでやや折り曲がりなどに不利なのか、RNAの方がより複雑な構造を取りやすいとはいえるかもしれません(いや、別にそんなことはないかな?)。)

 

ちなみに、前回紹介した構造予測ソフトでこのrRNAの構造を予測することも可能ですが(最大7500塩基まで入力できるので)、それはあくまでもコンピューターシミュレーションを使った予想であり、これだけコンピューターが発達した今でも、長ければ長いほど予想が外れるのは仕方ないことですから、仮に計算させて予測しても、割と外れている、しっちゃかめっちゃかな感じになるのではないかと予想されます。

…って、まぁせっかくなら実際にどうなるか見てみましょうか。

こちら、大腸菌の上記rRNA全長1542塩基を入力ボックスにぶち込んだ様子…

f:id:hit-us_con-cats:20211011061003p:plain

http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgiより


解析を実行すると、出ました、コンピューターが計算して予想した構造が!!

f:id:hit-us_con-cats:20211011061121p:plain

このソフトでは2つのアルゴリズムで計算されたものが表示されますが、まぁ割と似ているけれど細部は微妙に違って、何となく、右側のCentroidというアルゴリズムを用いた予想図の方が、ごちゃごちゃしすぎていない素直な感じでしょうか。

(ちなみにこのCentroidアルゴリズムを開発されたのは、日本人研究者の方だったように記憶しています。

academic.oup.com
…と、よく見たら元のアルゴリズムの開発ではなく既存の理論の改良をされた感じだったのかもしれませんが、いずれにせよ、↑に示した産総研の浜田さん達の仕事なんかが大いに役に立っている技術ですね。)

ということで、同じ日本人のよしみでCentroidの方に着目してみると、こちら320%に拡大した図(末端が来ている部分、図でいう右上の領域にフォーカス)ですが…

f:id:hit-us_con-cats:20211011061208p:plain

でっかい輪っかが切れているところが両末端ですが、5'末端の始まりの時点で、もう割と、先ほど一番最初に示していた実際の構造図とズレがありますね。

…あぁちなみに、最初のマサチューセッツ大の図は、これは(詳しくは見ていませんが恐らく)本物のrRNA分子を使って実験的に確かめられた実際の構造で(X線結晶解析で得られた構造をもとに、二重鎖RNAになってる部分のみを分解する酵素とか、一本鎖領域のCまたはUのみを切断する酵素とか、そういう特殊な酵素を駆使して、地道に完成させた偉大なる本物構造図ってことですね)、これはコンピューターの予想ではない、現実の構造を反映しているものと考えていいかと思います。


その実物のリアル構造を改めて見てみると、5'末端近傍はいきなり輪っかを作っているのですが、これ、実は案外特殊な構造なのです。

先ほどのマサチューセッツ大の拡大画像をご覧いただくと、9番目のGからのGAGと、23番目のCからのCUCとがステム(二重鎖)を形成していますが、ポイントはその間!

この9GAG11/23CUC25のステムの間に存在する17番目のUからのUCAが、ずーっと先の、920番目ぐらいのUGAとステムを形成しているんですね。

そもそもステムの形成というのは、基本的に、最も近い上流に位置する塩基とペアを形成するのが自然であると考えられます。

…って言葉だけだとかなりややこしいんですけど、例えばこのrRNA(マサチューセッツ大の、リアル構造図)を順番に見ていくと、まず最初「9-11番の3塩基が下流の3塩基と新たにステムを形成」、続いて「17-19番目の3塩基も下流の3塩基と新たにステムを形成」となるわけですが、その次に出てくる23-25番目の3塩基が「上流の3塩基とステムを完成させる(いわば、ステムを閉じる)」という役目をもっている場合、基本的にはこれは「直近に現れた、17-19番目の3塩基とくっついてステムを完成させる」となるのが筋というか自然なんですね。

そこを、遡ってもっと上流に位置する9-11番とステムを形成し、直近に位置していた17-19番塩基はもっと下流の塩基とステムを形成するとなると、正直、あっちこっちと入り乱れすぎて鎖がもつれてしまいそうな感じで、あまりにも複雑になってしまうわけです。

…まぁ実際はもつれることはないわけですが、これによってステムループではない部分に、結び目のようなものが生じることになります。

まぁ実際は結び目になることもないんですけど(いやさっきから何やねんって感じかもですが(笑)、図を見れば何となく分かるかと思います…)、結び目に近い構造にはなるので、これは「結び目もどき」、英語でシュードノット(pseudo-knot)と呼ばれる構造でして、ある意味結構特殊な構造なんですね。

シュードノットのWikipedia記事にもっと分かりやすい画像があったので引用させていただきましょう。

f:id:hit-us_con-cats:20211011061358p:plain

https://ja.wikipedia.org/wiki/シュードノットより

(これは画像右下の方から始まるRNA配列ですが)まず、①CGCGCGCUGというものが下流の塩基とステムを形成(とりあえず何と形成するかは置いておいて、少なくとも自分より下流のやつとステムを作るということ)、続いて何塩基か後に②GCUGACUUUという並びがありますが、これまたより下流の塩基とステムを形成…と、ここまでの「新しいステムの形成部位が連続して並ぶ」みたいなのは実際全く問題なくどんなRNAにもあるんですけど、その次の③CAGCGGGCGという部分、こいつは自分より上流のやつとペアになってステムを完成させる部分になってるわけですが、これが直近に存在する②GCUGACUUUとステムを形成して閉じるのではなく、2つ前の①CGCGCGCUGとステムを形成しているんですね!

(そして、その次に来る④AAAUGUCAGCが、②の部分とステムを形成している)


この入れ子構造は(分子の立体配置的に、普通は現実的に難しいことが多いためか)あまり見られないもので、この複雑な入れ子のことを、シュードノットと呼んでいるわけです。

実際、この入れ子構造的な並びになることで、投げ縄みたいなノットが、まぁできてるっちゃできてる気もしますね。


…で、正直もうかなり細かい話になってますが、コンピューターの二次構造予測の弱点として、こういうシュードノットを考慮に入れることができない、ってことが挙げられるのです。

(もちろん、絶対にできなくはないわけですが、そういう入れ子まで考え出すと計算量があまりにも膨大になって現実的ではなくなるので、多くの公開されているソフトでは、シュードノットは考慮されないアルゴリズムになっています。)


ということで、Centroidの構造に戻ると、頭から順番に1塩基ずつ見ていったときに、何番目からか「ここから新ステム」と割り当てられる塩基群が出てきて、さらにそこから異なる「ここから新ステム」の割り当てがいくつも連続で並ぶことだって普通にありますけど、その後に出てくる「ここから、ステムを閉じる」という、要は「上流とペアを組む」割り当ての塩基群が出てきたら、それは必ず直近の「ここから新ステム」という割り当てだった塩基群とペアを形成するようになっている、ってことですね。

(遡って、もっと前の「新ステムを形成」という割り当てのやつらとペアを組むことはないということ。
 実際そうなることは現実的にはあるけれど、予測ソフトのコンピューターは、それを計算できない、ってことですね。Centroidの構造予測図をどれだけ丁寧に見ても、遡って直近より前のグループとステムを形成するパターンは、1つもないはずです。

 一方、あまりシュードノットっぽくはなかったですが、マサチューセッツ大掲載の実際の構造では5'末端近傍でいきなりその例外パターンが見られていますし、Wikipediaの図もまさにそうなっている形です。)

…めっちゃ複雑な説明ですが、絵を描いたりするとビックリするぐらい単純なことしかいっていないので、冷静に考えてみるとご理解いただけるのではないかと思います(まぁ、こんなのマジで頑張って理解するほどの話でもないですけどね(笑))。

 

…といった所で、今回は、巨大なRNA分子の構造を見ることで、精度が高くて便利なRNA構造予測ソフトにも限界があることを見つつ、いずれにせよシュードノットなんかもありながら、RNAというのは一本鎖ではあるけれど実際はステムループがいっぱい形成されるように存在しているのだ…ということが改めてご理解いただけたのではないかと思います。

結局またご質問のあった実際のポイントの最後まで辿り着きませんでしたが、rRNAの構造の例だけで大分長くなってしまったので、また続きは次回にまわさせていただくといたしましょう。

にほんブログ村 恋愛ブログ 婚活・結婚活動(本人)へ
にほんブログ村