補足の補足：これでDNAもバッチリ？！ - ひたすら自己紹介を続けて、いいお相手に巡り会えるのを待つブログ

前回はプラスミドDNAマップの向きや考え方について講釈を垂れていましたが、やはりこの辺はマジで複雑怪奇で初学者泣かせな部分であり、改めて毎回温かいコメントをいただけるアンさんから、「前回の質問で勘違いしていたポイントは理解できたと思っちょるんやが…新たな謎が、、っていうか、ただのモヤモヤなんやけんど、これまた上手く疑問を伝えるのがなかなか難しいぜよ。。」という感じで、追い質問をいただきました。

いやぁ～、これは本っ当にありがたいというか、うれしい限りですね！

スッキリしないのに、もう面倒くせぇや、とか、何かもう悪いし…とかでいきなり打ち切りになってしまうのが一番ガッカリですし、こんな勝手にペラペラ語ってるだけのネタにガッツリお付き合いいただけて、恐悦至極にございます。

…ということで、いただいたポイントを、例によって適宜改変しつつ引用させていただきましょう。

追いQ. 例えば、前回の9塩基の例でいえば…

5'-TTAGGGCAT-3'
3'-AATCCCGTA-5'

…これ。左から読んだもの(TTAGGGCAT)と、右から読んだもの(ATGCCCTAA)は、別のものじゃろ？

例えばこれが何か意味のある遺伝子だった場合、明らかに配列の違うものなのに、どちらも同じ遺伝子のことだとは思えないんじゃが…。

並び方に関してもそうけんど、例えばpET-15bのプラスミドマップ(丸っこいやつ)を時計回りに読むとするじゃろ？

まず、素人が普通に考えたら、12時のところがスタート地点、これはいいとして…

始まりの場所から、まぁ、何を表しているのかは全くわからんのじゃが(最初の方は制限酵素やか？)、順番に…

BspDI-ClaI
HindⅢ
BlpI
BamHI
↓↓（などなど）
T7 promoter
↓↓（などなど）
lacI promoter
lacI (この紫色の矢印の間にもApaIやらHpaIやらがあるけんど、これは前に出てきちょった、この制限酵素で切ったら遺伝子が切れちゃってダメなパターンのやつかな？？)
↓↓（などなど）
ori
↓↓（などなど）
AmpR
AmpR promoter

…って感じになっちょって、それを全部読んだものが、

①TTCTCATGTTTGACA→→(ひたすら続く)→→CGTCTTCAAGAA(合計5708塩基)

…なんじゃろ？

それを、“どっちから読んでもいい”感覚で逆から読むと、

②TTCTTGAAGACG→→(ひたすら続く)→→TGTCAAACATGAGAA(合計5708塩基)

となるわけやよね？

まず、①と②では配列が違うんだからそれが意味するものも違うように思えるんじゃが、如何か？（まぁこれは前出の疑問と同じやが…）

そして、配列が違うのみならず、oriやlacIなんかの出てくる順番も違うじゃろ？？

配列も違えば順番も違う……こんなもん、別物と考えねばアカンぜよ、としか思えんわけじゃが……ご意見教えてたもれ。

これ、矢印が元々逆だから、、っていうか、意味のあるものには矢印がついてる感じなんやか？？oriも元から逆じゃけど、時計回りに読んだときに、そこだけ相棒の鎖を逆から読むのでえぇのんか？

むむーん、実にわからん、わからんぜよ！！

A. なるほどぉ～、もう一歩、勘違いポイントがスッキリすれば、一気に解決へとつながりそうな感じですね！

順番に参りましょう。

最重要ポイントとしては、改めて、「こいつらは各ヌクレオチドが相棒としっかり手をつないだ、二本鎖で一分子になっている」ってことがまず挙げられるように思います。

紙に書くと若干認識しづらい点かもしれませんが、こいつらは、現実的に「2つの鎖が手をつないで、1つの塊として存在している物体」であることを意識してみましょう。

もうちょい分かりやすい絵にしてみると、9塩基対の二本鎖DNAは、こんな感じで存在しているといえるわけですね。

f:id:hit-us_con-cats:20211020062027p:plain — 簡単な9塩基対二本鎖DNAの模式図

「5'」とか「3'」とかはまぁ実際の物質にそんな表記があるわけではないし邪魔なので省略しましたが、反対側の鎖は文字列の方向を変えたので、「読める向きに並んでる文字が、5'→3'方向になっている」と認識してください。

分かりやすく鎖の色も変えましたが、黒い鎖は5'-TTAGGGCAT-3'、赤い鎖は5'-ATGCCCTAA-3'というわけですね。

そして、この二本の鎖は手をつなぎあって、最早「1つの塊」として存在している物質（分子）だということです。

まさに、こういう形のキーホルダー（物理的に離れてる部分があるのでイメージしづらいかもしれませんが、透明なプラスチックで固定されてるみたいな感じ？）が今目の前に物体として手元に存在しているとでも考えていただければと思います。

ダサすぎてこんなキーホルダー死んでも使いたくないですが(笑)、それはともかく、このキーホルダーは、180°くるりと回せば、（赤い鎖が上に来て）ATGCCCTAAと読める感じになりますね。

f:id:hit-us_con-cats:20211020062251p:plain — 回転すると、上に来る文字列が変わる！

結局、その違いでしかないわけです。

前回も書いた通り、このぐらいなら両方書くのも簡単ですけど、5000塩基とか、ヒトの染色体は億を超える長さを誇り、そういうのを二本鎖両方表記するのは現実的ではないので、「そのDNAの配列情報」として、紙の上や画面上ではどちらか一方の鎖のみを表示しなければいけない場面は多いんですね。

そのとき、TTAGGGCATと表記する場合もあるし、ATGCCCTAAと表記する場合もある……というだけで、いずれにせよこれらは全く同じ、これら2つの鎖が二本鎖としてくっついて存在する1つの物質なわけです。

だから、最初のご質問、「左から読んだもの(TTAGGGCAT)と、右から読んだもの(ATGCCCTAA)は、別のものでしょ？」ってのは、実は、「紙に書き記した表示の仕方が違うだけで、全く同じものです」という形になるんですね。

また、もう一つ大切なポイントとして、これを（黒い鎖を右から読んで）TACGGGATTと書くことは決してない、って点もありますね。

もちろん、このキーホルダーを裏から見たら、一見そう並んでいるようにも見えるわけですが……

f:id:hit-us_con-cats:20211020062336p:plain — 透明なキーホルダーを裏返したら…

TACGGGATTという並びだと、読める向きの文字になっていません！
（AとTは運悪くほぼ左右対称の文字なので正直区別がつきませんが、幸いCとGは裏返ってることが分かりますね。AとTでも違いが分かるように、小文字で表記した方が良かったかもしれません。）

なので、この二本鎖DNA（＝元々見ていたキーホルダー、TTAGGGCATやATGCCCTAAと読めるやつ）は、TACGGGATTや、AATCCCGTA（赤い鎖の逆向き読み）というDNAとは、完全に異なるもの（全く別のDNA分子）といえるんですね。

（逆にいうと、どんなに回しても裏返しても、これがTTAGGGCATあるいはATGCCCTAAと読める二本鎖DNAであるという事実は一切揺るぎません。）

単純に逆読みしたDNAはこう（↓画像右側）なりますが…

f:id:hit-us_con-cats:20211020062438p:plain — ふたりは別人！

この2つはマジであまりにも似ているし、「本当にそんな区別つくのぉ？」と思うのももっともなんですけど、細胞の中で、生体分子（RNAポリメラーゼとか）は、確実に、5000兆回このDNAを読んでも、100％絶対にこの2つを間違えて読んでしまうことは一度たりともないことでしょう。
（つまり、間違えて3'→5'方向にDNAを読んでしまうことは絶対にない、ということ。）

それぐらいに、生体分子・生体反応的には、この2つは完っっ璧に全くの別物だということですね。

（実際、この2つのキーホルダーを手にもって回すなり動かすなりしても、どう頑張っても重なり合わないですよね。）

逆に、（元々の並びの方のキーホルダーを頭に浮かべていただくと、）こいつはくるりと回したり裏返したりで色々な方向から見ることができますけど…

f:id:hit-us_con-cats:20211020062711p:plain — 全部全く同じキーホルダー（DNA）！！

…どうあっても、物質としては全く同じ9塩基対（二本鎖DNAは、「塩基対」と書くのが正確ですね）の二本鎖DNAであるわけです。
（上の6つのキーホルダーは、パッと見違っても、全く同じ商品ってことですね。）

ということで、最初の疑問ポイント＝「明らかに配列の違うものなのに、どちらも同じ遺伝子のことだとは思えない」は、「そもそも配列が違うものなのではなく、2つは全く同じものである（紙や画面で情報として表示するときは、やむなくどちらか一方を代表して載せているだけ）」ってのが解決アンサーですね。

続いて順に疑問ポイントを進めていきましょう。

まず小ネタをつぶしていくと、「謎のアルファベット」は、全て制限酵素で間違いありません。

例えば最初のBspDI-ClaIは（これは酵素に別名があるだけで、どっちも同じ。個人的にはClaI（クラワン）呼びの方がなじみがあります）、23-28番目のDNAがATCGATと並んでおり、この6文字はClaIで切れる（24番目のTの後ろで切れる）、ってことですね。

f:id:hit-us_con-cats:20211020062808p:plain — https://www.addgene.org/browse/sequence_vdb/2543/より

lacIの中にも制限酵素はありますが（ApaIやHpaI）、これも単に、lacI遺伝子の中にたまたまApaI認識配列（GGGCCC）やHpaI認識配列（GTTAAC）が存在した、というだけですね。

当然これらの制限酵素を使うとこの場所でプラスミドがスパッと切れちゃうのでこいつらは使えませんけど、そもそも入れたい遺伝子を挿入する場所＝MCSにこの制限酵素を使える部位は存在しませんから、使う意味も一切ないので別にどうでもいい点といえましょう。
（ほぼ間違いなく必要ないけど、Snapgeneなどのプラスミドマップ作成ソフトは、プラスミド内で一箇所だけ切れる制限酵素部位を一覧で示してくれている、というだけですね。）

で、ご質問本題の「 ①TTCTCATGTTTGACA……CGTCTTCAAGAA(合計5708塩基)と②TTCTTGAAGACG……TGTCAAACATGAGAA(合計5708塩基)は、配列が違うんだから別物だろ？」というのは、これはまさに上で見たとおり、表記上どちらの鎖を代表して示しているかが違うだけで、どちらも二本鎖DNAで、全く同じもの（というか、①と②が、逆向きにペアを組んで二本鎖を形成）、ってことですね。

改めておさらいですが、②をひっくり返して①の下に並べれば、全ての塩基がペア（A⇔T、C⇔G）を組んでいる形になっているのが確認できると思います。
（ちなみに、「ひっくり返して並べる」という操作、これはつまり、両方とも5'→3'向きで表記されている文字列であることをハッキリと示しています。DNAは、必ず逆向きに並ぶ形でペアを組んでいるからですね！）

残る疑問点の解決につながりそうなポイントとしては、

「二本鎖ではあるけれど、遺伝子として読まれる（タンパク質の配列レシピとして使われる）のは、どちらか一本の鎖である」

「各遺伝子やラベルされた要素は、完全に独立した塊(かたまり)であって、他の要素との関係性はほぼない」

…といった点が挙げられるでしょうか。

いただいたご質問は、「じゃあ二本鎖DNAでどちらにも読めるものとして存在してるのに、なぜマップでは向きのある矢印が描かれているの？」という疑問に帰着すると思うんですけど、これは結局、「遺伝子としての情報、つまりタンパク質のレシピ（アミノ酸＝コドンの並び）は、どちらか一方の鎖しか使われないから」というポイントに帰着する感じですね。

「は？じゃあ何のために二本鎖なの？」って思うかもしれませんが、まぁそれは究極的には「知らん。DNAに聞いてくれ」って話になりますけど、まぁDNAは二本鎖であるから構造として安定しているし、情報の保管庫として優れている（一方がちょっとダメージを受けて壊れても、他方の鎖を元に修復可能）、ってメリットがあるので、その意味で二本鎖である意味は十分あるのです……って話になる感じでしょうか。

とりあえず、遺伝情報の保管庫としては二本鎖だけど、実際にタンパク質を作る上で必要なのはどちらか一方、つまり使われなかった逆向きの方はぶっちゃけ何の意味もないものになってる、ということを理解すると、モヤモヤが晴れて幾分視界がスッキリするかもしれませんね。

「なぜどちらか一方なのか？」については、DNA→RNA→タンパク質という流れの第一ステップ＝既に見ていた「プロモーター部位から、RNAポリメラーゼが、DNAをRNAに変換する」というステップが、どちらか一方の鎖のみを採用することで反応が進んでいくから、という話に尽きるでしょう。

まさにこのステップで、二本鎖分あった情報が一本に厳選されるってことですね。

その先のRNA→タンパク質のステップは、例によってまだ見ていないので、そこまで見てからの方が理解が進むかもしれませんが（といっても、そのステップはあまりにも複雑すぎるので、ごく簡単に超単純化して適当に終わらせるかもしれない話ではありますが…）、改めてとりあえず、「情報として意味があるのは基本的にどちらか一方」ということを受け入れるのが肝心かと思われます。

一方、遺伝子のプラスミド内での位置や方向は、これも、まさにどうでもいいことになります。

「lacIは時計回りなのに、oriやAmpRは反時計回り…何でや？」と思われるかもしれないんですが、それぞれの要素は独立して機能するので、どっち向きか＆プラスミド内のどこに位置するかなんてのは一切関係ありません。

具体的には、遺伝子のスイッチであるプロモーターと、タンパク質レシピである停止コドンまでが含まれてればまぁOKなので、そこからそこまでが含まれる限り、プラスミドのどこに配置しようと、どっち向きに入れようと、全くもって一切問題になりません、ってことですね。

そしてそのプロモーターというのが改めて、遺伝子のスイッチとして働いている…のみならず、「この塩基から、下流へ向かって、RNAへの変換スタート！」ということも決めていますから、こいつによって遺伝子の向き（どちらの鎖が読まれるか）が決まっている、ってことになるわけです。

要は、プロモーターの向きが全てを決めているといっても過言ではなく、「プロモーターとアミノ酸配列レシピ（＝開始コドンから始まる、コドンの並び。そういえばこれをORFと呼ぶというのは既に触れていましたね）」のワンセットが1つの単位として存在しているってことですね。
（結局、マップ上の矢印は、このユニットを表しているわけです。…って、プロモーターとORFは別の矢印で表されることの方が多いかもしれませんが。）

例えばlacI遺伝子（プロモーターから、ORFの終わりまで）をまるっと制限酵素で切ってやれば（マップを見てもあんまりいい酵素がありませんでしたが、例えばまぁ、始まりも終わりもかなりゆとりをもってBglIIとEagIでも使えば、lacI遺伝子に必要な領域全体を確実にゲットできますね（先ほどのAddgeneの図参照）。）、これはもうこの塊自体が「lacIを作るDNA断片」として機能するので、こいつはどんなプラスミドのどんな位置に入れても、普通に大腸菌が細胞内でlacIを作ってくれるようになるのです（大腸菌のRNAポリメラーゼがプロモーターに結合して、その方向にlacI遺伝子のRNAを合成し、最終的にタンパク質が作られる…その辺の流れはまた追っていずれ見ていく予定）、というのが解決アンサー第2弾といえましょう。

（まぁ、oriは遺伝子ではなく複製起点なので、遺伝子とはちょっと違うんですけどね。とりあえずその辺の違いは今はどうでもいいでしょう。）

…ってな感じで、今回の話をまとめるとこんな感じでしょうか。

DNAは二本鎖で存在。情報として配列を表記するときはどちらか一方を代表して書くことが多いけど、それはそう書いているだけで（DNAの性質上、一方を書けば他方の配列も確定するので、実際両方を書き下す必要はない）、実物はどっちの向きの鎖も含んでいる、二本鎖だということ。
でも遺伝子として必要なのは、その内の一本だけで、「二本の内どっちが選ばれるのか？」は、遺伝子のスイッチであるプロモーターが決めている（プロモーター次第）、という感じ。
プラスミドはあくまで遺伝子を乗せている乗り物みたいなもんに過ぎないので、プラスミド内での遺伝子の位置関係や、向きは全くどうでもいい。各遺伝子やoriなんかはあくまで独立した、そこだけで完結しているエレメントであって、必要な領域を丸ごと取り出せば、プラスミドの中のどこにどっちの向きで入れても全然問題ないということ。

…って感じで、全ての疑問がクリアに雲散霧消した…とまでは思えませんけど、大分スッキリとご納得いただける点が増えたのではないかと思います。

疑問点がありましたら、まだまだどなたでもどしどし送っていただけることを楽しみにお待ちしております。

にほんブログ村