ペアの向きについての補足

プラスミドやらオペロンやらについていただいていたご質問が途中でしたが、前回のプラスミドマップの見方についての話で、改めてご質問をちょうだいしておりました。

これ、明らかに説明不足だった点なので、今回もう少し丁寧に補足させていただくとしましょう。

ご質問としては、前回の記事で書いていたDNA文字列の向きに関するこの部分…

『別に向きに決まりはなく、たまたま開発元のNovagenが、その向きにオリジナルマップを表示したからそうなっているだけで、逆向きに図示すれば、当然アンピシリン遺伝子は表示されるDNAの向きと同じ向きに存在する遺伝子になります』

なんですけど、これについて、「え?逆向きに表示したら同じ向きに……なる?え??ならなくない??」というポイントでした。

こ~れねぇ、マ~ジで最初に習ったときほぼ確定で躓く(まぁつまずくとまではいかなくても、こんがらがる)ポイントなので、もうちょい丁寧に見ておいて然るべき点だったというか、さっきも書いた通り、実際明らかに説明が足りなかった所があるので、改めて触れてみようと思います。


まず、「これに触れておく必要があった」というポイントですが、ズバリ…

DNAは、必ず、5'→3'の方向で記述する

ようになっていることが最重要点といえましょう。

(…って、まぁ別に「絶対にそうしなければいけない」というルールってわけではなく、書きたきゃ別に3'→5'の方向で書いてもいいんですが、そうする意味が1ミリもないから、普通はしない、って話ですね。
 なぜなら、結局遺伝子の読まれる向きは、絶対に5'→3'になっているからです。(その理由は、RNAポリメラーゼがDNA→RNAと変換する際に、そっち向きに合成するからともいえるし、RNA→タンパク質の変換も、その方向で行われるように合成マシーンができているから…という、いわば「現実の遺伝子発現がそういう形になっているから」という話に尽きるといえますね。)
 だから、逆向きに書いてしまうと、コドン(3塩基ペアで、タンパク質を指定)を逆から読まないといけなくて紛らわしいだけなので、その向き(3'→5'方向)で書き下す意味がないといえるわけです。

 もちろん、DNAは通常二本鎖で存在するので、どちらかは逆向きの方向を考えなければいけないのですが、少なくとも文字列として書き下す側の鎖は、必ず5'→3'方向にする(何も但し書きがなければ、そうみなす)、その方が考えやすいから……ってことですね。)


やはり言葉だけでは分かりづらい話なので、実例を交えて見てみましょう。

あんまり長くても考えにくいだけですし、分かりやすくわずか9塩基から成る遺伝子(開始ATGCCC・停止TAAで、メチオニン-プロリン-(ストップ)の2アミノ酸)を例に、この二本鎖を考えてみるとします。

pET-15bのマップとアンピシリンの例で、こいつらの関係は「アンピシリン遺伝子は、マップ表記と逆向きに存在」という形だったので、それになぞらえると、この9塩基対のDNAは、ちょうどこういう二本鎖を形成しているということですね。

5'-TTAGGGCAT-3'
3'-AATCCCGTA-5'

(ただの文字列なので環境によっては見辛いかもしれませんが、上と下の鎖がペアを形成して二本鎖状態になっている形です。改めて、二本鎖ペアは、A⇔T、C⇔Gで組まれます。)


まぁこのぐらいなら二本鎖両方を表示するのも余裕ですが、5000塩基とか超えると、二本鎖両方を表記する余裕も中々ないわけです(まぁ、Snapgeneのプラスミドマップでは、丁寧に全長二本鎖で表示されてますけどね)。

なので、一本鎖で書く場合(=マップとしてDNA文字列を表記する場合)は、こうなる感じですね。

1: TTAGGGCAT :9
(改めて、こんな短いのだと「別に両方表示した方が分かりやすいじゃん」って気もするものの、何千何万のDNAを表示したいような場合、両方の鎖を表示するのは現実的じゃないんですね。一方を表示すれば逆鎖は確定するので、表示する意味がないともいえますし。)

このように、この9塩基DNAのマップ上での文字列の表示はTTAGGGCATとなるわけですが、でも実際の遺伝子が読まれる向きはATGCCCTAAと、いわば「(表示されていない)相棒の鎖を、右から左読み」になっているため、マップの表示順と実際の遺伝子の読み向きが逆になっている……というのが、元ネタのpET-15bプラスミドとアンピシリン遺伝子の関係でした。


そしてここで、「マップの読み順を逆向きに変えると、どうなるか?」についてがご質問の本題ですが、これが、最初はこんがらがってしまいがちなポイントってことですね。

もしこの遺伝子のマップ表示を逆向きにする場合、改めて、必ず5'→3'方向に記述する決まりなので、マップに表示される文字列も(最初の二本鎖表記でいう)下の鎖を読む形になって、こう表示されるわけです。

1: ATGCCCTAA :9

こうすると、マップの向きと、遺伝子の実際の読み向きが無事一致するようになる、って感じですね。

めちゃんこややこしいですが、「逆向きに読む」といっても、TACGGGATT(=最初にマップ上で表記されていたものを、シンプルに逆から読んだもの、つまり、3'-5'表記)ということではなく、その辺説明不足&書き方が悪かったのでごっちゃになってしまったのが混乱の原因だと思われますが、逆向きの相棒鎖を読まなければいけなかった、ということ、つまり「DNAは、特別な断りがない限り、必ず5'→3'方向で記述する」(そして同じく重要なのは、「二本鎖は、必ずお互い逆向きでペアになっている」って点も忘れてはいけないポイントです)…これがやっぱり全てですね。


…せっかくなので、短い例や(アルファベット文字を入れたとはいえ)文章だけではやはり分かりづらいので、実際のプラスミドマップでも解説を試みてみるとしましょうか。

結局、二本鎖が表記されているSnapgeneで見るのが確実に一番分かりやすいので、Snapgeneの力を借りて、図を見ていきましょう。

後ほど「逆に読む」の実例を示したいので、今回はWebサイトで公開されているのではなく、手持ちのSnapgeneソフトウェアでpET-15bファイルを開いてみました。

(pET-15bのファイルは、もちろん5708塩基の文字列さえあればそれで十分なんですけど、Snapgeneでは、「Snapgeneで開くと各種ラベル(アンピシリン遺伝子の場所とか、前回Webサイト版で見ていた諸々全て)がちゃんと表示されるファイル」を用意してくれているので、それをダウンロードして開けば、ラベル付きの美しく便利な図が即座に得られるわけですね。pET-15b.dnaというファイルで、ダウンロード可能です。)

f:id:hit-us_con-cats:20211019061948p:plain

Snapgeneアプリで開いたpET-15b.dnaファイル(以下全て同様)

Web版ではできませんでしたが、Snapgeneソフトから開いたら、当然、マップ上の遺伝子をクリックすれば、自動で、シークエンス文字列の該当の場所に移動&ハイライトされる形です(画像はAmpRのラベルをクリックした状態)。便利!


まぁそれはともかく、リング状のマップでは、一番上を1番として、時計回りに文字列を読む形になっています。

そして、アンピシリン耐性遺伝子(AmpR)が、リングのかなり終わりの方(時計でいうと11時ぐらい)にあって、しかも反時計回り向きで存在しているというのも、前回見ていた通りですね。

文字列の部分だけを拡大表示してみましょう。

f:id:hit-us_con-cats:20211019062231p:plain

遺伝子などのラベルにマウスカーソルを置くと説明チップが出るのも、Web版と同じですね。

(…って、そういえばSnapgeneは日本語設定もできたなぁと思って言語を日本語に変えて開いてみたら…!

f:id:hit-us_con-cats:20211019062315p:plain

amino acidsが「アミノ酸」、segmentsが「セグメント」になるだけで、説明文とかは英語のまんま、これはショボ~(笑)
 一応メニューは日本語化されてますが、まぁ、遺伝子の説明文はファイルに付属されてる形でしょうし、これの自動翻訳は流石に無理ってことですね。)


…と、そんなオマケ機能もともかく、これこのように、AmpRは4640番から5500番にかけて、(この表示形式では)逆向きに存在している遺伝子ですが、図でいうと、このお尻の5500番目から、「下側の鎖を」「右から左に読むと」開始コドンのATG(M・メチオニン)に始まり、AGTでS・セリン、ATTでI・イソロイシン……とアミノ酸が次々とつながっていき、アンピシリン耐性遺伝子ことβ-ラクタマーゼが合成される…という形になっているわけです。

ポイントは、このpET-15bの配列を表記した場合、大抵上側の1本鎖だけを表示することになりますが、左から右に読んでいく文字列では、AmpR遺伝子だと実際とは逆の鎖が表示される状態になっている、って話なわけですね。
(ただ、くどすぎるけど、それはあくまで表記上の話であり、「たまたまこの向きで表示したから、そうなってるだけ」という話でしかないわけです。)


ちなみにちょっと脱線すると、先ほどの図ではpET-15bの一番最後、5708番目の塩基まで表示されていますが、面白いことに、ちょうど最後の最後が代表的な制限酵素であるEcoRIの切断部位と示されていますね。

EcoRIの切断認識部位はGAATTCですが、pET-15bはGAAで終わっています。

そこで、先頭の1番塩基に戻ってみると……

f:id:hit-us_con-cats:20211019062349p:plain

pET-15bはTTCから始まり、便宜上ここを1番にしていますが、このDNAは環状なので、先ほどの5708番のGAAと1番のTTCは現実ではつながっていますから、当然、ここはEcoRIで切断される形なわけです。


さて、これを踏まえてようやく、前回述べていた「このpET-15bプラスミドマップを、逆向きに表示するとどうなるか?」を、実例でお示しいたしましょう。

高機能のSnapgeneでは当然簡単にそれが可能になっており、まず、DNAの全長を選択して、コピーします。

これを貼り付けようとすると、貼り付けダイアログが出てくるので……

f:id:hit-us_con-cats:20211019062434p:plain

この際に「Reverse complement」にチェックマークを入れると、逆向きで、かつ相棒の鎖(先ほどまでの下の鎖)を表示する形の図が爆誕するんですね!

(Transfer features, primers and DNA colorsにチェックを入れると、各種遺伝子のラベルなどもちゃんと維持されます。)

f:id:hit-us_con-cats:20211019062518p:plain

見事、1番塩基がTTCTTG…で始まり(=変換前の、下の鎖の一番お尻からの並び)、AmpR遺伝子が全体文字列と同じ右読み(左から右へ、自然な向き)で読めるという、アンピシリンファン感涙の(そんなファンいるかよ(笑))、「我々アンピシリン耐性遺伝子が、ついに、開始ATGからAGTATT…と、見やすい向きで実際のコドンが表示されるようになったぞー!!」という状況になるってことですね。

なお、この逆向き表記のお尻の方を見ておくと…

f:id:hit-us_con-cats:20211019062623p:plain

元々最初の方にあった、ソーマチン遺伝子を導入するMCS(マルチ・クローニング・サイト、制限酵素部位が複数あって、今回の例ではNdeI-BamHIを使うという話でした)なんかが、逆向きになった結果、かなりお尻の方に来ているという感じになってますね!

また、EcoRIが最初と最後をまたいで存在しているのも、当然変わりません。

面白いポイントとしては、制限酵素認識部位は回文配列(どっちの鎖も、5'-GAATTC-3'になっている)なので、逆向きで表示しても、pET-15bは結局必ずGAAで終わり、TTCで始まるという感じになってるんですね(死ぬほどややこしいけど、冷静に考えるとなぜか分かると思います)。


まぁぶっちゃけいうと、二本鎖が表示されているこの図だと、逆向きにしたというより、180°回転したというのが一番スマートな考え方ともいえるかもしれません。

なお、関連して、やっぱり「逆向き」という書き方が良くなかったと改めて思ったんですけど、先ほど貼り付け画面であったように、相棒鎖の方が右読みになるように表示することを、英語でReverse complementと読んでおり、日本語だと「逆向き・相補鎖」と呼ばれますが、これがDNAの向きを考える上では最大のキーワードかもしれませんね。

改めて、ポイントは、必ず5'→3'向きになるように表記するって点で、これさえ抑えておけば、まぁそれでも最初はかなりややこしく、実際に自分が実験する際に色々考えるときは「う~ん…?」と迷ったりもするのですが、先ほども書いた通り、こまごまとパッと見で悩むことはあっても、冷静に考えれば必ず理解できる形になっているのではないかと思います。


そして最後に改めて補足として、「マップで示す際にどっち向きの表記を採用するか?」は完全にマップ作者の意図次第で、そもそもDNAに絶対的な向きなど存在しないので(もちろん5'→3'という一本の鎖の方向はあるけれど、二本鎖の場合、お互いが逆向きにペアを組んでいるんだから、リングならどこが/直線状ならどっちが始まりとは言い切れない)、自分で考える際は好きな向きで考えると良いでしょう、って話に尽きる感じですね。

(一応、あえていうならば、プラスミドの複製はoriを起点に始まるので、oriの合成が始まる点を1番、そして5'→3'向きに合成が進む方を時計回りにするのが、客観的に「ここ」とすることができそうな分かりやすい基準かな、とも思えますが、しかし現実的にpET-15bのマップ作者はoriはかなり後半に、しかも複製の向きは反時計回りで配置されている感じで、全くoriなんて意識しない描き方をしていました。一見良さそうに思えましたが、全然どうでもいい基準かもしれませんね。)

というかむしろ、公式マップの方向では、一番重要なT7プロモーター(=導入する遺伝子用のスイッチですね)の向きが反時計回りに配置されていて分かりづらい(導入する遺伝子を、逆向きで考えなくてはいけない)ので、何でこんな向きを公式にしたんやろ、と思えるのが正直な所ですが、まぁ別に必要な部分を拡大して考えるときは向きを変えればいいだけなので、大した点でもないかもしれないですね。

とにかく、説明を受けて、一通り理解できてもなおややこしいのがこの二本鎖DNAの向きなどの話なのですが、以上の説明で、じっくり考えればご理解いただける形になっている&慣れればまあまあそんなにややこしくなくなるのがこの辺の内容かな、と思います。


…と、書き終わった後読み直して、もう1点だけ触れておこうかな、と思った点を補足しておくと、例えば「アンピシリン遺伝子は逆向きで存在する」といっても、これはあくまでたまたま表記上そうなってるだけで、当たり前だけどこれだって必ず5'→3'の向きで遺伝子が入っている、ってことが、絶対に忘れてはいけない重要ポイントとして(似たようなことはもう書いていたので、ややしつこい感じですが)挙げておきたい感じでね。
(一見、逆向き矢印で入ってる遺伝子は、(特にDNAが一本鎖表記されていた場合)「3'→5'って向きで読まれる遺伝子なのかな?」とか思いがちなんですが、これはそうではなく、絶対に、マップ上で表示されていない相棒の鎖を逆向きに読む(あくまでも、遺伝子が読まれる向きは5'→3'には違いない)という形になっている、ってことです。)

改めて、紙に書く場合はどうしても固定して表示しなきゃいけないけど、現実のリングには向きなんて存在せず、ある向きから見たら反時計回りに存在してたとしても、それは裏から見たら時計回りになってるといえるでしょ、という、それだけの話だってことですね。
(画面上での表示の限界のせいでクッソややこしくなっているけれど、冷静に考えたら、DNAの逆向き相補鎖が組み合わさって二本鎖になっているという仕組み含め、意外と結構めっちゃよくできているなぁ、と思える話と思えるのではないか…って気がします。)


割と長くなりましたが、次回は延びに延びている、ご質問Q2の続きへと参りましょう。

にほんブログ村 恋愛ブログ 婚活・結婚活動(本人)へ
にほんブログ村