補足:全員同じ?

ギネス甘物質ソーマチン合成実験の話に行く前に、またちょっと前置きとしていただいていたご質問に触れようと思ったら、思いの外長くなったので、今回はまた補足回といたしましょう。

この辺の話にはモグリの初学者でありながら鋭い着眼点のコメントをいただけることでおなじみ、アンさんにいただいたコメントを、例によって適宜改変引用していく形で順次答えていこうと思います。

ほほぅ…、大事な3塩基(アンチコドン)以外にも大事なものもあるっちゅうことか…

酵母のtRNAに関して、アンチコドンは41種類だったけど、例えばアンチコドンがGGUのtRNAは全て塩基配列は同じなんかえ?

サラっと出てきてたtRNAの修飾も、同じアンチコドンなら(同じタンパク質を運ぶものなら、かなぁ?)76塩基全て同じ修飾?

いいご質問ですねぇ~。

この辺も、触れようと思っていたんですがイマイチ断言はできかねたので触れずじまいでやり過ごしてた感じだったんですけど、一応、全生物の全tRNAをチェックしたわけではないですが、基本的には同じ生物の同じアンチコドンをもつtRNAなら、同じ配列になっているように思います。

もちろん、生物種が違えば、同じアンチコドンのtRNAでも配列は結構変わってきます。

それでも、近い生物(マウスとラットとか)なら近い配列なんじゃないかな(下手したら、完全に同じ場合すらあるかも)、とは思えますね(特にこれも直接比較したわけではないですが)。


…と、せっかくなので、今の時代すぐに確認できるデータベースがあるわけですから、せめて酵母のものぐらい見ておくとしましょうか。

まず、コドンが6種類もあるアミノ酸でおなじみ、Ser(セリン)のtRNAに着目してみると(特に理由はなく、一番バラエティに富むこいつを見てみた感じです。Leu(ロイシン)も6種類ありますが、Leuは6種のコドンが一つながりで存在しているものの、Serはコドン表の完全に離れた位置に存在する、珍しいパターンです)、前回も貼ったアンチコドン表を見てみると、その6種類のtRNA-Serの内、最も多くの遺伝子が存在するのは、tS(AGA)の11個ですね。


前回もお世話になったSGDで「tS(AGA)」と検索してみると、しっかり11個ヒットしてきました(画像は途中で切れているだけで、まだまだ下に続いています)。

f:id:hit-us_con-cats:20211111060654p:plain

https://www.yeastgenome.org/search?q=ts(AGA)より

まぁ11個ぐらいなら全部見て配列を確認すればいいんですけど、もっとスマートに比較してみましょう。

何でもいいですが(多分全部一緒なので)、一番上に来ていたtS(AGA)H(正式名だとYNCH0004Cですね)をクリックし、Sequenceタブから配列をゲットします。

f:id:hit-us_con-cats:20211111060747p:plain

https://www.yeastgenome.org/locus/S000006726/sequenceより

そして、配列の比較といえばコレ、以前見ていましたBLAST

実はSGDにも酵母専用のBLASTがあるのですが、使ってみたら慣れていないからか何か分かりにくかったので(多分使いこなせばちゃんと必要な情報は見れると思いますが)、スタンダードなNCBIのBLASTを使う感じでいきましょう。

f:id:hit-us_con-cats:20211111060810p:plain

https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastnより

配列を最上部の入力ボックスに貼り付けて(例によって、数字・スペース・改行は無視されるので、コピーしたそのままを貼り付けるだけでOKです)、Organismには今見たい酵母S288C株(Saccharomyces cerevisiae S288C (taxid: 559292))を入力し、BLAST実行!

数秒待つと、無事、相同性の高い配列が、全列挙!

f:id:hit-us_con-cats:20211111060909p:plain

BLAST検索結果

…ね?

見事、11個の遺伝子がヒットし、同一性は全部100%……

…って、あるぇ~?!

一番下、よく見たら、「Per. Ident(同一性%)」が、100.00%じゃない!!

どういうことだ!と思いこの項目をクリックしてみると……

f:id:hit-us_con-cats:20211111061007p:plain

一番下の、98.80%の配列をクリック

「Query」が検索した配列で、「Sbjct」がヒットした配列なので、この仲間外れtRNAは、51番目ぐらいに、1塩基だけ、余計なGが挿入されているって感じなんですね!

配列が違うので、こちらは、「tRNA-Ser-AGA-2」という名前で分類されているようです。


しかし、こちらは単にデータベースに登録されているもののようで、詳しい染色体の情報とかがないですねぇ。

もしかして、誰かうっかりさんによるミスで、間違えてデータベースに登録されてしまっただけだったり…??

そこで、遺伝子の詳細情報が掲載されているGenBankを見てみるべく、検索結果に貼られているリンクをクリックしてみると…

f:id:hit-us_con-cats:20211111061141p:plain

https://www.ncbi.nlm.nih.gov/nucleotide/HG985228.1より

どうやら、こちらはUCSC(カリフォルニア大学サンタクルーズ校)の運営する、gtRNAdbというデータベースに登録されている模様…。

こないだは国産のtRNADB-CEを見ていましたが、世の中色々なデータベースがあるんですねぇ。

一応、こちらgtRNAdbは、コンピューターによる予想も含めたtRNAデータベースということで、より広く沢山のデータが集まっている(同時に、あくまでもシミュレーション結果も含んでいるので、実験的に確かめられていないものもあるかも)という感じですが、早速チェックしてみましょう。

トップページから、Links to Most Viewed Genomes(よく見られているゲノム)のSaccharomyces cerevisiae S288c(出芽酵母S288c株)をクリックし、Summaryページに飛んだ所で、「tRNA Gene List(遺伝子リスト)」をクリックすると、酵母のtRNA一覧が出て来ました。

今見たいのはセリンtRNAなので、tRNA-Serと打ち込むと、リアルタイムで1文字打つたびに自動的に絞り込まれていく親切仕様!(インクリメンタルサーチってやつですね)

f:id:hit-us_con-cats:20211111063832p:plain

http://gtrnadb.ucsc.edu/genomes/eukaryota/Scere3/Scere3-gene-list.htmlより

tRNA-Serまで打った状態なので、AGA以外のやつも列挙されていますが、結局、tRNA-Ser-AGA-2は、下から7番目ぐらいにありますけど、4番染色体(Chr IV)に存在するちゃんとした遺伝子のようで、データミスとかではなく、モノホンのtRNA遺伝子だったようです。


クリックして出てくる詳細ページには、詳しい情報とともに二次構造の図(あんまり一般的に描かれるtRNAの形じゃないので違和感がありますが)と…

f:id:hit-us_con-cats:20211111061929p:plain

http://gtrnadb.ucsc.edu/genomes/eukaryota/Scere3/genes/tRNA-Ser-AGA-2-1.htmlより

さらに下の方には、同じtRNA-Ser全遺伝子(アンチコドンが違うやつも含め)の配列比較をしたものまで掲載されており、何気に親切なサイトですね!

f:id:hit-us_con-cats:20211111062311p:plain

同じページの、配列比較

ということで、tRNA-Ser(AGA)は、10個が全く同一の配列(先ほどの検索結果ページが分かりやすいですが、tRNA-Ser-AGA-1-1から1-10まで列挙されていました)で、1個だけ、1塩基多い配列のものもあるという感じでした。

意外にも同じアンチコドンtRNAですら同じ配列ではなかったという結果になりましたが、でもまぁ50番目なんて可変ループみたいな割と重要性の小さそうな領域ですし、恐らくこの1塩基の違いは大したことはないのではないかと思います。
(もちろん調べていないので分かりませんし、実際はセリンの運搬に絶妙な役割をもっている…なんてことがひょっとしたらあるのかもしれませんが。)


それから、ちょうど上の配列比較(細かくて見づらいかもしれませんが)を見ると明らかなように、同じセリン用のtRNAでも、アンチコドンが違うと、全体の配列は結構違うことがご覧いただけるように思います。

(しかし、AGA以外は、アンチコドン1つにつき1種類の配列(=全部完全に同じ配列)しかありませんね。まぁ、TGAが3つ、GCTが2つ、CGAにいたっては1つしか遺伝子が存在しませんから、流石にそれしかなかったら完全一致も当然、って感じでしょうか。)


なお、最初に貼ったBLAST結果は11個ヒットしていましたが、表示結果一番上と一番下のやつはデータベースに登録されている配列がヒットしただけで、これは酵母染色体上に存在する遺伝子配列がヒットしてきたものではなかった、ってことになりますね。

すると、なぜBLASTでは2つ少なかったのか…?

改めてBLAST検索結果を見てみると、4番染色体にはtRNA-Ser(AGA)遺伝子が地味に3つも存在しており、その3つが(検索結果ページでは)1つの項目にまとめられている、というそれだけでした。

検索結果詳細を見てみると……

f:id:hit-us_con-cats:20211111062921p:plain

BLAST検索結果、4番染色体のやつより

ちゃんと、Number of Matchesが3となって、3つが列挙されています。

つまり、BLAST検索では2つ余計なもの(データベースに登録されている、単なる参考情報・リファレンス)がヒットしていたけど、本物の遺伝子2つが同じ染色体上に存在していたため隠されてしまっていただけで、合計11であることには変わりない、って感じですね。

しかも、4番染色体は、何気に例の1塩基多いSer-AGA-2-1が乗ってるやつでしたね。

一番下に、ちゃんと1塩基多い配列比較結果含め、表示されています。
(こちらはデータベースの情報ではないので、ちゃんと、染色体の塩基番号(Sbjct 1305630とか)が表示されていますね。先ほど見ていたやつは、ただの登録情報の参考データなので、Sbjctの方も1番から振られているだけでした。)

 

…ってな所で、何気にご質問はまだいくつかあるのですが、1つ目の話だけで案外べらぼうに長くなってしまいました。
(ぶっちゃけ細かすぎてかなり面白みに欠ける話になってしまった気もします。)

とりあえず触れておきたいご質問はまだ残っているので、tRNAに関する補足回を、また次回も続けていこうと思います。

にほんブログ村 恋愛ブログ 婚活・結婚活動(本人)へ
にほんブログ村