前回、ヒトとマウスの遺伝子比較を、tRNAデータベースを用いることで唐突にやらせてもろうていました。
万物の霊長たる人間様がネズミごときと同じ遺伝子なわけがない、マウカス・ネズゴミごときがよぉ……などと罵ることで自らの優位性を保とうと躍起になっていましたが、結果はまさかの、見てみたあらゆるtRNA分子で、ホモサピ(ヒト)とマスマス(マウス)は少なくとも1つ完全に同一のものをシェアしているという体たらく!
ヒトの特別性を確かめて溜飲を下げるどころか、「人間はマウスと同等。愚かで欲深いだけの肉塊」という、人類全体に対するヘイトスピーチのようなものを投げかけたも同然になってしまい、これは由々しき事態です(いやそこまでの話かよ(笑))。
しかし、20種のアミノ酸を運ぶtRNAは、まだちょっと残っているのでした。
まぁ、妙に中途半端な所でいきなり「to be continued...」となったことからも推察できる通り、割とネタになるものが待っていたわけですけど、早速見てみましょう。
tRNA-Trpまで見終えていたので、お次はTyr(チロシン;アメリカ英語読みだとタイロシン)!
こちらも、9種類ほどの同一アンチコドンtRNA分子(トップに位置するtRNA-Tyr-ATAは1種類のみですが、まぁより種類の多いGTAに着目するとしましょう)あるようですが…
早速、前回同様、9種の中で一番上にあるヒトtRNA-Tyr-GTA-1の配列を使って、マウスの全遺伝子DNA(ゲノム)に対してBLASTサーチを行ってみましょう。
結果はこうじゃ!
あぁーっと!
過去例を見ない、驚きの同一性%の低さ、一番高いのでも91.21%!!
(というか今更ですが、検索結果が大量に引っかかってくるのは、参照しているデータがいくつもあるためで、例えば特定の遺伝子をノックアウトしたマウスのゲノムがどこかに登録されていたら、それも同じ「マウスの遺伝子」としてヒットしてくるという感じですね。
もちろん、そもそもこのtRNAデータベースに辿り着いたきっかけとなったように、ゲノム情報のみならず、データベースに個別登録されている配列もヒットする形になっています(長さが極端に短いものは、染色体上の遺伝子情報ではなく、個別に登録されているデータベース情報といえましょう)。
まぁ何かややこしいですが、基本的には相同性が同じなら同じものを意味していますし、あんまり気にしなくても良い点かと思われます。
ちなみによく引っ張ってくる「TPA」で始まるものはThird Party Annotation(「第三者により関連付けられた情報」的な意味)で、まさに第三者がまとめたデータベース登録配列(今回見ているGtRNAdbに登録されているのとか)なんかがこれですが、今は別にその遺伝子が染色体のどこにあるものなのかとかはどうでもよく、配列情報だけが得られれば十分(かつ、データベース情報の場合、遺伝子名も表示されているので便利)ですから、これを見るのが分かりやすくていいですね。
…改めて、細かすぎてどうでもいい点なので気にする必要皆無です。)
…注釈が長くなりましたが、一番上の、TPA: Mus musculus tRNA-Tyr-GTA-1-4 geneをクリックして詳細を見てみましょう。
おぉ~っと、8塩基も違う、これは結構大きくちゃいまんがな!
…と思ったけれど、違う部分が一箇所に固まりすぎてるし、これは妙だな……。
改めて最初に貼ったアラインメントの一覧をよく見てみると、あぁっーー!!
先ほどマウスと違った部分、そしてそれどころか、同じヒトtRNA-Tyr-GTAの中でも、他と違う部分は、小文字になっている部分だった…!
この小文字の集団は、実は、「転写で合成された後、RNA分子が編集されて削り取られる部分」なのです!
…と、いうことは…?
これは不要な部分であり、実際働くときには、切り取られていなくなっているから、これはノーカン!!
悔しいけど仕方ありません、一見配列が違っても、「最終形態は実は同じでした」なんてなったら、「イェ~イ、やっぱりヒトとネズミは違うんだぜぇ~い!」とかドンチャンお祭り騒ぎしている折、ネズ公さん達から影で「ププッ、本当は共チュー(共通)なのに、バカ丸出しでチュー」とか笑われてしまうのがオチですから、そんな屈辱もないでしょう。
正々堂々、「実際に使っている分子が、人とマウスでは違う(ものもある)んです」と言ってのけてこそってもんです(何が?)。
一応マウスゲノムのtRNAアラインデータの方もチェックしてみると、やはり、こいつらのtRNA-Tyrにも、同じ場所に小文字クラスターが存在するようで、配列は違うものの、「大きく切り取られる部分が存在する」って点は共通…
…むーん、結局これ、この部分を無視したら、やっぱり同じなんちゃいます…?って気もするものの、ここはやはりきちんと比べるまでは分かりませんね。
…と、このように既に手持ちに複数の配列があって、それらを比較したい場合はどうすればいいのでしょうか…?
もちろんこの程度の数なら目で比べればいいんですけど、配列が長かったり、数が多すぎる場合、人の目に頼っていてはミスもあるし賢くありません。
そこで、手持ちの複数の配列を比較するために、これまた素晴らしいバイオインフォマティクスツールが偉い人の手によって開発され、誰でも無料で利用できるようになっていますから、これを使わない手はないでしょう。
それこそが、記事タイトルにもした、CLUSTALW(クラスタル・ダブル)!
こちらはまぁ単に配列のアラインメントを行ってくれるもので、例のtRNAデータベースで並んでいるものも基本的にこの手のソフトウェアで分析されたものですね。
要は、最初に貼った図みたいなアラインメントを、手持ちの好きな配列で行える、ってのがこのCLUSTALWなわけです。
(なお、割と歴史あるツールなので、今はさらにアルゴリズムが発展して賢くなった後継ツールもあるようで、CLUSTAL W2とかXとかOmegaとか、色々なものが見当たりました。
でも、がっつり配列アラインメントをして進化学的な研究をする…みたいな用途でもなければ、どれでも一緒でしょう。)
今回は、検索したらトップに出てきた、京大バイオインフォマティクスセンターの運営するCLUSTALWを使わせていただきましょう。
このリンク先の検索ボックスに遺伝子配列を入れて分析実行を押すだけですが、ちょっとフォーマットを整える必要がありますね。
データベースから配列をコピーして、「.」を消したり、名前を分かりやすくHuman/Mouseを付けたりと、色々ちょいちょい形を変えて、こんな感じのデータにすればOKでしょう。
正規表現を使えば、特にマクロとかを組まなくても、このぐらいの変換なら一瞬でできる感じですね。
あぁ、大事な点として、小文字の塊の部分も、削除しておきました。
小文字部分なしで配列比較をしたい、ってのが今回の目的です。
それから、名前の先頭には「>」マークがありますが、これは「この行の文字列は、遺伝子の名前です」ということを意味するDNAファイル特有の書き方で…
>マークの後に名前
(改行)
DNAやRNAの配列
…というこの一連のフォーマット形式をFASTAと呼んでおり、この類の配列解析で汎用されている感じですが、まぁ細かすぎるのでどうでもいいでしょう。
御託が長くなりましたが、さぁ、このFASTA形式の配列(画像は途中で切れているだけで、実際は、マウスの配列はまだ下に続いています)をCLUSTALWにかけると、どーなる?
…まぁ、ただの文字列が並ぶだけなので、あんまり映える結果ではないですが、こんな感じで、近いもの同士を並べて表示してくれる感じですね。
なお、下にある「*」がついている塩基が、全遺伝子で全て一致している場所(同じ塩基になっている部位)になります。
60文字で強制改行が入るようで、結果は2段に分かれていますが、むむ、正直、並んだ所で、完全一致してるものがあるのかどうかは分かりにくいですねぇ…。
普通にマウスの一番上に来てるやつで検索してみると…
おっ!
Mouse-GTA-3は、Human-GTA-5、それから-4の2つと完全一致!
改行された後半部もチェックしておくと…
こちらはほとんどのもので同じ(でも、前半完全一致だったHuman-GTA-4とは違うんですね)で、結果、このMouse-GTA-3遺伝子は、Human-GTA-5シリーズと全長が100%完璧に同じということで、やっぱり結局「ヒトとマウスで同じtRNAを使っている」ことの例外、発見ならず…!
…ってまぁ正直、そもそもこの程度の比較ならCLUSTALWを使わなくても、先ほど用意したフォーマットをそろえてあるテキストファイル上で検索すればいいだけだったんですが、まぁせっかくなのでこういうツールもあります、という紹介を兼ねて使ってみた感じですね。
なお、そんな感じで今回の例ではぶっちゃけほとんど何の役にも立ってませんでしたが、そもそもこのCLUSTALWというツール、DNAの比較だと恩恵は低いものの、タンパク質配列の場合、似たアミノ酸は「それなりに似たもの」としてアラインメントを行ってくれるので(例えば、詳しいことは省略しますが、GPHという並びとWEAという並びの3アミノ酸はそれぞれ全く別物とみなされますが、DRYとEKFとかだと、これはかなり近いアミノ酸3つの並びとみなせる(性質がとても似ているため)…みたいな感じですね)、構成要素として20種類もの文字が存在するタンパク質配列のアラインメントで、特に強力な効果を発揮してくれるものなのです。
(単純に、文字が違っても、「このアミノ酸はある程度似てるから、両者はあんまり変わっていません、近いです!」と判定してくれる、ってことですね。)
別の生物由来だけど同じ機能をもつタンパク質のアミノ酸配列を比較して、「進化的にどこが保存されているのか」とかを見て重要な部位を特定したり、逆に機能上重要ではなさそうな部位を判断したり…みたいな、そういう用途での活用がなされている感じですね。
tRNAの話に戻ると、まぁ、よく見るとマウスのtRNA-TyrにはアンチコドンATAをもつものが存在しなかったので、その時点でヒトと違うわけですが、せっかくならやっぱり、「ヒトもマウスもどちらも同じアンチコドンのtRNAがあるけど、配列は違うよ!」って例を見つけたいものです。
Tyrの続き、アルファベット的に最後のVal(バリン)は、あっさり100%一致のものがみつかったので…
…今まで見てきた中の、少数アンチコドングループに目を付ける必要がありそうです…。
各アミノ酸で、トップに来ているわけではないアンチコドンもいくつか見てみましたが、どれも案外バリエーションが豊富ですねぇ…。
まぁ詳しく見ていったわけではないですが、何となく目を付けたのが、6種類もコドンがあるアミノ酸の、Leu(ロイシン)!
前回もアラインメント図は貼りましたが、再掲しておきましょう。
一番下に位置する、tRNA-Leu-TAAで、ちょっくらマウスゲノムのBLASTサーチをかけてみますか。
一発目…
うっし、Mouse-tRNA-Leu-TAA-3と93.51%、Mouse-tRNA-Leu-TAA-2とは90.91%の同一性と、全然惜しくもない相同性で、出足は好調!
続いてヒトtRNA-Leu-TAA-1は…
っぶねぇ~、たった1塩基の違いだけど、違うものは違う!オケマル水産!!
さぁ最後、ヒトtRNA-Leu-TAA-3はどうだ?!
キタァーーー!
こいつも1塩基違うぅっ!!
これにて「ヒトとマウスで、違うtRNAを使ってる例もある」ということで、やはり我々地上の支配者は、地面を這いつくばって生きてるカッスーマウスなんかとは違う、選ばれし生物だということですね!
…って、あぁー!
tRNA一覧の図をよくみたら、ステムマーク「>」「<」の行の下に、tRNA-Leu-TAA-4というのがイタァー!!
こいつを調べ忘れていたぁーっ!!!
まさか…
最後の最後、喜んだのもつかの間、ぬか喜びだったのか…??
TAA-4の配列でBLAST検索、どうだ…?!
よっしゃ~い、まさかの7塩基ズレと、全然違うぅ~!
実際このTAA-4番を見逃していたので一瞬ビビリましたが、結局、普通にtRNA-Leu-TAAは、ヒトとマウスで完全一致しているものは見つからない、というのが結論でOKですね!
…って、今までどれだけのtRNAが完全一致していたかを考えると、こんな例外1つだけで一人で勝手に喜んでるのも、最早滑稽とすらいえそうですが…。
ま、それだけ、同じ哺乳類、ヒトとマウスは遺伝子的に近い生物ってことですね。
では、もっと離れている生物ならどうなのか…?
せっかくだから最後、単細胞の酵母との比較をしてみましょうか。
単細胞とはいえ、同じ真核生物グループに属するのが酵母ですけど、流石に酵母とまで遺伝子が同じとあっては、人としての尊厳が失われてしまいそうです。
ここは代表例として、一番同じ配列でまとまっていた、ヒトのtRNA-His-GTG-1の配列を使ってチェックしてみましょう。
例によってBLASTサーチから、配列をコピペして、対象生物を今度は酵母に変えて、BLAST実行!
…結果……!!
キタァーー!
まさかの、配列が違いすぎて、「酵母のゲノムからは、類似した配列が見つかりませんでした」というメッセージのみ!!
やったぜ、流石に酵母とヒトには、越えられない壁があるってことですね。
ま、酵母さんも、研究対象・お酒造り・パン作りと、ヒトの役に立ってくれてるからね、同じだったとしても全然ウェルカムだったんだけどなぁ~残念だなぁ~(煽りカス)。
…しかし、逆に、同じtRNAでそこまで違うものなのか…?
実際どのぐらい似ているのか気になったので、BLASTオプションに「ある程度似ているものならヒットさせる」という項目があったので、これを選んでもう一度サーチしてみましょう。
今度はどうだ?!
おぉ~う、今回はいっぱいヒットしてきましたね…!
そして、ヒトと酵母のtRNA-Hisは、最大類似度でも、わずか82.35%の相同性!
詳しく見てみると…
ふーむ、そもそも最初の10塩基と最後の10塩基ぐらいは、あまりにも違いすぎて除外させられた上での(Queryが、10~60になっているのがご覧いただけると思います)、つまり似てる部分だけピックアップした上での82.35%ってことで、やっぱり同じアミノ酸を認識するtRNAなのに、ヒトと酵母ともなると結構違うもんですねぇ~。
ちなみに、上記詳細画像2つ目の項目は酵母8番染色体でヒットしたものですが、8番染色体には似てる配列が2つあり、1つ目が上に表示されているtRNA-His、そして下の方は、パーセントは低いけど、より広い領域で相同性が見られている感じですね…。
こいつは何の遺伝子なのか、この表示からは分かりませんから、GenBankのリンクで詳細を見てみた所、これは、酵母のtRNA-Glnでした。
先ほどの一覧でもヒットしていましたが、ヒトのtRNA-Hisは酵母のtRNA-Glnとも結構近い感じのようですけど、まぁこれは偶然の範囲ですかね。
特に意味のある類似度ではないと思います。
…という感じで、申し訳程度に酵母との比較も見てみましたが、やはり、単細胞生物とヒトとはかなり違う、ってことも確かめられて、中々面白い感じだったように個人的には思えます。
次回はまたtRNAについていただいていたご質問、途中になっていたのでその続きから参りましょう。