文献

Reference No. R06104
Title A large-scale full-length cDNA analysis to explore the budding yeast
transcriptome.
Authors Miura F, Kawaguchi N, Sese J, Toyoda A, Hattori M, Morishita S, Ito T.
Journal Proc Natl Acad Sci U S A. 2006 Nov 21;103(47):17846-51.
PMID 17101987

目的


出芽酵母はゲノムの全塩基配列が決定された最初の真核生物ですが、実はこの論文が出た頃、転写産物の解析はまだ十分に行われていませんでした。それまでに同定された遺伝子のマイクロアレイによる発現量解析は進んでいても、転写開始点、プロモーター、5’-UTRに関しては、ほとんどの遺伝子に関して未解明のままでした。そこで著者らは、当時、哺乳類をはじめ高等真核生物で行われていたように、完全長cDNAを解析することによって、これらの情報を得ようと考えました。


方法


完全長cDNAクローンを得る方法として、著者らが目をつけたのが、ベクターキャッピング法です。その最大の理由は、cDNAの5’端に余分なdGが付加しているかどうかで、完全長であるかどうか判定できるからです。最少培地で培養した対数増殖期の細胞と減数分裂期の細胞からそれぞれ完全長cDNAライブラリーを作製し、その中から任意に選んだクローンの5’端の部分塩基配列を決定し、ゲノム上にマッピングして転写開始点を決めました。なお、ライブラリーの作製は、日立計測器サービス(株)よって行われています。


結果


ゲノム上にマッピングできる総計51,026クローンの5’端塩基配列が得られ、次のようなことが明らかになりました。


・ほとんどの遺伝子が、2個以上の転写開始点を有している。

・遺伝子間や既知遺伝子内の転写開始点から始まる転写産物がある。

・既知遺伝子に対するアンチセンス転写産物が存在する。

・新規選択的スプライシングバリアントが存在する。

・隣接する遺伝子間のスプライシングにより遺伝子融合が起こる。


以上の結果から、酵母のトランスクリプトームはこれまで考えられていたよりずっと複雑であること、しかも哺乳類や他の高等真核生物で起こっているのと同様の転写機構の存在が示唆されたので、これらのメカニズム研究の有用なモデルになりうると考えられました。


評価


この論文は、ベクターキャッピング法で作製した完全長cDNAライブラリーが、トランスクリプトーム解析において有用であることを初めて示してくれました。すなわち、希少遺伝子の同定、複数の転写開始点の存在、選択的スプライシングバリアントの存在、アンチセンス転写産物の存在など、ベクターキャッピング法によって期待される主な結果を例示してくれました。Supplementary Table 1-2に、全クローンの5’端塩基配列データと遺伝子名が記載されているので、それに基づき開発者の視点から考察してみます。


インサート含有率:5’端の部分塩基配列を決定したクローンの総数は83,706とあり、その中の51,026クローン(61.0%)が、ベクターとcDNAの接続部の配列を読み取れ、かつcDNAの配列が出芽酵母のゲノムの配列と一致したとあります。この割合は、我々がヒト培養細胞株で得た値(>90%)より低いですが、ベクタープライマーの量に比べ、mRNAの量が少なかった可能性があります。


5’端に付加した塩基:5’端に余分な塩基の付加がないものが13.0%、一個の余分なGが付加したものは63.9%、ゲノム配列に含まれているGから始まるものが2.7%となっています。また、0.1%以上含まれているクローンの中で、NGが付加されているものが16種類(TG、TGG、TTG、・・・の順)、合計10.6%となり、GとNGが付加されたものの合計は、74.5%となります。従って、全クローンに占める完全長クローンの割合は、この値以上であると考えられます。


完全長率に及ぼす含有量と鎖長の影響:最も多く含まれているHOR7(180bp)の完全長率は96.0%(940/988)です。3番目に多いSPS4(1,017bp)の完全長率は92.6%(698/754)と若干低くなっています。もう少し鎖長が長いCDC19(1,503bp)では82.7%(81/98)、さらに長鎖のMUC1(4,104bp)では53.5% (7/13)と、鎖長が長くなるに従い、完全長率の低下がみられます。このような鎖長依存性の完全長率低下は、mRNAの分解によると考えられます。


長鎖遺伝子の有無:長鎖遺伝子クローンの数を調べてみると、7kbp以上の遺伝子が14種19クローン含まれており、その中の3クローン、TOM1 (9,807bp)、GCN1 (8,019bp)、UTP20 (7,483bp)が少なくとも5’端は完全長です。完全長率は低くとも、長鎖遺伝子の完全長クローンが取れていることは確かのようです。


我々の結果と比較すると、完全長率は低いですが、これはRNAが分解しているせいと考えられます。酵母のような細胞壁を有する細胞からRNAを抽出する場合は、長鎖RNAの分解を極力抑える抽出法が望まれます。


インパクト


本論文は、Dimensions Badgeによれば、2021年時点で、189の論文に引用されており、この分野で大きなインパクトを与えていることが伺えます。酵母のトランスクリプトームの予期せぬ複雑さについては、タイリングアレイによるハイブリダイゼーションやRNA-seqによっても示されていますが、完全長cDNAのシーケンシングによる本方法の最大のメリットは、得られたクローンを使って、各種機能解析が行えるということにあります。被引用論文の多くは、転写産物の複雑さを示した論文の一つとして取り上げていますが、完全長cDNAという物が得られ、リソースとして活用できることをもっと評価されても良いのではないかと思います。