論文

Article No. K94-4
Title Construction of a human full-length cDNA bank.
Authors Kato S, Sekine S, Oh SW, Kim NS, Umezawa Y, Abe N, Yokoyama-Kobayashi M, Aoki T.
Journal Gene. 1994 Dec 15;150(2):243-50.
PMID 7821789

ことの始まり


相模中研とスポンサー会社5社の共同プロジェクトであるGE研究室が終了し、その後継となる研究テーマとして、私が提案したのが「ホモ・プロテインcDNAバンク構想」です。これはヒト有用タンパク質を探索するために、遺伝子の方から攻めようという計画です。そのために必要な技術開発を行うプロジェクトが、(財)神奈川科学技術アカデミー(KAST)で「ヒューマン・プロテインプロジェクト」として採択されました。その主要成果である新規完全長cDNAライブラリー作製法を用いてホモ・プロテインcDNAバンクのプロトタイプを構築したのが本論文です。


タンパク質をターゲットにするのであれば、完全長cDNAの取得が必須となります。さらに、取得したcDNAの塩基配列決定を容易に行えることや、cDNAがコードするタンパク質の機能解析のためのインビトロ発現や哺乳動物細胞内発現を他のベクターに組み換えることなく行えるシステムが望まれます。そこでこれらを満足するcDNAライブラリー作製法の開発と解析システムの構築を目指しました。


経緯


当時完全長cDNAライブラリー作製法として知られていたOkayama-Berg法は、NIHに出張中に試してみましたが、なかなかうまくいきませんでした。その後、Okayama-Berg法の改良版として報告されたPruitt法を用いることにより、ある程度満足できるライブラリーを作製することができました。ただ、分解したmRNAに由来する短縮cDNAも含まれており、得られたcDNAが完全長かどうかの判定ができないという問題がありました。


この問題を解決する方法として開発したのが、キメラオリゴキャッピング法です。その開発の経緯とcDNA合成工程は、先行論文であるNucleic Acids Symp Ser. (K93-4)の論文紹介に記載してあります。本論文では、クローン化したcDNAの塩基配列決定と哺乳動物細胞内発現やインビトロ発現を可能とする多機能ベクターpKA1を作製し、これをベクタープライマーとして用いてライブラリーを作製しました。そして、作製したライブラリーに含まれるcDNAクローンの5’端部分塩基配列解析を試みることにしました。


pKA1の構造

結果


ヒト組織球リンパ腫細胞株U937のポリ(A)RNAからPruitt法で、またヒト繊維肉腫細胞株HT-1080のポリ(A)RNAからキメラオリゴキャッピング法でライブラリーを作製し、それぞれのライブラリーから無作為に選んだ776クローンと720クローンの5’端部分塩基配列を決定しました。その結果、既知タンパク質と同じあるいは類似性を有するタンパク質のMetから始まる翻訳領域を有するcDNAが、236種類、683個得られました。


この中には70種類のリボソームタンパク質cDNAが含まれており、23種はヒトリボソームタンパク質の新規cDNAでした。他にも多くのハウスキーピングタンパク質をコードするcDNAが含まれており、完全長cDNAライブラリーからランダムに選んだクローンの5’端部分塩基配列解析が、完全なタンパク質をコードするcDNAを効率的に取得する有効な方法であることが示されました。


5’端部分塩基配列解析の結果を見て驚きだったのは、得られたすべてのリボソームタンパク質をコードするcDNAの5’端にCmTnC(m=0, 1, 2; n≧1)というピリミジンに富む配列(5’TOP, 5’ terminal oligopyrimidine)が存在したことです。他にもEF-1α、laminin-binding proteinなど、同様の配列で始まるcDNAが見つかりました。不思議なのは、同じタンパク質のcDNAであっても、ゲノムの配列にはない、Cの数(m)やTの数(n)が異なる多型が見られることです。


キメラオリゴキャッピング法は、原理的にはキャップ部位から始まる完全長cDNAのみを生成するはずですが、実際は分解したmRNAに由来する短縮cDNAクローンも一定割合で含まれていました。5’端が同じ配列である複数のクローンが取れている場合は完全長と判定できますが、1クローンしか取れていない場合、たとえMetから始まるタンパク質をコードしていても完全長cDNAかどうか判定不能であり、今後の課題として残りました。


余談


多機能ベクターの名前”pKA1(ピカイチ)”は、私の名前のイニシャル”K”と、プラスミドを作製してくれた青木隆史氏のイニシャル”A”に由来します。その後、このベクターを改良したものの名前を、pKA2、pKA3とするわけにはいかず、pKA1U、pKA1Mなどとしています。ある会合で東大医科研の新井賢一博士から、自分もpKA1というベクターを作ったことがあるよと言われました。確かに新井氏のイニシャルは、K. A. です。


本論文はヒト完全長cDNAバンクの構築を提唱する初めての論文として、最初Natureへ、ついでNature Geneticsへ投稿しましたが、いずれも拒絶されました。当時、ヒト遺伝子特許出願で、我々の技術がNatureのNewsに取り上げられたりしており、査読者の中にこの論文が出ることを好ましくないと思っている人がいたようにも思えます。結局Geneに投稿して受理されました。


疑問点


Q1 5’端オリゴピリミジン(5’TOP)の生理的役割は何か。
Q2 5’TOPの多様性はどのようにして生成するか。


被引用文献


2014年までの20年間で、84件の引用がなされています。最も多いのは、完全長cDNAライブラリー作製法の一つとしての引用で、丸山&菅野のオリゴキャッピング法の論文(Maruyama and Sugano, 1994)と一緒に引用されています。次に多いのは、特定遺伝子のcDNAの配列情報に関する引用で、24件あります。その中の半分12件は、5’TOPに関するものです。いくつかのリボソームタンパク質のmRNAの5’端に5’TOPが存在することはすでに報告されていましたが、それ以外の多くのタンパク質mRNAでも5’TOPが存在することを明らかにした最初の論文であるためと思われます。取得した完全長cDNAを用いて、塩基配列解析や機能解析を行なった論文も14件ありますが、これらは全て我々が直接関与した論文です。

被引用文献リスト (Ref IDで、aが付加しているものは、アブストラクトのみアクセス可。)
No. Ref ID 研究機関 雑誌名 論文タイトル 被引用内容 PMID
1 K95-2 日本 KAST Gene. A signal sequence detection system using secreted protease activity as an indicator. pKA1 vector 7590265
2 R96424 日本 徳島大、相模中研 他 Eur J Biochem. cDNA cloning and functional analysis of the p97 subunit of the 26S proteasome, a polypeptide identical to the type-1 tumor-necrosis-factor-receptor-associated protein-2/55.11. Proteasome subunit p97 cDNA 8774743
3 K96-1 日本 東工大、相模中研 Bioconjug Chem. On-off switching of enzymatic reaction by recombinant calmodulin on a solid-phase matrix. Calmodulin cDNA 8742000
4 K96-4 日本 相模中研、国立遺伝研 J Biochem. Cloning and expression of cDNA encoding a human ubiquitin-conjugating enzyme similar to the Drosophila bendless gene product. UBE2N cDNA 8902611
5 R97149 日本 理研 DNA Res. High efficiency selection of full-length cDNA by improved biotinylated cap trapper. 完全長cDNAライブラリー作製法 9179497
6 R97289 日本 東大 Gene. Construction and characterization of a full length-enriched and a 5'-end-enriched cDNA library. 完全長cDNAライブラリー作製法 9373149
7 R97476a オーストラリア University of Sydney Electrophoresis. Proteome research: complementarity and limitations with respect to the RNA and DNA worlds. ? 9298643
8 R97477 デンマーク Rigshospitalet Eur J Biochem. Distinct repression of translation by wortmannin and rapamycin. 5'TOP 9249059
9 R97478 スペイン University of Oviedo Cell Mol Life Sci. Annexin gene structures and molecular evolutionary genetics. Annexin 9230928
10 R97479a イタリア Università di Roma Tor Vergata Prog Mol Subcell Biol. TOP genes: a translationally controlled class of genes including those coding for ribosomal proteins. 5'TOP 8994258
11 R97481a ドイツ Boehringer Mannheim GmbH Anticancer Res. Differential gene expression in human mammary carcinoma cells: identification of a new member of a receptor family. ? 9066625
12 R97482a 英国 MRC Human Genetics Unit Cytogenet Cell Genet. In situ hybridisation mapping of genomic clones for five human respiratory chain complex I genes. NDUF sequence 9345899
13 K97-1 日本 相模中研 J Biochem. Human cDNA encoding a novel TGF-beta superfamily protein highly expressed in placenta. GDF15 cDNA 9348093
14 R98368 オーストラリア CSIRO Virology. Identification of transcripts and promoter regions of ovine adenovirus OAV287. 5'TOP 9614874
15 R98369 スイス Friedrich Miescher-Institut Mol Cell Biol. The host gene for intronic U17 small nucleolar RNAs in mammals has no protein-coding potential and is a member of the 5'-terminal oligopyrimidine gene family. 5'TOP 9671460
16 R98370 中国 Shanghai Second Medical University Proc Natl Acad Sci U S A. Identification of genes expressed in human CD34(+) hematopoietic stem/progenitor cells by expressed sequence tags and efficient full-length cDNA cloning. 完全長cDNAライブラリー作製法 9653160
17 R98372 米国 Yale University Mol Cell Biol. Classification of gas5 as a multi-small-nucleolar-RNA (snoRNA) host gene and a member of the 5'-terminal oligopyrimidine gene family reveals common features of snoRNA host genes. 5'TOP 9819378
18 R98378 英国 Queen Charlotte's and Chelsea Hospital Gene. Molecular cloning and characterization of a highly conserved human 67-kDa laminin receptor pseudogene mapping to Xq21.3. ? 9461426
19 K98-2 日本 ERATO Anal Biochem. Detection of lectins using ligand blotting and polyacrylamide-type glycoconjugate probes. Galectin-3 cDNA 9570845
20 K98-3 日本 相模中研、ERATO J Biochem. Cloning of human polyubiquitin cDNAs and a ubiquitin-binding assay involving its in vitro translation product. Polyubiquitin cDNA 9644242
21 K98-4 日本 ERATO、都臨床研 Genes Dev. A new NEDD8-ligating system for cullin-4A. NEDD8, SUMO-1, Cul4A cDNAs 9694792
22 K98-5 日本 都臨床研、相模中研 Gene. cDNA cloning and functional analysis of p28 (Nas6p) and p40.5 (Nas7p), two novel regulatory subunits of the 26S proteasome. Proteasome subunit p28、p40.5 cDNAs 9714768
23 R99384 米国 University of Washington Proc Natl Acad Sci U S A. Messenger RNA translation state: the second dimension of high-throughput expression screening. 5'TOP 10485877
24 R99385a 日本 琉球大 Gene. Gene organization and sequence of the region containing the ribosomal protein genes RPL13A and RPS11 in the human genome and conserved features in the mouse genome. RPL13A, RPS11 10580157
25 R99386a 日本 理研 Methods Enzymol. High-efficiency full-length cDNA cloning. 完全長cDNAライブラリー作製法 10349636
26 K99-1 日本 ERATO、相模中研 Gene. Selection of cDNAs encoding putative type II membrane proteins on the cell surface from a human full-length cDNA bank. Type II membrane proteins cDNA clones 10072769
27 K99-2 日本 岐阜大、相模中研 Cytogenet Cell Genet. cDNA cloning, characterization, and chromosome mapping of UBE2E3 (alias UbcH9), encoding an N-terminally extended human ubiquitin-conjugating enzyme. UBE2E3 cDNA 10343118
28 K99-3 日本 ERATO Nucleic Acids Res. Npw38, a novel nuclear protein possessing a WW domain capable of activating basal transcription. Npw38 cDNA 10198427
29 K99-4 日本 ERATO J Biochem. Multi-ubiquitination of a nascent membrane protein produced in a rabbit reticulocyte lysate. cDNA clone HP10122 10393320
30 K99-5 日本米国 東大、熊本大、相模中研、NIH Proc Natl Acad Sci U S A. A heterozygous mutation of beta-actin associated with neutrophil dysfunction and recurrent infection. キメラオリゴキャッピング法 10411937
31 R00119 日本 東大、九州大、理研 Proc Natl Acad Sci U S A Toward a protein-protein interaction map of the budding yeast: A comprehensive system to examine two-hybrid interactions in all possible combinations between the yeast proteins. 完全長cDNAライブラリー作製法 10655498
32 R00384 日本 理研 Genome Res. Normalization and subtraction of cap-trapper-selected cDNAs to prepare full-length cDNA libraries for rapid discovery of new genes. 完全長cDNAライブラリー作製法 11042159
33 R00453a スエーデン Royal Institute of Technology J Biotechnol. Sequence analysis of genes and genomes. cDNAの塩基配列決定法? 10784293
34 R00454 日本 東大 Genes Cells. Intronic U50 small-nucleolar-RNA (snoRNA) host gene of no protein-coding potential is mapped at the chromosome breakpoint t(3;6)(q27;q15) of human B-cell lymphoma. 5'TOP 10792466
35 R00455 日本 日立中研、ヘリックス研 Genome Inform Ser Workshop Genome Inform. An integrated analysis and database system for full-length cDNA. 完全長cDNAライブラリー作製法 11700583
36 R00459a 日本 東大 Gene. Genomic organization and alternative transcripts of the human PQBP-1 gene. Npw38 11163963
37 K00-2 日本 ERATO Gene. Identification of cDNAs encoding two novel nuclear proteins, IMUP-1 and IMUP-2, upregulated in SV40-immortalized human fibroblasts. IMUP-1, IMUP-2 cDNA 11080599
38 R01373 日本 理研 Gene. Comparative evaluation of 5'-end-sequence quality of clones in CAP trapper and other full-length-cDNA libraries. 完全長cDNAライブラリー作製法 11223247
39 R01438 米国 CLONTECH Laboratories Biotechniques. Reverse transcriptase template switching: a SMART approach for full-length cDNA library construction. 完全長cDNAライブラリー作製法 11314272
40 R01472 米国 CLONTECH Laboratories Biotechniques. Use of SMART-generated cDNA for gene expression studies in multiple human tumors. 完全長cDNAライブラリー作製法 11196307
41 R01473a 米国 University of California Gene. Expression sequence tag-specific full-length cDNA cloning: actin cDNAs. 完全長cDNAライブラリー作製法 11223266
42 R01474 日本 ヘリックス研、東大 DNA Res. Comparison of sequences of cDNA clones obtained from oligo-capping cDNA libraries with those from unigene. 完全長cDNAライブラリー作製法 11853313
43 R01475a 日本 琉球大 Genomics. A complete map of the human ribosomal protein genes: assignment of 80 genes to the cytogenetic map and implications for human disorders. Ribosomal proteins 11401437
44 R01477a 日本 東大 Methods Mol Biol. Construction of full-length-enriched cDNA libraries. The oligo-capping method. 完全長cDNAライブラリー作製法 11462832
45 R02227a インド International Centre for Genetic Engineering and Biotechnology Mol Biotechnol. Global amplification of cDNA from limiting amounts of tissue. An improved method for gene cloning and analysis. ? 12448877
46 R02321 中国 the Second Military Medical University World J Gastroenterol. Overexpression of p28/gankyrin in human hepatocellular carcinoma and its clinical significance. Proteasome subunit p28 12174370
47 R02326 日本 高知医科大 Biochemistry Inhibition of poly(ADP-ribose) polymerase activity by Bcl-2 in association with the ribosomal protein S3a. Ribosomal protein S3a 11790116
48 R02327a 日本 ヘリックス研、東大 In Silico Biol. Database and analysis system for cDNA clones obtained from full-length enriched cDNA libraries. 完全長cDNAライブラリー作製法 11808872
49 R02328a 日本 千葉大 Arch Biochem Biophys. Rapamycin induces binding activity to the terminal oligopyrimidine tract of ribosomal protein mRNA in rats. 5'TOP 12051685
50 K02-1 日本 琉球大、相模中研、慶應大 Genome Res. The human ribosomal protein genes: sequencing and comparative analysis of 73 genes. Ribosomal proteins 11875025
51 R03152a 日本 東大、信州大 Gene. The 5' terminal oligopyrimidine tract of human elongation factor 1A-1 gene functions as a transcriptional initiator and produces a variable number of Us at the transcriptional level. 5'TOP 12853148
52 R03166 韓国 Korea Research Institute of Bioscience and Biotechnology Exp Mol Med. An improved method for constructing a full-length enriched cDNA library using small amounts of total RNA as a starting material. 完全長cDNAライブラリー作製法 14749539
53 R03269a 中国 Chinese National Human Genome Center at Shanghai Methods Mol Biol. Generation of cDNA libraries for profiling gene expression of given tissues or cells. 完全長cDNAライブラリー作製法 12703744
54 R03270 日本 東大 Methods Mol Biol. Construction of a full-length enriched and a 5'-end enriched cDNA library using the oligo-capping method. 完全長cDNAライブラリー作製法 12703735
55 R03271 韓国 University of Ulsan College of Medicine Cancer Res. Expression profiling and subtype-specific expression of stomach cancer. キメラオリゴキャッピング法 14678982
56 R04250a 韓国 Korea Research Institute of Bioscience and Biotechnology Plasmid. Construction of multi-purpose vectors, pCNS and pCNS-D2, are suitable for collection and functional study of large-scale cDNAs. pKA1 15109828
57 R04251a 韓国 Korea Research Institute of Bioscience and Biotechnology Genomics. Gene cataloging and expression profiling in human gastric cancer cells by expressed sequence tags. 完全長cDNAライブラリー作製法 15177556
58 R04252 ドイツ German Cancer Research Center (DKFZ) BMC Genomics. 2007 Jun 4;8:145. SMART amplification combined with cDNA size fractionation in order to obtain large full-length clones. 完全長cDNAライブラリー作製法 15198809
59 R04253 ロシア Shemiakin and Ovchinnikov Institute of Bioorganic Chemistry RAS Nucleic Acids Res. Simple cDNA normalization using kamchatka crab duplex-specific nuclease. 完全長cDNAライブラリー作製法 14973331
60 R04263a 米国 BD Biosciences-Clontech Adv Biochem Eng Biotechnol. Disease profiling arrays: reverse format cDNA arrays complimentary to microarrays. 15088766
61 R04264 韓国 National Institute of Agricultural Science and Technology Int. J. Indust. Construction of the Full-length cDNA Library and Selection of Diapause-Associated cDNA Clones from Bombyx mori Diapausing Eggs and Diapause-Activated Eggs. 完全長cDNAライブラリー作製法 URL
62 K04-1 日本 国リハ DNA Res. Determination of the capped site sequence of mRNA based on the detection of cap-dependent nucleotide addition using an anchor ligation method. EF1A1 cDNA 15500255
63 R05201 米国 Fox Chase Cancer Center Philadelphia BMC Evol Biol. The architecture of mammalian ribosomal protein promoters. Ribosomal proteins 15707503
64 R05202a 中国 the Second Military Medical University Liver Int. Expression of p28GANK and its correlation with RB in human hepatocellular carcinoma. proteasome subunit p28 15910504
65 R05203a 米国 Columbia University Medical Center Gene. Complete open reading frame (C-ORF) technology: simple and efficient technique for cloning full-length protein-coding sequences. 完全長cDNAライブラリー作製法 15927425
66 R05208a 韓国 Korea Research Institute of Bioscience and Biotechnology Mamm Genome. Transcriptome analysis of human gastric cancer. 完全長cDNAライブラリー作製法 16341674
67 K05-1 日本 国リハ、日立計測器サービス DNA Res. Vector-capping: a simple method for preparing a high-quality full-length cDNA library. 完全長cDNAライブラリー作製法 16106752
68 R06192a 米国 The Ohio State University Fungal Genet Biol. Computational and comparative analyses of 150 full-length cDNA sequences from the oomycete plant pathogen Phytophthora infestans. 完全長cDNAライブラリー作製法 16380277
69 R06193 韓国 National LivestockResearch Institute BMC Genomics. Generation and analysis of large-scale expressed sequence tags (ESTs) from a full-length enriched cDNA library of porcine backfat tissue. 完全長cDNAライブラリー作製法 16504160
70 R06194 オーストラリア Griffith University Biochem J. The tert-butylhydroquinone-mediated activation of the human thioredoxin gene reveals a novel promoter structure. Thioredoxin 5' sequence 16712525
71 R06195a 韓国 Korea Research Institute of Bioscience and Biotechnology Int J Oncol. Gene expression profiling of human HBV- and/or HCV-associated hepatocellular carcinoma cells using expressed sequence tags. キメラオリゴキャッピング法 16820872
72 R07089 日本 理研 J Exp Biol. Constructing the landscape of the mammalian transcriptome. 完全長cDNAライブラリー作製法 17449815
73 R07164 米国 US Department of Agriculture BMC Genomics. Construction and characterization of a full-length cDNA library for the wheat stripe rust pathogen (Puccinia striiformis f. sp. tritici). 完全長cDNAライブラリー作製法 17547766
74 R08192 インド Vellore Institute of Technology Genomic Med. In silico investigations on functional and haplotype tag SNPs associated with congenital long QT syndromes (LQTSs). 5'TOP 19214780
75 R08193 日本 ダナフォーム Genomics. The current status of cDNA cloning. 完全長cDNAライブラリー作製法 18222633
76 R08194 日本 東大 Nucleic Acids Res. Comprehensive detection of human terminal oligo-pyrimidine (TOP) genes and analysis of their characteristics. 5'TOP 18480124
77 K08-1 日本 国リハ、東洋大 DNA Res. Fine expression profiling of full-length transcripts using a size-unbiased cDNA library prepared with the vector-capping method. 完全長cDNAライブラリー作製法 18487259
78 R09124 韓国 National Institute of Animal Science Mol Cells. Full-length enriched cDNA library construction from tissues related to energy metabolism in pigs. 完全長cDNAライブラリー作製法 19937143
79 R10112 米国 The University of Arizona BMC Genomics. Incorporation of non-natural nucleotides into template-switching oligonucleotides reduces background and improves cDNA synthesis from very small RNA samples. 完全長cDNAライブラリー作製法 20598146
80 R11071 日本 国リハ、東洋大、日立ハイテク Invest Ophthalmol Vis Sci. Full-length transcriptome analysis of human retina-derived cell lines ARPE-19 and Y79 using the vector-capping method. cDNA database 21697133
81 R11076 デンマーク Aarhus University Hospital BMC Genomics. Tumor-specific usage of alternative transcription start sites in colorectal cancer identified by genome-wide exon array analysis. 5'TOP 21999571
82 K11-1 日本 国リハ、日立ハイテク Methods Mol Biol. Full-Length Transcriptome Analysis Using a Bias-Free cDNA Library Prepared with the Vector-Capping Method. 完全長cDNAライブラリー作製法 21365483
83 R12069 韓国 Kyungpook National University Amer. J. Plant Sci. Effective Procedure for Development of EST-SSR Markers Using cDNA Library. 完全長cDNAライブラリー作製法 URL
84 R14054a 中国 Yunnan Agricultural University J. Integr. Agri. Generation and Analysis of Expressed Sequence Tags (ESTs) from Muscle Full-Length cDNA Library of Wujin Pig. 完全長cDNAライブラリー作製法 URL