解説

質量分析法を利用したRNA–タンパク質複合体のトータル解析

Comprehensive Analysis of RNA–Protein Complex Using Mass Spectrometry-Based Technology

Keiichi Izumikawa

泉川 桂一

東京農工大学大学院農学研究院 ◇ 〒183-8509 東京都府中市幸町三丁目5番8号

Institute of Agriculture, Tokyo University of Agriculture and Technology ◇ Saiwai-cho 3-5-8, Fuchu-shi, Tokyo 183-8509, Japan

Hideaki Ishikawa

石川 英明

東京農工大学大学院農学研究院 ◇ 〒183-8509 東京都府中市幸町三丁目5番8号

Institute of Agriculture, Tokyo University of Agriculture and Technology ◇ Saiwai-cho 3-5-8, Fuchu-shi, Tokyo 183-8509, Japan

Harunori Yoshikawa

吉川 治孝

Lamond Lab, Centre for Gene Regulation and Expression, School of Life Sciences, University of Dundee ◇ Nethergate, Dundee DD1 4HN, Scotland, United Kingdom

Toshiaki Isobe

礒辺 俊明

国立研究開発法人科学技術振興機構戦略的創造研究推進事業CREST「ライフサイエンスの革新を目指した構造生命科学と先端的基盤技術」研究領域 ◇ 〒102-0076 東京都千代田区五番町7番地

Research Area “Structural Life Science and Advanced Core Technologies for Innovative Life Science Research”, Core Research for Evolutionary Science and Technology (CREST), Japan Science and Technology Agency (JST) ◇ Goban-cho 7, Chiyoda-ku, Tokyo 102-0076, Japan

首都大学東京大学院理工学研究科 ◇ 〒192-0397 東京都八王子市南大沢一丁目1番地

Graduate School of Science and Engineering, Tokyo Metropolitan University ◇ Minami-Osawa 1-1, Hachioji-shi, Tokyo 192-0397, Japan

Nobuhiro Takahashi

高橋 信弘

東京農工大学大学院農学研究院応用生命化学部門 ◇ 〒183-8509 東京都府中市幸町三丁目5番8号

Division of Applied Biological Chemistry, Institute of Agriculture, Tokyo University of Agriculture and Technology ◇ Saiwai-cho 3-5-8, Fuchu-shi, Tokyo 183-8509, Japan

Published: 2015-11-20

生体内ではRNAとタンパク質は,お互いに相互作用し合いRNA–タンパク質複合体としてさまざまな生理機能を発揮する.その際,タンパク質が翻訳後修飾でその機能が制御されているのと同様に,RNAは転写後修飾によって機能が制御されている.RNAにも100種類を超える転写後修飾が知られ,RNAの生体内での真の機能をこれらの修飾情報を知ることなく理解することはできない.ここに,RNA–タンパク質複合体のトータル解析の必要性がある.本稿では,最近開発された質量分析法とゲノムワイドな検索エンジンを基礎とした直接的なRNA解析法を紹介し,プロテオミクスの手法によるタンパク質の直接解析法と合わせたRNA–タンパク質複合体のトータル解析について概説する.

はじめに

タンパク質の解析の歴史をさかのぼると,1956年にフレデリック・サンガーがインスリンのアミノ酸配列を決定し(1)1) J. I. Harris, M. A. Naughton & F. Sanger: Arch. Biochem. Biophys., 65, 427 (1956).,タンパク質がアミノ酸で構成された物質であることが明らかになって以来,そのアミノ酸配列の決定と立体構造解析はタンパク質の機能を理解するための必須な工程となった.しかし,タンパク質のアミノ酸配列の解析は,当時用いられていたEdman分解の効率の悪さや感度の悪さなどさまざまな問題点を抱え,労力と時間を要する非常に非効率な仕事であった.にもかかわらず,このEdman分解を基礎とする解析法はおよそ40年間使われ続けられ,タンパク質のアミノ酸配列解析が飛躍的な発展を遂げるのは,Mass Spectrometry(質量分析)法の進歩があってのことである.質量分析法は,19世紀末のオイゲン・ゴルドシュタインよる陽極線(カナル線)の発見と,その後のジョセフ・ジョン・トムソン,フレデリック・アストンらがカナル線に電磁場をあて得られた偏光放物線の観察から,質量値の異なる同位体の存在を発見したことから始まる.実際にタンパク質のアミノ酸配列決定に用いられるのは20世紀の終わりから今世紀の初めにかけてであり,この間1世紀もの時間を要した.アミノ酸配列の分析を可能にした質量分析法での大きな進歩は,記憶に新しいが,2002年のノーベル化学賞を受賞した田中耕一氏のマトリックス支援レーザー脱離法とジョン・フェン氏のエレクトロスプレーイオン化(ESI)法の開発によってなされた.特に,溶液内の試料を高電圧下でイオン化させるESI法を用いたシステムはタンパク質のような高分子化合物の安定的かつ連続的なイオン化には最適な方法であった.これらのイオン化法を利用した質量分析法は,タンパク質の大規模な解析というプロテオミクスのトレンドを作り出し,飛躍的な発展を遂げ,現在では一度の分析で10,000種類以上ものヒトのタンパク質を網羅してしまうほどの技術革新に結びついている(2)2) A. S. Deshmukh et al.: Mol. Cell Proteomics, pii: mcp.M114.044222 (2015)..これらの技術は,リン酸化やアセチル化など数百種類存在すると言われている翻訳後修飾の大規模解析も可能とし,さらにはタンパク質複合体を高純度で単離するプロテオミクス特有のエピトープタグ法/免疫沈降法の開発と相まって,タンパク質複合体のネットワークの解明へと進んでいる.酵母菌タンパク質の網羅的ネットワーク解析では,すべてのタンパク質は細胞内で約500種類のいずれかのタンパク質複合体の構成成分として機能することが示されている(3)3) A. C. Gavin, P. Aloy, P. Grandi, R. Krause, M. Boesche, M. Marzioch, C. Rau, L. J. Jensen, S. Bastuck, B. Dümpelfeld et al.: Nature, 440, 631 (2006).

一方でRNAに関する研究は1950年代後半から始まり,時をあまり経ずしてtransfer RNA(tRNA),ribosomal RNA(rRNA),messenger RNA(mRNA)が発見され,セントラルドグマのなかでRNAの役割はDNAの情報をタンパク質へ伝達することであると考えられるようになった.しかし,トーマス・チェックらによるリボザイムの発見によって,RNAもタンパク質と同様に触媒活性をもち,生体反応に積極的に関与していることが明らかとなり,生命の起源をRNAと考えるRNAワールド仮説(4)4) F. H. Crick: J. Mol. Biol., 38, 367 (1968).とも相まってRNAに対する概念が変わっていった.そのRNAの解析方法としては,1980年代からX線結晶解析や核磁気共鳴解析を用いた構造生物学的手法が,そして1990年代後半から質量分析法を利用した解析法が導入され,RNAを生体内のあるがままの状態で解析する直接解析法によってヌクレオシド,ヌクレオチド,またはオリゴヌクレオチド解析が行われるようになった.これらの直接解析によって,tRNAやrRNAの転写後修飾も含めた詳細な化学構造が決定された.また,構造生物学的方法では,2000年にトマス・スタイツらによって,RNAとタンパク質の巨大な複合体である細菌由来のリボソームの立体構造が解明された(5,6)5) N. Ban, P. Nissen, J. Hansen, P. B. Moore & T. A. Steitz: Science, 289, 905 (2000).6) B. T. Wimberly, D. E. Brodersen, W. M. Clemons Jr., R. J. Morgan-Warren, A. P. Carter, C. Vonrhein, T. Hartsch & V. Ramakrishnan: Nature, 407, 327 (2000)..このリボソームの解析は,RNA–タンパク質(リボヌクレオプロテイン:RNP)複合体の直接解析という意味では最終到達点の一つと言える.しかし,これらはいずれも細胞内での存在量が非常に多いRNAの解析であったと同時に,これらに要した労力と時間を考えると,これまでの直接解析法は,より存在量が少なくかつより多様性に富んだほかのRNAの解析に適用するには,極めて多くの困難が伴うことになる.そのことによって,より存在量が少なく多様性に富んだRNAの解析は,逆転写酵素とPCR法に基づいたDNAの高速シークエンサーを用いた間接的な解析法によって取って代わられることになる.この方法は極めて強力であり,mRNAだけでなくmicro RNA(miRNA)やゲノムのほぼ全領域から転写されるほかの長鎖非翻訳RNA(long RNA)などを含む微量なnon-coding RNA(ncRNA)の大規模なRNA解析を容易とし,最近では,ほぼすべてのRNA解析は,この間接的な方法で行われるまでになったと言っても過言ではない.この強力な解析法は,多くの新たな知見を得ることに役立てられ,近年の生命科学の発展に大きく貢献したことは間違いのない事実である.しかし,この方法には,RNAを生体内で働く状態で見ることができないという間接的解析法であるがゆえの限界がある.そこで,ここでは,RNAとタンパク質の生体内でのあるがままの状態で解析するという原点に立ち返って,RNAとタンパク質が織りなす機能形態としてのRNP複合体の解析について概説したい.

RNP複合体解析の現状

1. タンパク質に結合するRNAの同定法

RNP複合体の直接解析について述べる前に,まずは現在行われているRNP複合体解析の主な手法について見てみたい.RNP複合体解析にまず必要なのはどのタンパク質がどのRNAに結合しているかを同定することである.今まではこの目的には,RNA結合タンパク質をbait(釣り餌)として,これに結合するRNAを回収して同定するという方法が使われてきた.この場合,RNA結合タンパク質は,RNAのほかに,RNAに結合する特性をもつ複数のタンパク質とも結合する.このため,単一のタンパク質を標的とし,複合体を回収したとしても,複数のRNAと複数のRNA結合タンパク質が含まれ,実際に標的タンパク質がどのRNAと直接的に結合しているかはわからない.そこで,細胞へのUV照射によってRNAとタンパク質を細胞内で架橋し,標的のタンパク質と直接的に結合するRNAを回収するUV-CLIP(UV架橋免疫沈降)法が使われることになる(7)7) J. Ule, K. B. Jensen, M. Ruggiu, A. Mele, A. Ule & R. B. Darnell: Science, 302, 1212 (2003)..そして,この方法と高速シークエンサーを組み合わせることで,RNA結合タンパク質に直接結合したRNAの大規模な同定が可能となった[(high-throughput sequencing)HITS–CLIP](8)8) D. D. Licatalosi, A. Mele, J. J. Fak, J. Ule, M. Kayikci, S. W. Chi, T. A. Clark, A. C. Schweitzer, J. E. Blume, X. Wang et al.: Nature, 456, 464 (2008)..さらに,HITS-CLIPを改良し,より架橋効率の良い手法として開発されたのが,Photoactivatable-Ribonucleoside-Enhanced(PAR)-CLIP(9)9) A. C. Jungkamp et al.: Cell, 141, 129 (2010).とiCLIP(10)10) J. König, K. Zarnack, G. Rot, T. Curk, M. Kayikci, B. Zupan, D. J. Turner, N. M. Luscombe & J. Ule: Nat. Struct. Mol. Biol., 17, 909 (2010).である.PAR-CLIPは,4-thiouridine(4-SU)あるいは6-thioguanosine(6-SG)などの光励起性リボヌクレオシド類似体を細胞内でRNAに取り込ませ,365 nm波長のUV照射で架橋を行った後,標的タンパク質に結合したRNAを単離して,高速シークエンサーで同定するという手法である(図1A図1■PAR-CLIP法,PA-m6A-seqの概略図).この方法では架橋効率が上がるだけでなく,UV照射を受けた4–SUと6–SGが逆転写反応時にT→C,G→Aへと変換された状態で検出されるので,高速シークエンサーでの分析の際に,タンパク質と結合するRNAの箇所に塩基の変換が検出されることになる.これによりRNAのどの塩基でタンパク質と結合しているかが同定できる.これらの手法はRNA結合タンパク質の解析に用いられ,現在ではRNA結合タンパク質に結合するRNA解析の常套手段となっている.UV照射によりRNAとタンパク質を架橋させる方法は,当初mRNAを標的とした手法として開発されたが(7)7) J. Ule, K. B. Jensen, M. Ruggiu, A. Mele, A. Ule & R. B. Darnell: Science, 302, 1212 (2003).,その後,核小体低分子RNA(snoRNA)結合タンパク質であるNop1,Nop56,Nop58,Rrp9とU3 snoRNAとの結合部位の特定や(11)11) S. Granneman, G. Kudla, E. Petfalski & D. Tollervey: Proc. Natl. Acad. Sci. USA, 106, 9613 (2009).,ArgonautとmicroRNAの結合部位の特定(12)12) S. W. Chi, J. B. Zang, A. Mele & R. B. Darnell: Nature, 460, 479 (2009).などncRNAにも適応され,RNAの大きさにかかわらず,応用可能な方法である.また,これまでに報告されたHITS-CLIP,PAR-CLIP,iCLIPの結果はデータベース化され,RNA結合タンパク質と結合するRNAや,RNAに結合したRNA結合タンパク質は,結合部位も含め,このデータベースでそれぞれの側から容易に検索できる(13)13) Y. C. Yang, C. Di, B. Hu, M. Zhou, Y. Liu, N. Song, Y. Li, J. Umetsu & Z. J. Lu: BMC Genomics, 16, 51 (2015).

図1■PAR-CLIP法,PA-m6A-seqの概略図

(A)PAR-CLIP法の概略図:1)4-SUを取り込んだRNP複合体をUV照射で架橋する.2)免疫沈降で精製しRNaseにより断片化し5′端,3′端にadaptorを付加させる.3)電気泳動で分離したオリゴヌクレオチド–タンパク質をProtease Kで分解し,オリゴヌクレオチドのみ単離する.4)オリゴヌクレオチドの5′端,3′端にadaptorを付加後,逆転写反応によりcDNAを合成し,高速シークエンサーで塩基配列を決定する.(B)PA-m6A-seqの概略図:1)4-SUを取り込んだRNAをoligo(dT)カラムで精製する.2)抗m6A抗体で免疫沈降し,UV照射でクロスリンクスする.3)RNase T1により断片化し5′端,3′端にadaptorを付加させる.電気泳動で分離した後,抗体をProtease Kで分解し,オリゴヌクレオチドのみを単離する.逆転写反応によりcDNAを合成し,高速シークエンサーで解析する.

2. RNAの転写後修飾解析法

次にRNP複合体解析に必要とされるのは転写後修飾の解析である.RNAの転写後修飾としては,古くは真核生物mRNAの5′cap修飾(14)14) Y. Furuichi Y et al.: Nature, 253, 374 (1975).,tRNAのアンチコドン部のwobble base修飾,rRNAの擬ウリジン修飾をはじめとして,これまでに100種類以上のRNA修飾が見いだされ,たとえば,tRNAでは93種類,rRNAでは31種類,mRNAでは13種類見いだされている(15,16)15) J. Rozenski et al.: Nucleic Acids Res., 27 (Database issue), 196 (1999). 16) A. Czerwoniec, S. Dunin-Horkawicz, E. Purta, K. H. Kaminska, J. M. Kasprzak, J. M. Bujnicki, H. Grosjean & K. Rother: Nucleic Acids Res., 37(Database), D118 (2009)..ここでは,最近,特に注目を集めている転写後修飾であるアデニンのN6-methyl化(m6A)の解析法について触れておきたい.この修飾は,真核生物のmRNAやncRNAで多く見られ,それらの安定性や分解などのRNA代謝に深く関与している.このm6Aのゲノムワイドな解析手法としては,m6A-seq法(17)17) D. Dominissini, S. Moshitch-Moshkovitz, S. Schwartz, M. Salmon-Divon, L. Ungar, S. Osenberg, K. Cesarkas, J. Jacob-Hirsch, N. Amariglio, M. Kupiec et al.: Nature, 485, 201 (2012).とそれを改変したPA-m6A-seq法がある(18)18) K. Chen, Z. Lu, X. Wang, Y. Fu, G. Z. Luo, N. Liu, D. Han, D. Dominissini, Q. Dai, T. Pan et al.: Angew. Chem. Int. Ed. Engl., 54, 1587 (2015)..前者は架橋操作を除いてほぼ同じなのでPA-m6A-seq法について述べるが,この方法では,まず上述のPAR-CLIP同様,光励起性リボヌクレオシド類似体である4-SUを細胞に取り込ませ,oligo(dT)を用いてmRNAを回収し(mRNA内のm6A解析の場合),抗m6A抗体で免疫沈降する.次に,免疫沈降したm6Aを含むRNAを365 nm波長のUV照射で架橋し,RNase T1で断片化したm6Aを含むオリゴヌクレオチドを回収・解析することでm6A修飾をもつmRNAをゲノムワイドで解析する(図1B図1■PAR-CLIP法,PA-m6A-seqの概略図).m6A-seqとPA-m6A-seqは,細胞内量の少ないmRNAのm6A修飾を特定できるという点においては優れた方法である.一方でこのような手法は,m6A修飾の場合,これに対する抗体があることで始めて分析可能となる解析方法であり,特異性の高い抗体がなければそのほかのRNA修飾解析には適応できないという問題点が挙げられる.このほかのRNAの転写後修飾の解析法として,bisulfide sequencing法を用いたRNAの5-methylcytosine(5 mC)修飾解析法(19)19) E. Jeffrey et al.: Nucleic Acids Res., 40, 5023 (2012).が挙げられるが,これもまた,特定の修飾を標的とした解析法である.ほかの方法として,RNAをNuclease P1で断片し,リン酸基を除いてヌクレオシドの状態にし,修飾を含むヌクレオシドとして分析するヌクレオシド解析法(20,21)20) P. F. Crain: Methods Enzymol., 193, 782 (1990).21) S. C. Pomerantz & J. A. McCloskey: Methods Enzymol., 193, 796 (1990).,RNaseT1,RNaseAなど種々の部位特異的なRNaseで断片化するが修飾があった場合に切断に抵抗性が生じることを利用し分析するオリゴヌクレオチド解析法(22)22) M. Taoka, Y. Yamauchi, Y. Nobe, S. Masaki, H. Nakayama, H. Ishikawa, N. Takahashi & T. Isobe: Nucleic Acids Res., 37, e140 (2009).,tRNAやsiRNAなどのサイズのRNAを消化せずに完全長のRNAをそのまま分析する方法(23,24)23) M. Taucher & K. Breuker: Angew. Chem., 51, 11289 (2012).24) H. Nakayama. et al.: Anal. Chem., PMID, 25662820 (2015).が挙げられる.

機能プロテオミクスからリボヌクレオプロテオミクスによるRNP複合体解析へ

先に触れたように,生体内ではタンパク質は単独ではなく,複数のタンパク質と複合体を形成して働くため,この複合体を単離し,その構成タンパク質を質量分析法で同定することを目的とした機能プロテオミクスという分野が発達してきた.この機能プロテオミクスで使われるタンパク質複合体単離法としては,1種類のbait(釣り餌)タンパク質にタグとTEVプロテアーゼによる切断配列を融合させ,プロテアーゼによる切断と親和性クロマトグラフィーあるいは免疫沈降を組み合わせて2段階で精製を行うTEV法,2種類のタグを異なるbaitタンパク質にそれぞれ付加し2段階の精製操作を行うダブルタグ法,複合体の形成段階にかかわるタンパク質を次々とbaitとして用いるリバースタグギング法などがある.初期の機能プロテオミクスでは,これらによって単離したタンパク質複合体を,一次元,または二次元電気泳動ゲル上で構成タンパク質へと分離後,染色されたそれぞれのタンパク質を切り出しゲル内でペプチドに分解し,ゲルから抽出されたペプチドをMALDI-TOF/MSなどで分析するペプチドマップ法が使われていた.しかし,微量なペプチドの分離法として微流量の高速液体クロマトグラフィー(nano-LC)が発達し,これとESI法によるイオン化と質量分析法を組み合わせたnano-LC-MS,そして,ペプチドイオンをさらに断片化して質量値を測定するタンデム質量分析法(MS/MS)を組み合わせたnano-LC-MS/MSが一般化され,タンパク質複合体の構成成分の分離操作を行うことなく複合体を丸ごとペプチドまで分解し解析するショットガン法が進歩し,その解析は飛躍的に容易になった(2)2) A. S. Deshmukh et al.: Mol. Cell Proteomics, pii: mcp.M114.044222 (2015).

筆者らの研究グループではこれまで,上記の機能プロテオミクスの手法を使い,ヒトのリボソーム生合成にかかわる数十種のタンパク質をbaitとしたリバースタギング法でのリボソーム前駆体の単離を行い,ショットガン法を適用することで300種以上のリボソーム生合成にかかわるタンパク質の同定と,生合成段階に安定的に存在する少なくとも5種類のリボソーム前駆体の同定に成功してきた.特にリボソーム合成過程に形成される複合体は,40Sから90Sの沈降係数をもつほどの巨大複合体で,これらの複合体の構成成分は300~400種類にもなり,質量分析を基礎とする機能プロテオミクスの手法なくしてはその解析は不可能であったと言える(25)25) H. Yoshikawa et al.: Mol. Cell Proteomics, 10, M110.006148 (2011)..一方で,この解析を通して,RNP複合体であるリボソーム前駆体には何百ものsmall nucleolar RNA(snoRNA)が含まれ,さらにrRNA前駆体も多くの転写後修飾を受けているにもかかわらず,これらを無視した解析を行わざるを得ないことを思い知らされる.すなわち,ヒトのリボソーム生合成にかかわるsnoRNAの種類や,その過程でsnoRNAとrRNA前駆体が受ける転写後修飾についての情報は機能プロテオミクスの手法では全く得られないということである.酵母菌や細菌に比べ,ヒトのリボソーム生合成過程ははるかに複雑で,ヒトの細胞に固有のsnoRNAがかかわりrRNA前駆体の転写後修飾も異なりより複雑な制御が行われていることは明白であった.しかし,これらsnoRNAの種類や転写後修飾に関する情報は,かつて酵母菌や細菌のリボソーム生合成の解析から得られた知見とその類似性という観点からなぞる形でしか得られなかったのである.

これらのわれわれの経験に加え,snoRNAやrRNA前駆体だけでなく,RNAのスプライシングに関与するsmall nuclear RNA(snRNA),そしてmiRNAやpiRNA,XistやNEAT1などのlong RNA,あるいは多様な非翻訳RNA(ncRNA)の存在が明らかになり,それらの多くがタンパク質と複合体を形成して機能することも明らかになった.しかし,相変わらずRNP複合体のタンパク質は直接解析されるが,RNAは間接的な手法でのみ解析されているという状況は変わらなかった.そればかりか,miRNAやsnRNAなどを含むncRNAに関する報告は,ヒトゲノム計画の完了と,次世代型の高速シークエンサーの開発とも相まって2004年以降増加の一途をたどり,miRNAに関する報告だけでも2014年は8,000報を超えるなど日増しに増加している(図2図2■Non coding RNAに関する投稿論文数の推移(上)と,tRNA,rRNA,sn/snoRNA,miRNAに関する投稿論文数の推移(下)).ncRNAを中心としたRNA研究は,今後ますますタンパク質とのかかわりのうえで機能を理解する必要性が増していくと予想される.このような背景から,われわれは,RNP複合体中のタンパク質だけでなくRNAについても生体内に存在するままの状態を質量分析法により直接解析するための技術開発を試みてきた.

図2■Non coding RNAに関する投稿論文数の推移(上)と,tRNA,rRNA,sn/snoRNA,miRNAに関する投稿論文数の推移(下)

質量分析法を用いたRNAの直接解析

従来から質量分析法はRNA解析に用いられていたが,そのほぼすべての場合においては特定されたRNAの転写後修飾を解析することが目的であった.それは,RNAはわずか4種類のヌクレオチドの組み合わせからなる塩基配列をもつために,一つのオリゴヌクレオチドの質量分析で得られる塩基配列情報だけでは,ゲノム上の同じ配列をもつ複数の領域に帰属される可能性が高く,それがゲノム上のどの領域でコードされたRNAから由来するかを特定することができなかったためである.これに対し,タンパク質の場合には,20種のアミノ酸の組み合わせからなる配列情報を得ることができるために,質量分析から得られるスペクトル情報からだけでも由来するペプチドがゲノム上のどの遺伝子から由来するかを特定することができる.事実,タンパク質解析においては,質量分析によるスペクトル情報からタンパク質を同定するMASCOT(Matrix Science社),Sequest(Thermo Fisher Scientific社),Andromeda(Max Planck Institute)(26)26) J. Cox et al.: J. Proteome Res., 10, 1794 (2011).などの検索ソフトウェアがすでに一般に使われている.一方,RNAについては,先に述べた理由から,こうしたデータベース検索ソフトウェアすら存在せず,RNAの質量分析によるスペクトル情報からRNAを同定することは困難であると考えられていた.

そういった背景のなかで,2009年に,RNAの質量分析情報から同定を行う検索ソフトウェアが2つのグループからほぼ同時に報告された.一つは,南デンマーク大学のKirpekarらの研究グループによるRRM(27)27) R. Matthiesen & F. Kirpekar: Nucleic Acids Res., 37, e48 (2009).と呼ばれる検索ソフトウェアである.RRMは得られたオリゴヌクレオチドのMSデータセットをゲノム上やRNAデータベース上にマッピングし評価するため,従来のタンパク質解析でいうと,ペプチドマスフィンガープリンティング(PMF)法に相当する.もう一つは,理化学研究所の中山/首都大学東京の礒辺らの研究グループによって開発されたAriadne(28)28) H. Nakayama, M. Akiyama, M. Taoka, Y. Yamauchi, Y. Nobe, H. Ishikawa, N. Takahashi & T. Isobe: Nucleic Acids Res., 37, e47 (2009).である.AriadneはMS/MSデータの解析に対応しているため,オリゴヌクレオチドの塩基配列を特定でき,加えて,ゲノム上にマッピングしたオリゴヌクレオチドセットの密度を評価する2段階目のパラメーターを用いてRNAのゲノム上での非予見的同定を可能にしている.こちらは,配列の解析という観点からたとえて言うならば,従来のタンパク質解析のMS/MSイオンサーチに対比できるかもしれない.さらに,AriadneはMS/MS解析データを用いいくつかの転写後修飾の同定も可能としている.これらのほかにも,OMA & OPA(29)29) A. Nyakas, L. C. Blum, S. R. Stucki, J. L. Reymond & S. Schürch: J. Am. Soc., Mass Spectrom., 24, 249 (2013).やRoboOligo(30)30) P. J. Sample: “RoboOligo,” Software for RNA-based Data Analysis, The Ohio State University, https://u.osu.edu/paulsample/robooligo/などのRNAのMS/MS解析データに対応した検索ソフトウェアの開発も進められているが,Ariadneは質量分析情報からRNAのゲノムワイドな非予見的同定とその転写後修飾の同定までを一度の解析で可能とする現存する唯一の検索ソフトウェアと言える.新たな検索ソフトウェアの開発が世界中で進められつつあることから,今後は質量分析によるRNA解析を行う研究者にとっては多くの選択肢が与えられ,その解析の環境がより整っていくことが期待される.

RNP複合体の直接的トータル解析

前章で述べたような質量分析法の進歩とAriadneの開発は,RNAの非予見的な直接解析を可能とした.ここでは実際にRNP複合体の直接解析がどのように行われるのかを述べたい.精製されたRNP複合体は,まずタンパク質とRNAに分離される.タンパク質は,LC-MS/MSを用いて,従来のプロテオミクスの手法に沿って行う.タンパク質の同定法と翻訳後修飾の解析に関してはすでに多くの実験書や解説書があるのでここでは触れない.問題はRNAの解析である.複数のRNA種が混在するようであれば,HPLCで分離してからRNaseで消化するか(31)31) Y. Yamauchi, M. Taoka, Y. Nobe, K. Izumikawa, N. Takahashi, H. Nakayama & T. Isobe: J. Chromatogr. A, 1312, 87 (2013).,変性UREA-PAGEなどで分離し,SYBR goldなどで染色後,目的とする染色ゲルバンドを切り出し,In-gel digestion法を用いてRNaseでオリゴヌクレオチドに消化してからLC-MS/MS解析を行う(22,32)22) M. Taoka, Y. Yamauchi, Y. Nobe, S. Masaki, H. Nakayama, H. Ishikawa, N. Takahashi & T. Isobe: Nucleic Acids Res., 37, e140 (2009).32) M. Taoka, M. Ikumi, H. Nakayama, S. Masaki, R. Matsuda, Y. Nobe, Y. Yamauchi, J. Takeda, N. Takahashi & T. Isobe: Anal. Chem., 82, 7795 (2010).図3図3■RNA–タンパク質(RNP)複合体のトータル解析の手順).このように実験手順としては非常に単純であり,従来のタンパク質解析と同等の方法論で解析が可能となる.

図3■RNA–タンパク質(RNP)複合体のトータル解析の手順

細胞,組織内から精製したRNP複合体からタンパク質,RNAをそれぞれ単離する.タンパク質はプロテアーゼで分解し,ペプチドセットを質量分析(MS/MS)する.Mascot,Sequest,Andromedaなどによりタンパク質の同定,および翻訳後修飾を解析する.RNAはRNaseで分解し,断片化したオリゴヌクレオチドセットを質量分析(MS/MS)する.得られた質量スペクトルをAriadneで塩基配列の決定とゲノム上へのマッピング解析し,RNAおよびその転写後修飾を同定する.

次に,この方法でRNP複合体を解析した例を紹介したい.まず,RNP複合体を単離し,そのタンパク質成分とRNA成分を非予見的に同定した例としては,酵母菌のスプライセオソームの構成成分の一つであるLsm3をBaitとして単離したRNP複合体の30種のタンパク質と4種類のsnRNAsを同定したものがある(22)22) M. Taoka, Y. Yamauchi, Y. Nobe, S. Masaki, H. Nakayama, H. Ishikawa, N. Takahashi & T. Isobe: Nucleic Acids Res., 37, e140 (2009)..ただ,この例についてはすでに別の総説に紹介されているので,詳細については原著論文あるいはそちらを参照されたい.ここでは,ある標的タンパク質に結合するRNP複合体から単離したRNAの転写後修飾も含めた解析例を紹介したい.この例では,単離したRNP複合体を変性UREA-PAGEで分離し,In-gel digestion法によりRNase T1で消化したのち,LC-MS/MS分析を行い,その質量データを使ってAriadneで検索した.この場合,結合してきたRNAから得られた質量分析のデータから9種類のオリゴヌクレオチドの塩基配列を決定し,それらのゲノム上のマッピングからミトコンドリア(mt-)tRNAGlnであることが判明した.Ariadneによる修飾解析から,mt-tRNAGlnには複数の修飾が検出されたが,なかでも同定したオリゴヌクレオチドの一つ30-AAUUUUG-36には,34番目のウリジンが5-タウリノメチル2-チオ化修飾(tm5s2U)を受け,AAUU(tm5s2U)UGであることが明らかとなった.さらに解析すると,LCで分離された同じAAUUUUGには,34番目のウリジンがtm5s2Uの修飾中間体である2-チオウリジン(s2U)をもつAAUU(s2U)UGや,未修飾のAAUUUUGが検出された.これらの分子種のイオン化効率が一定であると仮定し,質量分析によるスペクトル比からその存在比を換算すると,tm5s2U : s2U : U=5 : 5 : 1であった(図4図4■LC-MS-Ariadneによるウリジンの修飾解析).mt-tRNAGlnが転写されてから成熟する過程においては,順次s2Uからtm5s2Uへと翻訳後修飾が進行することから,この結果は,この標的タンパク質が転写されたばかりの未修飾の分子種,中間体であるs2Uをもつ分子種,そして成熟したtm5s2Uをもつ分子種への移行過程のすべてで結合していることを示している.この解析のように,質量分析とAriadneによるデータベース解析は,RNAの修飾の種類とその存在割合という情報の提供を可能とする.今後,質量分析によるRNA修飾の解析は,RNP複合体の生合成過程の解析だけでなく,RNA修飾を標的とする疾患の判定あるいは代謝状態の判定できる指標などに応用できるのではないかと考えられる.

図4■LC-MS-Ariadneによるウリジンの修飾解析

修飾を受けたAAUUUUGオリゴヌクレオチドをLCで分離し,質量分析計により溶離液をそれぞれのイオンの質量値で検出した.(A)5-タウリノメチル-2-チオウリジン,(B)2-チオウリジン,(C)ウリジンのクロマトグラム

新規U snRNA代謝経路の存在

本総説で述べたRNP複合体の直接的トータル解析の有効性を示す例として,最後にスプライセオソームを構成するU snRNP複合体の生合成の過程で,今まで知られていない品質管理経路が存在することを見いだした例について少し詳しく触れたい.U snRNAはpre-mRNAのスプライシング反応にかかわる重要なncRNAであり,従来の報告(33)33) R. A. Sauterer, R. J. Feeney & G. W. Zieve: Exp. Cell Res., 176, 344 (1988).においては比較的半減期が長く,安定的に存在するRNAとして知られていた.その生合成に関しては,脊髄性筋萎縮症(Spinal motor atrophy; SMA)の原因遺伝子産物であるSurvival of motor neuron 1 protein(SMNタンパク質)が関与することが発見され,以来,精力的な解析によって,その全容が明らかにされつつある(34)34) D. J. Battle, M. Kasim, J. Yong, F. Lotti, C. K. Lau, J. Mouaikel, Z. Zhang, K. Han, L. Wan & G. Dreyfuss: Cold Spring Harb. Symp. Quant. Biol., 71, 313 (2006)..しかしながら,生合成過程における品質管理機構の存在については長い間詳細な解析がなされていなかった.

U1 snRNPの生合成の中間段階でSMNタンパク質に結合するU snRNAについて,質量分析法を用いたRNA修飾解析を行ったところ,新規のU1 snRNA分子種(U1-tfs)が発見された.このU1-tfsは通常のU1 snRNAより3′末端側で40塩基ほど短く,Smタンパク質を結合するSmサイトと呼ばれる領域以降が存在しないこと,そして5′キャップ近傍の構造が通常のU1 snRNAの前駆体型・成熟型いずれとも異なり,モノメチル化キャップ(m7G)ではあるが最初に転写されるアデノシンの塩基部分にメチル化修飾(mA)を受けていることが明らかとなった(35)35) H. Ishikawa, Y. Nobe, K. Izumikawa, H. Yoshikawa, N. Miyazawa, G. Terukina, N. Kurokawa, M. Taoka, Y. Yamauchi, H. Nakayama et al.: Nucleic Acids Res., 42, 2708 (2014)..従来知られていたU1 snRNAとU1-tfsの構造の違いをまとめたものを図に示す(図5図5■U1 snRNAとU1-tfsの構造比較図).

図5■U1 snRNAとU1-tfsの構造比較図

U1 snRNAの生合成は,核内での転写に始まり,細胞質への輸送,Smタンパク質との会合,それを契機としたキャップのトリメチル化,トリメチル化の認識による核への再輸送,核内での最終成熟という過程を経てなされる.この生合成過程においてU1-tfsがどの過程の中で生じた分子種であるかが解析された.その結果,U1-tfsは従来から知られている生合成段階のうち細胞質側の初期段階にしか存在せず,Smサイトを欠損しているためSmタンパク質との会合ができず,正常な生合成プロセスに進むことができずに細胞質にとどまることが明らかになった.また,U1-tfsは細胞質のRNAの分解・貯蔵の場所として知られているP-bodyに局在し,成熟できないU1-tfsがP-bodyで分解されることも明らかとなった(図5図5■U1 snRNAとU1-tfsの構造比較図).すなわち,U1-tfsの同定が,生合成段階における異常なU1 snRNAはU1-tfsという分子種を介してP-bodyへと運ばれ,そこで分解されるという経路の発見に結びついた.質量分析法を用いたRNAの転写後修飾解析の有用性を示す好例であると言える.

U1-tfsで発見されたmAはm6Aであると考えられているが,mRNAの場合,m6A修飾は細胞機能を調整する際に厳密に制御されている.たとえば,細胞を再プログラミング化し多能性幹細胞を作製する過程でm6A修飾を担うMETTL3は,m6A修飾を受けるmRNAと相補性をもつmiRNAによってリクルートされる(36)36) T. Chen et al.: Cell Stem Cell., pii: S1934-5909(15)00017-X doi: 10.1016/j.stem. (2015)..このことからもRNAの転写後修飾は部位特異的に厳密に制御されている可能性が高いと考えられ,U1-tfsで見いだされたmAがm6Aであるのか,その場合,U1-tfsが品質管理経路に入るための目印として働いているのか,どの段階でmA修飾が行われるのかなど,今後明らかにするべき興味深い問題点が浮上している.

おわりに

これまでのRNP複合体解析では,タンパク質はタンパク質の側から直接的に,RNAはRNAの側からいったんDNAに変換され間接的に,と別個に解析されてきた.しかし,生体内ではタンパク質とRNAはお互いが相互作用しそれぞれが翻訳後修飾,転写後修飾を受けRNP複合体として一体になって働いている.RNAの転写後修飾の解析については,間接的な方法で解析する手段も開発されてきたが,修飾RNAが逆転写反応の効率に影響を及ぼすこと,転写後修飾に応じた個別方法を用いる必要があることなど,多くの問題点が残されている.したがって,これらを生体内に存在するままの状態で同じ次元で解析する手段の開発が必要とされていた.このような状況下で,本総説で述べたように,質量分析法を用いてRNAを直接的に解析する方法が開発された.このRNAの直接解析法は,従来からの間接的方法を補うことができ,今までの間接的解析法では得られない情報が得られるようになった.この方法がさらに威力を発揮するためには,微量なRNAの解析に対応するべく高感度化すること,そして,タンパク質とRNAの結合部位を架橋した場合,その架橋部位のペプチド-オリゴヌクレオチドを同定するための解析ソフトを開発すること,などが必要とされている.今後の研究の発展により質量分析法を用いた方法が,mRNAやlong RNAなど細胞内の微量なRNAの直接解析にも適用できるようになり,生体内の新たな機能の解明につながることを期待したい.

Reference

1) J. I. Harris, M. A. Naughton & F. Sanger: Arch. Biochem. Biophys., 65, 427 (1956).

2) A. S. Deshmukh et al.: Mol. Cell Proteomics, pii: mcp.M114.044222 (2015).

3) A. C. Gavin, P. Aloy, P. Grandi, R. Krause, M. Boesche, M. Marzioch, C. Rau, L. J. Jensen, S. Bastuck, B. Dümpelfeld et al.: Nature, 440, 631 (2006).

4) F. H. Crick: J. Mol. Biol., 38, 367 (1968).

5) N. Ban, P. Nissen, J. Hansen, P. B. Moore & T. A. Steitz: Science, 289, 905 (2000).

6) B. T. Wimberly, D. E. Brodersen, W. M. Clemons Jr., R. J. Morgan-Warren, A. P. Carter, C. Vonrhein, T. Hartsch & V. Ramakrishnan: Nature, 407, 327 (2000).

7) J. Ule, K. B. Jensen, M. Ruggiu, A. Mele, A. Ule & R. B. Darnell: Science, 302, 1212 (2003).

8) D. D. Licatalosi, A. Mele, J. J. Fak, J. Ule, M. Kayikci, S. W. Chi, T. A. Clark, A. C. Schweitzer, J. E. Blume, X. Wang et al.: Nature, 456, 464 (2008).

9) A. C. Jungkamp et al.: Cell, 141, 129 (2010).

10) J. König, K. Zarnack, G. Rot, T. Curk, M. Kayikci, B. Zupan, D. J. Turner, N. M. Luscombe & J. Ule: Nat. Struct. Mol. Biol., 17, 909 (2010).

11) S. Granneman, G. Kudla, E. Petfalski & D. Tollervey: Proc. Natl. Acad. Sci. USA, 106, 9613 (2009).

12) S. W. Chi, J. B. Zang, A. Mele & R. B. Darnell: Nature, 460, 479 (2009).

13) Y. C. Yang, C. Di, B. Hu, M. Zhou, Y. Liu, N. Song, Y. Li, J. Umetsu & Z. J. Lu: BMC Genomics, 16, 51 (2015).

14) Y. Furuichi Y et al.: Nature, 253, 374 (1975).

15) J. Rozenski et al.: Nucleic Acids Res., 27 (Database issue), 196 (1999).

16) A. Czerwoniec, S. Dunin-Horkawicz, E. Purta, K. H. Kaminska, J. M. Kasprzak, J. M. Bujnicki, H. Grosjean & K. Rother: Nucleic Acids Res., 37(Database), D118 (2009).

17) D. Dominissini, S. Moshitch-Moshkovitz, S. Schwartz, M. Salmon-Divon, L. Ungar, S. Osenberg, K. Cesarkas, J. Jacob-Hirsch, N. Amariglio, M. Kupiec et al.: Nature, 485, 201 (2012).

18) K. Chen, Z. Lu, X. Wang, Y. Fu, G. Z. Luo, N. Liu, D. Han, D. Dominissini, Q. Dai, T. Pan et al.: Angew. Chem. Int. Ed. Engl., 54, 1587 (2015).

19) E. Jeffrey et al.: Nucleic Acids Res., 40, 5023 (2012).

20) P. F. Crain: Methods Enzymol., 193, 782 (1990).

21) S. C. Pomerantz & J. A. McCloskey: Methods Enzymol., 193, 796 (1990).

22) M. Taoka, Y. Yamauchi, Y. Nobe, S. Masaki, H. Nakayama, H. Ishikawa, N. Takahashi & T. Isobe: Nucleic Acids Res., 37, e140 (2009).

23) M. Taucher & K. Breuker: Angew. Chem., 51, 11289 (2012).

24) H. Nakayama. et al.: Anal. Chem., PMID, 25662820 (2015).

25) H. Yoshikawa et al.: Mol. Cell Proteomics, 10, M110.006148 (2011).

26) J. Cox et al.: J. Proteome Res., 10, 1794 (2011).

27) R. Matthiesen & F. Kirpekar: Nucleic Acids Res., 37, e48 (2009).

28) H. Nakayama, M. Akiyama, M. Taoka, Y. Yamauchi, Y. Nobe, H. Ishikawa, N. Takahashi & T. Isobe: Nucleic Acids Res., 37, e47 (2009).

29) A. Nyakas, L. C. Blum, S. R. Stucki, J. L. Reymond & S. Schürch: J. Am. Soc., Mass Spectrom., 24, 249 (2013).

30) P. J. Sample: “RoboOligo,” Software for RNA-based Data Analysis, The Ohio State University, https://u.osu.edu/paulsample/robooligo/

31) Y. Yamauchi, M. Taoka, Y. Nobe, K. Izumikawa, N. Takahashi, H. Nakayama & T. Isobe: J. Chromatogr. A, 1312, 87 (2013).

32) M. Taoka, M. Ikumi, H. Nakayama, S. Masaki, R. Matsuda, Y. Nobe, Y. Yamauchi, J. Takeda, N. Takahashi & T. Isobe: Anal. Chem., 82, 7795 (2010).

33) R. A. Sauterer, R. J. Feeney & G. W. Zieve: Exp. Cell Res., 176, 344 (1988).

34) D. J. Battle, M. Kasim, J. Yong, F. Lotti, C. K. Lau, J. Mouaikel, Z. Zhang, K. Han, L. Wan & G. Dreyfuss: Cold Spring Harb. Symp. Quant. Biol., 71, 313 (2006).

35) H. Ishikawa, Y. Nobe, K. Izumikawa, H. Yoshikawa, N. Miyazawa, G. Terukina, N. Kurokawa, M. Taoka, Y. Yamauchi, H. Nakayama et al.: Nucleic Acids Res., 42, 2708 (2014).

36) T. Chen et al.: Cell Stem Cell., pii: S1934-5909(15)00017-X doi: 10.1016/j.stem. (2015).