Kagaku to Seibutsu 54(03): 151-153 (2016)
今日の話題
生体内の低分子代謝産物を網羅的に捉えるための新技術MS-DIALプログラムによる次世代MS/MS解析
Published: 2016-02-20
© 2016 Japan Society for Bioscience, Biotechnology, and Agrochemistry
© 2016 公益社団法人日本農芸化学会
ゲノミクス,プロテオミクスに続く第三のオミクスとして,メタボロミクスが知られるようになった.しかし,質量分析計によるデータは,網羅性の観点からはオミクスと言い切れない弱みがある.それはすべてのMS/MSスペクトルを取得できないという技術的制約である.タンパク質や二次代謝物のように複雑な分子を同定するには,クロマトグラフィーの保持時間,精密質量,同位体比の情報だけでは不十分で,部分構造の手がかりを与えるMS/MSスペクトルの取得が必須になる.しかし現在の質量分析計は,走査スピードの限界から,検出されるすべてのMSピークに対してMS/MS分析を実施できない.MS/MSスペクトルを得るには,秒単位で流れる雑多な混合物のなかから特定のイオンだけを質量ウィンドウ(1~3 Da幅)で選択・分解し,その結果を質量分析するからである.検出されるすべてのピークに対してこれを実施するのが至難なことは,容易に想像がつく.
そこで従来のLC-MS/MSメタボロミクスでは,測定対象を数百以下に限定してMS/MSスペクトルの一部のみを確認するMRM(Multiple Reaction Monitoring)分析,もしくはイオン強度の大きいピークのみからMS/MSスペクトルを取得するDDA(Data Dependent MS/MS Acquisition)分析が実施されてきた(1)1) M. A. Gillette & S. A. Carr: Nat. Methods, 10, 28 (2013)..しかしこれらの手法は,クロマトグラフィーで分離できる数千ものピークのうち,1割にも満たない部分のMS/MSしか計測していない.これでは網羅的とは言いがたい.さらに深刻な問題点は,この選択性あるいは恣意性が分析結果を再利用しにくくする点だろう.たとえば興味深い生体サンプルから得られたMS/MS分析データが公開されているとする.しかしそこに自分が知りたい代謝物情報が記録されている可能性は低い.なぜなら分析者によって解析したい化合物は異なるし(たとえばMRMの対象外),ピークの強度もサンプルごとに異なる(たとえばDDAで選ばれない)からである.つまり,同じオミクスでも,網羅性が担保されるトランスクリプトームのデータとは状況が全く異なっている.理由はほかにもあるだろうが,この半網羅性こそ,生体由来代謝物のMS/MSスペクトルを蓄積したデータベースが普及しない主要因ではないだろうか.測定対象がまちまちである限り,研究者同士がお互いの結果に興味をもてないのは当然でもあろう.
最近はDDAに対比させて,DIA(Data Independent MS/MS Acquisition)という分析も実施される(2)2) J. D. Venable, M.-Q. Dong, J. Wohlschlegel, A. Dillin & J. R. Yates III: Nat. Methods, 1, 39 (2004)..この手法は,ある一定の質量範囲に含まれるイオンをすべて一緒にMS/MS分析してしまう.つまり特異性を犠牲にして網羅性を目指す戦略である.なかでもDIA分析の一つであるSWATH法は,たとえば100 Da幅のウィンドウをずらしながら10回MS/MSを取得する作業を繰り返し行い,合計1,000 Da幅に入る全イオンのMS/MSスペクトルを記録する(ウィンドウ幅や取得回数は可変)(3)3) H. L. Röst, G. Rosenberger, P. Navarro, L. Gillet, S. M. Miladinović, O. T. Schubert, W. Wolski, B. C. Collins, J. Malmström, L. Malmström et al.: Nat. Biotechnol., 32, 219 (2014)..複数のイオンをまとめて計測するため,混合スペクトルしか取得できない点がデメリットになる.しかし,クロマトグラフィー結果において親イオンの保持時間が完全に一致する場合は少ないはずである.したがって,各フラグメントイオン量の時間変化と,それらの親(候補)イオン量の時間変化を照合すれば,重なって溶出した代謝物MS/MSスペクトルの各ピークを,それぞれの親に帰属させられるはずである.この作業をデコンボリューションといい,ガスクロマトグラフィー質量分析の分野では実用化されている.今回,筆者らとカリフォルニア大学デイビス校オリバー・フィーン教授らの共同研究チームは,行列を用いた最小2乗法によるデコンボリューション技術をSWATHデータに適用し,LC-MS/MSの分析結果から個々のMS/MSスペクトルを網羅的に抽出できるソフトウェア,MS-DIALを開発した(4)4) H. Tsugawa, T. Cajka, T. Kind, Y. Ma, B. Higgins, K. Ikeda, M. Kanazawa, J. VanderGheynst, O. Fiehn & M. Arita: Nat. Methods, 12, 523 (2015)..
MS-DIALの特徴は使いやすいグラフィカルユーザーインターフェイスと,主要6社の質量分析データ形式を直接読み込んで処理できる柔軟さにある.このソフトウェアをユーグレナ(ミドリムシ)および8種の微細藻類のグリセロ脂質分析に応用した結果を図1図1■脂質分子種に基づいた9生物種の系統分類に示す.グリセロ脂質の有無をフィンガープリントとしてクラスタリングすることで,微細藻類の系統関係を再現できた(メタボロミクスによるケモタクソノミーの実現).
上側は16S rRNA系統解析による系統樹,下側が脂質分子種による分類で両者は一致した.黄色と青色はそれぞれ対象脂質の「検出」と「非検出」を示す(量は問わない).左端のUTEX2341とは分譲株のIDで本株はクロレラ種に属するかナンノクロロプシス種に属するか議論が分かれてきた.今回の結果はクロレラ種に属することを示唆する.
メタボロミクスにおいて代謝物を同定するには,親イオンの保持時間,精密質量,同位体比,MS/MSスペクトルの一致を確認することが重要である.ということは,想定される脂質分子すべてについてそれらの情報を網羅したライブラリーを用意しておかねばならない.幸い標準的なグリセロ脂質はMS/MSスペクトルの理論的予測が可能である.今回は米国側の研究グループが作成したLipidBlastライブラリー(5)5) T. Kind, K. H. Liu, Y. Lee do, B. DeFelice, J. K. Meissen & O. Fiehn: Nat. Methods, 10, 755 (2013).を藻類のガラクト脂質やベタイン脂質に拡張し,膜脂質構成成分に対する理論スペクトル77,962件(陽イオンモード35,608分子,陰イオンモード42,354分子)を用意した.さらに実測した254脂質分子の保持時間をもとに,上記分子の保持時間を機械学習により予測した.このライブラリーを用いて9種の微細藻類から合計1,023種の脂質を検出できた.この総数は同じ装置で同じサンプルをDDA分析した場合に比較しておよそ300も多い(ただしMS/MS解析ではグリセロール骨格に結合する個々の脂肪酸の順序やそれらがもつ二重結合の位置,シス・トランスを特定することはできない.そのため,正確な構造同定はしていない).
内訳を見るとベタイン脂質をもたないのはクロレラだけで,ユーグレナやほかの藻類は合成していること,ユーグレナとナンノクロロプシスがとりわけ多様な超長鎖高度不飽和脂肪酸を含むことがわかった.このソフトウェアやマニュアル,ライブラリー,測定の詳細情報はhttp://prime.psc.riken.jp/のstandalone softwareセクションから自由にダウンロードできるため,是非活用してもらいたい.
今回のグリセロ脂質解析はMS-DIALのデモンストレーションに過ぎない.このソフトウェアをSWATH法と組み合わせた最大の利点は,量の少ない分子種も含め,すべてのMS/MSスペクトルが記録されているところにある.分析の対象としたグリセロ脂質以外,たとえばスフィンゴ脂質やステロール類の有無を調べたい場合,それらのライブラリーをそろえてデータを再解析すればよい.従来のように生体サンプルを再測定する必要はない.本稿を次世代MS/MS解析というタイトルにした理由は,データベースに蓄積する価値のある結果を残せる初めての手法という意味である.今後のメタボロミクスデータベースや解析ソフトウェアの発展に期待していただきたい.