Kagaku to Seibutsu 55(8): 538-546 (2017)
解説
食品分野におけるメタボリック・プロファイリングの活用NMR・MSを用いた包括的な食品成分分析
Application of Metabolic Profiling to Food Science: Comprehensive Analysis of Food Components by NMR and Mass Spectrometry
Published: 2017-07-20
食品は多種多様な物質を含む混合物である.それらが独立して味,食感や香り等々を有しているだけではなく,相互的にかかわっている.また保存や調理過程により,化学反応を起こして新しい物質を生み出し,風味や色に変化を与える.したがって,食品分析の主流であるターゲット分析を重ねても食品の特徴を“網羅的”に把握することは難しく,また加工過程で生じるすべての物質について標品があるわけではない.この複雑な混合物である「食品」の評価には,対象を“包括的”に捉えることのできるメタボリック・プロファイリング(MP)が適していると考えている.本解説では,NMRあるいはMSを用いた食品の包括的MPについて紹介する.
© 2017 Japan Society for Bioscience, Biotechnology, and Agrochemistry
© 2017 公益社団法人日本農芸化学会
“プロファイリング”というと,犯人捜しを連想される方が多いかもしれない.犯罪心理学におけるプロファイリングは,犯人像特定のための資料収集方法の一つで,FBIにより開発されたものである(1)1) 越智啓太:犯罪捜査の心理学—プロファイリングで犯人に迫る,化学同人,2008..具体的には,犯人の身体的特徴,性格,癖や嗜好などを,心理学の見地を含めて抽出するもので,この手法が急速に発展した背景には,従来の物的証拠をそろえ,地道に地取り捜査をするというやり方では理解や解決ができない怪奇・難事件が多く発生したためで,犯人像をより明確にする技術の必要性に迫られたからである.
さて,食品をプロファイリングするとはどういうことであろうか.食べる過程では,まず食物を見て(視覚),その匂いを捉え(嗅覚),口に入れて味わい(味覚や戻り香),テクスチャー(食感)を感じている.これら感覚強度を定量化する方法の一つに,定量的官能記述法(Quantitative Descriptive Analysis; QDA)がある(2)2) 今村美穂:化学と生物,50,818(2012)..これは,よく訓練されたパネリスト(評価者)がそれぞれ感じた要素をできるだけ詳細に抽出し,その抽出された言葉をパネリスト間で共有化して評価項目を設定する.そして食したときの各評価項目について感覚強度を線分上で表現(数値化)をする.これは官能評価からアプローチする食品の全体像を捉えるプロファイリング方法の一つである.
次の興味は,これらの表現型を構成する物質がどのようなものから構成されているか? である.分子レベルの視点で化合物群をわしづかみにして捉えるアプローチ,それが本稿の主題のメタボリック・プロファイリングである.
メタボロームは,代謝物(メタボライト)の総体(オーム)を指す言葉であり,それらを網羅的に定性・定量分析することをメタボロミクスという.本誌を振り返ると,約10年前から解説がされており,農芸化学や食品科学の分野で注目されていることが伺える.医化学の分野はもちろん,遺伝子工学など,幅広い分野での技術の活用と発展がされている(3~8)3) 草野 都,斉藤和季:化学と生物,43,101(2005).4) 草野 都,斉藤和季:化学と生物,43,184(2005).5) 松田史生,及川 彰,草野 都,菊地 淳,斉藤和季:化学と生物,45,754(2007).6) 松田史生,及川 彰,草野 都,菊地 淳,斉藤和季:化学と生物,45,834(2007).7) 津川裕司,小林志寿,馬場健史,福﨑英一郎:化学と生物,49,683(2011).8) 及川 彰:化学と生物,51,615(2013)..
メタボロミクスは,植物や生体試料の代謝物を対象として,数十~数百程度の既知の対象化合物を網羅的に測定する標的型分析であることが多い.これにより,代謝異常の発見や,微生物を用いた有用な物質生産の改善などに応用されている.一方で,メタボリック・プロファイリング(MP)では,対象化合物を特定せずに試料中に含まれる成分を包括的に計測する非標的型分析である.すなわち,まずは測定機器から得られるスペクトルやクロマトグラムをスナップ写真のように捉え,そのパターンの違いから特徴を抽出していくという手法である.たとえば,試料データとして,正常品と異常品あるいは品質のランクづけという情報を持ち合わせていれば,多変量解析によって得られるデータ構造から測定試料の特徴とその変数を探るきっかけができる.そのため,食品企業のように生物系をバックグラウンドとする人材が比較的多い環境においても取り組みやすい有用なツールであり,筆者のグループではMPを活用している.
ただし,プロファイルの結果自体が,現象の動かぬ真の証拠をもたらすものではない点は留意したい.犯罪心理学におけるプロファイリングがあくまで犯人の特徴をあぶりだして情報提供をし,捜査の次の一手となるのが主な目的なのと同様,MPにおいても,多変量解析によって見いだされた特徴変数が表現型の直接的な因果関係として言い切ることはできない.NMRやMSで因子と推定される物質の構造解析を行い,そのほかの実験と組み合わせてその仮説を検証できたとき,初めてMPは評価法として利用でき,食品の製造プロセスや異常品判定へ応用することが可能となる.
メタボリック・プロファイリングは,大きく分けて次のようなプロセスがある.すなわち,(1)試料採取(生物学的実験系),(2)試料調製・分析,(3)統計的解析(多変量解析や判別分析)という一連の過程を経る(図1図1■メタボリック・プロファイリングのプロセス).このようにMPは,生物学・分析化学・統計学(インフォマティクス)などが融合した領域であるゆえ着手しにくいと感じる方も多い.しかし,近年の分析機器や解析ソフトの仕様が高性能化していることに加え,ユーザーフレンドリーであることも一助となり,比較的着手しやすい環境になりつつある.これは喜ぶべきことであるが,それゆえにデータの精度を高める技術の向上と得られる結果の解釈に当たっては,専門家を交えた多角的な視点での議論と検証作業が必要である.
これまでの経験上「試料採取」,「試料調製・分析」,「解析」のステップにおいて最も重要と感じているのは,「試料採取」である.試料の背景やその質がそろっていないと,分析や解析をしても観測したい目的の変動を見ているのか,目的以外の変動によるものかが不明になるからである.あまりに当たり前のことであるが,単にMPを依頼される方はこの部分を理解されていないことが意外と多い.試料の保存状態(特に食品では脂質の酸化やアミノ酸類の分解に留意)はもちろん,表現型の把握や試料にひもづけられたデータをできる限り詳細にかつ些細なことでも持ち合わせていることである.これらは,後の多変量解析のデータを観察し,考察をして仮説を立てるうえで重要となる.
食品に含まれる有機物成分の多くは,糖質,アミノ酸,脂質またはその由来物から構成される.それらは,紫外吸収がほとんどなく,低揮発性で,物理化学的性質が似ているため,試料を前処理せずに液体クロマトグラフィー-UVのような分析系では,包括的に成分分析をすることは難しい.特に水産物では,しばしば高い塩分濃度が感度を下げるため,検出を一層困難にする.さらに成分の含有濃度に大きなばらつきがあるので,高感度かつダイナミックレンジの広い方法が求められる.この点は,生体試料である尿(高塩分,多量の尿素やクレアチニンなど)や血漿(多量のグルコース)と同じ状況である.また多検体の処理が必要なため,迅速かつ簡便で安定性のある分析法が要求される.
上記のような物質特性を鑑みて,核磁気共鳴装置(NMR)と質量分析装置(MS)装置はプロファイリングに有用な分析装置として用いられている.
NMR分光計は,分析装置として非常に高価で操作も複雑であるが,近年装置としての精度や使い勝手が大幅に向上している.それゆえ,NMRを使用したことがない研究者でも,試料を抽出溶解さえすれば,すぐに測定に取り掛かることが可能である.また,注意深く測定すれば,原子核スピンという化学量により,定量性や再現性を担保できるので,スペクトルプロファイリングを行ううえではたいへん都合が良い.さらに,標準で多数の測定パルスプログラムを備えており,後ほど構造解析をするなどの発展的解析が可能なことも利点である.
一方,MSはNMRに比べて高感度であることから,ごく少量の試料で済むことが最大のメリットである.またMSの前段にあるクロマトグラフィー装置(たとえば,ガスクロマトグラフィー(GC),液体クロマトグラフィー(LC),キャピラリー電気泳動(CE),超臨界流体クロマトグラフィー(SFC)など)により,物質を分離してから質量情報を得ることができるため,現在のメタボローム研究では主流である.しかし,包括的なプロファイルを得るためには,大量に注入するので,キャリーオーバーやイオン源の汚れ,またイオンサプレッションなどの課題があるのも事実で,良好なデータを得るための装置のウォッシュアウトメソッドの組み入れや頻度の高いクリーニングなどのメンテナンスが重要となってくる.
筆者のグループでは,まずNMRをスクリーニング的に用いて試料群の特徴把握をする一方,微細構造や定量をするためLC-MSなどを相補的に活用しながら研究を進めている.
NMR-MPでは,分析対象物質をもたない「非標的分析」を行うので,まず,取り決めた手順で調製した一連の混合物試料の測定することから始める.水溶液系であれば水抽出,あるいはリン酸緩衝液などで希釈した試料にNMRロック用重水と内部標準(TSP-d4)を添加し,微小な浮遊物を遠心分離した上清をNMRチューブに移して測定試料として用いる.脂溶性の場合は,重クロロホルムあるいはそのほか適当な重溶媒を用いて抽出もしくはそれらに転溶したものを用いる.このように前処理がほぼなく,試料が溶解していればすぐに測定できる点がよい.
次に調製した一連の試料を1次元NMR測定する.水系溶媒であれば溶媒前飽和法(presaturation)により軽水のピークを低減し,有機溶媒であれば,通常のシングルパルスの測定を行う.良いプロファイリングを行うためには,良いスペクトルを得ることが重要であるが,その注意点などについては,成書を参照されたい(9)9) 根本 直,福﨑英一郎監修:メタボロミクスの先端技術と応用,シーエムシー出版,2008, pp. 74–85..良質なスペクトルの取得は,後で構造解析をするときにも重要になる.また,最近は内部標準の濃度を基準にして,精確に定量可能なqNMR技術も普及しており,標品がないものでも定量ができる.ただし,精確なqNMRを行う際には,飽和現象が起こらないように緩和時間(T1)の5倍以上,繰り返し時間を設定する必要がある点に留意する(10)10) 「qNMRプライマリーガイド」ワーキンググループ:qNMRプライマリーガイド—基礎から実践まで,共立出版,2015..
特殊な測定の例として,NMRのパルスシーケンスを用いて,高分子と低分子成分を分離することができる.低分子成分に興味がある場合,緩和時間(T2)の差を利用して,高分子成分をカットするT2フィルター(CPMG spin-echo)を利用する.一方,高分子成分に興味がある場合は,物質の拡散係数の差を利用した測定T1ρフィルターがあり,前処理せずにパルスシーケンスのみで分子量域を選択できることも利点であり,血漿などの生体試料で行われている例がある(11)11) J. C. Lindon, E. Holmes & J. K. Nicholson: Prog. Nucl. Magn. Reson. Spectrosc., 39, 1 (2001)..また,先述のように食品には,特定の成分が多量に入っていることがあり,そのほかの成分を検出しにくくなる.果汁に含まれる多量の糖分以外に着目するため,糖質のスペクトルが現れる領域(3.0~5.0 ppm)を外し,観測したい高磁場あるいは低磁場領域を選択的に励起し,微量成分を高感度に検出している例がある(12)12) M. Koda, K. Furihata, F. Wei, T. Miyakawa & M. Tanokura: J. Agric. Food Chem., 60, 1158 (2012)..
測定後,多変量解析を行う.筆者は,NMR専用多変量解析ソフトウェアとして,Alice2 for metabolome(ver.2.1)(日本電子㈱製)を用いている.16 kもしくは32 kポイントで取得した生データ(Free Induction Decay; FID)はゼロフィリングを1回して,32 kのスペクトルデータに変換し,絶対値微分の後,1Hであれば0.04 ppm,13Cであれば0.1 ppm程度の短冊状に区切り,面積積分を行う.この操作をBucket積分(もしくはbinning)と呼び,ソフトウェアで初期値を設定すれば自動で数値化から主成分分析結果までをノートパソコンでも瞬時に行うことができる.スペクトルをBucket積分で変数として数値化し,一つの試料を約200程度の変数として記述することになる(図2図2■NMR-MPのプロセス).一般のヒトが容易に理解できるのは3次元までなので,200次元という高次元を理解することは難解であるが,2次元から高次元への拡張は次のように考えると助けになる.
2つの変数の場合は,x1, x2軸上に規定される平面上に,3つの変数の場合,x1, x2, x3軸によって規定される空間に1点をプロットすることができる.これを高次元に拡張するとx1, x2, …, x200軸の空間に規定される1点を置くことができる.この1点が先ほどの200変数で変換された試料1点を表す.多検体を測定すれば,同様に各スペクトルを200変数にそれぞれ変換し,200軸空間内に測定した数の試料が点在することになる.
この後,主成分分析(Principal Component Analysis; PCA)や判別分析(PLS-DA, OPLS-DAなど)を行い,多次元空間のデータ分布の特徴を残しつつ,次元圧縮をし,1試料が1データ点に相当する2次元データ分布(散布図)を得る.
「非標的型」MS-MPを行う際は,前段のクロマトグラフィーによる分離と後段の質量分離機構の選択を行う.まず,前段のクロマトグラフとしては,GC, LC, CE, SFCなどがあるが,主たる化合物の特性(主として極性,分子量など)を考慮して選択を行う.特に,近年SFC-MSを用いたプロファイリングは,安定した装置開発がされ,注目の分離手法である(13)13) 馬場健史:生物工学会誌,94, 401(2016)..
後段の質量分離では,後で構造解析をするためにも,精密質量数が測定可能な質量分離機構が望ましく,またMS/MSなどにより構造断片が解析できると発展的な解析が可能となる.以降,筆者の取り組んでいるLC-MSの場合について,述べることにする.
まず,代表的な試料を用いて,物質の極性や分子量などを勘案し,よく分離する条件(カラム,溶媒,イオン化法など)をTotal ion current(TIC)を見ながら検討する.この検討が最も重要であり,分析者のセンスが問われ,そして時間を要する部分である.
次に,試料の測定ではイオン化の再現性を考慮して,1試料につき最低3回測定をしている.また,測定系の評価のため全試料を等量ずつ混和したクオリティー・コントロール(QC)試料を調製し,カラムのコンディショニングも兼ねて,測定開始から10回ほど連続測定して,本試料の測定を行う.また,同一の試料群が連続しないようにQC試料を適宜組み入れて,ランダムに測定を行う点もポイントである.
NMR-MPではBucket積分した際の「化学シフト」とその「面積値」の2つのパラメータであったのに対し,MSでは「LCの保持時間」,「m/z」,「スペクトル強度」の3つのパラメータ情報がある.そこで「保持時間とm/z」をまとめて一つのパラメータとし,それと「スペクトル強度」を用いて,1試料を記述する変数の2次元のマトリックスシートを作成する.その際,必要に応じて,保持時間のずれや内部標準による強度の補正などを行う.またスペクトル強度が106~108オーダーの場合,対数変換することも有用である.後段に測定例を述べるが,NMRでは変数が200程度であったのに対し,LC-TOF-MSでは変数が膨大(数千~数万)となるので,多変量解析を行う前に後述するデータ前処理をして,変数削減,次元圧縮を行っている.
MPに用いられる多変量解析には,大きく2通りある.
具体的な解析手法として,(A)には主成分分析(PCA)(パターン認識の分野ではKarhunen–Loéve展開といわれることが多い),(B)には部分最小2乗判別分析(Partial Least Square–Discriminant Analysis),OPLS-DA (Orthogonal Projection to Latent Structure Discriminant Analysis)などの識別装置があり,市販の解析ソフトウェア(たとえば,SIMCA-P, ALICE for metabolomeなど)やフリーのソフトウェア(Rなど)やウェブサイト(14)14) Metaboanalyst: http://www.metaboanalyst.caで解析することができる.筆者は最終的に(B)の群間識別が目標であっても,まずPCAでデータの分布を観察することから始める.MPでは,PCAのみでも試料間の特徴を抽出できることが多く,これを中心に解説する.
PCAでは,多次元空間のデータ分布の特徴を残しつつ,次元圧縮をし,1試料が1データ点に相当する2次元データ分布(散布図)を得る.数学的な詳細は専門書(15)15) 尾崎幸洋,宇田明史,赤井俊雄:化学者のための多変量解析—ケモメトリクス入門,講談社サイエンティフィック,2002, pp. 42–79.を参照いただきたいが,手順は次のとおりである.
まず,各変数について平均値中央化処理(平均値0にそろえる),あるいは正規化処理(平均値0,分散1)を行う.そのほか,正規化処理の変形で,各変数を分散の平方根で除した値を用いるPareto scalingがある.これは,強度の弱いスペクトルを適度に強調するため,特にNMR-MPなどで用いられることが多い(16)16) R. A. van den Berg, H. C. J. Hoefsloot, J. A. Westerhuis, A. K. Smilde & M. J. van der Werf: BMC Genomics, 142, 7 (2006)..
変数変換したものを多次元空間にプロットし,統計空間上に存在する試料の分布で最も分散の大きい部分に軸(PC1)をとる.それと直交するように次に分散の大きい軸(PC2)をとり,新しい2次元空間を形成する.以降,PC1とPC2に直交するような分散の大きい3軸目(PC3)をとることで,数百次元を特徴のある空間軸に射影して,データ分布を観察することができる(図3図3■PCAにおける高次元からの次元縮約過程とイメージ).
PCAでは,散布図とローディングプロット(変数の負荷図)が得られる.散布図では,多次元を縮約した2次元に試料1点を表す.また,ローディングプロットでは,散布図に対応した寄与する変数を示す.そして多次元空間からの縮約度の指標に寄与率がある.先の次元圧縮の過程からもわかるようにPC1>PC2>…の順に寄与率は減少する.たとえば,PC1が60%,PC2が25%であれば,PC1 : PC2=60 : 25の矩形にプロットされており,多次元空間にある試料の分布の特徴をこの2次元で60+25=85%の縮約を表現できていることを意味する.
NMR-MPのPCAでは,寄与率がPC1 50~70%,PC2 15~30%となり,ほぼ2次元に縮約されるのに対し,MS-MPの場合,PC1の寄与率が20%程度であり,以降PC2 10%…と徐々に減少していくことが多い.これは変数が数千~数万になるためで,後段のピーキング現象といわれる特徴抽出に関する変数の最適化と関係する.したがって,散布図上では分離しているように見えていても,その時どの程度の寄与率で描かれている統計空間なのかを把握することが重要となる.
一方,(B)判別分析(PLS-DA, OPLS-DA)では各試料の多変量のデータと群をラベルしたデータ両方を用いる.PCAでは群を識別するラベルがなく,試料の分布を観察するだけであるが,PLS-DAやその改良版であるOPLS-DAでは,群を分けるスコアを最大化しながら2次元に縮約することで,クラスタリングをしている.判別に寄与する変数は,VIP(variable importance of projection)やS-Plotで抽出することができる.
飛行時間型等の精密質量が測定可能なMSのデータは,変数が数千~数万になるため,ピーキング現象が生じやすい.これは,試料数に対し,過剰な変数によって,抽出情報の質が低下することである.変数は多くなると情報が加わっていくので,特徴抽出をしやすくなる一方,変数が多すぎるとノイズ(推定誤差)が大きくなるため,特徴抽出が鈍くなる.問題は,適当な変数がいくつか? ということであるが,最適な変数は試料数,データによって異なるため,これを求めることは極めて難しいとされる(図4図4■ピーキング現象(左)とFisher比による次元圧縮(右)左).しかし,適当な次元圧縮をして変数選択をすることで,有用な情報を抽出することができる.その方法の一つにフィッシャー比がある.
多変数がある場合,どの変数を選択するとよいか,ということになる.たとえば,2つの群をパターン認識したい場合,それぞれの変数において試料が正規分布であると仮定する.2群間の平均値が離れていて,分散が小さいものは分離した2つの分布を描く.一方,平均値が近く,分散が大きい場合は,2群間の分布が重なってしまう.この場合,前者を選択したほうが2つを識別する変数として選抜できる(図4図4■ピーキング現象(左)とFisher比による次元圧縮(右)右).これは,各変数における平均値,分散,試料数から簡単に計算できるので良い.このようにフィッシャー比は,試料数に比して変数が極めて多い遺伝子チップのデータ解析に利用されて効果を上げている(18)18) N. Iizuka, M. Oka, H. Yamada-Okabe, M. Nishida, Y. Maeda, N. Mori, T. Takao, T. Tamesa, A. Tangoku, H. Tabuchi et al.: Lancet, 361, 923 (2003)..
NMR-MPを用いた一例を述べる.市販のめんつゆ14種と自家製のめんつゆ(★)をプロファイリングした例である.具体的には,各めんつゆを重水で50倍希釈し,先述の方法で測定した.まず,PCAを行うと図5図5■めんつゆの1H-NMR-MP(PCA)と2次解析のようになる.寄与率は,PC1 79.6%,PC2 15.5%であり,PC1に対して正に寄与するローディングプロットを見ると,変数1.18, 3.66がある.これは,前者がエタノールのメチル基,後者がメチレン基に相当する.したがって,散布図の中心から右半分に位置する試料は,エタノールの割合が多いことが特徴である.次の興味は,エタノール以外の因子の探索である.このときPC1軸で強く牽引している変数(今回であればエタノール)を編集(削除)することで,次に牽引する新たな変数情報を抽出することができる.これをPCAの2次解析(2-step PCA)という(19)19) T. Nemoto, I. Ando, T. Kataoka, K. Arifuku, K. Kanazawa, Y. Natori & M. Fujiwara: J. Toxicol. Sci., 32, 429 (2007)..
たとえば,上記の例では,エタノールに相当する変数をソフトで削除すると,再解析がされて自動的に新たな散布図とローディングプロットが描かれる.すると,左側に位置する試料は,スクロースに相当する変数が,右側の試料群では,グルコースや麦芽糖に相当する変数によって特徴づけられていることが推測され,甘味料の比率が異なることを可視化できる.なお昆布と鰹節からだしを十分にとった試作品では酸味が相対的に強く,それと呼応するように乳酸が多いことが特徴的であった.測定した市販品の中には,通常品(●)と減塩品(○)があるが,散布図とローディングプロットから各社独自のノウハウで,甘味や酸味あるいはうま味の成分比率を調節し,減塩してもおいしいめんつゆを商品化していることが伺える.今回,官能評価結果は示さないが,官能評価とMPの散布図を併せて考察することで,嗜好性と成分組成を把握することができ,開発上どこを目指すのかという目標を設定するうえでも一助となる.
世界的にも重要な水産資源であるクロマグロを解析対象とした例を紹介する.近年,漁獲枠や漁の方法が国際的に厳しく取り決められているなど,資源管理が強化されているため,養殖が広く行われている.
実験には,養殖地の異なる産地A,産地Bのクロマグロを入手し,試料とした.養殖地が異なるだけでなく,養殖は餌や飼育方法など,業者の独自性が発揮される部分でありそれぞれのこだわりも大きい.
この養殖クロマグロについて,背中側中央部分の身に含まれる脂質を解析した.QDAにおいて,脂の質が重要な指標であることがわかり,脂質を対象成分とした.すなわち,産地A(21試料),産地B(22試料)由来の身を凍結乾燥後,クロロホルムを加えて氷冷下で摩砕し,懸濁液をろ別,溶液部分を濃縮し,重クロロホルムに転溶したものをNMR用の試料,アセトンで溶解したものをLC-TOF-MSの試料とした.統計処理にはAlice2 for MetabolomeとSIMCA-P+(Infocom)ソフトウェアを中心に利用した.以降,掲載したすべての散布図で青点は産地A,赤点は産地B由来の試料である.
まずNMR-MPにおいて,1H-NMRの変数選択なしのPCA散布図では養殖地の違いはさほど明確ではなかったが,OPLS-DAを用いると一応の分離傾向を示した(図6図6■養殖マグロ脂質のプロファイリング左上).一方,13C-NMRでは,側鎖の不飽和部分(二重結合)を反映した情報が1H-NMRより多いため良好に識別できた(図6図6■養殖マグロ脂質のプロファイリング左下).
1H-NMR-MP(左上),13C-NMR-MP(左下).LCMS-MP: Fisher比適用前 変数14万,PC1 9.4%,PC2 6.2%:(右上),Fisher比適用後 変数264,PC1 30%,PC2 18%:(右下).
NMR-MPの結果を踏まえ,養殖環境を反映した側鎖脂肪酸組成の詳細な情報を得る目的で質量分析を行い,そのデータを用いて質量分析プロファイリングを試みた.
主たる化学成分がトリアシルグリセロールであり,イオン化が大気圧化学イオン化法(APCI)のため,McLafferty転位に起因する側鎖の脱離が生じ,モノ-およびジアシルグリセロールのイオンが観測され,複雑なスペクトルが得られた.
全変数を用いたPCA散布図では,変数の総数は14万,PC1=9%,PC2=6%であり(図6図6■養殖マグロ脂質のプロファイリング右上),産地Aと産地Bに関する情報は見いだせなかった.
そこで,14万変数のデータから,まず脂肪酸に相当するm/z=300以下の変数を削除し,4万変数の散布図を得た.そこから,先述のフィッシャー比を用いて数百変数程度にまで次元削減することで,産地A,産地Bの2群の特徴的な分布を抽出することができた(図6図6■養殖マグロ脂質のプロファイリング右下).
さらに,産地A,産地Bに加え,世界各所で採捕された天然物のクロマグロのデータを加えて再散布した(図7図7■養殖マグロと天然マグロ).ここでは,水溶性成分の1H-NMRについても行った.天然マグロAは,水溶性成分も脂質成分も養殖マグロの近傍に散布されるのに対し,天然マグロBは水溶性成分,天然マグロCでは脂質成分において,養殖マグロとは異なる位置(外れ値)に分布をした.もちろん,養殖物と天然物とのどちらが「良い」のかを判断できないが,ある場所で採捕された天然物に近い場所に散布される養殖物の試料もあることから,養殖の過程をMPでモニタリングしながら,品質を目的に合わせてチューニングできるのではないかと考えている.
一般的な統計における外れ値は,概して棄却され興味の対象外であることが多いが,MPの統計空間上での外れ値(アウトライヤー)は,試料背景に棄却すべき理由がない場合,際立った特徴空間を牽引する変数を有していることを意味する.MPではアウトライヤーが次の仮説や実験系の最適化をするうえで,大きなヒントを与えてくれることがある.
MPをするうえで最も大切なプロセスは,データの吟味を,専門知識を持ち合わせた非測定者,非解析者とともに観察・討論することで,その背後にあるメカニズムを推定し,仮説の設定をすることである.
非標的のMPは,試料全体のデータ分布構造を把握することができ,未知や見過ごしていた知識をあぶりだしてくれる有用なツールである.しかし一方で,食品や生体試料を対象にしたMPは,化合物の多様性があるため,構成要素が決まっているゲノミクスやプロテオミクスのように定型の分析手法で対応できない部分も多い.今後,試料調製から因子物質の構造解析に至る一連の過程をより容易にかつ安定的に実行できる装置や手法のさらなる向上をアカデミアの方と機器・装置メーカーに期待したい.
筆者の所属する水産・食品メーカーでは,製薬や化学品メーカーのように研究所で開発した化合物が製品そのものに直結することがあまり多くはない.それゆえNMRやMSについては機能性食品素材の成分探索以外でも積極的な活用を求められた.その方法を模索していたとき,幸いにもMPを進める環境が整っていた.まずNMR-MPを始めるきっかけとなった(国研)産業技術総合研究所・根本主任研究員との出会いがあり,実務面では天然物や有機化学を背景とするケミストの存在が大きな推進力となった.そして水産・生物学などを専門とする研究者と議論することで,新たな視点や知見が加わり独自の知識発見・仮説設定をすることができた.今では当社のコア技術に成長しつつある.食品開発は,今でも経験と勘とコツが占める部分が大きい.先人の知恵を客観知として残すためにも,化学構造に立脚したMPのアプローチは有用であり,今後食品開発における重要な技術の一端を担うものと確信している.
Acknowledgments
本稿の機会を与えていただきました,日本大学教授・熊谷日登美先生に感謝申し上げます.また,筆者にNMR-MPを基礎から教えていただいた(国研)産業技術総合研究所主任研究員・根本 直先生,ピーキング現象と変数選択の資料について転載許可をいただいた山口大学教授・浜本義彦先生にこの場を借りて深謝申し上げます.
Reference
1) 越智啓太:犯罪捜査の心理学—プロファイリングで犯人に迫る,化学同人,2008.
3) 草野 都,斉藤和季:化学と生物,43,101(2005).
4) 草野 都,斉藤和季:化学と生物,43,184(2005).
5) 松田史生,及川 彰,草野 都,菊地 淳,斉藤和季:化学と生物,45,754(2007).
6) 松田史生,及川 彰,草野 都,菊地 淳,斉藤和季:化学と生物,45,834(2007).
7) 津川裕司,小林志寿,馬場健史,福﨑英一郎:化学と生物,49,683(2011).
9) 根本 直,福﨑英一郎監修:メタボロミクスの先端技術と応用,シーエムシー出版,2008, pp. 74–85.
10) 「qNMRプライマリーガイド」ワーキンググループ:qNMRプライマリーガイド—基礎から実践まで,共立出版,2015.
11) J. C. Lindon, E. Holmes & J. K. Nicholson: Prog. Nucl. Magn. Reson. Spectrosc., 39, 1 (2001).
12) M. Koda, K. Furihata, F. Wei, T. Miyakawa & M. Tanokura: J. Agric. Food Chem., 60, 1158 (2012).
13) 馬場健史:生物工学会誌,94, 401(2016).
14) Metaboanalyst: http://www.metaboanalyst.ca
15) 尾崎幸洋,宇田明史,赤井俊雄:化学者のための多変量解析—ケモメトリクス入門,講談社サイエンティフィック,2002, pp. 42–79.
16) R. A. van den Berg, H. C. J. Hoefsloot, J. A. Westerhuis, A. K. Smilde & M. J. van der Werf: BMC Genomics, 142, 7 (2006).
17) 浜本義彦:統計的パターン認識入門,森北出版,2009,pp. 64–100.
20) 根本 直,河原﨑正貴:ジャパンフードサイエンス,51, 50 (2012).