はじめに

健康を支える食品について，成分レベルでの関心が高まっている．ヒトの健康はゲノムや遺伝子多型などの先天的な遺伝情報だけで決まるものではなく，摂取した食事や腸内細菌叢など，環境に大きく左右される．摂取した成分がどのような変化を受けながら，吸収，循環，排せつされる過程で作用するのか，成分の動態と機能を個人レベルで解明していくことが，次世代の機能性成分研究として必要である．食事の記録も，思い出し調査や頻度調査に加え，スマートフォンで写真を残しながらより正確な記録が可能となってきた．こうした背景のなか，インプットである食事とアウトプットである健康を関連付けて解析するために必要なものは，食品に含まれる成分のデータベースと，多成分の動的な流れをモニターする検出技術である．

ポリフェノールなどの機能性成分のデータベースの状況を見ると，上記の要求に十分応えられるとは言い難い．また，多成分をモニターする技術としてメタボローム解析が有望であるが，その活用における課題を考えると，実は，成分データベースが抱える問題と同一であることが浮かび上がる．その問題とは「比較できる高品質なデータが整備されていない」ことである．

本稿では，化学成分データベースの現状を俯瞰し，メタボローム解析に触れながら問題について取り上げ，これを解決して次世代の機能性成分研究を強力に推進するために，比較できる高品質なデータ基盤を「作り上げること」の重要性を紹介する．

成分データベースの現状

化合物に関するデータベースは，商用，フリーを含めて多数あり，それぞれのフォーカスに応じて収載される化合物やひもづけられている情報が異なる（表1表1■化合物／食品関連データベース）．野菜など単一の生物から構成される食品もあるため，生物ごとの整備状況など，やや広い視点から見てみたい．

表1■化合物／食品関連データベース
データベース名	種類	登録数	説明	URL
Chemical Abstracts Service （CAS）	化合物全体	＞150 M	米国化学会による化合物情報を集積したデータベース	https://www.cas.org/ja
PubChem	化合物全体	＞109 M	米国国立衛生研究所（NIH）による化合物データベース	https://pubchem.ncbi.nlm.nih.gov/
ChemSpider	化合物全体	＞102 M	様々な情報源の化合物情報を一括検索できるサイト	http://www.chemspider.com/
Dictionary of Natural Products	天然物	285,222	英国Taylor&FrancisグループのCRC出版が編纂する天然物のデータベース	http://dnp.chemnetbase.com/
LIPID MAPS	化合物群	45,523	米国NIHの支援で開発されウェルカム・トラストが維持する脂質のデータベース	https://www.lipidmaps.org/
フラボノイドのデータベース	化合物群	～7,000	国立遺伝学研究所の有田教授によるフラボノイドのデータベース	http://metabolomics.jp/wiki/Category:FL
HMDB	生物	114,100	カナダのアルバータ大学で開発された，ヒトに存在する／存在が予想される化合物のデータベース	https://hmdb.ca/
KNApSAcK	天然物-生物	55,886	奈良先端大学の金谷教授が開発した，天然物とその由来生物のデータベース	http://www.knapsackfamily.com/KNApSAcK/
KEGG （COMPOUND）	生物-遺伝子	18,113	京都大学で開発された生物代謝マップのデータベース	https://www.genome.jp/kegg/
BioCyc	生物-遺伝子	生物種ごと	米国SRIインターナショナルが開発する生物の代謝マップデータベース	https://biocyc.org/
ChEBI	化合物分類	58,724	欧州バイオインフォマティクス研究所（EBI）が開発する化合物の分類データベース	https://www.ebi.ac.uk/chebi/
FooDB	食品成分	化合物：70926	カナダのアルバータ大学で開発された，食品に存在する／存在が予想される化合物のデータベース	https://foodb.ca/
FooDB	食品成分	食品：797	カナダのアルバータ大学で開発された，食品に存在する／存在が予想される化合物のデータベース	https://foodb.ca/
PhytoHub	食品成分	化合物：1,848	フランスのINRA（INRAe）が中心に開発する，食品成分の定性的なデータベース	http://phytohub.eu/
PhytoHub	食品成分	食品：371	フランスのINRA（INRAe）が中心に開発する，食品成分の定性的なデータベース	http://phytohub.eu/
Phenol-Explorer	食品成分	化合物：501	フランスのINRA（INRAe）が開発する，食品中のポリフェノール成分のデータベース	http://phenol-explorer.eu/
Phenol-Explorer	食品成分	食品：458	フランスのINRA（INRAe）が開発する，食品中のポリフェノール成分のデータベース	http://phenol-explorer.eu/

1. 化学成分データベース

世界でこれまでに報告された既知化合物を広く網羅するのは，Chemical Abstracts Service（CAS）とPubChemである．これらには人工物も含まれ，一部の元素が同位体で置換されたものや，塩や水和物などが個別に登録されていることもあり，膨大な数となっている．しかしその重複を除去しても，PubChemには7,600万件以上が存在する．ChemSpiderでは，試薬会社や生物データベースなど多くの情報源から集めた化合物を一括検索できる．これら巨大な化合物データベースでは，個々の物理化学的な性質などを詳しく調べることができる．CASではまた，関連する論文や特許などの情報が得られる．天然物を集めた最も大きいデータベースとしてはDictionary of Natural Products（DNP）があり，最初に発見された成分とその派生成分の関係などが文献情報とともに整理されている．特定の化合物群に焦点を当てたものとしては，脂質に関するLIPID MAPSや，フラボノイドに関するデータベースがある．特定の生物として，ヒトを対象にデータを集積しているのがHMDBであり，検出実績がある成分のほか，食品や薬に由来して検出が予想される成分も記載されている．成分ごとに天然界での存在に関する説明などが丁寧に書かれていることや，登録数が豊富なことから，天然成分のリファレンスとしても価値が高い．KANpSAcKは，化学成分とその由来生物を，確実な文献情報をもとに整理している．一生物が作るユニークな成分の平均数の試算から，植物界全体では100万成分以上の生産能力があると見積もられている⁽¹⁾1) F. M. Afendi, T. Okada, M. Yamazaki, A. Hirai-Morita, Y. Nakamura, K. Nakamura, S. Ikeda, H. Takahashi, M. Altaf-Ul-Amin, L. K. Darusman et al.: Plant Cell Physiol., 53, e1 (2012).．KEGGには，生物の代謝経路マップを介して遺伝子との対応関係が記載されている．遺伝子や代謝マップとの関係を生物種ごとに整理したものとしては，BioCycの派生プロジェクトがいくつかある．生物種ごとに研究コンソーシアムでデータ整備が行われているので，情報の充実度や信頼性は生物によって差がある．ChEBIは，化合物を構造によって分類しており，オントロジー（定義づけ）を整備している点がユニークである．

以上のように，個々の化合物の構造や基本的な物理化学的性質は十分整備されており，化合物グループごと，生物ごとの情報もそれなりに得られる．

2. 食品成分のデータベース

日本には，文部科学省が編纂する日本食品標準成分表があり，約2,500の食品について，タンパク質，アミノ酸，脂質，炭水化物，ミネラル，ビタミン類など，基本成分を定量した結果が記載されている．各国で同様な栄養成分データが公開されており，これらへのアクセスはデンマークのDanish Food Informaticsがまとめているリンク集⁽²⁾2) Danish Food Informatics: LINKS in LANGUAL, https://www.langual.org/langual_linkcategory.asp?CategoryID=4&Category=Food+Composition (2021).が参考になる．一方で，基本成分以外については情報が限られている．その中で，食品と成分の種類が充実しているのはFooDBであり，HMDBと同じアルバータ大学（カナダ）のDavid Wishartのラボが整備している．797の食品について，存在が予想される成分を含めて約7万件が記載されており，定量値の記載のある成分は3,751件存在する．FooDBは，食品摂取のバイオマーカーを探索するFOODBALLプロジェクト⁽³⁾3) EU Joint Programming Initiative: FOODBALL, https://foodmetabolome.org/ (2021).の一部でもあり，FOODBALLにはこのほか，植物二次代謝産物を含む食品成分の定性的な情報を集めたPhytoHubも含まれている．機能性成分のうちポリフェノールに特化したデータベースとしては，Phenol-Explorerが充実している．野菜や果物，植物を原料にした加工食品など458品目ついて，279種類のフラボノイドを含む501種類のポリフェノールの含量が記載されており，代表的なポリフェノールについては体内での検出量や滞留時間なども掲載されている．国内では，農研機構の食品研究部門が，日本食品標準成分表の中から選ばれた200種類の食品（植物中心）について，ポリフェノールやフラボノイドを含む70種類の機能性成分を測定した結果をPDFファイルで公開している⁽⁴⁾4) 農研機構：機能性成分含有量データ（抜粋），http://www.naro.affrc.go.jp/laboratory/nfri/contens/ffdb/ffdb.html, 2021.．食品や成分によって測定内容に偏りがあるが，総ポリフェノール量についてはカバー率が高い．

以上のように，食品ごとの成分情報も，それなりに収集することができる．

3. 機能性成分データベースの問題点

食べた食品とその影響を解析しようとする際，これらのデータベースを使ってまず行いたのは，①ある食品に含まれる成分の一覧表や，②ある成分を含む食品の一覧表を得るという，基本的な検索だろう．ところが，これを行おうとすると問題があることに気づく．それぞれの成分が全食品を通して測定されているわけではなく，食品ごとに測定を実施された成分に差があるため，得られた一覧表を，食品同士や成分同士で，単純に比較できないのである．比較できるデータかどうかを見極めることも，個々の情報に当たって測定法を確認していくことになるので，難しい状況と言える．

実はこの「比較が難しい」状況は，メタボローム解析でも全く同じである．

メタボローム解析

試料中の低分子化合物を網羅的に検出しようとする解析がメタボローム解析である．多様な成分の検出のために，クロマトグラフィー等で成分を分離後，イオン化させた成分の質量を質量分析装置（MS）で測定する手法がよく用いられる．立体構造を決定できる核磁気共鳴も相補的に用いられるが，本稿では高感度分析に適したMSに限って話をする．化学成分は性質が幅広いため，分離装置としては，液体クロマトグラフィー（LC），ガスクロマトグラフィー（GC），キャピラリー電気泳動（CE）などが，検出したい成分に応じて使用される（表2表2■分離装置-質量分析の種類と特徴）．LC-MSは植物由来の二次代謝産物など幅広い成分の分離・検出に適しているため，検出対象の化合物を定めないノンターゲットな解析でよく使用される．野菜や食品を分析すると数千の化合物ピークが得られるが，検出質量値で既知天然物データベースに検索しても該当しないものが多く，多くの未知化合物が潜在することが知られている．世界中の研究者によって得られたメタボロームデータを集積するデータベース（レポジトリ）が存在しており，欧州バイオインフォマティクス研究所（EBI）のMetaboLights⁽⁵⁾5) European Bioinformatics Institute (EBI): MetaboLights, https://www.ebi.ac.uk/metabolights/, 2021.と，米国国立衛生研究所（NIH）のMetabolomics Workbench⁽⁶⁾6) National Institutes of Health (NIH): Metabolomics Workbench, https://www.metabolomicsworkbench.org/, 2021.が，2大サイトとして2012年頃から運営されている．日本でもMetaboBankが2020年から開始された⁽⁷⁾7) 国立遺伝学研究所：MetaboBank, https://mb.ddbj.nig.ac.jp/, 2021.．ところが，上記2大サイトに10年近く蓄積されてきた，多様な試料のデータを横断的に解析して，たとえば特定の生物に特異的に存在している成分を明らかにするといった知識発見をした例は，実は1件もない．その理由は，データの比較が難しいからである．研究者は，自身の興味対象をよりよく分離・検出しようと，実験条件をカスタマイズする．その結果，自身が同条件で取得したデータは比較できるものの，レポジトリに集積された他者のデータと比較することはほぼ不可能となる．メタボローム解析における同定では，同じ装置条件で測定した精製標品との比較が必要なため，同定した成分の種類も数も研究によって異なり，それらの比較は大きな意味をもたないことが多い．

表2■分離装置-質量分析の種類と特徴
装置	主な対象化合物	成分の同定	未知成分の推定	他のデータとの比較
ガスクロマトグラフィー-質量分析（GC-MS）	揮発性成分，誘導体化することで，糖，アミノ酸，有機酸，脂肪酸などの一次代謝成分，ステロール，テルペン類	精製標品が必要（既知物質のライブラリが充実）	難しい（フラグメンテーションの再構築が困難）	比較しやすい（GCの保持時間を指標化できるため）
液体クロマトグラフィー-質量分析（LC-MS）	アミノ酸，糖，脂質，フラボノイドなど多様な二次代謝成分	精製標品が必要	可能（MS/MS解析，多段階MS解析による部分構造情報から）	難しい（測定条件を自由に設定でき，LCの保持時間が変わりやすいため）
キャピラリー電気泳動-質量分析（CE-MS）	アミノ酸，有機酸，糖リン酸，核酸などの一次代謝産物	精製標品が必要	難しい（アプライ量が限られMS/MS取得が困難）	難しい（条件によりCEの移動時間が変わりやすいため）

共通の解決法：比較できる高品質なデータを取得すること

このように，食品におけるポリフェノール類などのデータと，各試料におけるノンターゲットメタボロームのデータは，共通して，「比較が難しい」ことがわかる．化学成分は多様な性質をもち，それぞれに適した分析手法が必要となるため，この問題を宿命的に抱えていると言える．この点が，一つの手法でほぼ網羅できる遺伝子の解析とは大きく異なる．現状のデータのなかから，目的を絞って比較できるデータを探し活用する努力は必要で，それで十分目的を達せられることもあるだろう．しかし，さまざまな研究者がさまざまな独自の視点から比較解析を行い，思わぬ優れた知識発見ができるような，質の高いデータベースとするためには，既存の報告などの断片情報の収集を続けるだけでは不十分と言える．これを解決する最も効率の良い方法は，比較できる高品質のデータを，自分たちの手で整備することである．

摂取した成分量と健康との関連性を正しく解析するには，①狙いを定めた特定の成分について信頼のおける定量解析（ターゲット分析）をする必要がある．一方，フラボノイド類だけでも7,000種類以上と言われるなかで⁽⁸⁾8) E. Grotewold: “The Science of Flavonoids,” Springer-Verlag New York, 2006.，すべてを正確に測定することは現実的ではない．これをカバーするために，②ノンターゲットメタボローム解析が必要となる．ノンターゲット解析のデータは，摂取後の体内動態を解析する際に，モニター技術として使う同技術のデータを解釈するためのリファレンスとして重要となる．したがってベストな解法は，①ターゲット分析と②ノンターゲット分析を，同じ食品試料についてそれぞれ測定し，これを③多様な試料で集積したデータベースを作ることである．食品試料とはもちろん，日本食品標準成分表の項目に沿うことが，基本成分を含めた解析を行ううえでも望ましい．

比較できるデータセットを整備する効果

1. 食品メタボロームレポジトリの構築

比較できるデータセットを作り上げることで，新たなポリフェノールの世界を切り拓ける確かな理由として，以下，筆者らの研究例を簡単に紹介する．ほかに，多様な試料のデータを集めて新規成分の発見に至った唯一の例として，手法を標準化しやすいGC-MSの例があるのでご参考いただきたい⁽⁹⁾9) Z. Lai, H. Tsugawa, G. Wohlgemuth, S. Mehta, M. Mueller, Y. Zheng, A. Ogiwara, J. Meissen, M. Showalter, K. Takeuchi et al.: Nat. Methods, 15, 53 (2018).．

先に述べたとおり，公共のメタボロームデータのレポジトリは，多様な試料間で未知成分を比較することが困難なため，私たちは独自にデータを取得し，「食品メタボロームレポジトリ」（http://metabolites.in/foods，略して「食レポ」）として公開した⁽^{10, 11)}10) N. Sakurai & D. Shibata: Carot. Sci., 22, 16 (2017).11) 櫻井　望：バイオサイエンスとインダストリー, 78, 510 (2020).．日本食品標準成分表の中から選んだ222の食品について，LC-MSによるノンターゲットメタボローム解析を行った結果を収載している．すべの試料を同一の条件で分析・解析しているため，溶出時間を含めてデータを任意に比較できる．詳しくは述べないが，比較できる高品質なデータを生産するために，溶出時間のずれを±1％以内に収める再現性の高い装置メンテナンス技術のほか，分析条件を最適化する専用のデータ可視化ソフトの開発や，精度の高いピーク抽出，イオン化形態の判定，それに基づいた正確な既知データベース検索のためのソフト開発など，約20年間培ったさまざまな蓄積技術が総動員されている⁽^{10, 12, 13)}10) N. Sakurai & D. Shibata: Carot. Sci., 22, 16 (2017).12) N. Sakurai, T. Ara, M. Enomoto, T. Motegi, Y. Morishita, A. Kurabayashi, Y. Iijima, Y. Ogata, D. Nakajima, H. Suzuki et al.: BioMed Res. Int., 2014, 1 (2014).13) N. Sakurai, T. Narise, J. S. Sim, C. M. Lee, C. Ikeda, N. Akimoto, S. Kanaya & O. Stegle: Bioinformatics, 34, 698 (2018).．強度の強い約10％のピークについてはイオントラップ型MSによる多段階MS解析により，MS²，MS³スペクトルの取得を行っており，配糖体についてもそのアグリコンの構造を比較できる．

メタボローム解析では，同定に標品を必要とするため，多段階MS解析やMS/MS解析で得られるマススペクトルを元に，開裂前の元の化学構造を推定する研究が精力的に進められてきた⁽¹⁴⁾14) I. Blaženovíc, T. Kind, J. Ji & O. Fiehn: Metabolites, 8, 31 (2018).．下記で紹介するFlavonoidSearchもその一つである．未知化合物のスペクトルを，既知化合物のものと比較して解釈するGNPS⁽¹⁵⁾15) M. Wang, J. J. Carver, V. V. Phelan, L. M. Sanchez, N. Garg, Y. Peng, D. D. Nguyen, J. Watrous, C. A. Kapono, T. Luzzatto-Knaan et al.: Nat. Biotechnol., 34, 828 (2016).などの活動も盛んである一方で，開裂前のピークの試料特異性自体を比較し，解釈に用いることは，なぜか多くの研究者が行わない．これも，自身で取得したデータ以外は比較できないとの考えにとらわれているからなのかもしれない．

さて食レポには，独自に開発したFlavonoidSearchシステム⁽^{16, 17)}16) N. Akimoto, T. Ara, D. Nakajima, K. Suda, C. Ikeda, S. Takahashi, R. Muneto, M. Yamada, H. Suzuki, D. Shibata et al.: Sci. Rep., 7, 1243 (2017).17) 櫻井　望，秋元奈弓：バイオサイエンスとインダストリー, 76, 226 (2018).を使って，MS²，MS³スペクトルからアグリコンを予測した結果を搭載している．食レポは，ウェブサイトでデータの閲覧や検索ができるだけでなく，ブラウザ画面でのマウス操作等を介さずに，これらの機能をコンピュータープログラム言語から直接実行するためのAPI（Application Programing Interface）という仕組みを備えている．APIは食レポの最も重要な機能で，これがあることにより，大量の自動検索やそれに引き続くデータ処理などを行うことができ，世界で初めて，多様な試料のメタボロームデータを，バイオインフォマティクスで解析するためのデータ基盤が整った．

2. 新規フラボノイドのデータマイニング

食レポでは，検出されたピークの精密質量値を，既知の天然物データベース（KEGG, KNApSAcK, LIPID MAPS, HMDB，フラボノイドのデータベース）に検索した結果が掲載されており，該当しなかった場合をここでは未知ピークとする．さて，未知ピークであっても，MS³スペクトルが得られており，それがFlavonoidSearchで高いスコアを示していれば，未知のフラボノイドの配糖体（修飾体）の可能性がある．このような複合的な検索はウェブサイト上の操作では難しいが，API機能を使うことで，簡単に短時間（10分程度）で実施できる．Python言語のプログラム例が，食レポの「ヘルプ」メニュー「APIによる高度な利用」のページからダウンロードできるので，ご興味があれば実施してみてほしい．

食レポには，ESIポジティブモードで検出されたピークが，全222食品で合計約97万件搭載されているが，上記の絞り込み条件で，FlavonoidSearchのスコアを0.5以上と高く設定した場合，水素付加イオン［M＋H］^＋に限ると24件に絞り込まれた．そこで，試料特異性や置換基の種類などを，ウェブサイト上で確認していくと，短時間に興味深いピークがいくつも見つかってきた（表3表3■食レポ・植レポによるデータマイニングで見つかった新規フラボノイドの候補）．キク科，くるみ，すだち，ほうれんそうに特異的なものや，ぶどうに存在しメチオニンと同じ質量のニュートラルロスを示すものなどもある．

表3■食レポ・植レポによるデータマイニングで見つかった新規フラボノイドの候補
食品番号	食品群	食品名	ピークID	溶出時間（min）	m/z （［M＋H］^＋）	FlavonoidSearchスコア（MS³）	特徴	置換基の候補*	リンク
05014	種実類	くるみいり	2560	40.0	785.0703	0.500	くるみ特異的		http://metabolites.in/foods/peak/05014/pos/2560
06058_2	野菜類	きく花びら生ピンク	1704	37.8	553.1189	0.600	ピンクのキクのみに存在	（Malonyl）-Galactosyl, （Malonyl）-Glucosyl, （Glucuronosyl）-Lactoyl	http://metabolites.in/foods/peak/06058_2/pos/1704
06267	野菜類	ほうれんそう葉通年平均生	7956	60.8	683.1613	0.667	ほうれんそう特異的	（Rhamnosyl）-Galacturonosyl, （（OMe）-Rhamnosyl）-Glucosyl	http://metabolites.in/foods/peak/06267/pos/7956
06267	野菜類	ほうれんそう葉通年平均生	8020	61.5	713.1721	0.667	ほうれんそう特異的	（Glucuronosyl）-Glucuronosyl	http://metabolites.in/foods/peak/06267/pos/8020
06314	野菜類	（レタス類）リーフレタス葉生	1507	35.7	727.1357	0.650	キク科特異的	（Malonyl）-（Glucuronosyl）-Glucosyl	http://metabolites.in/foods/peak/06314/pos/1507
07078	果実類	（かんきつ類）すだち果皮生	5754	57.8	643.1668	0.500	すだち特異的	Dihydrophaseoyl, （p-Hydroxybenzoyl）-Galactosyl, （p-Hydroxybenzoyl）-Glucosyl	http://metabolites.in/foods/peak/07078/pos/5754
07116	果実類	ぶどう生	1476	39.3	438.1214	0.500	メチオニンと同じニュートラルロス	C₅H₁₁NO₂S（メチオニン等）	http://metabolites.in/foods/peak/07116/pos/1476
03001	砂糖および甘味類	（砂糖類）黒砂糖	4749	47.9	587.0706	0.800	植レポでMS3がイネの葉，米に	（Sulfo）-Glucuronosyl	http://metabolites.in/foods/peak/03001/pos/4749
03002	砂糖および甘味類	（砂糖類）和三盆糖	2542	47.5	587.0699	0.667
17001	調味料及び香辛料類	〈調味料類〉（ウスターソース類）ウスターソース	2102	47.7	587.0708	0.667
17031	調味料及び香辛料類	〈調味料類〉（調味ソース類）オイスターソース	3085	47.8	587.0708	0.667
*既知フラボノイドの既知の置換基をFlavonoidSearchで検索した結果（C₅H₁₁NO₂S以外）

3. 試料の多様性の重要性

一方で解釈が難しい候補もあった．和三盆糖や黒砂糖などに検出されるが，グラニュー糖には存在しないものである．これを解釈するヒントは意外なところから得られた．私たちは近年，非可食部を含む28種類の植物試料について，食レポと同様にメタボロームデータを収載した姉妹サイト，植物メタボロームレポジトリ（http://metabolites.in/plants，「植レポ」と略す）を公開した．食レポと植レポは同一の条件で分析されており，相互にデータを比較できる．この植レポに対して，先ほどの解釈が難しいピークを検索したところ，同じマススペクトルをもつピークがイネの葉に多数検出されていた．このヒントにより，和三盆糖と黒砂糖はサトウキビを原料としていることが想起され，この候補はイネ科に由来するアグリコンの配糖体である可能性が考えられた．

探索研究に有用なデータベースとするために

以上，比較できるデータ基盤ができると，未知成分であっても有望な研究対象を探索できる可能性を示した．特に，和三盆糖と黒砂糖の例で示したように，試料の種類（多様性）が増えると，解釈が劇的に進む．食品以外のデータが食品を解釈するために役立ち，また逆に，食品のデータが食品以外の思わぬ分野に役立つことも経験している⁽^{18, 19)}18) N. Sakurai, H. Mardani-Korrani, M. Nakayasu, K. Matsuda, K. Ochiai, M. Kobayashi, Y. Tahara, T. Onodera, Y. Aoki, T. Motobayashi et al.: Front. Genet., 11, 114 (2020).19) 松田一彦，櫻井　望，藤井義晴，杉山暁史：化学と生物，58, 325 (2020).．

Phenol-Explorerはよく整備された情報リソースであるが，一つの欠点は，試料の多様性が乏しいことである．現在はほぼ，植物に由来するものしか対象になっていない．たとえば食レポでロースハムを見ると，添加物として大豆たんぱく質が含まれているため，ダイズ由来のフラボノイド類（推定）が多数混入していることがわかる．将来，摂取量との相関を詳しく解析していくデータリソースとするならば，限定した食品試料を選ぶのではなく，なるべく多くの食品を解析対象にするべきであろう．理想を言えば，動植物，微生物，食品以外にも，河川，土壌，海洋などの環境，廃棄物，糞尿，人工物，歴史的資料など，ありとあらゆるものを比較できることが，価値を相乗的に高めるために望ましい．

また，化合物の網羅性の拡大も必要である．逆相LC-MSだけでなく，順相LC-MSや脂質分析，GC-MSによるメタボローム解析が同時に行われることにより，香気成分の貯蔵形態の解析や，健康と嗜好性との解析，ポリフェノール類とステロール類の複合的な影響など，さらに多角的な解析に役立つだろう．

このように，試料の多様性と化合物の網羅性を拡大することで，そのデータを扱うバイオインフォマティクス研究者がおのずと拡大すると考える．われわれは，摂取した食品や漢方薬とヒト体内の成分の質量差分を比較することで，ヒト体内の未知修飾体の同定・推定に成功した⁽^{20, 21)}20) K. Ohbuchi, N. Sakurai, H. Kitagawa, M. Sato, H. Suzuki, H. Kushida, A. Nishi, M. Yamamoto, K. Hanazaki & M. Arita: Metabolomics, 16, 62 (2020).21) Y. Fujita, N. Sakurai, K. Ikeda, N. Isomura, F. Mano, F. Furuya, D. Shibata, T. Ara, H. Minamino, Y. Matsumura et al.: 15th Annu. Conf. Metabol. Soc., P-356 (2019).．食品などのノンターゲットデータ基盤は，今後蓄積されるコホートデータを正しく解釈するために役立つだけでなく，生産，消費，健康まであらゆる分野に波及する．ポリフェノールについても思わぬ視点で解き明かす専門外の研究者が必ず現れるだろう．

研究拠点の必要性

このようなデータ基盤を構築するためは，研究の拠点化が必要である．ターゲット分析については，基本となる一揃いの試料項目を定めることで，特定の成分についてその分析技術をもった研究者が一貫して測定することが可能となり，いつでも参入し，データを増強することができるようになる．ノンターゲットメタボローム解析については，比較できる高品質なデータの取得に特化した専用の分析拠点がもはや不可欠と言える．データの品質を確保するには，依頼に応じて手法をカスタマイズするような従来型の分析センターは適さない．

いったんこのような拠点が構築されれば，産学を含めたさまざまな好循環が期待できる．分析技術をもった多くの研究者の参入により，データ基盤は自然と充実する．また一般の研究者は，新規試料を提供してノンターゲットの予備データを得ることができ，その結果から同定や定量が必要となれば，他の研究室との共同研究や受託サービスなどでカスタマイズした詳細分析を行うことができる．バイオインフォマティクス研究者や企業などは，充実するデータ基盤を使った健康モニタリングサービスの開発など，新しい価値を創造できるだろう．

未知成分の解明において最大の律速は，最終的な化合物の同定である．データ基盤を使って天然界から興味対象となる候補をトップダウンに発見したのち，仮説証明のために同定が必要となる．微量で立体構造を決定できる結晶スポンジ法（藤田　誠・東京大学教授）⁽²²⁾22) M. Hoshino, A. Khutia, H. Xing, Y. Inokuma & M. Fujita: IUCrJ, 3, 139 (2016).との組み合わせは最も有望なものの一つだろう．

おわりに

日本は化学成分資源の宝庫である．南北に長く多雨である地理的環境から，日本は世界有数の生物多様性ホットスポットとして知られ，固有の植物は約3,000種に及ぶ．日本人は多様な野草とキノコ類を食す傾向があり⁽²³⁾23) 平井（森田）晶，中村由紀子，黄　銘，佐藤哲大，小野直亮，西岡孝明，白井　剛，金谷重彦：化学と生物，53, 600 (2015).，また，植物原料由来の多様な発酵食品を含む独自の和食文化を形成してきた⁽²⁴⁾24) 河野一世，柴田英之：日本調理科学会誌，43, 131 (2010).．一方で，ポリフェノールの摂取量は欧米に比べて若干少ない傾向があり，その主な摂取源はコーヒーや緑茶などの飲料である⁽²⁵⁾25) 田口千恵：静岡県立大学薬食生命科学総合学府博士論文，2017, p.3.．こうした食文化が私たちの健康にどのように関与しているのか．日本だからこそできるデータ基盤の整備により，世界に向けて解明していけることを期待したい．