解説

ビッグ・データ・バイオロジー医食同源と生態学の体系化に向けて

Cutting Edge Data Science towards Understanding of Crude Drug, Food and Ecosystem Based on Metabolomics

平井(森田)

Aki Hirai-Morita

奈良先端科学技術大学院大学情報科学研究科 ◇ 〒630-0192 奈良県生駒市高山町8916番地の5

Graduate School of Information Science, Nara Institute of Science and Technology ◇ 8916-5 Takayama-cho, Ikoma-shi, Nara 630-0192, Japan

中村 由紀子

Yukiko Nakamura

奈良先端科学技術大学院大学情報科学研究科 ◇ 〒630-0192 奈良県生駒市高山町8916番地の5

Graduate School of Information Science, Nara Institute of Science and Technology ◇ 8916-5 Takayama-cho, Ikoma-shi, Nara 630-0192, Japan

Ming Huang

奈良先端科学技術大学院大学情報科学研究科 ◇ 〒630-0192 奈良県生駒市高山町8916番地の5

Graduate School of Information Science, Nara Institute of Science and Technology ◇ 8916-5 Takayama-cho, Ikoma-shi, Nara 630-0192, Japan

佐藤 哲大

Tetsuo Sato

奈良先端科学技術大学院大学情報科学研究科 ◇ 〒630-0192 奈良県生駒市高山町8916番地の5

Graduate School of Information Science, Nara Institute of Science and Technology ◇ 8916-5 Takayama-cho, Ikoma-shi, Nara 630-0192, Japan

小野 直亮

Naoaki Ono

奈良先端科学技術大学院大学情報科学研究科 ◇ 〒630-0192 奈良県生駒市高山町8916番地の5

Graduate School of Information Science, Nara Institute of Science and Technology ◇ 8916-5 Takayama-cho, Ikoma-shi, Nara 630-0192, Japan

西岡 孝明

Takaaki Nishioka

奈良先端科学技術大学院大学情報科学研究科 ◇ 〒630-0192 奈良県生駒市高山町8916番地の5

Graduate School of Information Science, Nara Institute of Science and Technology ◇ 8916-5 Takayama-cho, Ikoma-shi, Nara 630-0192, Japan

白井

Tsuyoshi Shirai

長浜バイオ大学バイオサイエンス学部コンピュータバイオサイエンス学科 ◇ 〒526-0829 滋賀県長浜市田村町1266番地

Department of Computer Bioscience, Faculty of Bioscience, Nagahama Institute of Bio-Science and Technology ◇ 1266 Tamura-cho, Nagahama-shi, Shiga 526-0829, Japan

金谷 重彦

Shigehiko Kanaya

奈良先端科学技術大学院大学情報科学研究科 ◇ 〒630-0192 奈良県生駒市高山町8916番地の5

Graduate School of Information Science, Nara Institute of Science and Technology ◇ 8916-5 Takayama-cho, Ikoma-shi, Nara 630-0192, Japan

Published: 2015-08-20

2009年,Jim Grayの「第4のパラダイム:データ集約型の科学的発見」がもととなって,データ・サイエンスという新たな研究分野が提案された.データ・サイエンスとは,データに基づいて科学の分野間を横断し,現象を解析することにより,政策決定などの意思決定にまでつなぐことが目標となっている.このような分野横断型の研究対象として,地球環境,医療,ライフサイエンス,生物科学,生体医工学,センサーを介した地球観測や宇宙観測に関する分野が例として挙げられる.本稿では,食品,生薬ならびに生態系の理解を目指し研究開発が進められているKNApSAcK Family DBならびにその活用例を紹介する.

はじめに:データ・サイエンス

2009年,Jim Grayが「第4のパラダイム:データ集約型の科学的発見」を提唱した(1)1) T. Hey, S. Tansley & K. Tolle: “The fourth paradigm: data-intensive scientific discovery,” Microsoft Research, 2009..第4のパラダイムが提案されるに至った第1から第3のパラダイムとは,科学歴史において,アリストテレスの時代から始まった経験・実験的手法(第1のパラダイム),ライプニッツ,ケプラー,ニュートン,マクスウェル(電磁気学創始者)などの科学者が展開したように,観測データ群を分析し,その背後にある論理・法則を見いだしていく方法(第2のパラダイム),解析解が得られない非線形方程式をジョン・フォン・ノイマンにより開発されたノイマン型計算機,すなわちコンピュータの演算能力によって数値解の形で解いていく方法,つまり計算機シミュレーションにより解決することを目指した方法論(第3のパラダイム)である.そして第4のパラダイムは,大量のデータをもとに統計的な推論モデルにより科学を展開することを目指して提案された.

これまでの科学のように,理論に基づいた演繹により事実や現象を解明することを目指す方法論に加え,理論式がないところであっても,氾濫する大量のデータ(ビッグデータ)から関係式を近似的に作ることで,帰納的推論が可能となった.データ・サイエンスとは,データに基づいて科学の分野間を横断し,現象を解析することにより,政策決定などの意思決定にまでつなぐものである.このような分野横断型の研究対象として,地球環境,医療,ライフサイエンス,生物科学,生体医工学,センサーを介した地球観測や宇宙観測に関する分野が例として挙げられる.すなわち,(1)データを集約し,(2)データマイニングし,(3)データに基づいたモデリングを行い,(4)社会還元するというプロセスを,分野を越えて融合研究を進める科学研究スタイルがビッグ・データ・サイエンスである.

多くの研究分野において計算○○と○○情報学という二つの発想で研究が進められてきた.これらを学際的に融合し,データベース(DB)を中心としたコンピューティングをビッグ・データ・サイエンスと位置づけることもできる(1)1) T. Hey, S. Tansley & K. Tolle: “The fourth paradigm: data-intensive scientific discovery,” Microsoft Research, 2009.

ゲノム生物学においては,ゲノム情報を中核にトランスクリプトーム,プロテオーム,さらにはメタボロームという異なった次元の情報を統合し,生命現象を解明するために発展した分野がバイオインフォマティクスであり,一方,生物システムを数理科学により解明することを試みた分野が計算生物学であった.これらの2つの分野を統合し,新たな分野として提唱されているのがビッグ・データ・バイオロジーである(2~4)2) W. Callebaut: Studies in History and Philosophy of Biological and Biomedical Sciences, 43, 69 (2012).3) 中村由紀子,小野直亮,佐藤哲大,森田(平井)晶,杉浦忠男,Altaf-Ul-Amin,金谷重彦:“生命のビッグデータ利用の最前線”,植田充美監修,CMC books, 2014, pp. 84–92.4) M. A. U. Amin, F. M. Afendi, S. K. Kiboi & S. Kanaya: BioMed Research International, 2014, 428570, 1 (2014)..すなわち,大量のゲノム情報,さらにはマルチ・オミックス情報を収集しデータベースを構築し,これらの情報を体系的に整理し,最終的にはシミュレーションにつなぎ,たとえば,ヘルスケアなど健康医療分野もしくは農業などの産業への一助となることまでがビッグ・データ・バイオロジーに含まれる(1~4)1) T. Hey, S. Tansley & K. Tolle: “The fourth paradigm: data-intensive scientific discovery,” Microsoft Research, 2009.2) W. Callebaut: Studies in History and Philosophy of Biological and Biomedical Sciences, 43, 69 (2012).3) 中村由紀子,小野直亮,佐藤哲大,森田(平井)晶,杉浦忠男,Altaf-Ul-Amin,金谷重彦:“生命のビッグデータ利用の最前線”,植田充美監修,CMC books, 2014, pp. 84–92.4) M. A. U. Amin, F. M. Afendi, S. K. Kiboi & S. Kanaya: BioMed Research International, 2014, 428570, 1 (2014).

このような状況を踏まえて,人類における最も重要なテーマは,ヘルスケアとエコロジーである.また,「日本の国費を見ると,医療費が補正予算総額とほぼ同一となっており,このような状況から脱却するためにはどうすべきか?」という問いに対して多面的にデータ・サイエンスにより検討することもビッグ・データ・サイエンスの重要なテーマとなる.医療費を削減するためには,病気にならないことが重要であり,その解決には,われわれの生活において「いかにヘルスをケアするか?」が課題である.また,生命体が生きるための基盤であるエコロジーを理解し,あるべき姿を理解することは,持続可能な社会を作るという点で最も重要である.そこで,われわれの研究室では,メタボロミクスを基盤に医食同源を目指した「食」にかかわるデータならびに,生物間の相互作用を理解するための「エコロジー」関係のデータをもとに統合したデータベース(KNApSAcK Family DB)の構築を進めている(5~11)5) F. M. Afendi, N. Ono, Y. Nakamura, K. Nakamura, L. K. Darusman, N. Kibinge, A. H. Morita, K. Tanaka, H. Horai, M. A. U. Amin et al.: Comput. Struct. Biotechnol. J., 4, e201301010 (2013).6) Y. Nakamura, F. M. Afendi, A. K. Parvin, N. Ono, K. Tanaka, A. M. Hirai, T. Sato, T. Sugiura, M. A. U. Amin & S. Kanaya: Plant Cell Physiol., 55, e7 (2014).7) S. Ikeda, T. Abe, Y. Nakamura, N. Kibinge, A. Hirai Morita, A. Nakatani, N. Ono, T. Ikemura, K. Nakamura, M. Altaf-Ul-Amin et al.: Plant Cell Physiol., 54, 711 (2013).8) K. Nakamura, N. Shimura, Y. Otabe, A. M. Hirai, Y. Nakamura, N. Ono, M. A. U. Amin & S. Kanaya: Plant Cell Physiol., 54, e4 (2013).9) F. M. Afendi, T. Okada, M. Yamazaki, A. M. Hirai, Y. Nakamura, K. Nakamura, S. Ikeda, H. Takahashi, M. A. U. Amin, L. K. Darusman et al.: Plant Cell Physiol., 53, e1 (2012).10) Y. Shinbo, Y. Nakamura, M. A. U. Amin, H. Asahi, K. Kurokawa, M. Arita, K. Saito, D. Ohta, D. Shibata & S. Kanaya: Biotechnol. Agric. Forestry, 57, 165 (2006).11) 平井(森田)晶,中村由紀子,佐藤哲大,小野直亮,黄 銘,金谷重彦:食品と開発,49, 1 (2014).

本稿では,オミックス・プラットフォームに基づいてKNApSAcK Family DBを紹介し,現在までに研究・開発が進んでいるDBの活用例,ならびに今後の課題について述べる.

KNApSAcK Family DB

1. メタボロミクス

質量分析装置による測定技術の進展に伴い,ppmの精度で代謝物の精密分子量を測定することが可能になった.そこで,精密分子量をもとに分子式さらには代謝物の候補を列挙することができれば,細胞・組織におけるメタボロームを悉皆的に把握することができる.生物種と代謝物の関係を文献情報から網羅したデータベースがあれば,生物サンプルにおける質量分析をもとに精密分子量から分子式を推定し,生体内の二次代謝物の候補を列挙することが達成される.そこでメタボローム研究の効率化に寄与する目的のデータベース(KNApSAcK Core, 3D)ならびにツール(Search Engine)をメインウインドウ(http://kanaya.naist.jp/KNApSAcK_Family/;最新のメインウインドウについては近日公開)においてKNApSAcK Metabolomicsとして配置した.生物種と代謝物の関係データベースとしてKNApSAcK Core DB(図1図1■KNApSAcK Family DB)を開発した.また,質量分析データからの検索エンジン(Search Engine)の開発も進め公開した.文献情報に基づいて,現在まで,KNApSAcK Core DBには101,500対の生物種–代謝物の関係,5万種の代謝物,2万種の生物が格納されている.本来,データベースに収録されるべき正味の代謝数を推定すると約10万種の代謝物の構造が決定されていることになり,収録されている生物種数と地球上の顕花植物数の割合から,地球上に存在する代謝物種の数は106万と推定できる(9)9) F. M. Afendi, T. Okada, M. Yamazaki, A. M. Hirai, Y. Nakamura, K. Nakamura, S. Ikeda, H. Takahashi, M. A. U. Amin, L. K. Darusman et al.: Plant Cell Physiol., 53, e1 (2012)..すなわち,地球上の顕花植物が生合成できる代謝物の約1割が構造決定されており,KNApSAcK Core DBにはその半数が登録されていることとなる.本データベースは,新規バイオデータベースの開発ならびにバイオインフォマティクス研究,ファンクショナルゲノミクス,生物学相互作用の理解のためのメタボロミクスなどの多岐にわたる分野で活用されている(5~11)5) F. M. Afendi, N. Ono, Y. Nakamura, K. Nakamura, L. K. Darusman, N. Kibinge, A. H. Morita, K. Tanaka, H. Horai, M. A. U. Amin et al.: Comput. Struct. Biotechnol. J., 4, e201301010 (2013).6) Y. Nakamura, F. M. Afendi, A. K. Parvin, N. Ono, K. Tanaka, A. M. Hirai, T. Sato, T. Sugiura, M. A. U. Amin & S. Kanaya: Plant Cell Physiol., 55, e7 (2014).7) S. Ikeda, T. Abe, Y. Nakamura, N. Kibinge, A. Hirai Morita, A. Nakatani, N. Ono, T. Ikemura, K. Nakamura, M. Altaf-Ul-Amin et al.: Plant Cell Physiol., 54, 711 (2013).8) K. Nakamura, N. Shimura, Y. Otabe, A. M. Hirai, Y. Nakamura, N. Ono, M. A. U. Amin & S. Kanaya: Plant Cell Physiol., 54, e4 (2013).9) F. M. Afendi, T. Okada, M. Yamazaki, A. M. Hirai, Y. Nakamura, K. Nakamura, S. Ikeda, H. Takahashi, M. A. U. Amin, L. K. Darusman et al.: Plant Cell Physiol., 53, e1 (2012).10) Y. Shinbo, Y. Nakamura, M. A. U. Amin, H. Asahi, K. Kurokawa, M. Arita, K. Saito, D. Ohta, D. Shibata & S. Kanaya: Biotechnol. Agric. Forestry, 57, 165 (2006).11) 平井(森田)晶,中村由紀子,佐藤哲大,小野直亮,黄 銘,金谷重彦:食品と開発,49, 1 (2014).

図1■KNApSAcK Family DB

(A)メインウインドウならびに(B)各々のDBにおいて格納されるデータ属性による関係.

2. メタボロームの食品学・生薬・生態学へのリンク

生物種–二次代謝物の関係データが充実すると,二次代謝物に基づいて,食品・生薬・生態についての検討が可能になる.すなわち,ビッグ・データ・サイエンスとして,これらの分野をメタボロームにより横断的につなぐことが可能となる.そこで,代謝物をもとに食品・ヘルスケア,生薬学,生物学,生態学のさまざまな分野と対応させて二次代謝物を提供するDBの研究・開発を進めPocketとして公開を始めた(5)5) F. M. Afendi, N. Ono, Y. Nakamura, K. Nakamura, L. K. Darusman, N. Kibinge, A. H. Morita, K. Tanaka, H. Horai, M. A. U. Amin et al.: Comput. Struct. Biotechnol. J., 4, e201301010 (2013).図1A図1■KNApSAcK Family DBにおけるPocketの左側から食品と健康(Food & Health),生薬(Crude Drug),生物活性ならびに生物活性物質の生物組織ならびに地球上の分布(Biology)に関するDBが配置されている(9)9) F. M. Afendi, T. Okada, M. Yamazaki, A. M. Hirai, Y. Nakamura, K. Nakamura, S. Ikeda, H. Takahashi, M. A. U. Amin, L. K. Darusman et al.: Plant Cell Physiol., 53, e1 (2012)..これらのDBに収録されているデータの属性の関係を図1B図1■KNApSAcK Family DBに示す.

食品と健康に関する情報(Food & Health)については,Lunch Boxに1,940種の食用生物の情報,DietNaviに食材と健康の病気予防の関係,FoodProcessorに加工食品における野菜,肉類,魚介類などの天然素材の情報,DietDishに食品の相乗効果を整理した.さらに日本における食文化において重要な季節と食材の関係,すなわち食材の「旬」の関係をMARCHÉとして整理を進めている(11)11) 平井(森田)晶,中村由紀子,佐藤哲大,小野直亮,黄 銘,金谷重彦:食品と開発,49, 1 (2014).

生薬にかかわる情報はCrude Drugの4つのDBに整理されている.WorldMapには,地球のそれぞれの地域で使用している食・薬用に使用されている生物と使用国(219地域)の関係(51,282地域-薬/薬用植物の関係),KAMPOにおいては漢方配合法における生薬情報(278薬用生物,336処方),JAMUにおいてはインドネシア配合生薬(1,133薬用植物,5,310処方)さらにはTea Potではハーブ情報(732種のハーブ)が整理されている.

Biologyにおいては生薬・生態学の立場から,二次代謝物の生物における組織の分布ならびに地球規模における生物間の関係を揮発物質(BVOC)により関連づけることを目的に,生物–二次代謝物–分布(生物組織と揮発性)の関係を生物活性(Metabolite Ecology)に収録した.また,生態系をさまざまな生物における対生物戦略ならびにヒトに対する効能を含む生物活性を理解することを目的に,生薬などの天然素材と生物活性の情報をNatural Activity DB(418種の生物活性における3万対の植物と生物活性の関係)として,二次代謝物が生物に与える影響を検討する目的で二次代謝物と活性の関係(10,758エントリー)が収録されている.

一方,遺伝子の機能情報をPicnic, 発現相関をStrapとして整理を進めている.また,二次代謝物と遺伝子を関係づける目的から,二次代謝データベース(Motorcycle DB,2,881エントリー)ならびに藻類の代謝反応データベース(Bicycle,96,641エントリー)の開発も進めている.

メタボロミクス,天然物化学,生態学などさまざな分野においてKNApSAcK Core DBが使用されており(7,12)7) S. Ikeda, T. Abe, Y. Nakamura, N. Kibinge, A. Hirai Morita, A. Nakatani, N. Ono, T. Ikemura, K. Nakamura, M. Altaf-Ul-Amin et al.: Plant Cell Physiol., 54, 711 (2013).12) 金谷重彦,平井(森田)晶,旭 弘子,高橋弘喜,中村建介,M. A. U. Amin,二瓶義人,池田 奨,尾嶌雄也,西岡孝明:実験医学,29, 2460 (2011).,世界の100を超えるドメインからアクセスされ,月当たりのアクセス数は10万件を超えている.本データベースは,世界のメタボローム研究の中核としても評価されている.現在,さらに二次代謝酵素に関するデータの充実を図っている.以下ではKNApSAcK Family DBのデータを用いたマイニング解析例を示す.

データ・サイエンス

1. 「食」「生薬」におけるデータ・サイエンス

日本人が,通常,一生に食べる食材としての生物種の数は約2,000種と言われている.KNApSAcK Lunch Boxには1,940種の生物種が収録されている.日本は,最も多くの食材を食して健康を維持している国民の一つに数えられている.日本には,キノコ,野草を食する文化がある.ところが,東南アジアでは,野菜として食するものは,ほぼ栽培種に限られる.一つには,植物は,熱帯雨林になるに従い,昆虫,動物などから身を守るため種々の防御物質を生産し,身を守る機能が進化した結果,ヒトにも有害となった.このように熱帯雨林における植物はヒトに対しても有害な代謝物を生産する能力を有している.これらのいわゆる毒となる代謝物(生理活性天然物)は,抗がん剤をはじめとする医薬品の開発におけるリード化合物として重要な役割を果たしている.欧米における生物多様性の維持の重要性とは,このような医薬品開発における基盤としての化学構造多様性を守ることに重点をおいた発想であるのかもしれない.たとえば,ヨーロッパでは,熱帯雨林に比べれば寒冷対策の植物の多様性は見られるものの,対昆虫,対動物,対微生物としての植物の生物戦略の多様性は低い.一方,熱帯雨林では,可食部分としての果実が発達し,昆虫,動物を誘導し種子を拡散する機能が進化した.北欧などの国々では,キノコは基本的にすべて食べられると言われている.昆虫の種類も数も激減するので,防御物質により動物から防衛する必要はなくなることから,野草,キノコにヒトが食べられるものが多くなるのであろう.また,寒さに強い種のみが残り,多様性が失われた.このように,地域ごとの植物について見ると,日本は,食材としての野草・キノコ類が最も多様に存在する地域となっている.

魚介類について見ると,たとえば,インドネシア,フィリピンなどで食材として使用する魚類のほとんどは,養殖に限られている.これは,日本以南の海では,シガテラ毒素を作る海藻が増え,これを餌として食べた魚類に毒素が蓄積されるため,天然魚を食べる習慣があまりないからである.

また,ドイツを中心とした地域では,産業革命があまりに早期に進んだため,食べ物を自然から調達するのではなくて,スーパーマーケットから調達する.そこでは,ソーセージ,パン,チーズ,燻製のように食べ物をプロセスされたフードとなっている.その一つの理由は,生物の形を残さないという発想であるという.日本でのシラウオの踊り食い,ホタルイカ丸ごとの沖漬けなどは驚いてしまうし,待降節では,クリスマスまで肉を控えるため,伝統的には魚料理を食べる.だから,食べ物の種類も限られるのだろうとドイツの研究者からうかがったことがある.日本では,江戸時代に鎖国があり産業革命が遅れたことが生活速度の余裕を生み,野草・キノコを採取し多様な食材を楽しむ食文化へと直結しているのかもしれない.さらに,日本には「旬」という文化がある.江戸時代において日本は食に飢えており,時期ごとの食材を追いかけて食べてやっと人々は1年を過ごすことができたのかもしれない.インドネシアなどの東南アジアに出張してみると,1年はおおよそ雨季と乾季に分かれ,果物を1年中収穫することができるため,このような苦労はなさそうである.江戸時代の日本の人々は,このような旬の文化に基づいて,食を最適化して1年を過ごすことによる生き残り戦略をとった.このことが勤勉さへとつながったのかもしれない.そこで,穀物・魚介類などの天然食材の旬の情報を蓄積するとともにKNApSAcK MARCHÉで公開した.

FoodProcessor DBでは,加工食品について,現在までに265個のレトルト・カレーの食材情報を整理した.日本にはご当地カレーという根深い文化があり,そこで開発されたレトルト・パウチ・カレーに含まれる食材の総数は262種にのぼる.これらの食材をもとに共利用する食材の関係をクラスター分析に基づいてデンドログラムで表現した(図2図2■レトルト・パウチ・カレーにおける食材のデンドログラム).この図から,加工食品であるレトルト・パウチ・カレーの構築原理が読み取れる(13)13) 桂樹哲雄,小野直亮,平井(森田)晶,中村由紀子,M. A. U. Amin,金谷重彦:Food & Food Ingredients J. Japan, 218, 43 (2013)..おおまかには,多くのカレーに含まれる食材(コンセンサス食材)とご当地食材に分けられる.ご当地カレーを開発するには,ご当地の食材をカレーの味に馴染ませるためにさらなる食材・ソースが必要となる.そこで使われるのが,図中のご当地を特徴づける食材とカレーをつなぐための食材である.「うま味の科学」は1908年以前より池田菊苗博士により研究され,うま味は,甘味,辛味,苦味,塩味に加え第5の味となり,英語ではumamiと命名された(14)14) S. Yamaguchi & K. Ninomiya: J. Nutr., 130(4S Suppl.), 921S (2000)..うま味として,いまのところ3つの代謝物(グルタミン酸,グアニル酸,イノシン酸)が受容されるそれぞれのレセプターにより規定されると報告されている.これらの複数のうま味成分がレセプターに受容されると,相乗効果により非常に強いうま味として味が認識される,いわゆる「らりる」ほどにうま味を感じるという特徴がある.このうま味の観点からデンドログラムを見てみよう.まずはじめに,コンセンサス食材において,化学調味料ならびにトマトにはグルタミン酸が豊富に含まれる.すなわちレトルト・カレーのうま味は,グルタミン酸により醸し出されていることになる.さらに,ご当地を特徴づける食材とカレーをつなぐための食材には,魚介類が含まれるイノシン酸,さらにはキノコ類によるグアニル酸による補強された相乗効果により一層うま味を醸し出していると考えられる.また,デンドログラムを詳細にみると,「しょうが」と「にんにく」,「バナナ」と「マンゴー」はともに使われる傾向にあり,人類が築き上げてきた暗黙のルールを垣間見ることもできる.このように,食品情報の集積により,加工食品の構築原理が見えてくる.このことがまさにデータ・サイエンスの面白いところであろう.また,まさにビッグデータから引き出されたルールを科学により検証することは今後のサイエンスの課題となるに違いない.

図2■レトルト・パウチ・カレーにおける食材のデンドログラム

多くの国々では独自に伝統的に配合法を開発し,ヒトのヘルスケアに役立てている.そこで世界の薬・食用生物の文献情報を世界中から集めてデータベース(WorldMap)に整理して公開を進めている.中医学,アユルベーダには配合生薬の文化がある.そのなかで,インドネシアではJamu, 日本では漢方薬としてその配合法が公開されている.インドネシアではJamu配合生薬の解析から,健康改善に直接関係のある生薬とむしろ味付けとして用いられる生薬についての識別ルールについても,データサイエンスとして示唆することができた(9,15~18)9) F. M. Afendi, T. Okada, M. Yamazaki, A. M. Hirai, Y. Nakamura, K. Nakamura, S. Ikeda, H. Takahashi, M. A. U. Amin, L. K. Darusman et al.: Plant Cell Physiol., 53, e1 (2012).15) S. H. Wijaya, H. Husnawati, F. M. Afend, I. Batubara, L. K. Darusman, M. A. U. Amin, T. Sato, N. Ono, T. Sugiura & S. Kanaya: BioMed Research International, 2014, 831751, 1 (2014).16) F. M. Afendi, T. Katsuragi, A. Kato, N. Nishihara, K. Nakamura, Y. Nakamura, K. Tanaka, A. M. Hirai, M. A. U. Amin, H. Takahashi et al.: Cur. Pharmacogenomics Personalized Med., 10, 111 (2012).17) F. M. Afendi, L. K. Darusman, M. Fukuyama, M. A. U. Amin & S. Kanaya: Malalysian J. Math. Sci., 6, 147 (2012).18) T. Okada, F. M. Afendi, M. A. U. Amin, H. Takahashi, K. Nakamura & S. Kanaya: Cur. Comput. Aided Drug Design, 10, 179 (2010)..さらに高速ヒューリスティックアルゴリズムCOMPLIG(19)19) M. Saito, N. Takemura & T. Shirai: J. Mol. Biol., 424, 379 (2012).により評価することにより,二次代謝物の三次元構造の類似性と生物活性の関係を悉皆的に検討し,代謝経路の多様性から生物活性を説明することにも成功している(20)20) Y. Ohtana, A. A. Abdullah, M. A. U. Amin, M. Huang, N. Ono, T. Sato, T. Sugiura, H. Horai, Y. Nakamura, A. M. Hirai et al.: Mol. Inf., 33, 790 (2014).

2. エコロジーにおけるデータ・サイエンス

ヘルスケアとともにエコロジーを理解することは,ヒトが持続的に健康を維持するための重要な課題であり,データ・サイエンスの重要な課題である.地球は,過去にない早さで変動しており,生物圏にどのような影響を与えるのかを正しく把握すべきであろう.そのためには,まず現在の生物圏の真の姿を明らかにしなければならない.生物間相互作用ネットワークにおいて二次代謝物が重要な役割を果たしている.図3図3■二次代謝物による生物間の関係づけの例に示すように,アブラナ科植物から生産されるシニグリンは,一般には昆虫に対する忌避物質としての役割を果たしているが,モンシロチョウの幼虫においては摂食促進物質として働く.すなわち,シニグリンにより植物と昆虫が関連づけられていることになる(図3図3■二次代謝物による生物間の関係づけの例).また,植物が生産する揮発性有機化合物(BVOC)が生物圏における生物間相互作用ネットワークの成立に大きくかかわっている.

図3■二次代謝物による生物間の関係づけの例

BVOCに関する天然物は現在,991種の植物種について1,719種報告されている.顕花植物に限っても地球上には20万種以上の植物が分布することから,植物アロマに関する天然物を38.7万種と推定できる.すなわち,地球上で生産される天然物種の1/3以上は植物–植食者–捕食者の三者相互作用ならびに植物-微生物間の生物間相互作用にかかわる分子であると推定できる.これらの生物間相互作用ネットワークを体系的に把握するため,KNApSAcK Metabolite Activityデータベースの構築を進めている.さらに,生物が生産する代謝物の局在部位,環境への放出の可能性を合わせてMetabolite Ecology DBとしてデータベースの構築を進めている.

今後,これらのデータベースとともに,植物–植食者–捕食者の関係を複数のアロマ成分により関係づけるための数理モデルを組み合わせ,ダイナミックに変化するBVOCの機能と構造を定量的に理解することが地球全体のエコロジーを理解することへとつながる(21)21) 高林純示,矢崎一史,斉藤拓也,金谷重彦:Aroma Res., 57, 61 (2014)..データベースとシミュレーションといった基本要素技術をもとに生態系を理解することは今後のビッグ・データ・サイエンスの重要な課題となるであろう.

おわりに

ヘルスケアならびにエコロジーは,一見,全く異なった分野に見えるが,人類が持続的に快適に生存するという点においていずれも重要なテーマである.オミックスを活用し,大量の情報を体系化することはこれらの分野の発展には欠かせない研究である.一方で,図4図4■生活情報と学術情報の関連づけスキームに示すように,これらのアカデミックな研究をさらに社会へと実装すること,たとえば,血圧計,体温計などのさまざまなバイタルサインセンサーデバイスで測定されたヒトの状態をもとに,DBに基づいた行動の提案といった社会と学術をいかにつなぐかということが今後の課題である.このことを実現するために,現在,ウェアラブル深部体温計の研究開発も進めているところである(22,23)22) M. Huang, T. Tamura, W. Chen & S. Kanaya: J. Therm. Biol., 47, 26 (2015).23) M. Huang, T. Tamura, W. Chen, K. Kitamura, T. Nemoto & S. Kanaya: “Geometrical improvement of a noninvasive core temperature thermometer based on numeric modeling and experiment validation,” 7th International Joint Conference on Biomedical Engineering Systems and Technologies (BIOSTEC 2014), 2014, pp. 23–27..今後さらに,社会と学術を融合すべくDBを充実させる予定である.

図4■生活情報と学術情報の関連づけスキーム

Reference

1) T. Hey, S. Tansley & K. Tolle: “The fourth paradigm: data-intensive scientific discovery,” Microsoft Research, 2009.

2) W. Callebaut: Studies in History and Philosophy of Biological and Biomedical Sciences, 43, 69 (2012).

3) 中村由紀子,小野直亮,佐藤哲大,森田(平井)晶,杉浦忠男,Altaf-Ul-Amin,金谷重彦:“生命のビッグデータ利用の最前線”,植田充美監修,CMC books, 2014, pp. 84–92.

4) M. A. U. Amin, F. M. Afendi, S. K. Kiboi & S. Kanaya: BioMed Research International, 2014, 428570, 1 (2014).

5) F. M. Afendi, N. Ono, Y. Nakamura, K. Nakamura, L. K. Darusman, N. Kibinge, A. H. Morita, K. Tanaka, H. Horai, M. A. U. Amin et al.: Comput. Struct. Biotechnol. J., 4, e201301010 (2013).

6) Y. Nakamura, F. M. Afendi, A. K. Parvin, N. Ono, K. Tanaka, A. M. Hirai, T. Sato, T. Sugiura, M. A. U. Amin & S. Kanaya: Plant Cell Physiol., 55, e7 (2014).

7) S. Ikeda, T. Abe, Y. Nakamura, N. Kibinge, A. Hirai Morita, A. Nakatani, N. Ono, T. Ikemura, K. Nakamura, M. Altaf-Ul-Amin et al.: Plant Cell Physiol., 54, 711 (2013).

8) K. Nakamura, N. Shimura, Y. Otabe, A. M. Hirai, Y. Nakamura, N. Ono, M. A. U. Amin & S. Kanaya: Plant Cell Physiol., 54, e4 (2013).

9) F. M. Afendi, T. Okada, M. Yamazaki, A. M. Hirai, Y. Nakamura, K. Nakamura, S. Ikeda, H. Takahashi, M. A. U. Amin, L. K. Darusman et al.: Plant Cell Physiol., 53, e1 (2012).

10) Y. Shinbo, Y. Nakamura, M. A. U. Amin, H. Asahi, K. Kurokawa, M. Arita, K. Saito, D. Ohta, D. Shibata & S. Kanaya: Biotechnol. Agric. Forestry, 57, 165 (2006).

11) 平井(森田)晶,中村由紀子,佐藤哲大,小野直亮,黄 銘,金谷重彦:食品と開発,49, 1 (2014).

12) 金谷重彦,平井(森田)晶,旭 弘子,高橋弘喜,中村建介,M. A. U. Amin,二瓶義人,池田 奨,尾嶌雄也,西岡孝明:実験医学,29, 2460 (2011).

13) 桂樹哲雄,小野直亮,平井(森田)晶,中村由紀子,M. A. U. Amin,金谷重彦:Food & Food Ingredients J. Japan, 218, 43 (2013).

14) S. Yamaguchi & K. Ninomiya: J. Nutr., 130(4S Suppl.), 921S (2000).

15) S. H. Wijaya, H. Husnawati, F. M. Afend, I. Batubara, L. K. Darusman, M. A. U. Amin, T. Sato, N. Ono, T. Sugiura & S. Kanaya: BioMed Research International, 2014, 831751, 1 (2014).

16) F. M. Afendi, T. Katsuragi, A. Kato, N. Nishihara, K. Nakamura, Y. Nakamura, K. Tanaka, A. M. Hirai, M. A. U. Amin, H. Takahashi et al.: Cur. Pharmacogenomics Personalized Med., 10, 111 (2012).

17) F. M. Afendi, L. K. Darusman, M. Fukuyama, M. A. U. Amin & S. Kanaya: Malalysian J. Math. Sci., 6, 147 (2012).

18) T. Okada, F. M. Afendi, M. A. U. Amin, H. Takahashi, K. Nakamura & S. Kanaya: Cur. Comput. Aided Drug Design, 10, 179 (2010).

19) M. Saito, N. Takemura & T. Shirai: J. Mol. Biol., 424, 379 (2012).

20) Y. Ohtana, A. A. Abdullah, M. A. U. Amin, M. Huang, N. Ono, T. Sato, T. Sugiura, H. Horai, Y. Nakamura, A. M. Hirai et al.: Mol. Inf., 33, 790 (2014).

21) 高林純示,矢崎一史,斉藤拓也,金谷重彦:Aroma Res., 57, 61 (2014).

22) M. Huang, T. Tamura, W. Chen & S. Kanaya: J. Therm. Biol., 47, 26 (2015).

23) M. Huang, T. Tamura, W. Chen, K. Kitamura, T. Nemoto & S. Kanaya: “Geometrical improvement of a noninvasive core temperature thermometer based on numeric modeling and experiment validation,” 7th International Joint Conference on Biomedical Engineering Systems and Technologies (BIOSTEC 2014), 2014, pp. 23–27.