今日の話題

バイオインフォマティクスによる微生物群集解析の新展開微生物生態系の理解に向けて

Koji Ishiya

石谷 孔司

産業技術総合研究所生命工学領域生物プロセス研究部門

Sachiyo Aburatani

油谷 幸代

産業技術総合研究所生命工学領域生体システムビッグデータ解析オープンイノベーションラボラトリ

Published: 2022-02-01

・メタゲノムとは?

地球上に存在する微生物の個体数は約1030個とも言われており,われわれの周囲には多種多様な微生物が生息している.彼らは,周囲の環境因子やその他の微生物とさまざまな関係性を有した群集構造をとることで,それぞれの生態系を維持している.しかしながら,これら環境微生物の大半は培養困難とされ,微生物群集への理解には多くの課題が残されている.本稿では,「メタゲノム」として,ある環境中で群集を構成している微生物群のゲノムに由来する塩基配列の集まり(プール)を示すものとする.メタゲノムの概念は,1998年に土壌細菌叢に関する論文(1)1) J. Handelsman, M. R. Rondon, S. F. Brady, J. Clardy & R. M. Goodman: Chem. Biol., 5, R245 (1998).で初めて登場した.2004年に高出力なDNAシーケンス技術(次世代シーケンサー: NGS)が開発されると,NGSの普及とともにメタゲノムに関する研究は急激な拡がりをみせている(図1図1■Metagenome関連研究の増加).

図1■Metagenome関連研究の増加

1998~2020年のNCBI PubMed抄録データより著者が作成.

昨今では,大量のゲノム情報を分析するための生物情報科学(バイオインフォマティクス)の技術開発がメタゲノム研究の発展における主な原動力となっている.本稿ではメタゲノム研究を大きく推し進める主要なバイオインフォマティクスのアプローチについて概観したい.

・微生物群集に対するゲノム解析

先述したように環境中に存在する微生物の大半は,難培養性であることから各微生物種固有のゲノム情報を得ることは困難である.そこで,一般的には,メタ16S解析と呼ばれる16SリボソームRNA(16SrRNA)遺伝子からサンプル中の微生物群集の構成や存在量を推定する研究が行われている.16SrRNAは,生物間で普遍的に存在し多型性を有することから,16SrRNAを解析することで,サンプルに含まれる微生物の遺伝的な系統関係や相対的な存在量を知ることができる.通常,メタ16S解析では,対象となる16SrRNAの領域をプライマーによってPCR増幅し,その増幅された塩基配列をシーケンスする.その後,シーケンサーによって読まれた塩基配列(リード)から低品質の塩基配列や対象外の塩基配列が除外され,残った塩基配列を用いて系統分類等の解析が行われる.現在では,これら一連の解析は,ほぼ自動化されたパイプラインで実行可能である(2, 3)2) P. D. Schloss, S. L. Westcott, T. Ryabin, J. R. Hall, M. Hartmann, E. B. Hollister, R. A. Lesniewski, B. B. Oakley, D. H. Parks, C. J. Robinson et al.: Appl. Environ. Microbiol., 75, 7537 (2009).3) E. Bolyen, J. R. Rideout, M. R. Dillon, N. A. Bokulich, C. C. Abnet, G. A. Al-Ghalith, H. Alexander, E. J. Alm, M. Arumugam, F. Asnicar et al.: Nat. Biotechnol., 37, 852 (2019)..しかしながら,メタ16S解析だけでは,他の遺伝子機能や代謝機能を知ることはできない.16SrRNA遺伝子以外の遺伝子機能等を明らかにするためには,メタゲノムサンプルに含まれる塩基配列を直接シーケンスし,そこから各微生物のゲノム情報を得る必要がある.大量のメタゲノム情報から再構築されたゲノムは,Metagenome Assembled Genomes(MAGs)(4)4) D. H. Parks, C. Rinke, M. Chuvochina, P.-A. Chaumeil, B. J. Woodcroft, P. N. Evans, P. Hugenholtz & G. W. Tyson: Nat. Microbiol., 2, 1533 (2017).と呼ばれる.通常,新たなゲノム配列を構築する際は,シーケンサーによって読まれたリードを連結させ,ゲノムの部分配列に相当するコンティグを構築する.構築されたコンティグやシーケンサーで読まれたリードの中から,配列組成や存在量等を元に同種や近い系統に属しているものを分類することで,MAGsは個々のゲノムとして構築される.この工程は,メタゲノム・ビニングとも呼ばれている.実際,このメタゲノム・ビニングを適用し,環境メタゲノムのデータセットから難培養微生物の新規ゲノムを多数構築した研究成果も報告されている(4)4) D. H. Parks, C. Rinke, M. Chuvochina, P.-A. Chaumeil, B. J. Woodcroft, P. N. Evans, P. Hugenholtz & G. W. Tyson: Nat. Microbiol., 2, 1533 (2017)..こうして個別に構築されたゲノム配列に対して遺伝子アノテーション解析等を行うことで,群集単位での遺伝子機能や代謝機能の比較分析も可能となってきた.しかし,MAGsを行うためには,微生物それぞれのゲノム構築に必要な相当量の塩基配列の取得が必要であり,シーケンスにかかるコストも高くなる.そこで現在では,より簡易かつ低コストに取得できる16SrRNAのシーケンスデータから間接的に遺伝子機能や代謝機能を予測する技術(5)5) G. M. Douglas, V. J. Maffei, J. R. Zaneveld, S. N. Yurgel, J. R. Brown, C. M. Taylor, C. Huttenhower & M. G. I. Langille: Nat. Biotechnol., 38, 685 (2020).も開発されている.

・微生物群集解析

自然界に存在する微生物群集の中には,特定の条件下で重要な働きや感受性を示す微生物も知られている.群集構造を解析することで,群集全体の変化や集団内で特異な動きを示す微生物,微生物間の関係性等も捉えることが出来るようになる.群集構造を調べる上で最もよく行われている手法の1つが微生物種の存在量に基づく組成分析である.組成分析では,群集の構成が比やパーセンテージ(%)で表現されるため直感的に理解しやすい一方で,結果の比較や解釈には十分な注意が必要である.たとえば,計算される組成値は合計が1(あるいは100%)となるような定数和の制約を受けるため,ある微生物種の組成変化が他種の組成値に影響を及ぼす可能性が高い.また,微生物の存在量をカウントしたデータには欠損値が多く,欠損値補完にも注意が必要である.加えて,組成値では実空間を想定した統計処理がそのまま適用できないことも多い.そこで,最近は組成値の抱える問題点に考慮したメタゲノム組成分析技術も提案されてきている(6~8)6) J. T. Morton, C. Marotz, A. Washburne, J. Silverman, L. S. Zaramela, A. Edlund, K. Zengler & R. Knight: Nat. Commun., 10, 2719 (2019).7) K. Ishiya & S. Aburatani: Appl. Sci. (Basel), 9, 1355 (2019).8) K. Ishiya & S. Aburatani: Phys. Biol.; Advance online (2021), in press..また,群集構造の解析の一つとして種間の関係性を調べるために,ネットワーク科学を応用した解析(9)9) F. Karoline & J. Raes: Nat. Rev. Microbiol., 10, 538 (2012).もよく利用されている.たとえば,腸内細菌叢や土壌細菌叢における微生物間の共起関係がネットワークグラフとして表現され,群集内の関連性を視覚的に理解できるようになっている.他にも,存在量の変化に対する種間の相関関係をネットワークで示した方法論もよく利用されている.ただし,こうした共起や相関を表したネットワークは,生物種(ノード)が互いに線(エッジ)で結ばれているからといって,直接的な因果関係や相互作用を示しているわけではない点には注意が必要である.

・最後に

本稿では,簡単ではあるが微生物群集に対するゲノム構築と群集構造解析に使われるバイオインフォマティクス技術について概観した.シーケンス機器や情報科学技術の発展に伴い,この分野の研究は,まさに日進月歩の様相を呈している.昨今では,さまざまな環境における微生物群集からの知識抽出や,得られた知識を活用した新規知見につながるようなデータ駆動型の技術基盤も続々と開発されている.微生物群集解析に端を発した種々のバイオインフォマティクス技術は,将来的に微生物間相互作用や微生物群集の機能解明,制御技術等につながっていくとものと期待している.

Reference

1) J. Handelsman, M. R. Rondon, S. F. Brady, J. Clardy & R. M. Goodman: Chem. Biol., 5, R245 (1998).

2) P. D. Schloss, S. L. Westcott, T. Ryabin, J. R. Hall, M. Hartmann, E. B. Hollister, R. A. Lesniewski, B. B. Oakley, D. H. Parks, C. J. Robinson et al.: Appl. Environ. Microbiol., 75, 7537 (2009).

3) E. Bolyen, J. R. Rideout, M. R. Dillon, N. A. Bokulich, C. C. Abnet, G. A. Al-Ghalith, H. Alexander, E. J. Alm, M. Arumugam, F. Asnicar et al.: Nat. Biotechnol., 37, 852 (2019).

4) D. H. Parks, C. Rinke, M. Chuvochina, P.-A. Chaumeil, B. J. Woodcroft, P. N. Evans, P. Hugenholtz & G. W. Tyson: Nat. Microbiol., 2, 1533 (2017).

5) G. M. Douglas, V. J. Maffei, J. R. Zaneveld, S. N. Yurgel, J. R. Brown, C. M. Taylor, C. Huttenhower & M. G. I. Langille: Nat. Biotechnol., 38, 685 (2020).

6) J. T. Morton, C. Marotz, A. Washburne, J. Silverman, L. S. Zaramela, A. Edlund, K. Zengler & R. Knight: Nat. Commun., 10, 2719 (2019).

7) K. Ishiya & S. Aburatani: Appl. Sci. (Basel), 9, 1355 (2019).

8) K. Ishiya & S. Aburatani: Phys. Biol.; Advance online (2021), in press.

9) F. Karoline & J. Raes: Nat. Rev. Microbiol., 10, 538 (2012).