解説

集団ゲノミクスが解き明かす植物進化のダイナミクス適応をゲノムから探る

Evolutionary Dynamics of Plant Populations Studied by Population Genomics: Genomics of Adaptation

Takashi Tsuchimatsu

土松 隆志

千葉大学大学院理学研究院

Published: 2018-04-20

シークエンス技術の発展に伴って,ゲノムを網羅する多型データに基づいた進化研究が近年盛んである.特に,一つの種,もしくは近縁な複数の種について,多数のサンプルのゲノム配列に基づいた解析を行う「集団ゲノミクス」研究が進んでいる.集団ゲノムデータを解析することで,過去の個体数変動や集団の分化の過程,あるいは各遺伝子に働く自然選択圧を推定できるだけでなく,ゲノムワイド関連解析を用いて自然変異にかかわる遺伝子を同定することも可能である.このレビューでは,特に研究が進むシロイヌナズナとその近縁種の事例の紹介を中心に,集団ゲノミクスの概念や利用法を解説する.

この解説で取り上げるのは,一つの種内,もしくは近縁な複数の種について,数十~数千に及ぶ多数のサンプルのゲノム配列に基づいた解析を行う「集団ゲノミクス」である.集団ゲノムを解析することで,環境適応にかかわる表現型の遺伝的背景や,集団の進化の歴史を解明することができる.まず,集団ゲノムのデータセットがどのようなものかを説明し,(1)個体数の変化などの集団の進化の歴史をどのように推定するか,(2)ゲノムワイド関連解析や連鎖解析(QTL解析)などの手法から,自然変異にかかわる遺伝子をどのように推定するか,という2つの視点から話を進めたい.

集団ゲノミクスに用いるデータセット

集団ゲノミクスに用いられるデータセットは,種内,もしくは近縁な複数種の多数個体についての,ゲノムを網羅する大量の遺伝マーカーの情報である.遺伝マーカーは,近年では次世代シーケンサーを利用し全ゲノムをシーケンスする「リシーケンス解析」により得るものが主流になりつつある.リシーケンス解析とは,すでにある個体についてゲノム配列が解読されている種について,その既知ゲノム配列を参照配列として,他個体のゲノム配列に由来する次世代シーケンサーショートリードをマッピングし,参照配列との違いのある部分を検出していく方法である.参照配列との違いとして得られるのは一塩基多型(Single Nucleotide Polymorphism; SNP)や短い挿入・欠失(インデル)などさまざまなであるが,最も頻繁に見られるSNPを遺伝マーカーに用いることが多い.リシーケンス解析により,各系統のSNPを抽出した巨大なSNP行列が作成できる.これが,さまざまな解析の基礎となる重要なデータセットになる.

このSNPデータセットを用いて,たとえば各個体が互いにどの程度近縁かを簡単に計算できる.ある2系統を抽出し,SNPが何個異なっているかをカウントしゲノム全長で割り算すれば,ゲノム中の平均塩基置換率を求めることができる.より近縁であればこの値が小さく,より遠縁であれば大きくなる.ちなみに,この計算をすべての個体の組み合わせについて行い平均した値は塩基多様度と呼ばれ,種や集団の遺伝的多様性の基本的な指標になる.塩基多様度は,たとえばシロイヌナズナで約0.5%,ヒトでは約0.1%程度である.

このような個体間の類縁度のパターンを把握するために,ゲノムの類似度を主成分分析などの手法で2次元平面に投影することがよく行われる(図1図1■主成分分析の例).たとえば,ヨーロッパにおけるヒト集団間の遺伝的類縁度を約3,000人,500,568遺伝子座の多型データを用いて解析し,主成分分析を用いて可視化したのが図2図2■「1001ゲノムプロジェクト」から明らかになったシロイヌナズナの進化史である(1)1) J. Novembre, T. Johnson, K. Bryc, Z. Kutalik, A. R. Boyko, A. Auton, A. Indap, K. S. King, S. Bergmann, M. R. Nelson et al.: Nature, 456, 98 (2008)..遺伝的類縁度は集団間の地理的関係とおおむね対応しており,ヒトの交配や移動が地理的にある程度限定されていることを示唆している.

図1■主成分分析の例

ヨーロッパにおけるヒト集団間の遺伝的類縁度を約3,000人,500,568遺伝子座の多型データを用いて解析し,主成分分析を用いて可視化したもの.Novembre et al. (2008)を改変.

図2■「1001ゲノムプロジェクト」から明らかになったシロイヌナズナの進化史

(a)2系統間のゲノム配列の違いを,全組み合わせについて計算した結果の分布.遺存系統を除くと右に伸びた裾野が消え,おおむね左右対称な分布になる.(b)MSMC解析から推定した遺存系統・非遺存系統間の合着率の時間的推移(緑線).青線,紫線はいずれも非遺存系統内,赤線は遺存系統内の合着率の推移をそれぞれ示す.(a, b)The 1001 Genomes Consortium(2016)を改変.

主成分分析に加えて,STRUCTUREなどのソフトウェアを用いたクラスタリング解析も一般的である(2)2) J. K. Pritchard, M. Stephens & P. Donnelly: Genetics, 155, 945 (2000)..STRUCTUREでは,種全体がN個の分集団に分かれると仮定したときに,各個体がX番目(1≤XN)に属する確率を求める.完全にN個の集団に分かれるわけではなく,特定の集団への帰属がはっきりしない個体も見られることが多い.それでも,対象とする種がだいたい何個のグループに分かれるかのおおまかな目安をつけることはできる.このように,種や集団全体が遺伝的に均一に混ざりあっておらず,分集団のような「構造」が見られるとき,これを集団構造と呼ぶ.主成分分析やクラスタリング解析を用いて,対象とする生物種の集団構造を把握することができる.

集団の歴史の推定:コアレセント理論の概要

主成分分析やクラスタリング解析から明らかになる集団構造は,その生物種の進化史を反映している.たとえば,その種が長い間2つの集団に分かれていたら,クラスタリング解析では2つのはっきり分かれたクラスターが見られるはずである.集団ゲノムデータの解析により,集団構造の背景にある集団の進化の歴史を定量的に推定することができる.ここで,集団の歴史とは具体的に,過去の集団の個体数の変化,種・集団の分化や遺伝子流動の過程などのことを指す.このような推定は,コアレセント理論(coalescent theory)と呼ばれる比較的新しい集団遺伝学の理論に基づいている.コアレセント理論とは,集団からサンプリングされたDNA配列の系譜を遺伝子系図(gene genealogy)として解析し,さまざまな進化的パラメーターを定量的に推定する集団遺伝学の理論的枠組みである.コアレセント(coalescent)という語は「合着」「合祖」などと訳され,集団中のある2つのDNA配列が世代を遡って共通の祖先に至ることを指す.

コアレセント理論の詳しい説明は省略するが,核心となるコンセプトは,実際に得られたDNA配列の合着が何世代前に遡るかについての理論的期待値が求められるということである.そして,合着が何世代前にどれだけ起きるかは,個体数の変動や自然選択,集団構造などの進化的影響を受けて変化する.よって,これを逆に考えれば,サンプルとして得られたDNA配列の合着がいつどれだけ起きたかを調べることで,過去の集団の個体数変動などの進化の歴史を推定できるということになる.おおまかには,集団サイズが大きいときには合着は相対的により少なく,集団サイズが小さいときにはより多くの合着が起きると期待される.また,過去のある時期に集団が2つの分集団に分かれていたとすると,その間の分集団間での合着は少ないと考えられる.

このようなコアレセント理論による個体数変動の推定を,一つの種の多数個体のゲノムデータに基づいて行うMultiple Sequentially Markovian Coalescent(MSMC)とよばれるアルゴリズムが最近提案された(3)3) S. Schiffels & R. Durbin: Nat. Genet., 46, 919 (2014)..ここでは,MSMCをシロイヌナズナのデータに適用した例を紹介したい.シロイヌナズナは主にユーラシア大陸,アフリカ大陸や北アメリカに生育する一年草であり,「1001ゲノムプロジェクト」と呼ばれる1135に及ぶ野生系統のリシーケンス解析が行われるなど,集団ゲノミクス研究のモデル生物である(4)4) 1001 Genomes Consortium: Cell, 166, 481 (2016)..1001ゲノムプロジェクトのリシーケンスデータをもとに図1図1■主成分分析の例に示したようなSNPの行列を作成し,すべての系統の組み合わせについて塩基置換率を計算したのが図2aである.基本的には約0.005(0.5%)をピークとする山形であるが,注目したいのが分布の右側の裾野の膨らみである.この結果は,ほかの大多数の系統とは遠縁な個体が,1135系統の中にいくつか紛れていることを示している.調べてみると,これらの遠縁な系統(「遺存系統」と呼ぶ)は計26系統あり,多くが地中海地域に由来していた.MSMC解析を行うと,遺存系統と残りの大多数の系統との間では,最終氷期が始まった7万年前頃から氷期後の現在に至るまでほとんど合着が見られないことが明らかになった(4)4) 1001 Genomes Consortium: Cell, 166, 481 (2016).図2b図2■「1001ゲノムプロジェクト」から明らかになったシロイヌナズナの進化史).この結果は,両者の間での遺伝的な交流は最終氷期以降ほとんど起きていないことを示す.最終氷期におけるシロイヌナズナの分布は地中海地方に制限され,さらに集団がいくつかに分断されていたと考えられている.最終氷期の後,これらの集団から再び分布が北の方へ拡大した際に,おそらくはそのうち一つの集団に由来する系統が圧倒的に頻度を増やし,それが現在の多数派の系統となったと予想される.一方,少数派の遺存系統は,いわば氷河期の生き残りとでも呼ぶべき系統であり,表現型レベルでも多数派系統とは異なる特徴が見られることが報告されている.

コアレセント理論に基づいてゲノムデータから集団の歴史を推定する方法は,MSMC以外にもさまざまなものが提案されている.たとえば ∂aiは,集団の間で遺伝子流動がどの程度起きているか,特に遺伝子流動の非対称性について,対立遺伝子頻度の集団間の違いに基づき推定する(5)5) R. N. Gutenkunst, R. D. Hernandez, S. H. Williamson & C. D. Bustamante: PLoS Genet., 5, e1000695 (2009)..ほかに,生物種の系統関係と個々の遺伝子の遺伝子系図の違いから遺伝子流動を検出するABBA/BABAテストなどもよく利用されている(6)6) E. Y. Durand, N. Patterson, D. Reich & M. Slatkin: Mol. Biol. Evol., 28, 2239 (2011)..シロイヌナズナ属(Arabidopsis)において,これらの手法を適用した研究例を紹介しよう(7)7) P. Y. Novikova, N. Hohmann, V. Nizhynska, T. Tsuchimatsu, J. Ali, G. Muir, A. Guggisberg, T. Paape, K. Schmid, O. M. Fedorenko et al.: Nat. Genet., 48, 1077 (2016)..モデル生物シロイヌナズナの近縁種として,ハクサンハタザオ(A. halleri)やミヤマハタザオ(A. kamchatica)などシロイヌナズナ属に属するいくつかの種・亜種が知られている.これらの種は,分布域,生育環境,生殖システム(自家不和合性),生活史(一年生・多年生),花成,重金属耐性など多くの形質がシロイヌナズナとは異なっており,シロイヌナズナの豊富な分子遺伝学的な知見を活かして,これまで多くの研究が行われてきた.近年,これらのシロイヌナズナ近縁種の研究に取り組む研究者たちが国際的なコンソーシアムを組織してサンプルを持ち寄り,合計27種(亜種を含む)94個体についてリシーケンス解析が行われた.シロイヌナズナゲノムをリファレンスとしてマッピングを行い,平均してゲノムの66%をカバーする計9,119遺伝子についての配列情報が得られた.塩基配列から抽出されたゲノムワイドなSNPデータを用いて,まずおおまかなクラスタリング解析を行うと,以前より分類学的・系統学的に認識されていた4つの大きな系統的グループ(A. thaliana, A. arenosa, A. halleri, A. lyrata)におおむね分かれることが確認された.この結果は,これらの分類学的なグループが生殖的に隔離された「種」におおむね対応することを意味している.しかしながら,ゲノムをさらに詳しく調べると,実際にはこれらのグループ間でも実はかなり頻繁に遺伝子流動が見られるということが明らかになった.まず,ハプロタイプ解析からそれぞれ2kb(中央値)ほどの領域が種間で計49カ所ほど共有されていることが明らかになり,ABBA/BABAテストから,これらが過去から現在に渡る種間の遺伝的交流によるものであることがわかった.また∂ai解析から,遺伝子流動の程度はゲノム領域によって大きく異なることも明らかになった.なかでも遺伝子流動が頻繁だったのは病害抵抗性にかかわる遺伝子群などであった.これらの遺伝子群では,病原菌への対抗進化のために新しい対立遺伝子を他種から取り入れることが自然選択上有利になると考えられており,集団ゲノムのデータはこの予測を支持している.そもそも生物学的に「種」とは,互いに生殖的に隔離されたグループのことであるが,この集団ゲノムデータが明らかにしたことは,「別種」と考えられるものでも遺伝的流動はしばしばあり,かつそのパターンはゲノムのなかでもかなり不均一ということである.

自然変異にかかわる遺伝子を探る:ゲノムワイド関連解析

一つの種の中に存在する表現型変異を自然変異と呼ぶ.これらは基本的に,個体ごとにゲノムDNA配列が少しずつ異なることに起因するものである.リシーケンス解析の主要な目的はこのような種内の表現型変異を司る遺伝変異を探ることにあるが,その一般的な解析手法がゲノムワイド関連解析(Genome-Wide Association Study; GWAS)である.GWASはこれまで主にヒトの遺伝疾患関連遺伝子を同定するために利用されてきたが,近年シロイヌナズナやイネなど,植物においても盛んに用いられるようになってきている.

GWASは,集団内の多数の個体について表現型とゲノムワイドな遺伝子型データを得て,表現型と遺伝子型との統計的な相関関係を網羅的に探索する手法だ.表現型は,病気への感受性・抵抗性など二値的なものだけでなく,背丈や乾燥重量などの連続量も扱うことができる.

GWASは,表現型変異の原因となる塩基多型と,そのごく近傍のSNPマーカーとの間に連鎖不平衡があることを利用するマッピング手法である.連鎖不平衡とは,2つの遺伝マーカーの対立遺伝子の間に見られる相関関係のことである.連鎖不平衡はSNPマーカー間の組み換えにより解消されるが,染色体上の距離が近いSNPマーカー間の組み換えは通常まれであるため,距離の近いSNPマーカー間では連鎖不平衡は強く,距離が遠くなるにつれだんだんと減衰していく.SNPマーカー同士がどの程度離れると連鎖不平衡が減衰するかは,生物種によって大きく異なる.シロイヌナズナではおおむね10 kb程度以内であれば連鎖不平衡が見られることがわかっている.このことは,シロイヌナズナでは,理論上は10 kb程度のゲノム領域までGWASで原因遺伝子座を絞り込むことができるということを意味している.

自然変異を担う遺伝子を同定する方法として,従来はF2集団などを用いた連鎖解析(QTL解析)がよく用いられてきた.GWASと連鎖解析にはそれぞれ長所と短所がある.まずGWASの明らかな長所は,掛け合わせなどによりF2などの後代を作出する必要がない点である.これは,樹木など長寿の生物種では特に重要なメリットだろう.もう一点は,GWASは連鎖解析よりも一般にマッピングの解像度が高いという点である.これは,マッピングに用いる集団における組み換えの総量の違いに起因する.F2を用いた連鎖解析では,両親のゲノムが組み換わるのはF1からF2の1世代のみである.その一方,GWASが対象とする自然集団では毎世代ごとに組み換えを繰り返しており(歴史的組換えhistorical recombinationと呼ぶ),マッピング集団における組み換えの総数は,F2集団よりもずっと多くなる.具体的な解像度としては先述のとおり,原因の突然変異と連鎖不平衡の関係にある染色体領域(多くの種では数百bp~数十kb程度)にまで絞ることができるはずである.なお,一般にGWASには連鎖解析よりずっと多くの遺伝マーカーが必要になる.これは,GWASはSNPマーカーと原因遺伝子との間の連鎖不平衡を利用したマッピングであるため,連鎖不平衡が見られる平均的な距離(種により異なるが,だいたい数百bp~数十kb)より十分に密な間隔でSNPマーカーが設計されている必要があるからである.もしSNPマーカーの密度が低すぎると,原因遺伝子と連鎖不平衡の関係にあるSNPマーカーが一つも存在しない可能性が高くなる.なお,たとえばシロイヌナズナでよくGWASに使われるSNPマーカーのセットは,約214,000個のSNPからなる(8)8) S. Atwell, Y. S. Huang, B. J. Vilhjálmsson, G. Willems, M. Horton, Y. Li, D. Meng, A. Platt, A. M. Tarone, T. T. Hu et al.: Nature, 465, 627 (2010)..シロイヌナズナのゲノムサイズは約130 MBなので,平均するとだいたい600 bpに1個の間隔でマーカーが存在することになる.これは,シロイヌナズナで連鎖不平衡が減衰する平均的な距離(約10 kb)よりずっと短い間隔である.

一方F2などを用いた連鎖解析には,一般にそこまで大量の遺伝マーカーは必要なく,せいぜい数百個程度あれば染色体上のおおまかな位置を特定できる.これは,連鎖解析の場合マッピングの律速は遺伝マーカーの数よりむしろ組み換えの数であり,遺伝マーカーをあまり増やしても解像度は頭打ちになるということでもある.マッピングの解像度を上げるには組み換えの数を増やす必要があり,そのためには解析個体数を増やす必要がある.

一方,GWASの短所として指摘されているのが,検出における偽陽性や偽陰性である.ここで偽陽性とは,「実際には原因遺伝子ではないのに,GWASで検出されてしまう」ことで,偽陰性とは「実際には原因遺伝子なのに,GWASで検出されない」状況のことである.

偽陽性を生み出す主な要因は,対象とする種や集団における集団構造である.種や集団に分集団のような構造がみられると,分集団ごとにSNPの対立遺伝子頻度が異なることが予想される.このとき,対象とする表現型の頻度も分集団ごとに異なるようなときには,ゲノム上の多くのSNPが,実際には表現型と何の関係もなかったとしても「見かけ上の相関」を示してしまうと考えられる(図3図3■集団構造がGWASにおいて偽陽性を生み出す例).程度の差こそあれ,実際の野生集団には集団構造が必ず存在するため,この効果をうまく統制してGWASをすることが重要になってくる.

図3■集団構造がGWASにおいて偽陽性を生み出す例

赤花・白花という表現型変異にかかわる遺伝子を探索することを考える.赤花は分集団1で固定し,白花は分集団2で固定している.分集団間ではある程度遺伝子流動が制限されており,多くの遺伝子座において遺伝子頻度に集団間で違いが見られる.結果として,真の原因遺伝子座以外の遺伝子座でも花色と相関が見られることになる.

GWASにおいて集団構造の効果を統制する手法は,これまでさまざまなものが提案されてきた.現在よく使われているのは線形混合モデルによる集団構造の補正であり,以下のような式で表すことができる.

ここで,Yは表現型のベクトル,Xiはとあるi番目のSNPを表すベクトル,εは誤差項である.表現型とそのSNPとの間に相関がある場合には係数βiが有意にゼロから外れてくることになる.この計算をゲノム全体のすべてのSNPについて1個ずつ行う.uはサンプル同士のゲノム全体の類似度を表しており,この部分が集団構造の効果を反映している.この式はいわば,集団構造によって説明される表現型Yのバラツキを「差し引いた」うえで,今注目するi番目のSNPにどれだけ効果があるか(係数βiがゼロではないか)を調べるというものだ.線形混合モデルによるGWASはいくつかソフトウェアが提供されており,代表的なものとしてはEMMAX(9)9) H. M. Kang, J. H. Sul, S. K. Service, N. A. Zaitlen, S. Y. Kong, N. B. Freimer, C. Sabatti & E. Eskin: Nat. Genet., 42, 348 (2010).やGEMMA(10)10) X. Zhou & M. Stephens: Nat. Genet., 44, 821 (2012).がある.なお,連鎖解析は基本的にこのような集団構造の影響は受けない.連鎖解析とGWASの両方で同じ染色体領域にピークが得られた場合は,かなり信頼性が高いと言えるだろう.

このような集団構造の効果による偽陽性に加えて,GWASには偽陰性の問題もある.偽陰性は,要は検出力の不足ということであり,その要因もさまざまである.たとえば,表現型にかかわる遺伝変異の集団中の頻度が低いときや,そもそもその遺伝子が表現型に与える効果がごく小さいとき,あるいは同じ表現型をもつ個体であってもそれぞれ別の遺伝子の変異が原因である場合などは,GWASで高いピークが検出されにくくなる.一般に,サンプル数を増やすことで検出力は上昇していくものの,表現型変異の原因となる突然変異の頻度が極端に低いときなどは検出が難しいだろう.

このような偽陽性・偽陰性の問題はあるものの,GWASによりこれまでに自然変異にかかわるさまざまな遺伝子が同定されてきた.シロイヌナズナでは,開花タイミングや病害抵抗性などに関して,すでに機能が知られていた遺伝子がGWASで多くヒットしたほか(8, 11)8) S. Atwell, Y. S. Huang, B. J. Vilhjálmsson, G. Willems, M. Horton, Y. Li, D. Meng, A. Platt, A. M. Tarone, T. T. Hu et al.: Nature, 465, 627 (2010).11) I. Baxter, J. N. Brazelton, D. Yu, Y. S. Huang, B. Lahner, E. Yakubova, Y. Li, J. Bergelson, J. O. Borevitz, M. Nordborg et al.: PLoS Genet., 6, e1001193 (2010).,たとえば根端分裂組織のサイズ変異についてはGWASにより全く新規の遺伝子が同定されている(12)12) M. Meijón, S. B. Satbhai, T. Tsuchimatsu & W. Busch: Nat. Genet., 46, 77 (2014)..また,イネにおいても最近GWASが盛んに行われており,芒(のぎ)の長さや開花タイミング,背丈などに関連する遺伝子が同定されている(13, 14)13) X. Huang, X. Wei, T. Sang, Q. Zhao, Q. Feng, Y. Zhao, C. Li, C. Zhu, T. Lu, Z. Zhang et al.: Nat. Genet., 42, 961 (2010).14) K. Yano, E. Yamamoto, K. Aya, H. Takeuchi, P. C. Lo, L. Hu, M. Yamasaki, S. Yoshida, H. Kitano, K. Hirano et al.: Nat. Genet., 48, 927 (2016).

GWASから,機能がすでに知られていた遺伝子にさらにほかの機能があることが明らかになった例もある.シロイヌナズナの浸透圧耐性にかかわる遺伝子の研究を紹介しよう(15)15) H. Ariga, T. Katori, T. Tsuchimatsu, T. Hirase, Y. Tajima, J. E. Parker, R. Alcázar, M. Koornneef, O. Hoekenga, A. E. Lipka et al.: Nat. Plants, 3, 17072 (2017)..シロイヌナズナは北半球を中心に広い分布をもつため,生育する環境も系統によってさまざまである.それぞれの系統は生育地の多様な外的環境に適応して進化してきたと考えられるが,浸透圧(水分欠乏)耐性はそのよい例である.実験室においてシロイヌナズナを高塩分濃度培地でしばらく育てると,系統によっては順化し浸透圧耐性を獲得するものがいる一方で,全く浸透圧耐性をもたない系統も見られることがわかった.この浸透圧耐性の表現型変異を約200の野生系統について定量しGWASを行うと,5番染色体上のある領域でピークが見られた.この領域の遺伝子を詳しく調べてみると,既知の浸透圧ストレス耐性関連遺伝子に類似した特徴はもっておらず,驚くべきことに,植物の免疫応答遺伝子として知られるTIR-NLR遺伝子であることがわかった.新たにACQOSと名づけられたこの遺伝子について,塩基配列をさまざまな系統で調べてみると,実はACQOS遺伝子をもたない系統が多数派であり,ACQOS遺伝子をもつ系統では浸透圧耐性が失われていることがわかった.ACQOS遺伝子を捨て,浸透圧耐性をもつ個体のほうが自然選択上より有利であるように思えるが,なぜACQOS遺伝子がシロイヌナズナ種内で維持されているのだろうか.詳しく実験してみると,ACQOSをもつことで,浸透圧耐性が失われる代わりに防御応答や病原菌抵抗性は高まることが明らかになった.浸透圧耐性と病原菌への抵抗との間にこのようなトレードオフがあり,かつそれが1個の遺伝子に規定されていることで,ACQOS遺伝子の有無に関する多型が長期的に維持されてきたと考えられる.実際,ACQOS遺伝子周辺の遺伝的多様性はゲノム平均より極めて高く,これは多様化選択により多様性が維持されてきたことを裏づける結果である.

おわりに

本総説では,種内,もしくは近縁な複数種の多数個体についてSNPのデータセットを作成し,そこから集団の進化史の推定やGWASを行う方法やその適用例を紹介してきた.集団ゲノミクスの統計・解析手法はさまざまなものがあるものの,その適用例は,本総説で紹介してきた通り,依然としてシロイヌナズナやイネなどのモデル生物に限られているのが現状である.しかしながら,シーケンス技術の向上は今も急速に続いており,今後このような研究手法がいわゆる「非モデル生物」にも本格的に利用されるようになる日は近いと考えられる.さらなる研究の発展に期待したい.

Reference

1) J. Novembre, T. Johnson, K. Bryc, Z. Kutalik, A. R. Boyko, A. Auton, A. Indap, K. S. King, S. Bergmann, M. R. Nelson et al.: Nature, 456, 98 (2008).

2) J. K. Pritchard, M. Stephens & P. Donnelly: Genetics, 155, 945 (2000).

3) S. Schiffels & R. Durbin: Nat. Genet., 46, 919 (2014).

4) 1001 Genomes Consortium: Cell, 166, 481 (2016).

5) R. N. Gutenkunst, R. D. Hernandez, S. H. Williamson & C. D. Bustamante: PLoS Genet., 5, e1000695 (2009).

6) E. Y. Durand, N. Patterson, D. Reich & M. Slatkin: Mol. Biol. Evol., 28, 2239 (2011).

7) P. Y. Novikova, N. Hohmann, V. Nizhynska, T. Tsuchimatsu, J. Ali, G. Muir, A. Guggisberg, T. Paape, K. Schmid, O. M. Fedorenko et al.: Nat. Genet., 48, 1077 (2016).

8) S. Atwell, Y. S. Huang, B. J. Vilhjálmsson, G. Willems, M. Horton, Y. Li, D. Meng, A. Platt, A. M. Tarone, T. T. Hu et al.: Nature, 465, 627 (2010).

9) H. M. Kang, J. H. Sul, S. K. Service, N. A. Zaitlen, S. Y. Kong, N. B. Freimer, C. Sabatti & E. Eskin: Nat. Genet., 42, 348 (2010).

10) X. Zhou & M. Stephens: Nat. Genet., 44, 821 (2012).

11) I. Baxter, J. N. Brazelton, D. Yu, Y. S. Huang, B. Lahner, E. Yakubova, Y. Li, J. Bergelson, J. O. Borevitz, M. Nordborg et al.: PLoS Genet., 6, e1001193 (2010).

12) M. Meijón, S. B. Satbhai, T. Tsuchimatsu & W. Busch: Nat. Genet., 46, 77 (2014).

13) X. Huang, X. Wei, T. Sang, Q. Zhao, Q. Feng, Y. Zhao, C. Li, C. Zhu, T. Lu, Z. Zhang et al.: Nat. Genet., 42, 961 (2010).

14) K. Yano, E. Yamamoto, K. Aya, H. Takeuchi, P. C. Lo, L. Hu, M. Yamasaki, S. Yoshida, H. Kitano, K. Hirano et al.: Nat. Genet., 48, 927 (2016).

15) H. Ariga, T. Katori, T. Tsuchimatsu, T. Hirase, Y. Tajima, J. E. Parker, R. Alcázar, M. Koornneef, O. Hoekenga, A. E. Lipka et al.: Nat. Plants, 3, 17072 (2017).