解説

ベニバナ色素生合成経路のトランスクリプトーム解析による解明紅の生産にかかわる遺伝子に迫る

Transcriptomic Study of Biosynthetic Pathway of Carthamus Pigments: Exploring Genes Related to Carthamin Biosynthesis

Kohei Kazuma

数馬 恒平

名古屋大学大学院情報学研究科

帝京科学大学生命環境学部

Hiromichi Kenmoku

兼目 裕充

徳島文理大学薬学部

Junichi Shinozaki

篠崎 淳一

昭和薬科大学薬学部

Published: 2017-10-20

紅(べに)は紅花(ベニバナ)の加工花から得られる赤色色素であり,その数千年にも及ぶ用途は,動物性および植物性繊維の染色,化粧品,医薬品および食用色素である.筆者らは紅の前駆物質などベニバナ色素の化学構造を決めて以来,ベニバナが紅を合成する仕組みについて興味をもってきた.最近,花で発現する遺伝子を網羅的に明らかにするトランスクリプトーム解析を行うことで,紅の生合成にかかわる遺伝子の候補が見えてきた.本稿では紅の化学的および生物学的背景について,また最新の研究結果と周辺領域の研究とを合わせて見えてくる紅の推定生合成経路について解説する.

ベニバナとベニバナ色素

1. 紅花の花の加工と紅の調製

ベニバナ(Carthamus tinctorius)はその名「紅花」とは裏腹に黄色い花を咲かせる(図1図1■ベニバナの花の成長,収穫および加工).総苞に包まれて成長した集合花は,開花直前に一気に花の基部が伸張し総苞をこじ開け,外部に細長い黄色の花を露わにし,蕾がなくなるまで毎日新しい花が現れる.個々の花は開花後徐々に花弁の基部から赤みを帯び,やがて花全体へ拡がり赤黒くしおれる.このとき生じる赤色素は紅と化学的に同一だが,赤黒い花は収量も品質も優れないため紅の生産には用いない.

図1■ベニバナの花の成長,収穫および加工

花は,緑の総苞の上部にポンポンがついているように見えるとき収穫する.これを天日で乾燥させたオレンジ色の乾燥花が「乱花」で,主に生薬として用いる.収穫花を日陰に数日間放置し発酵後,形成して天日で乾燥したものが「紅餅」で,紅の生産に用いる(図1図1■ベニバナの花の成長,収穫および加工).

紅の生産は,まず紅餅を水で繰り返し洗浄し,水溶性黄色色素を十分に取り除く.次いで,残渣に残った紅を草木灰の灰汁で抽出する.この暗赤色の抽出液に烏梅汁(梅の燻製の熱湯抽出液)を加減して加えた鮮赤色の液で青苧などの繊維を染色する.染色した繊維を水洗後,再度灰汁で抽出すると紅の純度が高まる.この抽出液に烏梅汁を十分に加えると紅が沈殿するので,これを絹二重で越して泥状の紅を得る.

2. カーサミンとプレカーサミン

紅の化学的本質はカーサミン(カルタミン)というフラボノイド系の赤色色素である(1~3)1) C. Kuroda: J. Chem. Soc., 1930, 752 (1930).2) H. Obara & J. Onodera: Chem. Lett., 8, 201 (1979).3) Y. Takahashi, N. Miyasaka, S. Tasaka, I. Miura, S. Urano, M. Ikura, K. Hikichi, T. Matsumoto & M. Wada: Tetrahedron Lett., 23, 5163 (1982).図2図2■変異の遺伝的背景を示唆する花色変異体の色素構成).カーサミンはベニバナ色素に特徴的なキノカルコンC-グルコシド(QCG)骨格をもつQCG二量体で,左右の発色団が中央のメチン炭素を介して共役しており,赤色の発色に貢献している.全合成はまだ達成されていないが,最近の全合成研究に注目したい(4)4) T. Hayashi, K. Ohmori & K. Suzuki: Org. Lett., 19, 866 (2017).

図2■変異の遺伝的背景を示唆する花色変異体の色素構成

破線丸内は6-ヒドロキシケンフェロールとQCG骨格の相同な部位の水酸基を示す.

紅餅の調製を通して,カーサミンの前駆物質プレカーサミンが,植物自身の酸化酵素あるいは微生物の作用でカーサミンへ変換される(5, 6)5) T. Kumazawa, S. Sato, D. Kanenari, A. Kunimatsu, R. Hirose, S. Matsuba, H. Obara, M. Suzuki, M. Sato & J.-i. Onodera: Chem. Lett., 23, 2343 (1994).6) K. Kazuma, E. Shirai, M. Wada, K. Umeo, A. Sato, T. Matsumoto & T. Okuno: Biosci. Biotechnol. Biochem., 59, 1588 (1995).図2図2■変異の遺伝的背景を示唆する花色変異体の色素構成).プレカーサミンは二つのQCG骨格で置換された酢酸の構造を有しており,酸化的脱炭酸反応により左右の発色団間に不飽和のメチン炭素が生じる.食品添加物のうち,カーサミンを主成分とするものをベニバナ赤色素,水で抽出される水溶性黄色色素をベニバナ黄色素という(7)7) 日本食品化学研究振興財団:既存添加物名簿収載品目リスト,http://www.ffcr.or.jp/zaidan/MHWinfo.nsf/a11c0985ea3cb14b492567ec002041df/c3f4c591005986d949256fa900252700?OpenDocument, 2014.

3. 新鮮花と加工花,花色変異体間でフラボノイド組成が異なる

キノカルコンC-グルコシド類(QCGs)はベニバナに特異な化合物群で十数種類知られている.カーサミン以外はすべて黄色である.QCGsの構造の多様性は乱花で大きく十数種類のQCGが検出されるが,新鮮花では主成分としてヒドロキシサフロールイエロウAとサフロールイエロウBが,マイナー成分としてアンヒドロサフロールイエロウB,プレカーサミンおよびカーサミンなどが検出される程度の単純さがあり(8)8) K. Kazuma, T. Takahashi, K. Sato, H. Takeuchi, T. Matsumoto & T. Okuno: Biosci. Biotechnol. Biochem., 64, 1588 (2000).,乱花中には乾燥加工中に二次的に生じたQCGsがあることを示唆している.

ベニバナには,花色が黄色で赤くならない黄花系統,花色が白の白花系統がある.これらの花色変異型に対して,カーサミン生産系統をここでは赤花系統と呼ぶことにする.花色の変異型は,QCGsの合成に関連する複数の遺伝子が変異して生じたと考えられる.黄花系統はプレカーサミンおよびカーサミンを含まない以外QCGsの組成もフラボノール組成も赤花系統と同じである(8)8) K. Kazuma, T. Takahashi, K. Sato, H. Takeuchi, T. Matsumoto & T. Okuno: Biosci. Biotechnol. Biochem., 64, 1588 (2000).図2図2■変異の遺伝的背景を示唆する花色変異体の色素構成).白花系統ではQCGsと6-ヒドロキシケンフェロール配糖体を含まず,フラボノール配糖体を含んでいる(8)8) K. Kazuma, T. Takahashi, K. Sato, H. Takeuchi, T. Matsumoto & T. Okuno: Biosci. Biotechnol. Biochem., 64, 1588 (2000)..QCGsの4位と6-ヒドロキシフラボノールの6位はフラボノイドA環の相同な部位であり,赤花および黄花のQCGs生産系統のみがこの部位に水酸基をもつ.このことを考慮して推定生合成経路が提案されたが(8)8) K. Kazuma, T. Takahashi, K. Sato, H. Takeuchi, T. Matsumoto & T. Okuno: Biosci. Biotechnol. Biochem., 64, 1588 (2000).,十分に遺伝的な背景に迫れる結果ではなかった.そこで,筆者らは花色変異の遺伝的背景を考慮したトランスクリプトーム解析を行った.

次世代シーケンサーを用いたベニバナのトランスクリプトーム解析

1. 解析戦略

次世代シーケンサー(next generation sequencer; NGS)を用いたトランスクリプトーム解析(RNA-seq)は,個々の未知遺伝子の配列情報に加え,これらの発現量をも明らかにすることができる.筆者らはまず,各花色系統の花のフラボノイド組成の差異(図2図2■変異の遺伝的背景を示唆する花色変異体の色素構成)は,フラボノイド生合成関連遺伝子の(変異を含む)発現量の差異に依存すると仮定し,各花色系統の花と赤花系統の葉のmRNAを対象としたRNA-seqと遺伝子発現パターンのクラスタリング解析およびアノテーションを行うこととした.なお,ベニバナの花のトランスクリプトーム解析には前例があるが(9~11)9) H. Li, Y. Dong, J. Yang, X. Liu, Y. Wang, N. Yao, L. Guan, N. Wang, J. Wu & X. Li: PLOS ONE, 7, e30987 (2012).10) H. Lulin, Y. Xiao, S. Pei, T. Wen & H. Shangqin: PLOS ONE, 7, e38653 (2012).11) X. Liu, Y. Dong, N. Yao, Y. Zhang, N. Wang, X. Cui, X. Li, Y. Wang, F. Wang, J. Yang et al.: Int. J. Mol. Sci., 16, 25657 (2015).,その後フラボノイド生合成関連酵素遺伝子のクローニングは報告されていない.

2. サンプル調製とシーケンス

現時点で代表的なNGSはIlumina社のHiSeq/NextSeq/MiSeqシリーズ,Thermo Fisher Scientific社のIon proton/Ion S5シリーズおよびPacific Bioscience社のPacBio RS ll/PacBio Sequelシリーズがある.これらの機器は,シーケンスの原理や塩基配列の読める長さ,正確性などについてそれぞれ特徴があり,機器自体の発展や試薬性能の向上も日進月歩である.筆者らがベニバナのRNA-seqに用いたのは,Ilumina社のGenome Analyzer IIxであり,以下のサンプル調製の過程は現行のシリーズでもほぼ同じである.各RNAサンプルの抽出は市販のRNA抽出キットを数種試し,Agilent社の2100 Bioanalyzerなどで評価の良いものを選ぶのが理想的である.RNAの抽出・品質評価の後は,使用する試薬のマニュアルに沿ってmRNA精製,逆転写,断片化,アダプター配列の付加などを進め,サンプル調製が完了する.現在では,受託解析でも読み取り塩基長100 bp以上でcDNA断片の両端を読むペアエンドシーケンスが主流であるが,筆者らは当時の主流であった100 bpのシングルエンドシーケンスを行った.

3. シーケンスデータの解析環境

非モデル生物のトランスクリプトームを解読する場合には,参照配列がないため,NGSで得られたリード断片を新規(de novo)に張り合わせ(アセンブル)して元の配列を再構成する必要がある.トランスクリプトームのde novoアセンブルのためのソフトウェア(アセンブラー)などは無償配布で使えるものが数多く開発されており,国立遺伝学研究所ではこれらを無償で使用できるクラウド型データ解析プラットフォームを整備している(12)12) DDBJ: DDBJ Read Annotation Pipeline, https://p.ddbj.nig.ac.jp/pipeline/, 2017..シーケンスデータを外部に出さないで解析したい場合は解析環境を自前で整える必要がある.WindowsやMac上で動作する市販ソフトウェアの例として,CLC bio社/QIAGEN社のCLC genomicsシリーズは,リード断片に入り込んだアダプター配列や品質の悪い部分配列の除去といったトリミングから,アセンブルおよび相同性検索や遺伝子発現量の可視化までも行うことができる.一方,無償配布のプログラム群はそれぞれの開発者が管理しており,そのほとんどはコンピューターOSのLinux上でコマンドラインから実行する必要がある.これらのプログラムを使用するためにはLinuxに加えてPerl, Ruby, Rといったスクリプト言語の知識も少々必要ではあるが,プログラムの導入・使用方法もSEQanswers(13)13) SEQanswers: SEQanswers: the next generation sequencing community, http://seqanswers.com/, 2017.やTogoTV(14)14) DBCLS: TOGO TV, http://togotv.dbcls.jp/, 2017.で解説されており,敷居は年々低くなってきている.現在,筆者らのデータ処理は,LinuxディストリビューションのUbuntu(15)15) U. J. Team: Ubuntu, https://www.ubuntulinux.jp/, 2017.を導入した64 bit市販コンピュータ(CPU: 4コア8スレッド,メモリ:32 G)に無償配布されている複数のプログラムを導入して行っている.

4. シーケンスデータ処理とアセンブル

NGSによって得られたデータは配列とクオリティ値を一つにまとめたFASTQファイルとして取り扱われる.アセンブラーによるde novoアセンブルを行う前に,FASTQファイルを丹念かつ慎重にトリミングを行うことで,アセンブラーで得られるContig配列の長さが飛躍的に伸びることを筆者らは経験している.筆者らは,tagcleaner.pl(16)16) R. Schmieder, Y. Lim, F. Rohwer & R. Edwards: TagCleaner: for cleaner sequences, http://tagcleaner.sourceforge.net/index.html, 2013.プログラムを用いて両末端のアダプター配列,クオリティ値の悪い両末端部分配列,塩基配列がNとされた両末端配列を複数回除去するように設定したbashスクリプトを作成・実行して,トリミングを行っている.

トランスクリプトーム用のアセンブラーではTrinity(17)17) B. Haas: RNA-Seq De novo Assembly Using Trinity, https://github.com/trinityrnaseq/trinityrnaseq/wiki, 2017.がよく使われているが,得られたContig配列から目的候補遺伝子を抜き出してみると,一つの遺伝子に由来すると思われる複数の配列が得られている場合が多い.これは複数の転写産物(splice variants)が存在している場合に加え,多型や遺伝子重複といった生物学的な理由とシーケンスエラーに起因すると思われる断片化したContigを含んでいるためである.P450酵素遺伝子や糖転移酵素遺伝子といったファミリーが大きい遺伝子の機能解析を行いたい場合は,この断片化したContig同士を探して張り合わせる作業で苦労する.筆者らはこれをなるべく省力化するため,SEQanswersで初期に提案のあった以下のようなアセンブル方法をとることで良好な結果を得ることができた.ABySS(18)18) A. Raymond: ABySS: Assembly By Short Sequences—A de novo, parallel, paired-end sequence assembler, http://www.bcgsc.ca/platform/bioinfo/software/abyss, 2016.は現在でも並列処理化やペアエンドシーケンス,トランスクリプトームへの対応など更新が続いているゲノム用アセンブラーである.このプログラムで用いられているアルゴリズムで重要なパラメータにk-merがあり,kの値はアセンブルの際の「のりしろ」となる塩基配列の長さに相当する.k値を大きくすると,高発現の長いContigが得られる傾向にある.一方,k値を小さくすると低発現の配列も拾われるが,得られるContigは断片化する.Trinityはk=25をk-merとして固定しているのに対し,筆者らはABySSを用いてk=25~95でアセンブルを行い,多数の重複するContigを得るという戦略を採用した.ここで得られたContigは集合和としてさらに貼り合わせる必要がある.NGSの登場以前にEST(expressed sequence tag)配列の末端同士を貼り合わせるためにCAP3(19)19) X. Huang: CAP3 and PCAP and PCAP.Solexa, http://seq.cs.iastate.edu/, 2017.というプログラムが用いられており,筆者らはCAP3を内部で用いて並列処理化されたPCAP(19)19) X. Huang: CAP3 and PCAP and PCAP.Solexa, http://seq.cs.iastate.edu/, 2017.の使用を新たに検討し,この張り合わせで良好な結果を得ることができた.さらにCD-HIT-EST(20)20) W. Li: CD-HIT, http://weizhongli-lab.org/cd-hit/, 2017.を用いた重複配列の統合を行うことで冗長性のないSupercontigを得ることができた.筆者らは,ABySSによる複数のk値によるアセンブルからPCAPおよびCD-HIT-ESTによる統合までの工程をbashスクリプトでまとめて実行している.また,次に述べる遺伝子発現パターンのクラスタリング解析のために,共通するリファレンス配列が必要となることから,赤,黄および白のベニバナ花弁と赤花ベニバナの葉についてPCAP実行後に得られたContigすべてをまとめて投入してCD-HIT-ESTを実行し,得られたものをリファレンス配列として用いるUnigene配列とした.

5. 遺伝子発現パターンのクラスタリング解析とアノテーション

花色の違いを利用してカーサミンの生合成関連遺伝子群を絞り込むために,各花色系統間の遺伝子発現量を比較することとした.Bowtie2(21)21) B. Langmead: Bowtie 2: Fast and sensitive read alignment, http://bowtie-bio.sourceforge.net/bowtie2/index.shtml, 2017.はFASTQファイルなどのリード配列をリファレンス配列に高速でマッピング(貼り付け)を行い,その数をカウントするプログラムである.ただし,このカウント数を直接比較はできない.なぜなら,サンプルごとに得られたリード総数は異なり,また,遺伝子の配列長に応じてマッピングされるリード数は増えるからである.このカウント数を比較できるようにすることを正規化と言い,RPKM(reads per kilobase per million mapped reads)値がよく用いられる.前述のUnigene配列はUTR(非翻訳領域)配列を含み,そのままマッピングを行うと正確なカウント数を得ることができないことから,TransDecoder(22)22) B. Haan: TransDecoder (Find Coding Regions Within Transcripts), https://transdecoder.github.io/, 2015.によるORF(Open Reading Frame)配列の切り出しを行い,得られたUnigene-ORF配列をリファレンス配列に用いてマッピングを行った.TransDecoderはORF配列を切り出す際にblastp検索結果およびPfamデータベースを対象としたドメイン・モチーフ検索結果を用いるため,この過程でUnigene-ORF配列のアノテーション(意義づけ,注釈)も同時に行うことになる.赤,黄および白花系統の花弁と赤花系統の葉のそれぞれのマッピングカウント数からeXpress(23)23) A. Roberts: eXpress: Streaming quantification for high-throughput sequencing, https://pachterlab.github.io/eXpress/overview.html, 2017.により遺伝子発現量をRPKM値として算出し,MeV(24)24) A. Saeed: MeV, https://sourceforge.net/projects/mev-tm4/, 2017.ツールによりlog2でクラスタリング後に可視化した結果の一部を図3図3■各花色系統における遺伝子発現量の比較に示す.CHS(カルコン合成酵素),P450酵素,UGT(糖転移酵素類),酸化還元酵素,転写因子等の各候補遺伝子配列において,赤花のみ,または赤花と黄花で強く発現しているものを明らかにできたことから,これらが図2図2■変異の遺伝的背景を示唆する花色変異体の色素構成に示す各花色系統間のフラボノイド組成にかかわる遺伝子発現の差異を表していると期待している.現在ここで得られた候補遺伝子を中心に機能解析を進めている.

図3■各花色系統における遺伝子発現量の比較

生合成関連酵素遺伝子のクローニングとQCG推定生合成経路

1. カルコン合成酵素遺伝子のクローニング

トランスクリプトーム解析および発現解析の結果を受けて,筆者らはまずIII型ポリケタイド合成酵素(PKSIII)をクローニングした(25)25) J. Shinozaki, H. Kenmoku, K. Nihei, K. Masuda, M. Noji, K. Konno, Y. Asakawa & K. Kazuma: Nat. Prod. Commun., 11, 787 (2016)..PKSIIIは分子量約40 kDaのサブユニットからなるホモダイマー酵素であり,植物においてはフラボノイド,カテキン(茶)やカンナビノイド(大麻)などさまざまな二次代謝産物の生合成にかかわっている.これまでに最もよく研究がなされているPKSIIIはカルコン合成酵素(CHS)である.CHSは1分子のp-クマロイルCoAを開始基質として,3分子のマロニルCoAに由来するC2単位を順次縮合の後,クライゼン型の環化反応が進行して,C6–C3–C6構造のフラボノイド骨格(ナリンゲニンカルコン)を生成する(26, 27)26) M. B. Austin & J. P. Noel: Nat. Prod. Rep., 20, 79 (2003).27) 森田洋行,阿部郁朗:化学と生物,47, 772 (2009).

PKSIIIのうち赤花系統の花で高発現が見られたCtCHS1, 2,および3について赤花系統の花よりクローニングした.これら3種の遺伝子のORF(open reading frame)は約1,188 bpであり,約396残基のタンパク質(約40 kDa)をコードしていた.CtCHS1, 2,および3はアミノ酸配列で81~89%と高い相同性を示した.また,系統樹解析の結果,CtCHS1, 2および3はCHS/STS(スチルベン合成酵素)クラスターに入ることが明らかとなった.植物由来PKSは,大腸菌のケトアシルキャリアタンパク合成酵素III(FabH)を外群に選定することで,CHS/STSクラスターとそのほかのPKSクラスターに二分できることが知られている(28)28) I. Abe, Y. Takahashi, H. Morita & H. Noguchi: Eur. J. Biochem., 268, 3354 (2001)..さらに,CtCHS1, 2および3にはカルコン合成酵素で高度に保存されている触媒3残基(システイン164,フェニルアラニン215およびアスパラギン336)やそのほかの重要なアミノ酸残基もすべて保存されていた(25)25) J. Shinozaki, H. Kenmoku, K. Nihei, K. Masuda, M. Noji, K. Konno, Y. Asakawa & K. Kazuma: Nat. Prod. Commun., 11, 787 (2016).

大腸菌で発現させたこれらの組換えタンパク質について酵素活性を確認したところ,CtCHS1, 2, および3はいずれもp-クマロイルCoAを開始基質として生成物を与えることが明らかとなった.これら組換えタンパク質の基質特異性についても検討しており,p-クマロイルCoA以外の芳香族アシルCoA(カフェオイル,フェルロイル,およびシナポイルCoA)も基質として認識することがわかった.これらのことからCtCHS1, 2,および3は典型的なCHSであることが明らかになった.ベニバナの花からフラボノイド生合成関連遺伝子がクローニングされたのはこれが最初の例である.

赤花系統の花には今回クローニングおよび機能解析に成功したCtCHS1, 2,および3のほかにも,高発現しているPKSIIIがある.その中の2種(CtCHS-like 4および5)については酵素機能を解析中であり,QCG生合成との関連を調べている.

2. フラボノイド生合成とキノカルコン生合成の接点

QCG骨格の特徴は,4位のC-グルコシル基および水酸基,およびヘミキノン化カルコンA環である(図2図2■変異の遺伝的背景を示唆する花色変異体の色素構成).これらの特徴を与える酵素反応について考察する(図4図4■カーサミン推定生合成経路).まずC-グルコシルトランスフェラーゼ(CGT)遺伝子は,最近コムギなどからクローニングされており一般的に2-ヒドロキシフラバノン(希にフラボン)を基質とする(29~34)29) M. Brazier-Hicks, K. M. Evans, M. C. Gershater, H. Puschmann, P. G. Steel & R. Edwards: J. Biol. Chem., 284, 17926 (2009).30) M. L. Falcone Ferreyra, E. Rodriguez, M. I. Casas, G. Labadie, E. Grotewold & P. Casati: J. Biol. Chem., 288, 31678 (2013).31) Y. Nagatomo, S. Usui, T. Ito, A. Kato, M. Shimosaka & G. Taguchi: Plant J., 80, 437 (2014).32) D. Chen, R. Chen, R. Wang, J. Li, K. Xie, C. Bian, L. Sun, X. Zhang, J. Liu, L. Yang et al.: Angew. Chem. Int. Ed. Engl., 54, 12678 (2015).33) Y. Hirade, N. Kotoku, K. Terasaka, Y. Saijo-Hamano, A. Fukumoto & H. Mizukami: FEBS Lett., 589, 1778 (2015).34) T. Ito, S. Fujimoto, F. Suito, M. Shimosaka & G. Taguchi: Plant J., 91, 187 (2017)..ベニバナでも同類のCGTが関与するとすれば,2-ヒドロキシナリンゲニンの合成にかかわるフラボノイド2位水酸化酵素(F2H)の関与は濃厚だが,ベニバナはC-グリコシル化フラボンを生産しない.