現在の我が国の制度では，機能性を表示できる食品は保健機能食品のみである．この保健機能食品の中でも特定保健用食品（トクホ）や機能性表示食品では，ヒト試験の成績が有効性のエビデンスとして要求される．トクホでは，販売しようとする商品と同じものを被験物として使用し，直接ヒト試験で有効性を示すことによりエビデンスとする．このプロセスは，試験の規模や各種ガイドラインの有無など様々な点で違いはあるものの，医薬品の承認審査の考え方と基本的には同じである．一方，機能性表示食品では，トクホと同様に直接ヒト試験で有効性を示してエビデンスを取得する方法と，有効成分（正確には機能性関与成分）の有効性を，ヒト試験を対象としたシステマティックレビュー（SR）で評価しエビデンスとする方法が認められている⁽¹⁾1) 消費者庁：機能性食品の届出等に関するガイドライン，令和4年4月1日，消食表第136号．．両者には許可制と届出制の違いがあるものの，食品成分の生理活性に関する研究結果を社会に還元する大切な役割を担っていると考える．こうした背景より，機能性食品は保健機能食品を手本とし，ヒト試験で有効性を検証することが当たり前になりつつある．本稿では，統計解析からみた機能性食品におけるヒト試験の有効性評価について紹介する．

・機能性食品におけるヒト介入試験と統計解析

研究対象が医薬品であっても食品成分であっても，得られたエビデンス強度のヒエラルキーに関する考え方は変わらず，無作為化比較試験で実施することが理想である．このため，食品成分の有効性を検証する試験でも，無作為化比較試験を試験デザインとして採用する研究が多数報告されている．また，試験ボランティアに対する倫理的配慮や試験プロトコールの登録制度など，ヒト試験の運用に関するルールも基本的には同じである．このように両研究分野におけるヒト試験は似ているが，細かい点で相違点がいくつかある．例えば，機能性食品の有効性評価のための被験者は，健常人から（疾病の）境界域者を選択基準に行うことが多いことや，期待される有効性の大きさ（effect size）が医薬品に比べて小さい場合が多い．また，サンプルサイズが極めて多い試験を実施することが資金の面で困難な場合が多い．このような場合，介入効果に対する共変量（covariate）の影響が大きくなる可能性がある⁽²⁾2) 角間辰之，服部　聡：“臨床試験のデザインと解析—薬剤開発のためのバイオ統計—”，近代科学社，2012, pp. 99–132.．特にサンプルサイズが小さい試験の場合，介入群と対照群との間で共変量のアンバランスが起きている場合，介入効果の評価結果にはバイアスが生じる．例えば，ある食品成分の効果が年齢の影響を受ける場合，試験群と対照群の年齢帯が異なっている（アンバランス状態）と，本来なら食品成分に効果があるにも関わらず，介入後の測定値を比較すると，見かけ上効果として差が見えなくなることがある．これは一種のバイアスである．この場合，データ解析時に年齢を共変量として処理する必要があったということになる．

共変量は性別や年齢だけではなく，介入前の測定値も含まれる．上述した通り，機能性食品のヒト試験の被験者は健常人から境界域者（あるいは軽度疾患者）であるため，介入前の測定値に幅があり，これが介入後の測定値の共変量となることがある．

共変量で調整した解析方法の代表は共分散分析（analysis of covariance; ANCOVA）である．ANCOVAは回帰分析の考え方を群間比較に用いた手法であり，共変量や交絡因子が多いヒト試験の解析では有効な手法の一つである（図1図1■共分散分析の概念）．ANCOVAの統計学的な理論は，紙面の都合で割愛するが，最近では一般的な統計解析ソフトでサポートされていることが多く，プログラムなどを書かなくても実行できるので，興味をある読者は是非試して頂きたい．

図1■共分散分析の概念

・メタアナリシスと統計解析手法

1. 統合解析

2015年に機能性表示食品の制度がスタートしたが，これを機にSRへの注目が，特に機能性食品を開発するメーカーで一気に高まったと言える．機能性表示食品の市場が大きくなったのは，SRという手法を，関与成分の有効性のエビデンスとして使えるようになったからと言っても過言ではないだろう．機能性表示食品で行われるSRは定性的SRと定量的SRの2つがあるが，特に後者をメタアナリシスという．メタアナリシスは当初社会科学（特に教育学）の分野で始まった⁽³⁾3) 丹後俊郎：“新版　メタ・アナリシス入門”，朝倉書店，2016．．1985年にYusurfらが心筋梗塞後のβブロッカーの長期投与による2次予防効果をメタアナリシスで解析した結果が報告され，その後急速に臨床試験を対象とした分野に広がった⁽^{3, 4)}3) 丹後俊郎：“新版　メタ・アナリシス入門”，朝倉書店，2016．4) S. Yusuf, R. Peto, J. Lewis, R. Collins & P. Sleight: Prog. Cardiovasc. Dis., 27, 335 (1985).．メタアナリシスは複数の試験結果を，あたかも一つの大きな試験の結果として解析しているように見えるが，単純にデータをプールしている訳ではない．集められた研究は試験実施場所，サンプルサイズ，介入後の効果量などが試験によって異なるからである．そこで，メタアナリシスでは，個々の研究結果の分散を用いて重み付けを行い，結果を統合する．

統合する解析モデルには，母数効果モデル（fixed-effects model）と変量効果モデル（random-effects model）がある．母数効果モデルは各研究に偏りはなく均質であるとし，各研究結果の変動（バラツキ）は偶然誤差であるとしている．重み付けは下記の通りである．

$\begin{matrix} (1) & \begin{array}{l} 母数効果モデルの各研究の重み \\ = \frac{1}{各研究の推定誤差の分散} = \frac{1}{（各研究の標準誤差）^{2}} \end{array} \end{matrix}$

この式から，標準誤差（SE）が小さい方が，重み付けが大きくなることがわかる．

SEはサンプル数が大きくなると小さくなるので，被験者が多い研究から得られた結果は，重み付けが大きくなる．

一方，変量効果モデルは各研究に偏りがあり，研究間に異質性があるとして処理する．そもそもメタアナリシスでは，複数の独立した研究結果を統合して行うが，個々の研究は実施場所，対象者の人種，対象者の人数，投与方法など研究間で異なる項目が多数ある．特に食品成分を対象とした研究は，試験実施場所の違いは，その地域の普段の食習慣や人種差が試験結果に影響するかもしれない．こうした違いが，個々の研究で報告した結果が同じにならない，つまり異質性として表れているのではないかと考える．そこで，変量効果モデルでは各研究結果の変動（バラツキ）は偶然誤差と各研究の偏りによって起きていると捉え，研究間のバラツキを考慮して重みづけを行う．研究間のバラツキはTau²（τ²）として計算される．τ²の計算方法は専門書を参照されたい⁽³⁾3) 丹後俊郎：“新版　メタ・アナリシス入門”，朝倉書店，2016．．

$\begin{matrix} (2) & \begin{array}{l} 変量効果モデルの各研究の重み \\ = \frac{1}{{(各研究の標準誤差)}^{2} + τ^{2}} \end{array} \end{matrix}$

この式から，研究間のバラツキが大きい場合，重み付けが小さくなることがわかる．また，研究間のバラツキが無い場合，τ²＝0となり母数効果モデルと同じ結果になることがわかる．

研究間に異質性があるかどうかは，コクランQ統計量とI²値で判断ができる．Q統計量は，メタアナリシスで統合した効果量と各研究の効果量の差を用いて計算する．

$\begin{matrix} (3) & Q = \sum {各研究の重み \times {(各研究の効果量 - 統合した効果量)}^{2}} \end{matrix}$

Q統計量はχ²検定のp値で示されるので，p＜0.05であれば異質性があると判断する．一方，Q統計量の結果では，異質性の有無は判断できるが，その大小は判断できない．そのため，I²値が考案されている．

$\begin{matrix} (4) & I^{2} = 100 % \times {\frac{Q - (研究の数 - 1)}{Q}} \end{matrix}$

I²は0～100％の値を取り，一般的には0～25％では問題となる異質性はなく，25～50％は中程度，50～75％は高い，75％～100％では極めて高い異質性があると判断する．

異質性がない場合は母数効果モデルと変量効果モデルは同じ統合結果を示す．一方，異質性があると判断された場合，統合解析は異質性を考慮した変量効果モデルで行う．またその原因を探るため，サブグループ解析を行う．メタアナリシスで統合した結果はフォレストプロットで表される（図2図2■フォレストプロットの例（Sample Xが血中コレステロールに与える影響））．メタアナリシスをソフトウエアで行うと，フォレストプロットの作図，τ²値，Q統計量やI²もレポートなどが自動で返ってくる．

図2■フォレストプロットの例（Sample Xが血中コレステロールに与える影響）

2. 出版バイアスの検証

研究者にとって好ましい結果が得られた時，その研究結果が公表されやすくなる．この偏りを出版バイアスまたは公表バイアスと呼ぶ．出版バイアスの検出は，効果指標を横軸に，サンプルサイズ，1/SEまたはSEを逆方向に縦軸にプロットしたファンネルプロットが用いられる（図3図3■ファンネルプロットの例（Sample Xが血中コレステロールに与える影響））⁽⁵⁾5) J. P. T. Higgins & J. Thomas: “Cochrane Handbook for systematic reviews of interventions 2nd Edition”, John Wiley & Sons, 2019, pp. 241–431.．ファンネルプロットは，サンプルサイズが大きい研究から得られた結果は，より真の値に近づくことを利用している．もし実施した研究が全て公開されていれば，ファンネルプロットは左右対象のプロットを示し，縦軸の上に向かって，ある値（真の値）に収束していくはずである．反対に出版バイアスがあれば，左右非対称なプロットになるはずである．

出版バイアスの検出はファンネルプロットの観察に加え，Beggの検定やEggerの検定などで評価ができる．

本稿では機能性食品の有効性評価に関わる統計解析手法について，機能性食品の介入試験で良く直面する課題として「共変量の調整」と，機能性表示食品で注目されている「メタアナリシスの基本」をごく簡単に紹介した．機能性表示食品の制度を機に，今後，機能性食品の有効性評価におけるデータ解析やSRの方法論の議論が活発になることを多いに期待する．

図3■ファンネルプロットの例（Sample Xが血中コレステロールに与える影響）