プロダクトイノベーション

血液中のアミノ酸プロファイルで健康状態を評価する「アミノインデックス技術」の開発と実用化

Akira Imaizumi

今泉

味の素株式会社イノベーション研究所 ◇ 〒210-8681 神奈川県川崎市川崎区鈴木町1番1号

Institute for Innovation, Ajinomoto Co., Inc. ◇ 1-1 Suzuki-cho, Kawasaki-ku, Kawasaki-ku, Kanagawa210-0801 Japan

Published: 2015-02-20

はじめに

昨今,「未病」という言葉を目にした方も多いと思う.この言葉はもともと中国由来(中国最古の医学書である「黄帝内経」に記載がある)で,日本では江戸時代に貝原益軒によって用いられたとされている.したがって語源的には東洋医学の用語ではあるが,最近健康・医療分野で再び大きくクローズアップされている.これは個人の健康意識の高まりや高齢化に伴う医療費の増大などにより,QOLや生命予後に大きな影響を及ぼす重篤な疾患を発症前に未然に防ぐことの重要性に対する認識の高まりに呼応していると考えられる.未病とは,読んで字のごとく,「いまだ病に至らぬ」状態で,健康と病気の間のマージナルな領域である.その時点で病気になる徴候を見つけ,適切な対応をとることができれば,QOLの低下も医療費の増大もより抑制することが可能になると期待される.したがって,医療の領域に属する疾患の有無の判定に特化された既存の検査指標とは異なり,疾患の徴候となる現象をより早期に,より簡単に(低侵襲性,簡便,低コスト)予防の領域でとらえるためには適切な指標(バイオマーカー)の探索と実用化が重要であると考えられる.

近年,末梢血や尿などを用いた疾患早期発見技術の開発が急速に進歩している.なかでもメタボローム解析は,遺伝的な要因とその後の生活・環境要因双方を反映していると考えられ,有望な手法である.しかし,代謝物は化学的・生化学的な特性や生体内の濃度分布が非常に広範囲で,生体内の代謝物を高精度で定量性高く網羅的に分析することは,最新の分析技術をもってしても困難である.そこで,測定対象とする代謝物を,広く代謝にかかわり,物性的に類似しており,かつ比較的高濃度で生体内に存在するものに絞り込んで測定する(いわゆる“focused metabolomics”)ことは,上記課題を克服する一つの有効な方法である.

「アミノインデックス技術」の技術的概要

アミノ酸は栄養源として食事によって摂取,あるいは体内で生合成され,さらには代謝制御にも関与する代謝ネットワークにおけるハブ物質であり,血液を含め多くの生体サンプル中に比較的多量含まれることなどからfocused metabolomicsの対象としても優れた性質を有していると考えられる.加えて,われわれはもともとアミノ酸の発酵生産などの事業を通じ,アミノ酸の分析技術の蓄積もほかに比較して優位性があると自負している.また,これまでの予備検討や他グループの先行研究の結果からも,血漿中遊離アミノ酸(Plasma free amino acid; PFAA)プロファイルがさまざまな病態で変化しているという知見が得られているものの,報告例はいずれも個々のアミノ酸が病態に相関する,という事実を述べるにとどまっている.そこで,多変量解析を用いて情報を圧縮することで,よりシンプルな形でかつ高精度でPFAAプロファイルから病態の差異を識別することが期待される(図1図1■「アミノインデックス技術」の概要).

図1■「アミノインデックス技術」の概要

(文献4より一部改変して引用)

しかしながら,後述するアミノ酸分析技術上の課題や,報告によってPFAAプロファイルが同一の疾患に対して相反する挙動を示しているなどの事実も,PFAA濃度の分析精度や統計的な信頼性を含め,エビデンスが確立されるには至っておらず,まだ多くの課題が存在していることの証左と考えられた.そこで,われわれはPFAAプロファイルをヒトの健康状態の新しい指標として臨床的に活用することを目的とし,以下に挙げる技術的な諸課題を解決すべく検討を開始した.

a. アミノ酸分析技術

アミノ酸の分析は,従来アミノ酸を液体クロマトグラフィー(LC)により分離し,ニンヒドリンによる呈色反応で検出・定量する方法が長年使われているが,本方法では1検体2時間近く分析に要するため,精度,正確性は高いものの多数の臨床検体を測定するには不向きで,結果としてアミノ酸分析の臨床用途は先天性代謝異常の検出など限定的なものにとどまっていた.そこで,われわれはアミノ酸を新規試薬(3-アミノピリジル-N-ヒドロキシサクシニミジルカルバミン酸:APDS)で誘導体化し,液体クロマトグラフィー-質量分析計(LC-MS)を用いて,1検体を10分以内で分析可能で,既存方法とほぼ同等の精度,正確性で分析する革新的技術を開発した(1~3)1) K. Shimbo, T. Oonuki, A. Yahashi, K. Hirayama & H. Miyano: Rapid Commun. Mass Spectrom., 23, 1483 (2009).2) K. Shimbo, A. Yahashi, K. Hirayama, M. Nakazawa & H. Miyano: Anal. Chem., 81, 5172 (2009).3) K. Shimbo, S. Kubo, Y. Harada, T. Oonuki, T. Yokokura, H. Yoshida, M. Amao, M. Nakamura, N. Kageyama, J. Yamazaki et al.: Biomed. Chromatogr., 24, 683 (2010).

b. 統計解析

PFAAプロファイルは疾患などにより変動するが,その一方で一部の先天性代謝異常などを除いて一つのアミノ酸の濃度変化のみである特定の疾患の有無を判別することは難しい.一方,多くの疾患において血中濃度の変化するアミノ酸は一つではなく,複数のアミノ酸の血中濃度が変化する.そこで,われわれは多変量解析の技術を応用し,個々のアミノ酸の濃度変化に関する情報を圧縮することで,患者群と対照群などの2群間の差異を最大化する方法を採用した(図1図1■「アミノインデックス技術」の概要).式が実用的であるためには,単純に式導出用データに対して高い判別能を有するだけでなく,検査対象集団全体に対して高い判別性能を有する(式の頑健性)ことが保証されていることが必要になる.われわれは,モデル作成から検証までのサンプルサイズ設計や式決定のアルゴリズムに関して,下記のポイントを考慮しながら,PFAAと疾患の関連に関する実用的な指標式を得る方法を構築した.統計解析では,本来検出したい真の関係(疾患の有無,あるいは疾患リスクの有無)を検出するためには年齢,性別などのデータの背景条件などを合わせることが重要である.また,サンプルサイズが小さいと,統計的パワー(検出力)の低下が発生するので,必要十分なサンプルサイズをあらかじめ設定することも重要となる.また,説明変数数(この場合式中のアミノ酸数)を増やせば,必ずしも最良の式を得られるというわけではない.これは,いわゆるオーバーフィッティングや多重共線性といった問題が発生するからである.われわれは可能なすべての組み合わせについて計算を行い,統計的に広く用いられているモデル選択基準に従って最適モデルを選択した.さらに,実用的な式は,新しいデータに対しても式を構築したデータで得られる結果を再現するものでなければならない.そこで,われわれはアプローチの異なる複数の方法で最適と考えられる式を抽出する方法でそれぞれ検討を行った.具体的には,式作成用データを用いたクロスバリデーション*1クロスバリデーション:交差検証法とも呼ばれる.モデルを推定する際にデータのサイズが小さいと,集団の真の分布とは異なるパラメータが得られてしまう確率も高くなる.そこで,データの一部を抜き取り,これを検証用のデータ,残りのデータをモデル推定用のデータとし,モデル推定用データで推定したモデルを検証用データにあてはめる.このプロセスを繰り返し行い,各回で算出された精度の平均を,集団の真の分布に従うモデルの推定精度とするというのがこの方法の考え方である.と新規の検証用データを用いたバリデーションを併用し,実用的な判別式を得るためのプロセスを構築した.

c. 検体管理

血液には血球やタンパク質が多量に含まれているため,採血後に速やかに血液検体の冷却を行わないと生体内では一定に保たれているPFAA濃度も生体内の濃度分布から大きく逸脱することが予備検討の結果判明した.一方,血漿の状態にしてしまえば,PFAA濃度は比較的安定に保たれることもわかった.しかしながら実際の臨床現場では採血後全血から血漿を速やかに分離するのは困難であるため,採血して直ちに検体を4°C程度まで冷却することが必要となる.通常,実験室などではこのような冷却には氷水を使うのが一般的であるが,採血現場に氷水を持ち込むのはオペレーション上難しいこと,小さなクリニックなどでは氷水を日常的に準備するのは困難であるといった課題があった.そこで,われわれは小型で複数の検体を同時に氷水とほぼ同等の速度で冷却可能なデバイス(キューブクーラー®として販売中)を開発し,効率よく均質な血漿サンプルを得ることができるようになった.キューブクーラー®による検体冷却法は氷冷法のように氷水を満すが恐れがないことから,臨床現場では使い勝手の良い方法である.本製品は,①氷水に近い冷却速度を有し,②採血管挿入部位による温度のばらつきがなく,③長時間保冷が可能(0°C,10時間)であるという3つの特徴を有する.

以上のような課題を解決し,「アミノインデックス技術」は実用的な水準を満たすものになった.本技術の特徴としては,さまざまな健康状態・病態を目的変数として,PFAAプロファイルを説明変数として用い,多変量解析により各病態に最適な指標を導出することにある(図1図1■「アミノインデックス技術」の概要).以下,本技術を活用して疾患・健康リスクを早期発見する指標を導出した実例を示す.

がん患者におけるPFAAプロファイル解析とAICSの事業化

数年以内に,がんが世界における死因の第1位になることが予測されており,予防,早期発見,治療法の技術向上は,がんによる死亡抑制のためには非常に重要な要素である.本研究を含め,数多くのがんスクリーニング法が開発されているが,検査における高い特異性は被験者に対してそれぞれのがんを別々に検査することを強いるものが多く,経済的,時間的な負担が大きく,肉体的,精神的負担も大きくなっている.結果として,受診率の向上を阻害する要因にもなっている.これらとは対照的に,「アミノインデックス技術」は簡便な検査法で侵襲性も低く,1回の採血で複数疾患についても同時に検査できるという汎用性を有している.

日本におけるがん死亡者のうち多くを占める5種類のがん,すなわち肺がん,胃がん,大腸がん,乳がん,前立腺がんの患者それぞれ130~200人(がん種によって異なる),およびそれぞれのがん患者群に対して年齢,性別をマッチングさせた人間ドックを受診した非がん健常者650~1,000人から早朝空腹時に採血を行い,直ちに氷水中で冷却したのち遠心分離にて血漿を分離し,PFAA濃度を測定した.

まず,がん患者群におけるPFAAプロファイルの特徴を明確化するために,単変量の統計解析による比較解析を2通りの方法(血中モル濃度での評価,アミノ酸全体に対する個々のアミノ酸のモル比率)で行った.その結果,がん患者においてはPFAAプロファイルに健常者と比較して顕著な差異が認められ,がん種において共通した挙動を示すアミノ酸と,がん種によって異なる挙動を示すアミノ酸が存在することなどが示された(図2A図2■各種のがん患者におけるPFAAプロファイルの変化(健常人に対するROC曲線下面積)).また,PFAAプロファイルは早期がん患者においても顕著に認められたことから,PFAAプロファイル解析はさまざまながんの早期発見に対して有効である可能性が示唆された(図2B図2■各種のがん患者におけるPFAAプロファイルの変化(健常人に対するROC曲線下面積)).

図2■各種のがん患者におけるPFAAプロファイルの変化(健常人に対するROC曲線下面積)

つづいて,これらの5種がんの患者のPFAAプロファイルを用いて健常人との判別可能性について検討を行った.各種がんの有無を目的変数,各アミノ酸の血中濃度を説明変数とする多変量の判別モデルを,すべての変数の組み合わせを網羅的に実行し,統計的に最も良好なモデルを推定した.得られたモデルの各種がん患者に対する判別能をROC曲線*2ROC曲線:もともとは戦争の際のレーダーの性能評価のために考えられた指標であるが,現在は診断指標の性能評価として一般的に用いられている.図3図3■判別関数値の分布およびROC曲線左において,a. カットオフ値より上になる患者:真陽性,b. カットオフ値より上になる対照:偽陽性,c. カットオフ値より下になる対照:真陰性,d. カットオフ値より下になる患者:偽陰性,とすると,e. 感度=真陽性となる患者数/全患者数,f. 特異度=真陰性となる対照数/全対照数,となる.カットオフ値を①→②→③→④と移動させたときに100%−特異度(偽陽性率)を横軸に,感度を縦軸にプロットすると図3図3■判別関数値の分布およびROC曲線右のようなROC曲線が得られる.0.5≦ROC_AUC≦1で,値が高いほど判別性能が良好であることを意味する.ROC曲線の利点は,集団の有病率の違いにかかわらず,同列にその性能を評価できることにある.により評価した結果,いずれも0.75を上回る判別能が得られた(表1表1■得られたLDAモデルによる各種がん患者の判別能).さらに,がん患者データをがんの進行度ごとに層別化し,得られたモデルの判別能を算出して,がんの進行度の影響を評価した結果,本モデルはがん進行度に関係なく,早期がん患者においても,ROC_AUC>0.75の性能で判別可能であった(4)4) Y. Miyagi, M. Higashiyama, A. Gochi, M. Akaike, T. Ishikawa, T. Miura, N. Saruki, E. Bando, H. Kimura, F. Imamura et al.: PLoS ONE, 6, e24143 (2011).表1表1■得られたLDAモデルによる各種がん患者の判別能).

図3■判別関数値の分布およびROC曲線

表1■得られたLDAモデルによる各種がん患者の判別能
対象患者群肺がん胃がん大腸がん乳がん前立腺がん
全患者0.8020.8490.8740.7780.783
ステージ0患者0.9030.813
ステージⅠ患者0.7520.8590.8590.754
ステージⅡ患者*0.870.8290.9210.7860.764
ステージⅢ患者**0.8440.8340.8170.7550.777
ステージⅣ患者***0.9010.8430.9500.873
* 前立腺がんについてはステージB,** 前立腺がんについてはステージC,*** 前立腺がんについてはステージD(文献4より一部改変して引用).

本研究で得られたモデルをもとに,より詳細な検討を加えた結果,2011年より「アミノインデックス®がんリスクスクリーニング」(AICS)が発売され,全国の病院で徐々に導入されつつある.また,2012年より婦人科がん(子宮頸がん,子宮体がん,卵巣がん)が新たにAICSのラインナップとして加わっている.上記検討を通じてAICSは,早期がんにおいても進行がんとほぼ同等の感度で発見可能であること,既存の腫瘍マーカーと比較して高い検出感度が得られること(たとえば,広く腫瘍マーカーとして用いられているCEAは,多くの種類のがん患者において値が高値を示すが,がんの種類に対する特異性は低いと考えられる.また,進行がんにならないとCEAは高値を示さない傾向がある).がんの組織型にかかわらず同等に発見可能(組織型によっては悪性度が高く,より早期発見が重要になるものもある),既存がん検査では偽陽性となりやすい良性疾患(たとえば大腸がんにおける大腸ポリープ)に対する高い陰性率など,これまでのがん検査法とは異なる特徴を有していると期待される.

現状ではAICSは事業として始まったばかりであり,検診の有効性評価において最重要のエビデンスである実フィールドでの検診成績の蓄積は不十分であること,生物学的機構も不明確な部分が多いなどの課題も残存している.現在,よりサイズの大きいコホート集団を用いたバリデーションによる,臨床的有用性に関する検討と,動物モデルを含めたメカニズム研究が同時並行で進行中である.このうち,メカニズムについてはがん細胞においては通常核内に存在するタンパク質(HMGB1)が血中に放出されることにより,さまざまな遠隔臓器の代謝に影響を及ぼすことが明らかとなり,このような現象ががん患者におけるPFAAプロファイル変化に関与している可能性が示唆されている(5)5) Y. Luo, J. Yoneda, H. Ohmori, T. Sasaki, K. Shimbo, S. Eto, Y. Kato, H. Miyano, T. Kobayashi, T. Sasahira et al.: Cancer Res., 74, 330 (2014).

内臓脂肪蓄積の評価におけるPFAAプロファイル解析の応用

さらに,われわれはPFAAプロファイル解析をメタボリックシンドロームの領域に応用検討することを目的として,メタボリックシンドロームの主成因であると考えられている内臓脂肪の蓄積量推定に応用することを試みた.長年のコホート研究などの結果,内臓脂肪蓄積型の肥満は皮下脂肪蓄積型の肥満に比較して,将来の心血管疾患,脳血管疾患などのリスクが増大すると考えられおり,一般的に内臓脂肪面積(VFA)が100 cm2を上回ると,上記リスクが高まるという考えが現在の主流で,特定保健指導の枠組みでは簡便法として腹囲(男性≧85 cm,女性≧90 cm)もしくは,一般的な肥満の基準であるBMI(Body mass index)≧25がリスク群としてスクリーニングされている.しかしながら,この方法では内臓脂肪蓄積型肥満と皮下脂肪蓄積型肥満の区別がつかないこと,上記基準値以下でもVFA≧100 cm2である人(「隠れ肥満」と便宜的に呼ぶ)が少なからずいることから,簡便法には限界がある.一方,VFAを正確に測定する方法としてはCTによる測定法があるが,簡便法に比較してコスト,時間がかかり,さらには放射線被曝の問題などがあり,広範に実施するのは困難である.そこで,簡便な採血により,現行スクリーニング基準で見落とされてしまうような「隠れ肥満」を「アミノインデックス技術」で検出できれば,その意義は大きいと考えられる.

人間ドックにて腹部CTによるVFAを測定した受診者(N=1,449)のPFAAプロファイルより,VFA≧100 cm2の群を有所見者,VFA<100 cm2の群を無所見者として,まず単変量解析によりPFAAプロファイルと各種肥満関連パラメータとの相関関係について検討した.その結果,分岐鎖アミノ酸をはじめとした多くのPFAA濃度がBMI≧25であるか否かにかかわらず有所見者群では有意に変動することが認められた.さらに,興味深いことに多くのPFAAプロファイルはVFAに対しては有意な相関関係を示すのに対して,皮下脂肪蓄積量(SFA)に対してはほとんど有意な相関関係を示さなかった.BMIや腹囲はVFA,SFAいずれにも相関関係を示した.したがって,PFAAプロファイルは既存の肥満指標とは異なる病態に関連していることが示唆された(6)6) M. Yamakado, T. Tanaka, K. Nagao, Y. Ishizaka, T. Mitushima, M. Tani, A. Toda, E. Toda, M. Okada, H. Miyano et al.: Clinical Obesity, 2, 29 (2012).表2表2■内臓脂肪蓄積,皮下脂肪蓄積とアミノ酸,メタボリックシンドローム関連指標との相関係数).

表2■内臓脂肪蓄積,皮下脂肪蓄積とアミノ酸,メタボリックシンドローム関連指標との相関係数
アミノ酸内臓脂肪皮下脂肪
グリシン−0.31−0.12
アラニン0.330.15
バリン0.420.08
イソロイシン0.390.06
ロイシン0.390.04
チロシン0.400.18
フェニルアラニン0.270.07
オルニチン0.200.02
リジン0.230.02
メタボリックシンドローム関連指標
BMI0.610.72
腹囲0.660.71
(文献6より一部改変して引用)

次に,多変量解析により,有所見者群を判別するモデルの推定を行った.所見有無を目的変数としたロジスティック回帰によりVFA評価モデルを推定した結果,ROC_AUC=0.81のパフォーマンスで判別可能であった.この判別能は腹囲とほぼ同等であったが,腹囲測定ではBMI<25である有所見者(「隠れ肥満群」,有所見者全体のうちのほぼ半数を占める)のうち54%が見落とされてしまっているのに対し,VFA評価モデルでは27%とほぼ半分に減少し,PFAAプロファイルにより,BMIや腹囲といった指標では見つけることのできない内臓脂肪型肥満(「隠れ肥満」)を検出可能であることが示唆された(図4図4■内臓脂肪蓄積状態と腹囲測定.「アミノインデックス技術」による正診率比較).

図4■内臓脂肪蓄積状態と腹囲測定.「アミノインデックス技術」による正診率比較

(文献6より一部改変して引用)

今後の展望

本研究は“focused metabolomics”としてのPFAAプロファイル解析によるがん患者やメタボリックシンドローム患者の早期発見における有用性を示すもので,これまでに明らかにされていなかったヒトにおけるアミノ酸代謝の側面を明確にしたものである.複数の先行研究において,がんやメタボリックシンドロームによりアミノ酸を含むさまざまな代謝が正常細胞と比較して顕著に変化していることが報告されているが,本検討はそれを実際の疾病診断の領域に応用して実際に事業として確立した初めての例になる.

冒頭にも言及したように,人の健康管理は単に疾病を発症してから治療を行うことにとどまらず,より早期発見ができること,疾病発生を未然に防ぐことにシフトしつつある.今後は本稿で紹介した「アミノインデックス技術」をさらに有効利用して総合的な健康管理システムの構築を目指していきたいと考えている.具体的には①提供可能な情報の高度化と個別化,②情報と密接にリンクしたソリューションの提供,③情報をより簡便に提供できるシステムの開発と実用化を目指していきたい.

①提供可能な情報の高度化と個別化:たとえばSNPsに代表される遺伝子検査等では生涯の疾患リスクは評価できるが,疾患は遺伝的な固定された要因とともに本人の生活環境,生活習慣などの変動する環境要因との相互作用で発病すると考えられる.一方,「アミノインデックス技術」が現時点で提供している情報は現時点での疾患の有無である.PFAAプロファイルはその性質上遺伝的要因と環境要因双方を反映していると考えられ,さらなる高付加価値化のためには,刻一刻と変動する罹患リスクをリアルタイムで評価,さらに言えば予測できない具体的な発病時期も含めたリスクを見積もり,医療的な介入が必要になる前の段階で疾患を未然に防ぐことを可能にしていきたいと考えている.また,「アミノインデックス技術」はSNPsに代表される遺伝子検査とは必ずしも背反的なものではなく,両者を相互補完的に活用することで,双方の技術的な欠点を補い,個別化された健康モニタリング技術を確立することに貢献できると考えられる.

②情報と密接にリンクしたソリューションの提供:特にメタボリックシンドロームについては,医療的な介入が必要になる前の段階で生活習慣の改善により疾患を未然に防ぐことが重要である.一方,メタボリックシンドロームの病態とPFAAプロファイルの間に相関関係があることは,現時点ではそれが原因であるか結果であるかは不明確であるが,もしPFAAプロファイル変化の一部がこれらの病態の原因であるならば,人為的にPFAAプロファイルをコントロールすることで疾患を未然に防ぐことも可能であると期待される.健康管理の視点とおいしさの視点を両立した食事メニュー提案などのソリューションまで含めた健康情報を提供できるようにすることで,当社の目指す社会像である「おいしく食べて健康づくり」の理念を具現化し,受診者にとっての価値を最大化できると期待している.

③情報をより簡便に提供できるシステム:現時点では,「アミノインデックス技術」の適用場面は病院の人間ドックやクリニックに限定されている.これは,PFAAプロファイルの取得が既存生化学検査の大半と同じく,採血という方法に限定されていることが原因である.一方,血糖値測定のように,簡易なポータブルデバイスで測定可能な技術も次第に浸透しつつある.今後はこのような簡易測定デバイスを応用して,「いつでも,どこでも,だれでも」PFAAプロファイルを測定できるような技術を確立していきたいと考えている.

Reference

1) K. Shimbo, T. Oonuki, A. Yahashi, K. Hirayama & H. Miyano: Rapid Commun. Mass Spectrom., 23, 1483 (2009).

2) K. Shimbo, A. Yahashi, K. Hirayama, M. Nakazawa & H. Miyano: Anal. Chem., 81, 5172 (2009).

3) K. Shimbo, S. Kubo, Y. Harada, T. Oonuki, T. Yokokura, H. Yoshida, M. Amao, M. Nakamura, N. Kageyama, J. Yamazaki et al.: Biomed. Chromatogr., 24, 683 (2010).

4) Y. Miyagi, M. Higashiyama, A. Gochi, M. Akaike, T. Ishikawa, T. Miura, N. Saruki, E. Bando, H. Kimura, F. Imamura et al.: PLoS ONE, 6, e24143 (2011).

5) Y. Luo, J. Yoneda, H. Ohmori, T. Sasaki, K. Shimbo, S. Eto, Y. Kato, H. Miyano, T. Kobayashi, T. Sasahira et al.: Cancer Res., 74, 330 (2014).

6) M. Yamakado, T. Tanaka, K. Nagao, Y. Ishizaka, T. Mitushima, M. Tani, A. Toda, E. Toda, M. Okada, H. Miyano et al.: Clinical Obesity, 2, 29 (2012).

*1 クロスバリデーション:交差検証法とも呼ばれる.モデルを推定する際にデータのサイズが小さいと,集団の真の分布とは異なるパラメータが得られてしまう確率も高くなる.そこで,データの一部を抜き取り,これを検証用のデータ,残りのデータをモデル推定用のデータとし,モデル推定用データで推定したモデルを検証用データにあてはめる.このプロセスを繰り返し行い,各回で算出された精度の平均を,集団の真の分布に従うモデルの推定精度とするというのがこの方法の考え方である.

*2 ROC曲線:もともとは戦争の際のレーダーの性能評価のために考えられた指標であるが,現在は診断指標の性能評価として一般的に用いられている.図3図3■判別関数値の分布およびROC曲線左において,a. カットオフ値より上になる患者:真陽性,b. カットオフ値より上になる対照:偽陽性,c. カットオフ値より下になる対照:真陰性,d. カットオフ値より下になる患者:偽陰性,とすると,e. 感度=真陽性となる患者数/全患者数,f. 特異度=真陰性となる対照数/全対照数,となる.カットオフ値を①→②→③→④と移動させたときに100%−特異度(偽陽性率)を横軸に,感度を縦軸にプロットすると図3図3■判別関数値の分布およびROC曲線右のようなROC曲線が得られる.0.5≦ROC_AUC≦1で,値が高いほど判別性能が良好であることを意味する.ROC曲線の利点は,集団の有病率の違いにかかわらず,同列にその性能を評価できることにある.