Kagaku to Seibutsu 57(10): 589 (2019)
巻頭言
統計処理のなかで見過ごされるもの
Published: 2019-10-01
© 2019 Japan Society for Bioscience, Biotechnology, and Agrochemistry
© 2019 公益社団法人日本農芸化学会
得られた実験データから結論を得る際に,そのデータの確実さを表す指標は有意差と再現性であることは疑いもない.大学や研究機関で行われる実験,また企業にあっては研究のみならず市場調査も含め,データに「確実性」が伴わねばならない.論文投稿にあたって近年はどの分野であっても,測定される数値はともかく,電気泳動の図や顕微鏡写真画像までも統計処理して示すことがほぼ必須になっている.得られた結果を統計処理してその解釈が誰の目にもゆるがないように示すことは,研究者のみならずデータを扱う者にとって必須の作業であろう.さらには,質量分析や遺伝子発現パターンなどの「網羅的解析」では膨大なデータ作成をコンピュータに統計処理も含めて行ってもらうことになる.この場合もっと人の手から離れて自動的にリストアップされて結果が出てくるので,すべてを理解するのにかなりの経験が必要になる.
しかしながら,実験者がまず眼のあたりにする「生データ」が最も大切であることは言うまでもない.企業での市場調査の場合,生データは「消費者の声」ということになるだろうか.また,統計処理で生データを扱う以前に,現実にはデータがなかなか再現しないこともある.実験を行う時期や人が変わったりすると結果が異なる,などということにも遭遇するし,そうなるとその時点で実験は終了,ということもある.論文業績などの成果を求められながら,このような状況で結果を出していく実験者の苦労は並大抵のものではない.
このように昨今はデータの解析のための統計処理と再現性がすべてにおいて優先されるようになってきた.しかし成果を急がされる風潮のなか,統計処理ということだけに気を取られるのは,長い目でみてどうであろうか.統計的に有意でないから,再現しないからダメ,もうそれ以上やらない,と思考が停止してしまうことは果たしていいのかどうか.また逆に,得られた結果は微妙だが統計的に有意だからこれでいいのだと,さらなる実験系の工夫やプロセス改善に努力をすることなく,「有意な統計処理に基づいた結果」を世に送り出して安心しているようなことがないだろうか.再現しにくい現象があれば,ちょっとした操作の裏に隠れている何か重大なことを見逃すことにならないか.消費者の生の声は,少数であっても的をついていることがあるように,単に結果として出てくる値だけでは見えないものもある.もちろんきちんとした統計学を学んでいくことは大切である.だが,「こういうやり方で行って有意差がつけばいい」というような考えは過ちをもたらさないか.
動物行動学実験では,変動が多くなかなか有意差が出ないと思っていたら,温度や季節,雌雄差が原因だった,という話も耳にする.試験管内実験でも,バッファーの種類だけで結果が変わり思わぬ重要な発見になることも経験する.統計処理で数字の上では有意ではなかった,再現性がなかった,で片付けられない事実に目を向ける重要性を,実験科学者としてはもっと大切にすべきでないかと考える.今後はデータの解釈もAI(人工知能)などで行われて,統計処理だけでなく,やがてはその次の指示まで人の手から離れて為されることが当たり前のようになりそうである.そのような時代になる前に,あるいはなったとしても自身の目で生データは常に大切に見る努力は怠れないのではと思う.