「〇〇を食べると××にいい」は本当? 間違えやすいデータの見方
データを見れば一目瞭然? 正しく読み解くことが大切です
「○○を食べると△△にいい」「毎日〇〇を食べている人は、××になりにくい」といった話がよく取り上げられます。これらのわかりやすい情報には、ちょっと注意が必要です。
「食」は、健康維持のために大切ですし、食生活の乱れは生活習慣病の引き金になります。食べ物に気をつかうことは、もちろんよいことです。しかしシンプルな説は、疫学調査のデータを根拠に言われているものが少なくありません。しかし実際には、疫学データからは、「○○を食べる」ことと「△△になりにくい」ことの間に一定の関係がある、すなわち「相関関係」を見出すことができたとしても、それらが原因と結果として直接つながっていること、すなわち「因果関係」があるかどうかまでは、実はわからないのです。
因果関係が証明されてもいないのに、2つの事柄を無理やり結び付けて、都合のいいように解釈されているケースも珍しくないことに注意しなければなりません。場合によっては、誤った拡大解釈でとんでもない説が生まれ、多くの人が振り回されてしまっていることもあります。
今回は、疫学調査、相関関係、因果関係についてわかりやすく解説し、食と健康に関する本当の因果関係を知るためにはどうすればいいのかを知っていただければと思います。
疫学調査とは何か……社会集団の調査研究法の一つ
「疫学」という言葉は、日常会話ではあまり馴染みがありませんね。「疫」という漢字が伝染病を意味することから想像つくと思いますが、もともとは、伝染病の流行を調査研究するための手法だったのですが、いまは対象範囲を広げ、社会集団におけるいろいろな健康障害の原因を探る調査研究法の一つとされています。
たとえば、病気の原因と考えられる要因を反映した変数Aをグラフの横軸にとり、健康状態を反映した変数Bをグラフの縦軸にとり、 ある特定の集団に属する一人一人の(A, B)のデータをプロットしていき、その分布について統計的な解析を行います。そのとき、「Aが大きいほどBも大きい(もしくは小さい)」というような関係が認められれば、「相関関係」があるとみなされます。さらにその関係性の強さを評価するには、変数AとBの間に直線的な関連(比例関係)があることを表す指標として「相関係数(r)」という数値(-1から+1の範囲)が算出され、 rが1に近いほど正の相関の関係が強いと判断されます。
何らかの予備的な研究によって原因と結果の関係がある程度推定できていた場合に、それを確証するために調査・解析を行ったのであれば、この結果をもって「原因Aによって結果Bがもたられていることが支持された」と結論してもよいですが、何も他にデータがなく、単にAとBの相関関係が初めて見つかっただけでは、因果関係は言えません。Aが原因とは限らず、逆にBが原因でAが起きているかもしれないし、AとBには何の直接的な関係もないかもしれません。疫学調査でわかることには限界があることを知っておく必要があります。
単なる偶然で強い相関関係が認められることも……結婚率と溺死率に関連など
インターネット検索をすると、こんな記事が見つかりました。アメリカにおける統計データを利用して、1999~2010年の各年における「全国で漁船から転落して溺死した人の数」をグラフの横軸にとり、「ケンタッキー州の結婚率」をグラフの縦軸にとって、両者の関連性を調べたところ、相関係数(r)が 0.9524 となり、極めて強い正の相関が得られたとのことです。
この分析結果から、「全国で漁船から転落して溺死する人が増えることが原因で、ケンタッキー州で多くの人が結婚するようになる」もしくはその逆「ケンタッキー州で結婚する人が増えることが原因で、全国で漁船から転落して溺死する人が増える」と言えるでしょうか。どう考えても、2つの出来事には関係性はなく、単なる偶然のいたずらで、相関関係があるように見えてしまっただけですね。
この場合は、明らかに関係がなさそうな2つの事柄なので、解釈の誤りに気づくことができますが、食べ物と病気の関係を疫学調査した場合には、こうした間違いに気づきにくいと思われます。疫学調査だけでは、何の関係もないのに偶然のいたずらで相関関係があるように見えてしまうこともあり得るということを、十分に注意しなければなりません。
相関関係があっても、直接の因果関係はない場合もある
別の例を挙げると、一年間の各日の「蚊にさされた件数」をグラフの横軸にとり、「アイスクリームが食べられた件数」をグラフの縦軸にとってデータをプロットし、両者の関連性を調べると、相関関係が認められます。
この分析結果から、「蚊にさされることが原因でアイスクリームが食べられる」もしくはその逆が言えるでしょうか。何か変ですね。種明かしをすると、両者には少しだけ関係があります。夏になると、蚊がたくさん発生するので刺されやすくなるとともに、暑くなるのでアイスクリームが食べたくなります。つまり、両者には、共通した要素があるので、連動した増減を示すのですが、直接的なつながりはありません。
もう一つの例として、ある小学校での調査結果を紹介しましょう。グラフの横軸に体育の成績、縦軸に国語の成績をとって、各児童のデータをプロットしたところ、見事に正の相関が示されたとのことです。つまり、体育の成績がいい子ほど、国語の成績もよかったのです。この結果から、「いっぱい運動して体育の成績を上げれば、国語の成績も上がる」もしくはその逆が言えるでしょうか。違いますね。意欲的に何でも取り組める子は体育も国語もがんばっている、というだけのことではないでしょうか。あるいは、体力的に劣る子が、体育だけではなく他の科目の勉強にもついていけないということもあり得るかもしれません。いずれにしても、国語と体育の成績に、直接的なつながりがあるわけではありません。
このように、疫学調査では、間接的なつながりによって相関関係が示されてしまい、それを因果関係があると勘違いしてしまうケースが非常に多いので、気をつけなければなりません。
解釈を誤る危険性が高い! 飲食物と健康にまつわる疫学調査
緑茶と認知症の関係を調べようとした疫学調査があります。具体的な研究チーム名や調査地などはあえて伏せますが、これから紹介するのは実際に行われたものです。
ある研究チームは、ある地域に住む70歳以上のおよそ1000人を対象に、MMSE(Mini-Mental State Examinationの略)というテストを受けてもらい、各人の認知機能を数値化しました。その一方で、お茶類をどれくらい飲んでいるかを聞き取り調査し、その頻度を「1週間に3杯以下」「1週間に4杯以上~1日1杯」「1日2杯以上」の3段階にグループ分けしました。そして、お茶類の摂取頻度とMMSEの点数との関係性を調べたところ、緑茶の摂取頻度が多いグループほど、MMSEスコアの低い(認知症もしくは疑いがある)人の割合が少ないことがわかりました。
この研究成果に興味を示したメディアに報道されたのが、「緑茶を飲んで認知症予防」という文言でした。そしてこれが、緑茶飲料のマーケティングに利用されてしまいました。これでいいのでしょうか。
データの読み方の誤り、何が問題か
上述した緑茶と認知症リスクの研究結果とその解釈について、何が問題なのかを整理しましょう。
第一に、研究グループが報告したのは「緑茶を飲む習慣と認知機能に一定の関係性があった」というだけです。「緑茶を飲むと認知症になりにくい」という因果関係は、一つの可能性としてあげることはできますが、他にも、次のようないろいろな可能性が考えられます。
- 単なる偶然のいたずらで関係性が見られただけで、実は何の因果関係もないかもしれない。
- 緑茶と認知機能に直接の因果関係はなくても、相関関係は生じうる。たとえば、健康でよく運動する人は咽が渇くので緑茶をよく飲むし、運動が認知機能維持に役立っているのかもしれない。
- 因果関係があるとしても、原因と結果が逆かもしれない。つまり、認知機能が高く保たれている人の方が緑茶を好んで飲むのかもしれない。
- 緑茶をよく飲んでいる人は他の飲み物をあまり飲んでいないかもしれない。緑茶をよく飲む人と飲まない人は食の好みも違うかもしれない。緑茶以外の飲み物や食べ物が認知機能と関係があるのかもしれない。
これらの可能性を無視せず、きちんと検証してから結論を出すべきです。
第二に、この研究で、認知機能に関してデータ収集されたのは、調査時点での各人のMMSEスコアだけです。長期間にわたって各人の認知機能の変化をフォローしたわけではありません。つまり、決して「認知症リスク」を調べているわけではないのです。つまり、こんな可能性も考えられます。
- 調査時点でMMSEスコアが低かった人は、緑茶とは関係なく、もともと認知機能が低かっただけかもしれない。
- もともと認知機能が低い人は、水分をとろうとしないのかもしれない。
実は「緑茶が認知機能の低下を防いだ」ことを示すデータはどこにもないことに気づきましょう。
第三に、いわゆる「バイアス(調査に関する偏りや先入観)」が懸念される点です。
おそらく研究グループは、お茶に興味があり、その有益性を明らかにしたいと思って研究をスタートさせたに違いありません。そして、調査データの分析結果が期待通りだったからこそ、成果を公表したのではないでしょうか。もし結果が期待外れだった場合には、その成果を発表しないでデータは闇に埋もれていたかもしれません。あるいは、一度行った調査結果が芳しくなかったために、何度も調査を繰り返して、期待通りの結果が出たものを公表したのかもしれません。公表されたデータだけを見ても、こうした研究側のバイアスは、わかりません。
公表された調査データを受け取る側にも、バイアスはあります。「緑茶と認知症がむすびつけば面白い」という期待感から、生のデータを見ただけで「やっぱりそうだ。緑茶が認知症予防になるんだ」と読み取ってしまいがちです。「結果ありき」でデータを扱うのであれば、そもそも調査研究をする意味がありません。
私は「緑茶に効果がない」と否定したいわけではありません。むしろ、緑茶に有用性を期待したい方です。しかし、現状のようないい加減な解釈に基づいたマーケティングをしてしまうと、かえって消費者の不信感を生み出し、せっかくの発見が無駄になってしまうかもしれないことを危惧しているのです。きちんと、慎重にあらゆる可能性を検証したうえで正しい答えを導くことが必要だと思います。
直接の因果関係を証明するために必要なこと
疫学調査は、何も手がかりがない中から、健康や病気に関する予防や治療につながる要因をあぶりだすために有用な手法ですが、万能ではありません。得られた結果を過信せずに、その欠点を補うような別の研究を合わせて行う必要があります。
たとえば、上の緑茶と認知症の例ですと、研究に参加してくれた人に協力してもらい、緑茶をあまり飲まない習慣だったグループに緑茶を飲む頻度を増やすように変えてもらうか、緑茶をよく飲む習慣だったグループに緑茶を飲むのをやめてもらい、一定期間後にMMSEスコアを再度調べるといった研究を行うのも一手です。こうした方法は、一般に「介入研究」と呼ばれ、未知の医薬品の有効性や安全性を確認するための臨床試験もその一部です。ただし、介入研究を行うことは、研究に参加してくれた人たちの生活に立ち入ることになりますので、その方たちが不利にならないように十分配慮することが大切です。緑茶を飲むのをやめたために本当に認知症リスクが高まるのであれば、そのような介入は避けるべきですね。
みなさんには、食と健康・病気にまつわる関係性を明らかにすることはそんなに簡単ではないということをよく理解し、世の中に流布された情報を正しく読み取れるようになっていいただきたいと願います。