3 因果関係と相関 ― 科学的推論の正しい使い方
3.1 導入:なぜ区別が必要か
科学的探究や日常の意思決定では、二つの現象が同時に変化する様子を発見することがある。例えば、夏になるとある飲料の売上が伸び、同時期に熱中症患者も増える。このように変数同士が同時に増減する状態を相関関係という。
相関を発見すること自体は重要であり、仮説生成のきっかけにもなる。しかし、相関があるからといって「一方がもう一方を引き起こしている」、すなわち因果関係があると即断するのは危険だ。誤った因果解釈は、無意味な政策、誤情報の拡散、資源の浪費、さらには有害な介入につながる可能性がある。
歴史を振り返れば、因果と相関の混同が社会に深刻な影響を与えた事例は多い。19世紀の一部医師たちは、病院での高い死亡率を「患者が重症だから」と説明し、手洗いや衛生の必要性を軽視した。その結果、多くの感染死が防げなかった。これは、真の原因(医師の手から患者への病原体伝播)を見抜けなかった典型例である。
3.2 因果関係(Causation)
定義と三要件
因果関係とは、「ある事象(原因)が別の事象(結果)を直接的に生じさせる関係」である。科学的に因果を主張するには、以下の三要件を満たす必要がある。
- 時間的先行:原因は結果より前に発生していなければならない。
- 共変性:原因の変化に伴って結果も系統的に変化する。
- 交絡因子の排除:第三の要因が両者に影響していないことを確認する。
単一原因と複合原因
物理実験の一部や単純な化学反応のように、単一原因で結果を説明できる場合もある。しかし、生物・社会・経済の現象は複合因果が支配的である。気候変動や経済不況、健康状態の変化などは、複数の要因が同時並行で作用し、その組み合わせが結果を形作る。
哲学的背景
18世紀のヒュームは、「因果は直接観察できず、繰り返し現れる規則的連関から推論するものだ」と述べた。19世紀のJ.S.ミルは「一致法」「差異法」などの方法で因果を探る体系を提示した。これらは現代の統計的因果推論にも通じる基本原則である。
3.3 相関関係(Correlation)
定義
相関関係とは、二つの変数が同時に増減する統計的な関係である。相関は「一緒に動く」ことを示すが、それが原因と結果の関係であるとは限らない。
測定方法
相関の強さと方向は、相関係数(ピアソン、スピアマンなど)で定量化できる。散布図を描くことで、線形か非線形か、外れ値があるかなども視覚的に把握できる。
解釈上の注意
相関は仮説の出発点であり、証拠の一部にはなるが、それ単体では因果を証明できない。「Aを買う人はBも買う」という相関は、AがBを促しているのではなく、同じ嗜好や所得層といった第三の要因による可能性がある。
3.4 相関と因果の混同による典型的誤り
- 交絡因子(Confounding)
共通の第三要因がAとBを同時に動かしている。例:気温がアイス販売と熱中症発症の両方を増やす。 - 逆因果(Reverse Causation)
本当は結果が原因になっているケース。例:健康悪化が運動不足を招く。 - 偶然の一致(Spurious Correlation)
無関係な変数同士が偶然相関する。特に多変量データでは頻発する。 - 測定・集計バイアス
データ収集や集計方法の違いで見かけの相関が生じる。 - 情報の早合点
メディアやSNSで、相関を因果と誤認させるグラフや見出しが拡散する。
3.5 因果関係を特定する方法
実験(介入研究)
最も確実な方法は、原因を操作して結果の変化を観察することである。無作為化比較試験(RCT)は交絡因子を最小化できるが、費用・時間・倫理の制約が大きい。
観察研究
実験が困難な場合、長期の観察データから因果を推定する。コホート研究やケースコントロール研究では、多変量解析を用いて交絡因子の影響を調整する。
統計的・計量経済的手法
- 差の差分法(DiD):介入群と非介入群の変化量を比較し、介入の効果を推定する。
- 操作変数法(IV):原因に影響を与えるが結果に直接作用しない外的変数を利用して因果を推定する。
- 構造方程式モデリング(SEM):複数の因果パスを同時に推定する。
- 因果グラフ(DAG):変数間の因果関係を視覚化し、交絡や媒介パスを特定する。
3.6 相関と因果を取り違えないためのチェックリスト
- 原因が結果より前に起きているか。
- 第三の要因が両者に影響していないか。
- 測定・集計方法が一貫しているか。
- サンプルに偏りはないか。
- 偶然の相関ではないか。
- 逆因果の可能性はないか。
- 複数の方法で一貫した結果が得られているか。
3.7 抽象的ケーススタディ
- ケースA:特定製品の購入者は特定サービスの利用率が高い。背景に地域や所得層の共通性がある可能性。
- ケースB:健康アプリ利用頻度と自己申告の健康度の相関。健康意識や生活習慣の影響を考慮。
- ケースC:学習時間と成績の相関。成績向上が学習時間を増やす逆因果の可能性。
3.8 因果と相関を区別する意義
- 政策立案の精度向上:因果を誤認すれば、無駄な施策や逆効果を招く。
- 誤情報の拡散防止:データの見せ方に惑わされず、根拠を検証できる。
- 研究の方向付け:相関は仮説生成の出発点であり、因果検証へと進む契機となる。
- 科学リテラシー向上:日常的な情報の真偽を批判的に評価できる。
3.9 章まとめ
相関は「一緒に変動する」関係、因果は「結果を生じさせる」関係である。因果の主張には時間的先行・共変性・交絡排除が必要であり、相関だけでは因果は証明できない。典型的誤りを理解し、実験・観察・統計モデルを適切に用いることで、誤解を減らし正確な判断が可能になる。