相関関係で面白い例はある?「マーガリンの消費量」と「離婚率」の相関性などを紹介 | データで越境者に寄り添うメディア データのじかん
会員ページへmember

About us データのじかんとは?

相関関係で面白い例はある?「マーガリンの消費量」と「離婚率」の相関性などを紹介

         

「すべてのものに因果関係があり、世界は見えないところで繋がっている」。

インターネットの普及により人や情報の流動性が増す中、こうした視点がまことしやかに語られます。誰でも膨大な情報にアクセスできる現代では、様々な事象に相関関係と因果関係を見出すことができるからです。最近発見された意外な説には、腸内細菌の量がやメンタルヘルスに影響するというものがありますね。

意外と言えば、マーガリンの消費量と離婚率に相関関係があるのをご存知ですか? アメリカ・メイン州の10年間のマーガリンの消費量と離婚率を見比べてみたところ、両者のあいだに99%の相関関係があることが分かったのです。

Margarine/ Divorce rates

ここまで高い相関関係があると、そこに因果関係を見出したくなりますよね。では実際、マーガリンの消費量と離婚率のあいだに因果関係はあるのでしょうか?

そもそも相関関係とは?

前提の確認をしておきましょう。相関関係とは、2つの事柄が関わり合う関係のことであり、特に統計学では一方の数値が増加すると、もう一方の数値が減少または増加する関係のことをいいます。

例として、雨が降るとその地域の川や湖の水量は増加するような形が相関関係といい、例の通り片方が増えるともう片方も増えるような関係を「正の相関関係」と呼びます。

より詳しく相関関係について知りたい方は下記のデータのじかんにて、統計初心者でもわかりやすくまとめていますので、ご活用ください。

相関関係と因果関係の違い

相関関係と類似した言葉で「因果関係」という言葉を聞いたことあるかと思います。この2つの言葉似ているようで全く異なるので注意してください。

まず、因果関係とは、一方がもう一方に影響を与えるような関係を指します。例えば、警察官の例で言えば、警察官の定員が増えたことが検挙件数の増加に直接的な影響を与えているという関係です。しかし、実際には警察官の定員の増加が検挙件数の増加に直接的な影響を与えているわけではないため、因果関係は存在しません。

一方、相関関係とは、一方が増減するともう一方も増減するといった関係を指します。警察官の例でも言えば、警察官の定員が増えると検挙件数も増えるという傾向が見られます。しかし、この傾向は単なる数字の関係であり、実際には警察官の定員の増加が検挙件数の増加に直接的な影響を与えているわけではありません。つまり、この関係はみせかけの相関、擬似相関と言えるのです。

データのマッチングサイト

冒頭の話に戻りますが、マーガリンの消費量と離婚率の相関関係についてですが、結論から言ってしまうと、そのふたつの間には相関関係はありますが、因果関係はありません。マーガリンに含まれるトランス脂肪酸を取りすぎると離婚の原因になるのでは? こうした仮説はもっともらしく聞こえますが、科学的な因果関係は認められていないのです。

マーガリンと離婚率の相関関係を発見したのは、ハーバード法科大学で犯罪学を専攻するタイラー・ヴィーゲン氏。彼は高い相関関係を持つデータを掘り起こすコンピューター・プログラムを製作し、見つけたデータを自身のウェブサイトSpurious Correlations
(見せかけの相関関係)に掲載しています。

例えば、

・1人あたりのチーズ消費量と、就寝中にシーツが絡まったせいで死亡する人数
・各年のニコラス・ケイジの出演作の数と、ハーバード・ロー・レビュー誌の女性編集者の人数

一瞬、因果関係を見出そうとしませんでしたか? ちなみに筆者は「チーズには、シーツが絡まって窒息しそうでも目覚めないほど深い眠りを誘う物質が含まれているのだろうか」と大真面目に考えました。

「高い相関関係を見せられると、誰しもにわか科学者になって因果関係の仮説を立てたくなるものです」とヴィーゲン氏は言います。「でもすぐ我に返って、現実的に考えて自分の仮説には何の根拠もないことに気がつくんですよ」。

共通の要因が相関関係を生むことも

ただし、データAとBのあいだに直接の因果関係はなくても、共通の要因がA、Bの相関関係を生み出しているケースはあります。

例えば、「ホルモン補充療法を受ける女性は、冠状動脈性心臓病を患う確率が低い」というデータ。このデータを見て、ホルモン補充療法は心疾患のリスクを下げる効果がある、とまことしやかに語る医師も登場しました。

しかし実際には、ホルモン補充療法は心疾患のリスクをやや押し上げるという実験結果が出たのです。ではなぜ上記のようなデータが出たのでしょうか。

研究者は、ホルモン補充療法を受ける経済的余裕のある女性は、社会的に上位グループに属しており、下位グループよりも健康的な食事や運動の習慣がある割合が高いため、と推測しています。

偶然が悪用される場合も。踊らされないためには?

ランダムなデータを抽出して相関関係を面白がるだけならいいのですが、こうした見せかけの相関関係が悪用される可能性も十分あるわけです。上記のホルモン療法と心疾患の例のように、権威のある人やメディアが嘘の因果関係を吹聴して回れば、社会に大きなダメージを与えると予測できますよね。

さらに、数値だけでは分かり難い相関関係も、グラフにすることで視覚的なインパクトが上がり、因果関係を見出したくなる衝動を掻き立てるのだとか。

またヴィーゲン氏によると、ニコラス・ケイジの出演作(毎年0〜4本のあいだ)のように、基準数が少ないデータであれば、他のデータと相関関係を持たせたグラフを作成するのは簡単なのだそう。

では、見せかけの因果関係に踊らされないためにできることとは? ヴィーゲン氏によるアドバイスは以下の3つ。

1. データを常に斜めに見る
2. 因果関係やメカニズムを探してみる
3. 統計的に強い因果関係があると決めつける前に、厳密な科学的根拠があるのか見極める

当たり前のことのように見えますが、いざとなると惑わされるものです。人間というのはセンセーショナルな見出しに弱いですから。そしてそれを利用したがる人たちがいることをお忘れなく。

佐藤ちひろ

 

参照元

Spurious correlations: Margarine linked to divorce?

データ活用 Data utilization テクノロジー technology 社会 society ビジネス business ライフ life 特集 Special feature

関連記事Related article

書評記事Book-review

データのじかん公式InstagramInstagram

データのじかん公式Instagram

30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!

おすすめ記事Recommended articles

データのじかん会員なら、
全てのコンテンツが
見放題・ダウンロードし放題
データのじかん会員でできること
  • 会員限定資料がすべてダウンロードできる
  • セミナー開催を優先告知
  • 厳選情報をメルマガで確認
会員登録する
データのじかん会員について詳しく知りたい方
close close