About us データのじかんとは?
選挙の時期にテレビを眺めていると開票率が数%であるにも関わらず、「当選確実!」という文字が目に飛び込んで来ることがあります。
そうした中で、「なんでこんなに少ない開票数から結果が判るんだろう」と訝しんだことがある人は少なくないのではないでしょうか?
そこで今回は、選挙結果を早々に判断できる理由やその仕組み、逆に選挙結果をなかなか出せない場合はどんな場合なのか?をご紹介していきます。
まだ数%に満たない開票数であるにも関わらず、高い確率で結果を予想できるのは統計を行っているからです。
統計学を日常的に私たちが使っている、ということを示すためによく使われる例として「お味噌汁の味見」があります。
例えば、鍋いっぱいのお味噌汁を作った時、味噌や出汁の具合を調整するためにわざわざお椀を出して丸々一杯飲むでしょうか?たいていの場合はお玉に一掬い程度を味見をすればその後に何を足せば良いか、おおよその検討はつきますよね。
一掬いの味噌汁から鍋全体の味噌汁の味が予想できるように、無作為に取り出したデータがあれば、その数が全体の数%でも全体の動向をおおよそ予測することができるのです。
では実際に数%から全体の傾向が判るのか、Googleスプレットシートで数値実験をしてみました。
今回の条件は母集団を1000人としてそのうち70%の確率でA党に、それ以外の場合はB党に投票するようにRAND 関数を使い、乱数を発生させます。
=if(RAND()< 0.7, 1,0)
ここで重要になるのが信頼係数と許容誤差です。
p=0.7 |
信頼係数 |
||||||
許容誤差 |
70% |
75% |
80% |
85% |
90% |
95% |
99% |
1% |
693.07 |
735.57 |
775.40 |
813.30 |
850.46 |
889.81 |
933.10 |
5% |
82.84 |
100.13 |
121.34 |
148.39 |
185.33 |
244.15 |
358.11 |
10% |
22.08 |
27.06 |
33.37 |
41.74 |
53.81 |
74.72 |
122.40 |
15% |
9.94 |
12.21 |
15.11 |
18.99 |
24.65 |
34.65 |
58.37 |
N=1000 |
なお信頼係数と許容誤差ごとの人数はNORMINV関数を使い、スプレッドシート上で以下のように求めました。
=母集団の数(N)/((許容誤差/NORMINV((1-信頼係数)/2,平均,標準偏差))^2*((母集団の数(N)-1)/(確率(p)*(1-確率(p))))+1)
例えば、この条件で、信頼係数が95%で許容誤差が10%となるのはおおよそ75人。つまり無作為に75人(全体の7.5%)を選んだ場合、95%の確率で60〜80%の人がA党に投票していることになります。
数値実験を行った結果、母集団の得票数はA党とB党でそれぞれ以下のようになりました。
全体(N=1000) |
A党 |
B党 |
得票数 |
706(70.6%) |
294(29.4%) |
さらにこの結果に対し、無作為なサンプリング抽出を3回行った結果それぞれ以下のようになりました。
標本1(N=75) |
A党 |
B党 |
得票数 |
51(68.0%) |
24(32.0%) |
標本2(N=75) |
A党 |
B党 |
得票数 |
53(70.7%) |
22(29.3%) |
標本3(N=75) |
A党 |
B党 |
得票数 |
57(76%) |
18(24%) |
どの標本でもA党の得票数が高くなり、母集団と同じ結果となりました。
また、テレビなどで発表される当選確実は開票結果からの統計だけでなく、出口調査や事前の世論調査のデータを使い、複合的に判断することでより確度を高めていると考えられます。
1 2
メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。
30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!