「母数800万のデータから800個の標本を抽出し、平均値を求めた。」
という文章を読んであなたは違和感を覚えますか?実は上記の文章の表現には誤りがあります。
しかし、統計学の観点からどこがどう間違っているのか、あなたは説明できるでしょうか?
統計は私たちの身近にありながら、その基本用語や概念の誤解が日常やビジネスの場でよく見られます。特に「標本と母数」「平均と中央値」「偏差と分散」といった基礎的ながら誤解しやすい統計用語は、正確な理解が必要です。この記事で、標本、平均値、偏差などの違いを詳しく理解し、より正確なデータ分析や解釈を行うための手助けとしましょう!
まずは統計の基本中の基本用語であり、だからこそ誤解を生みやすい「標本」「サンプルサイズ」「母集団」「母数」の違いについて解説します。
標本 | 手元にあるデータのこと |
サンプルサイズ | 標本の大きさ(標本として抽出されたデータの個数) |
母集団 | 標本にない未知のデータも含めたすべてのデータのこと |
母数 | 母平均や母分散など、母集団の特徴 |
冒頭の文章がなぜ間違っているかはもうわかりましたね。
「母数」と「母集団」を混合してしまっているのです! 「母数」を「分数の分母」のようなイメージでとらえてしまう間違いは、よく見られます。しかし、実際の母数は母平均や母分散のように母集団が持つ特徴を指す言葉です。複数の意味を持つ表現は指し示すものをあいまいにしてしまう恐れがあるため、統計の場ではなるべく母数という表現は避け、求めたい値そのものを意味する表現を選んだほうが良いかもしれません。
母数と同様に誤用されやすいのが「サンプル数(標本数)」という言葉。サンプルサイズの意味で用いられたり、標本の数で用いられたり、といった曖昧な使い方がされがちです。この言葉も誤解を生まないため、使わないようにするのがベターでしょう。
(宮田文机)
1 2
・栗原伸一 (著), 丸山敦史 (著), ジーグレイプ (その他)『統計学図鑑』オーム社、2017
・永野裕之『ゼロからはじめる! 統計学見るだけノート』宝島社、2018
・馬場 真哉 (著) 『Pythonで学ぶあたらしい統計学の教科書』翔泳社、2018
・偏差値┃なるほど統計学園高等部(総務省統計局) ・統計用語集┃統計WEB
・「母数」の意味とは?誤用しやすい「分母・サンプル数」との関係も┃TRANS.Biz
・サンプル数とは何か?┃独立行政法人労働政策研究・研修機構
メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。
30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!