- 更新:2021.04.16
- 公開:2021.04.14
「母数800万のデータから800個の標本を抽出し、平均値を求めた。」
という文章を読んであなたは違和感を覚えますか?実は上記の文章の表現には誤りがあります。
しかし、統計学の観点からどこがどう間違っているのか、あなたは説明できるでしょうか?
統計は私たちの身近にありながら学問として専門に勉強したことがある方は少ないため、重大な誤用がまだまだ見られます。「標本と母数」「平均と中央値」「偏差と分散」など基礎的ながら誤解しやすい統計用語を、この記事でまとめて理解しましょう!
「標本」「サンプルサイズ」「母集団」「母数」の違いと「母数」「サンプル数」の誤用
まずは統計の基本中の基本用語であり、だからこそ誤解を生みやすい「標本」「サンプルサイズ」「母集団」「母数」の違いについて解説します。
標本 | 手元にあるデータのこと |
サンプルサイズ | 標本の大きさ(標本として抽出されたデータの個数) |
母集団 | 標本にない未知のデータも含めたすべてのデータのこと |
母数 | 母平均や母分散など、母集団の特徴 |
冒頭の文章がなぜ間違っているかはもうわかりましたね。
「母数」と「母集団」を混合してしまっているのです! 「母数」を「分数の分母」のようなイメージでとらえてしまう間違いは、よく見られます。しかし、実際の母数は母平均や母分散のように母集団が持つ特徴を指す言葉です。複数の意味を持つ表現は指し示すものをあいまいにしてしまう恐れがあるため、統計の場ではなるべく母数という表現は避け、求めたい値そのものを意味する表現を選んだほうが良いかもしれません。
母数と同様に誤用されやすいのが「サンプル数(標本数)」という言葉。サンプルサイズの意味で用いられたり、標本の数で用いられたり、といった曖昧な使い方がされがちです。この言葉も誤解を生まないため、使わないようにするのがベターでしょう。
1 2