統計学の誤解しやすい基本用語を徹底解説!「標本」「平均値」「偏差」の違いとは? | ページ 2 | データで越境者に寄り添うメディア データのじかん
カテゴリー
キーワード
統計学の誤解しやすい基本用語を徹底解説!「標本」「平均値」「偏差」の違いとは?

統計学の誤解しやすい基本用語を徹底解説!「標本」「平均値」「偏差」の違いとは?

統計学は、日常生活やビジネスの中で頻繁に使われる学問分野です。しかし、その中には誤解しやすい用語や概念が多数存在します。この記事では、統計学の中でも特に誤解されやすい「標本」「サンプルサイズ」「母集団」「母数」や「平均値」「中央値」「偏差」「分散」といった基本的な用語について、その正確な意味や使い方をわかりやすく解説しています。これにより、統計学の基本的な知識を正しく理解し、より正確なデータ分析や解釈を行うための第一歩として活用できます。

         

「平均値」「中央値」「最頻値」の違いと色々な「平均値」

 
続いて取り上げたいのは、データ全体を要約する「代表値」として用いられることの多い「平均値」「中央値」「最頻値」の違いです。

平均値すべてのデータを平らに均(なら)した値
中央値すべてのデータを大きい(小さい)順に並べたとき、真ん中に位置する値
最頻値最も頻繁に出現する値

どれが標本の特徴を最もよく表しているかを判断して代表値を選ぶことが重要です。なかでも最もポピュラーなのは「平均値」でしょう。「平均値」ときいて私たちが最も思い浮かべやすいのは「算術平均(総加平均)」ですが、平均値にはそのほかにも、幾何平均や調和平均といった種類があります。

算術平均(総加平均)データの総和をデータの個数で割った値。最もポピュラー
幾何平均(総乗平均)データをすべてかけ合わせ、データの個数でn乗根を計算した値。変化率や利率の平均値などの計算で用いられる
調和平均データの逆数を算術平均し、さらに逆数をとった値。速度や電気抵抗の平均値などの計算で用いられる

ちなみに算術平均、幾何平均、調和平均には「算術平均≧幾何平均≧調和平均」という関係があります。

「偏差」「分散」「標準偏差」の違いと「偏差値」の仕組み

平均から一歩進んだときに見聞きすることの多い 「偏差」「分散」「標準偏差」。それぞれの違いは以下の通りです。

偏差あるデータの値と平均値の差
分散偏差を二乗しデータの個数で割ることで、ばらつきの大きさを表しやすくしたもの
標準偏差分散の平方根をとった値

このように、データの値と平均値の差を図ることでデータのばらつき具合を把握するためにまず「偏差」がとられます。しかし、偏差だけではマイナスの値を考慮していないため、ばらつきの大きさを正確に把握するために「分散」の概念が生み出されました。分散は偏差を二乗することでマイナスをプラスに変え、すべてのデータを“ばらつき具合”という基準で比較できるようにしているのです。

しかし、二乗することで実際以上にばらつきが大きく見えてしまうという弊害が。そこで、分散の平方根をとった「標準偏差」でより実感に近いばらつき度合いを把握します。

偏差といえば、受験でおなじみの「偏差値」。元のデータが正規分布であると仮定して、平均50・標準偏差10に変換し、平均を標準偏差何個分上回っている、あるいは下回っているかで比較するという考えに基づいています。

なお、平均値や単位が異なる複数のデータのばらつき具合を比較する場合には、標準偏差を平均値で割った「変動係数」を用います。

終わりに

誤解されがちな統計用語について、まとめて解説いたしました。

データで用いるのは数値ですが、だからこそ「言葉」を厳密に用いることが求められます。回帰分析やベイズ統計学などを用いてデータを分析し、予測や確率予想を行いたいという方は多いでしょう。そのはじめの一歩として、まずは基礎的な用語を見直してみてください!

統計に関するさらなる知識を深めたい方に、以下の記事もおすすめ!

進化するAIは仕事をどう変えるのか(第2回) この記事では、AIの進化が私たちの仕事にどのような影響を与えるのかを詳しく解説しています。統計学の知識を持つことで、AIの動作や背後にあるデータの理解がより深まります。

(宮田文机)

 
「標本」「サンプルサイズ」「母集団」「母数」の違いと「母数」「サンプル数」の誤用

1 2

参照元

・栗原伸一 (著), 丸山敦史 (著), ジーグレイプ (その他)『統計学図鑑』オーム社、2017
・永野裕之『ゼロからはじめる! 統計学見るだけノート』宝島社、2018
・馬場 真哉 (著) 『Pythonで学ぶあたらしい統計学の教科書』翔泳社、2018
偏差値┃なるほど統計学園高等部(総務省統計局) ・統計用語集┃統計WEB
「母数」の意味とは?誤用しやすい「分母・サンプル数」との関係も┃TRANS.Biz
サンプル数とは何か?┃独立行政法人労働政策研究・研修機構

×

メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。


データ活用 Data utilization テクノロジー technology 社会 society ビジネス business ライフ life 特集 Special feature

関連記事Related article

書評記事Book-review

データのじかん公式InstagramInstagram

データのじかん公式Instagram

30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!

おすすめ記事Recommended articles

掲載特集

デジタル・DX・データにまつわる4コマ劇場『タイムくん』 デジタル・DX・データにまつわる4コマ劇場『タイムくん』 データのじかんをもっと詳しくデータのじかんフィーチャーズ データのじかんをもっと詳しく データのじかんフィーチャーズ 「47都道府県47色のDXの在り方」を訪ねる『Local DX Lab』 「47都道府県47色のDXの在り方」を訪ねる『Local DX Lab』 DXの1次情報をを世界から『World DX Journal』 DXの1次情報をを世界から 『World DX Journal』 データで越境するあなたへおすすめの『ブックレビュー』 データで越境するあなたへおすすめの 『ブックレビュー』 BIツールユーザーによる、BIツールユーザーのための、BIツールのトリセツ BIツールユーザーによる、BIツールユーザーのための、BIツールのトリセツ CIOの履歴書 by 一般社団法人CIOシェアリング協議会 CIOの履歴書 by 一般社団法人CIOシェアリング協議会 なぜ、日本企業のIT化が進まないのか――日本のSI構造から考える なぜ、日本企業のIT化が進まないのか――日本のSI構造から考える 日本ビジネスの血流である帳票のトレンドを徹底解説 日本ビジネスの血流である帳票のトレンドを徹底解説 データを武器にした課題解決家「柏木吉基」のあなたの組織がデータを活かせていないワケ データを武器にした課題解決家「柏木吉基」のあなたの組織がデータを活かせていないワケ BI(ビジネスインテリジェンス)のトリセツ BI(ビジネスインテリジェンス)のトリセツ 入社1年目に知っておきたい差が付くKPIマネジメント 入社1年目に知っておきたい 差が付くKPIマネジメント CIOLounge矢島氏が紐解くトップランナーたちのDXの“ホンネ” CIOLounge矢島氏が紐解く トップランナーたちのDXの“ホンネ” データのじかん Resources越境者のためのお役立ち資料集 データのじかん Resources 越境者のためのお役立ち資料集 AI実装の現在地点-トップITベンダーの捉え方 AI実装の現在地点-トップITベンダーの捉え方 データでビジネス、ライフを変える、面白くするDATA LOVERS データでビジネス、ライフを変える、 面白くするDATA LOVERS データマネジメント・ラジオ by データ横丁 データマネジメント・ラジオ by データ横丁 データのじかんNews データのじかんNews データ・情報は生もの!『DX Namamono information』 データ・情報は生もの! 『DX Namamono information』 ちょびっとラビット耳よりラピッドニュース ちょびっとラビット耳よりラピッドニュース AI事務員宮西さん(データ組織立ち上げ編) AI事務員宮西さん(データ組織立ち上げ編) 藤谷先生と一緒に学ぶ、DXリーダーのための危機管理入門 藤谷先生と一緒に学ぶ、DXリーダーのための危機管理入門 生情報取材班AI時代に逆行?ヒトが体感した「生情報」のみをお届け! 生情報取材班AI時代に逆行?ヒトが体感した「生情報」のみをお届け! データはともだち 〜怖くないよ!by UpdataTV Original データはともだち 〜怖くないよ!by UpdataTV Original データ飯店〜データに携わるモノたちの2.5thプレイス by UpdataTV〜 データ飯店〜データに携わるモノたちの2.5thプレイス by UpdataTV〜 インサイトーク〜データで世界を覗いてみたら〜by WingArc1st + IDEATECH インサイトーク〜データで世界を覗いてみたら〜by WingArc1st + IDEATECH
close close