About us データのじかんとは?
「統計ってどういうもの?」
「統計とデータ分析って何が違うの?」
上記のような疑問をお持ちの方がいるのではないでしょうか。
統計とは、集団の中の個々の情報を調査し、集団の性質や傾向を数量的かつ統一的に把握することを言います。また、データ分析とは定義から異なる点がありますので、本記事にて詳しく紹介します。
ちなみにですが、10月18日は「統計の日」です。これは明治3年に、日本全国の生産物の動向を調査した「府県物産表」に関する太政官布告がなされた日にちなんでいます。
では下記より、統計とは何か、データ分析との違いについて押さえておきましょう!
日常生活で使われがちな「統計」という言葉ですが、どのような意味なのでしょうか。辞書や広辞苑には下記のように定義されています。
集団における個々の要素の分布を調べ、その集団の傾向・性質などを数量的に統一的に明らかにすること。また、その結果として得られた数値。」
引用:広辞苑より
[名](スル)集団の個々の構成要素の分布を調べ、その集団の属性を数量的に把握すること。また、その結果を数値や図表で表現したもの。「—をとる」「—を出す」「就業人口を—する」
引用:goo辞書
上記より、統計は「集団の傾向や性質を数量的に明確化すること」と言えます。
では、統計にはどのような種類があるのか、また、データ分析とは何が違うのか下記にて紹介します。
日本では、社会や経済の状況を把握するためにさまざまな統計データが定期的に作成され、公表されています。これらの統計データは、テレビや新聞のニュースで頻繁に報道されたり、教科書や参考資料で引用されたりしています。特に教科書では、以下のような主要な統計データが頻繁に引用されています。
参考:日本統計年鑑
これらのデータは、毎年または5年ごとに公表されるものであり、日本全体だけでなく、都道府県や市区町村別など、詳細な地域別のデータも入手できるため、自分の地域の情報を調べるのにも役立ちます。
今、ビジネスの世界では、統計やデータ分析などのスキルやノウハウが注目されています。
しかし、統計とデータ分析は混同されがちですが同じものではありません。そして残念なことに、統計とデータ分析を混同しているビジネスマンが多いのです。ここでその違いを押さえておきましょう。
まず、言葉の定義を見ていきます。なお「データ分析」に関する公式な定義はまだ定まっていないため、ここでは「分析」としておきます。
統計(statistics) |
集団における個々の要素の分布を調べ、その集団の傾向・性質などを数量的に統一的に明らかにすること。また、その結果として得られた数値。 【統計学】 |
分析(analysis) |
(1)ある物事を分解して、それを成立させている成分・要素・側面を明らかにすること。(2)(化)物質の検出・特定、また化学的組成を定性的・定量的に識別すること。(3)(論)(ア)概念の内容を構成する諸微表を要素に分けて明らかにすること。(イ)証明すべき命題から、それを成立させている条件を次々に遡ってゆく証明の仕方。 |
(以上、広辞苑第六版より一部抜粋)
以上を見ると、統計や分析に関し、共通する概念があることがわかります。それは「ある物事の『要素』を分解し、それを『数量的』に明らかにしたり、または『定量的』に識別したりする」ということです。ただし、統計の場合は「物事の性質や傾向を数量的に明らかにすること」という定義なのに対し、分析の方は「論を組み立てる・証明する」という意味も含まれています。実際にビジネスでは、データ分析について「データを使って、仮説を証明したり、現象が起こった要因を考察したりする」という意味で使うこともありますが、それはこうした言葉の定義を暗黙のうちに了解しているためと言えるでしょう。
もう少し簡単に理解したいのなら、総務省統計局が提供している統計データを見てみるといいでしょう。
5年に1度行われる国勢調査は、人口推移や世帯収入などの要素を基に、国という大きな集団の構造や傾向を把握するための統計調査です。また経済センサスのように、ある集団の中から一定の要素を取り上げてその構造を調査し、集団の傾向を探るものもあります。
以上のように、数量的に傾向や特性をつかむために、数値の集計や処理を行うことが統計の分野です。
これに対し、特にデータ分析については、結果をより掘り下げて原因や理由を考えたり、仮説を証明・提示したりするために使います。
たとえば、ある商品の売上が特定地域だけ突出して良かったという結果が出たとします。具体的に、ほかの地域と比較してどの程度売上が良かったのか、特に売れた時間帯や日付はいつだったのか、どんな人が購入したのか、いろいろなことを調査しなくてはなりません。
そんな時、データをドリルダウンしたり、比較表や推移グラフを作成したり、データをさまざまな角度から比較・検討します。そして、それを行う時にBI(Business Intelligence)ツールと呼ばれるデータ分析に特化したツールが活用されることがあります。
分解した要素から、集団や事象の傾向・特徴を定量的に明らかにするのか、それとも事業や集団を構成する数値を比較検討して仮説を提示・証明するのか。これがビジネスにおける「統計」と「データ分析」の違いと理解すれば良いでしょう。
前章では統計とは何か、データとの違いなども紹介しましたが、具体的にイメージできなかった方も多いと思います。ですので本章では、「20人クラスの数学のテストの成績」での統計を見てみましょう。
まず、数学のテストの結果は下記の通りです。
出席番号 | 生徒名 | 得点 |
1番 | Aさん | 63点 |
2番 | Bさん | 69点 |
3番 | Cさん | 58点 |
4番 | Dさん | 86点 |
5番 | Eさん | 88点 |
6番 | Fさん | 62点 |
7番 | Gさん | 84点 |
8番 | Hさん | 89点 |
9番 | Iさん | 68点 |
10番 | Jさん | 95点 |
11番 | Kさん | 73点 |
12番 | Lさん | 58点 |
13番 | Mさん | 88点 |
14番 | Nさん | 77点 |
15番 | Oさん | 67点 |
16番 | Pさん | 65点 |
17番 | Qさん | 80点 |
18番 | Rさん | 98点 |
19番 | Sさん | 75点 |
20番 | Tさん | 65点 |
上記のテスト結果の平均点は、75.4点となります。計算式は下記を参照。
1508(生徒の合計点数)÷20(生徒数)=75.4
上記の平均点は、20名の生徒・クラスという「集団」の数学の能力を「数量的」に明確化した数値ですので、辞書や広辞苑の定義に当てはまっています。小学校や中学校、高等学校のテストは、教育の一環でテストを行なっていることはもちろん、「統計をとる」という活動でもあるようです。
また、上記の統計をとることで、「このクラスの数学の力は、他のクラスに比べてどれくらい優れているのか、もしくは劣っているのか」という比較ができるため、下記のようなことがわかります。
ここまで実例を用いつつ統計について解説しましたが、統計は「異なる集団の間で比較をしたり、複数回行えば同じ集団内で時間的な変化を捉えたりするための数字」と言えるでしょう。
正解は「統計の日」です。
明治3(1870)年のこの日、国内初となる近代的生産統計である「府県物産表」に関する太政官布告がなされました。当時日本では旧暦を利用していたため、実際に布告がなされたのは9月24日でしたが、現在の太陽暦に換算すると10月18日に相当するため、昭和48(1973)年の7月に10月18日を統計の日として定めることになったのです。
ちなみに府県物産表とは、農・海産物や地域の生産物など産業製品について府県ごとの生産高を集計した表のことです。原本を見ることはできませんが、インターネットで検索すると、『「明治七年 府県物産表」の分析』という論文(*1)がヒットし、当時の各地域における産業を知ることができます。この論文によると、当時の日本全体における産業は、農産物が61%、工産物が30%、原始生産物が9%であり、当時の日本は農産を主軸とする農業国だったことがわかります。
さて、冒頭に紹介した「統計の日」ですが、実は世界各地にさまざまな「統計の日」があります。国連統計局(UNSD)では、100カ国以上にわたる国々の「統計の日」をリストアップしています(*2)。
アルジェリアやケニア、南アフリカなどアフリカ諸国は、11月18日を「アフリカ統計デー(African Statistics Day)」と定めています。またインドでは、インド生まれの統計学者であるプラサンタ・チャンドラ・マハラノビス(1893-1972)の誕生日・6月29日を統計の日としています。マハラノビス氏は、考古学における骨の判別に統計的手法を取り入れ、その手法は「マハラノビス距離」として現在も名を残しているほか、統計手法を社会へ適用することにも積極的で、1931年にインド統計研究所を設立しました。インド政府は彼の功績を讃え、誕生日を統計の日として残すことにしたそうです。
なお、国連統計委員会 (UNSC)は2010年10月20日を「世界統計デー (World Statistics Day)」に制定しました。
(データのじかん編集部)
<注釈>
*1 北海道大学 經濟學研究 = THE ECONOMIC STUDIES, 1: 23-58 『「明治七年 府縣物産表」の分析』(著者:山口 和雄)
https://eprints.lib.hokudai.ac.jp/dspace/bitstream/2115/30974/1/1_P23-58.pdf
*2 国連統計局 各国の統計の日
https://unstats.un.org/unsd/dnss/statistics_day/Statistics_Day.htm
メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。
30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!