Share!

「ビッグデータ」という言葉をよく耳にするようになりました。ビッグデータの重要性だったり、ビッグデータで世界が変わる、と言ったなんだかちょっと大げさ話だったり、グーグルがビッグデータ解析フォームにイーサリアムを追加した話だったり、なんだかよくわからないけれど、とりあえず集めなきゃいけないと思っている話だったり、ビッグデータで人の本性がわかる、という話だったり、始まったと思っていたらもうすでにビッグデータ時代の終焉、という言葉も出現していたり。

しかし、「そもそもビッグデータとは何ですか?わかりやすく説明してください」と改めて聞かれると、答えに窮する人も多いのではないかと思います。そこで今回は、ビッグデータの定義から活用例までご紹介します。

ビッグデータとは?

ビッグデータというと、つい大量のデータのことを思い浮かべてしまいますが、それだけを意味しているわけではありません。

ビッグデータとは、「様々な形をした、様々な性格を持った、様々な種類のデータのこと※1」を指します。実はビッグデータは、データの量(Volume)、データの種類(Variety)、データの発生頻度・更新頻度(Velocity)の3つのVからなり、いずれも重要な要素です※2。

IT用語辞典では、ビッグデータは下記のように定義されています。

ビッグデータとは、従来のデータベース管理システムなどでは記録や保管、解析が難しいような巨大なデータ群。明確な定義があるわけではなく、企業向け情報システムメーカーのマーケティング用語として多用されている。
多くの場合、ビッグデータとは単に量が多いだけでなく、様々な種類・形式が含まれる非構造化データ・非定型的データであり、さらに、日々膨大に生成・記録される時系列性・リアルタイム性のあるようなものを指すことが多い。今までは管理しきれないため見過ごされてきたそのようなデータ群を記録・保管して即座に解析することで、ビジネスや社会に有用な知見を得たり、これまでにないような新たな仕組みやシステムを産み出す可能性が高まるとされている。

ビッグデータの定義がわかったところで、今度はビッグデータの分析方法を見ていきましょう。例えば、あなたが新しいビールを売り出したいと考えたとします。

あなたが(1)特約店別の出荷情報と(2)今年は晴れる日が多いかどうか、のビッグデータを持っている場合、(1)から「地域別の売上」を把握することができますが、(2)から「その地域の天気は悪い日が多い」ということがわかる場合は、天気の悪そうなエリアを避けたマーケティング戦略を練ることができます。(1)と(2)のビッグデータを使って「ではどこで売れるのか」というビジネス拡大の課題のヒントを得ることができるのです。どこで売れるのかが分かれば、そこに広告費を集中投下するというマーケティングの意思決定をすることができ、その分得られる利益も変わってきます※1。

ビッグデータを利用した需要予測

さて、新しいビールを実際に発売しようと考えたとき、懸念点として存在するのは「在庫保有コスト」や「在庫切れ」などによる機会損失です。特にビールは季節による需要の変化が大きいため、精度の高い発注・生産計画が必要となります。

富士通は、ビッグデータを活用し、複数の需要予測のシナリオに基づき、一定期間先読みができるSCM(サプライチェーンマネジメント)向けのモデル予測制御技術を開発しました。これにより、リスクを抑えつつ長期的な利益を最大にする計画を立てることが可能になっています(参考記事)。このように、ビッグデータを使えば高度な意思決定も可能です。

なぜビッグデータが普及したのか

ビッグデータが普及したのは、コンピューターやインターネットの急速な発達によるものが大きいですが、これまで「3つの流れ」によって発達してきました。第一の流れは「データのデジタル化とコンピューターの高速化」、第二の流れは「インターネットの発展」、そして第三の流れは「ビッグデータ時代のはじまり」です※3。

第三の流れに拍車を掛けたのが、「Hadoop(ハドゥープ)」と呼ばれる技術。これは、「大量のデータを手軽に複数のマシンに分散して処理できるオープンソースのプラットフォーム」のことです(参考記事)。これにより、ペタバイト(1ペタバイトは1テラバイトの1000倍)レベルの非構造化データ(メールや画像、動画などのデータ)の超高速処理が可能になりました。Hadoopの登場で、大量の情報を低コストで分析できるようになりました。

ビッグデータの活用例

それでは、実際にどのような場面でビッグデータが使われているのかをみてみましょう。

防犯カメラ

防犯カメラは膨大なビッグデータを集める手段として注目されています。かつては映像を記録するだけのものでしたが、現在では「手に取ってすぐ棚に戻したもの」「かごに入れたけれど棚に戻したもの」など、購入に至らなかった商品のデータ分析に使われています

これらのデータは、顧客の行動データを解析することでさらなるマーケティングに役立てることが可能になるのです(参考記事)。

Nシステム

Nシステムは「自動車ナンバー自動読取装置」のこと。これは警察が設置した監視システムであり、走行中の車のナンバーをすべて読み取ると同時に、手配車両のナンバーと照合します。このシステムは犯罪捜査だけではなく、渋滞の予測やドライバーへの警告などにも利用されています※1。

ICチップ付きの交通カード

駅の改札でタッチ&ゴーをするICチップ付きの交通カード(SuicaやPASMOなど)。このカードは利用客が電車に乗る際の支払いに使われるだけではなく、タッチした際の情報が改札機を通して鉄道会社に送られ、自社内システム(旅行業等※4)で利用されています。さらに、これらのカードを使って買い物をすると、「誰が」「何を」「何回買った」のかが自動的にビッグデータとして蓄積されていきます※3。

選挙速報

選挙速報でよく見る出口調査も、ビッグデータの例といえます。出口調査は投票所から出てくる人に、「誰に投票したか」を聞いて行います。調査対象者は無作為に選ばれますが、その数は調査投票区の人口密度で決まってきます※5。

最近では、出口調査による予測よりもかなり前に選挙結果を予測できるようになっています。Yahoo! JAPANのビッグデータレポートチームは、2013年の参議院議員選挙の結果を、「Yahoo!検索」のデータや過去の得票数の結果などから予測し、驚異的な精度の選挙予測を行っています(参考記事)。

ビッグデータとオープンデータ

by Anja Jentzsch

オープンデータは、政府・自治体が持つ情報資源を開放することで、革新的アイデアやイノベーションが生まれるきっかけを生み出そうというものです。IT業界の企業にとっては、オープンデータの情報を利用することで新たな商機を得ることが可能ですし、行政にとってはあらかじめ情報公開を行うことで行政に対する問い合わせが減少し、業務効率化につながります。

このオープンデータとビッグデータを組み合わせることで、様々な用途に応用できます。欧米では、犯罪を予測するサービスや農作物の収穫予測などにオープンデータが使用されていますが、日本でも静岡県が「ふじのくにオープンデータカタログ」を2013年に立ち上げました。こちらは観光情報・防災情報など県や市町村のデータが利用できるようになっています。また、「税金はどこへ行った? – WHERE DOES MY MONEY GO? –」というサイトでは、自分が支払った税金の使途がインフォグラフィックで見ることが可能です。現在は一部の自治体の結果のみ見ることができますが、ビッグデータの活用例として興味深いコンテンツといえます。

オープンデータに関しては、ニューヨーク市の取り組みである「NYC Open Data」が参考になると思います。これについて知りたい方は、以下のページを参考にしてください。

自治体によるオープンデータの先進事例! NYC Open Dataとは? _ データのじかん

AIとビッグデータ

IBMが開発したAI(「コグニティブ(認知型)・コンピューター」と紹介されることもあります)である「ワトソン」。アメリカのクイズ番組で賞金100万ドルを獲得したことで有名です。ワトソンは、事前にクイズに出題されそうな情報をインプットしておけば、機械学習(人間がもつ学習能力と同じく、コンピューターも経験から学習し、将来予測や意思決定を実現できるようにする技術や手法※6)や統計の解析などによってクイズに答えることができます。音声や画像を認識できたり、経験から学んで自ら賢くなっていったりするなど、人間の知能に非常に近づいているAIです。

このワトソンの機能とビッグデータを組み合わせた使い方が始まっています。例えば、アメリカとタイの医療機関では、医療の現場にワトソンを導入。がん治療のガイドラインや医学文献の抄録、図書館の公開データなど分析し、「この症状ならこの診断になる」とか「この治療をしたらどうか」など、医師の判断をサポートしています(参考記事)。このほか、資産運用や人材育成支援などにもワトソンは使われているようです(参考記事)。

社会保障分野におけるビッグデータの活用

2016年に利用が始まったマイナンバー制度。マイナンバーとは国民全員に割り当てられる12桁の番号のこと。現在は「社会保障」「税」「災害対策」の3つの分野での利用が認められています。利用分野については、今後利用範囲拡大も議論されています。

社会保障、とくに医療費に関しては、2014年度に40兆円を突破。医療費削減が課題になっています。医療分野でマイナンバーが利用されるようになれば、レセプト情報が医療機関で共有され、重複した診療等を減らすことができ、医療費削減につながります。このレセプト情報や電子カルテなど医療情報のデータが集まった「医療ビッグデータ」が実現すれば、大学や製薬会社の研究・新薬開発などにも役立つでしょう。もちろん個人が特定されない仕組みが必要ですが、医療の質が向上するのは言うまでもありません。

ビッグデータの導入に関して

組織で新しいことにチャレンジしようとすると、社長や上司から「導入した際の費用対効果」の検証を求められることも多いと思います。ビッグデータの導入に関しても同様でしょう。しかしながら、ビッグデータはそもそも試行錯誤を繰り返して情報・ノウハウを蓄積していくものです。さらに、ビッグデータが結果を出し始めるにはある程度の年月が必要になります。ですから、従来のように検証をしてから導入を検討するという意思決定プロセスにはそぐわないといえます。

もし本気でビッグデータを導入しようと考えている場合は、トライ&エラーを許容し、迅速な意思決定権を付与しつつ、ある程度の時間を覚悟する必要があるでしょう。このように、経営層の意識改革が必要なのです。

まとめ

Photo by TheDigitalArtist

ビッグデータの利用に関しては、Suicaのデータの外部販売が問題になるなど、まだまだ乗り越えなければならない課題も多いです。ベネッセの個人情報流出問題など、消費者は依然として企業の個人情報の扱いに関してナイーブになっています。このような状況下でいかにビッグデータを活用していくのか、各自治体・企業には適切な対応策が求められています。

ビッグデータの活用事例など関連記事をもっと読みたい方はこちらからどうぞ

 (参考文献)
 ※1 岡村久和 監修『IoT時代のビッグデータビジネス革命』(2018年、インプレス社)
 ※2 野村総合研究所「ビッグデータの真実~ビッグデータの誤解を解く~」(PDFファイル)
 ※3 稲田修一『知識ゼロからのビッグデータ入門』(2016年、幻冬舎)
 ※4 大槻知史 「Suicaシステムの概要」(PDFファイル)
 ※5 朝日新聞出版「知恵蔵」(コトバンク)
 ※6 デジタル大辞泉(goo国語辞書

(安齋慎平)

この記事を読んだあなたにおすすめのタグ

この記事を読んだあなたにおすすめのタグ

人気のカテゴリ