データの数値は捉え方次第。今、問われるのはデータの「目利き力」 | データで越境者に寄り添うメディア データのじかん
会員ページへmember

About us データのじかんとは?

データの数値は捉え方次第。今、問われるのはデータの「目利き力」

         

繁華街の人の動きなど、新型コロナウイルスの感染防止対策としてデータ活用が進み、生活者のデータへの関心が一気に高まった。メディアはもとより、複数の組織、政府や自治体がデータを発表、多くはビジュアライズ(可視化)して発表され、われわれはそれを見てさまざまな捉え方をする。ただ、同じデータでも人によって見方は異なり、正反対の反応を示すこともある。

いくらデータを持っていても、それを的確に判断する「目利き力」なければ、異なった判断を下してしまう。ドコモの携帯電話ネットワークから得られる膨大なデータを活用した「モバイル空間統計」を提供する株式会社ドコモ・インサイトマーケティングの古田泰子氏に「正しいデータの目利き」のヒントを伺った。

一つのデータが示すのは一つの側面に過ぎない

「1種類のデータだけでは、物事を限られた側面からしか見ることができず、誤った判断につながる恐れがあります。例えば、下のグラフは『東京都の流入人口』の推移を表していますが、事象を正確に知るには、他のデータも参照し、多角的にデータを分析していく必要があります」(古田氏。以下同)

グラフは新型コロナウイルス感染が拡大してからの東京都の流入人口の推移を表している。2020年4月7日の緊急事態宣言の発令以降、都内に入ってくる人の数は急激に減り、5月1日には直近で最も多かった2月21日と比べて56%も減少している。だがこれだけでは、総量として減った結果、感染者数が抑えられた可能性があるという程度の推測しか導き出せない。

だが、データをもう一つ参照してみると、全く別の側面が見えてくる。

このグラフは、東京都への流入人口の「男女比」を表したものだ。もともと都内に流入する人口の男女比は約6対4で男性の方が多いことが分かる。さらに人口の最大値と自粛がピークを迎えた最小値を比較すると、男性が53%減であるのに対して女性は59%減と女性のほうが減少率が大きいことも見てとれる。

「男性よりも女性の感染者数が少ないことから、『女性の方がコロナに感染しにくい?』という憶測も出ていましたが、このデータを見ると、必ずしもそうとは言えないことが分かります。会社勤めの関係上、都内に入ってくるのはもともと男性の方が多く、しかも自粛となった際も女性の人数が大幅に減少した上に自粛率も高い。つまり、そもそも男性よりも女性の方が移動を控えたこともあり、感染のリスク自体が低かった可能性を導き出すことができます」

この例は、正確なインサイトを得るためには、移動人口だけでなく居住地や性別などの項目に分けてさまざまな角度からデータを深掘りしていく必要があることを示唆している。これと同様のことが、ニュースで取り上げられた「あるエリアにおける自粛期間中の人出の増加」にも言える。

「とあるエリアで、人の数だけを見て、『人が減っていない。ぜんぜん自粛していないではないか』ということがニュースになりました。確かに、そのエリアに滞在していた人のトータル数は、減っていませんでした。しかし、出ていた人の属性を『市内居住者』『市外居住者』『県外からの来訪者』で分けてみると、市内居住者が増加し、市外居住者は減少、県外からの来訪者はそもそも少ないことが分かるかもしれません。そのような結果が出れば、『そのエリアの市内居住者は、自粛して市外に出ずに過ごしていた』という、一つの成果として捉えることが可能です。単に人数やパーセンテージだけで一喜一憂せずに、その『1(1人や1%)』が、どういう属性を持った『1』であるかを見ることが大切です」

一面的なデータだけで判断すると、間違った判断や思い込みに陥る危険がある。多面的な視野でデータを捉える、それがデータリテラシー向上につながるといえる。

コロナ対応を機に高まりつつあるデータリテラシー

冒頭でも触れたように、人口流入や移動状況を把握するため、各地の自治体担当者がデータを扱い出している。3月以降、古田氏が所属するドコモ・インサイトマーケティングにも、「モバイル空間統計」に対する問い合わせが一斉に舞い込んだ。

「モバイル空間統計」は、ドコモの携帯電話がつながる仕組みを利用して得られた人口の統計情報を提供するサービスだ。携帯電話は定期的に「今ここにいる」という信号を発信して、基地局に自分の位置を知らせている。この信号を集計すれば、いつどのエリアにドコモの端末が何台あるかが正確に分かる。国内で登録されているドコモの端末は、約8,000万台。加えて訪日外国人の接続端末は約1200万台。これらの運用データはボリューム、質ともに類を見ない人口統計データとして、多くの企業や自治体から大きな注目を集めている。

古田氏は、「ピーク時には30カ所の県の担当者とお話をしていました」と語る。しかも全員が、最新のデータを一刻も早く欲しいと要求してくる。通常であれば顧客の要望や用途に応じてデータを加工し、グラフ化などで可視化した上で提供するのだが、とてもそこまで手が回らない。そこで、加工はしていない統計データをCSV形式にて渡して加工・分析はユーザーに任せることにしたという。

「緊急事態とあって、平常時のような利用契約も間に合いません。そこで最新のデータを無償でサンプル提供して、それを見ていただいて自分たちで使えそうだったらお使いくださいとお願いしました」

とはいえ、自治体によってはデータ加工や分析経験のない担当者も大勢いる。そうしたユーザーにはCSVデータを基にピボットグラフの作成画面を見せたりしながら、実際に流入人口が増えている点を指摘するなどのフォローを行っていった。

古田氏はこうした切迫した経験を経て、ユーザーの中に自らデータをもっと活用しようという意識や、データから得られる気付きが生まれつつあると明かす。もちろんその経験はコロナ禍対応だけなく、この先事態が沈静化した際の産業や観光復興にも役立つものだ。コロナ禍以前は、何もしなくても客は来ていたためデータを見る必要はなかった。それが今回自分たちの手で人の動きを把握し、その背後にある事実を推測する体験を通じて、データ活用の可能性に目を向けるようになった点は大きい、と古田氏は見ている。

「どんな年代の方がどの県から一番訪れているかを見ることで、限られた観光予算を有効に使った施策が打てるのではないかといったアイデアが、皆さんの間から次々に出てきています」

自治体だけでなく地元企業にも、同様の動きがある。たとえばコロナ禍による営業時間の短縮で、より来客数の多い時間帯に集中して短時間だけ店を開けるために、「モバイル空間統計」を利用する例も出てきているという。

そもそも、そのデータは信頼できる?データの「目利き」になるには

では、正しくデータを読み解き、活用できる「目利き」になるためには、どのようなポイントを押さえるべきか。古田氏は、下の「データの信頼性に関わるポイント」を挙げる。

※「有効サンプル」は、「モバイル空間統計」の実績

具体的には、「サンプルの質」「サンプルサイズ」、そして「集計方法」の三つだ。「質」とは均一で連続しており、偏ったものでないこと。「量」は、サンプルのサイズが統計の信頼性に直結するということ。そして「集計方法」はプライバシーが保護されていること。また、手法が明確に公開されているかどうかも重要なポイントとなる。

「サンプルサイズは、例えば、1000人を元に推計すると数%の誤差で済むものが、もし100人しかいないと誤差が10%くらいに広がってしまいます。サンプルサイズは、統計の精度に大きく影響する要因の一つです」

そうした点でも、国内約8,000万台+訪日外国人約1,200万台のデータを持つ「モバイル空間統計」は信頼性を担保している。

だが古田氏は、そうしたデータの信頼性以前に重要なのが、データを利用する人や組織自身の「課題」、すなわち「何を得たいのか」だ。

「漫然と『データを集めたらビジネスに役立つのでは』というのではなく、解決したい課題があり、その解決策をデータから見出すというスタンスが必要です。例えば、売り上げが上がらないという課題であれば、『モバイル空間統計』でどのエリア・時間にどれくらいの人がいるかを把握し、人がそもそもいないのか、それとも人がいるのに来店していないのかを見極めます。一方、いるのに売れないというのなら、要因はどこにあるのか……といったことを追求していけば、解決のためのアイデアを生むことができることでしょう」

2020年5月27日には、新型コロナウィルス感染症の拡大防止に向けて、最短1時間前までの日本全国の人口分布を把握できる「モバイル空間統計 人口マップ」を2021年3月31日(水)まで無償提供することを発表した。

最後に、「モバイル空間統計」の展望について伺った。ドコモ・インサイトマーケティングでは、感染拡大の防止はもちろん、こうしたコロナ禍を乗り切っていこうと奮闘する自治体や企業を支援するために、2020年5月末から来年3月末まで「モバイル空間統計 人口マップ」の無償提供を行っているが、今後は、よりリアルタイムでのサービス提供に注力することで、「モバイル空間統計」の幅を大きく広げていきたいと考えているという。

「すでに最短1時間前の人口分布が把握できる『国内人口分布統計(リアルタイム版)』を提供しており、これを今後AI系ベンダーやAIシステムを持つ企業などと連携して、付加価値を高めていきたいと考えています。例えば、サブスクリプションモデルで、必要な時にいつでもデータが見られるといったサービスをイメージしています」

コロナ禍は日本にとって大きな痛手だが、企業や生活者のデータ活用が各段に進んだのは間違いなさそうだ。

お話をお伺いしたDataLover:古田 泰子(ふるた やすこ)さん
株式会社ドコモ・インサイトマーケティング エリアマーケティング部 副部長

電気通信大学卒業後、大日本印刷に入社。特許事務所、楽天の知財立ち上げを経て、2012年にNTTドコモに入社。2018年より現職。現在、モバイル空間統計の営業・企画として、観光戦略の立案や効果測定、店舗の出店計画や顧客分析などに従事。防災士。

 
 

 

(取材・TEXT:JBPRESS+田口/稲垣/工藤 企画・編集:野島光太郎)

   

ChatGPTとAPI連携したぼくたちが
機械的に答えます!

なんでも質問してください!

何か面白いことを言うかもしれないので、なんでもお気軽に質問してみてください。
ただし、何を聞いてもらってもいいですけど、責任は取れませんので、自己責任でお願いします。
無料ですよー

ヒューマくんAIの回答は正確ではない場合もあります。

データ活用 Data utilization テクノロジー technology 社会 society ビジネス business ライフ life 特集 Special feature

関連記事Related article

書評記事Book-review

データのじかん公式InstagramInstagram

データのじかん公式Instagram

30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!

おすすめ記事Recommended articles

データのじかん会員なら、
全てのコンテンツが
見放題・ダウンロードし放題
データのじかん会員でできること
  • 会員限定資料がすべてダウンロードできる
  • セミナー開催を優先告知
  • 厳選情報をメルマガで確認
会員登録する
データのじかん会員について詳しく知りたい方
close close