統計家・西内啓氏と語る、複数ベンターのデータを集約して「情報」として活用するまでの道のり | データで越境者に寄り添うメディア データのじかん
カテゴリー
キーワード

統計家・西内啓氏と語る、複数ベンターのデータを集約して「情報」として活用するまでの道のり

         

内閣府が公開するV-RESASは、新型コロナウイルス感染症の日本経済への影響を、ビッグデータを用いて可視化する地域経済分析サイトだ。気鋭のデザインエンジニア、Takram代表の田川欣哉氏と、データビークル代表取締役で統計家の西内啓氏はともにV-RESASプロジェクトのメンバーとして参加してきた。官民のさまざまなデータを集約し、比較できるという前例のないサイトをゼロから立ち上げるだけに、苦労もあった半面、手応えも感じているという。

株式会社Takram 代表取締役 田川 欣哉氏

空間の方向に二次医療圏を採用するアイデアがブレイクスルーに

田川: V-RESASは2020年6月末にサイトを公開しました。西内さんとは、V-RESASの前のRESAS時代からご一緒していています。西内さんと一緒に大臣室で説明した時のことを思い出すと懐かしいです。

V-RESASでは、データベースの設計からフロントエンドの開発まで、同時進行で進めました。ベンダーからもたくさんのデータが集まり、西内さんには各ベンダーと一緒に指標をつくる部分のコントロールも担当いただきました。

西内: 大変な仕事だったことを、今でも思い出します。データを「情報」として分かりやすく見せるためには、指標などをそろえなければなりません。しかし、V-RESASでは、複数の会社が各々の目的で設計したデータを集めているため、そろえきれない部分もあります。民間のサイトであれば、「そういうものです。すみません」と言えば済むのかもしれません。しかし、内閣府(内閣府地方創生推進室および内閣官房まち・ひと・しごと創生本部事務局)がつくるからには、「何でこういう形式になっているのか」を説明できなければいけません。

株式会社データビークル代表取締役 西内 啓氏

そのためV-RESASでは、地域経済分析という目的に適したカスタマイズを施しています。例えば、「飲食」データは口コミグルメサービス「Retty(レッティ)」の食領域のビッグデータ連携基盤「Food Data Platform」が保有するデータを用いていますが、Retty で使われている飲食店のジャンルの分け方ではなく、V-RESAS独自の分け方に変えています。ここも骨が折れました。

田川: エリアの分け方もどうすればいいのか悩みましたね。全体的に分析粒度をそろえなければいけないのですが、これがかなり大変。そこで、時間方向と空間方向の分析粒度のガイドラインを西内さんにつくっていただきました。そして、空間方向の粒度設計に二次医療圏を採用するという斬新なアイデアを出してもらいました。思い返すと、これがブレイクスルーだった気がします。

西内: 市区町村だと小さすぎて、都道府県だと大きすぎます。実は、最初に浮かんだアイデアは江戸時代の「藩」という概念でした。都道府県の47の分け方よりも多く、ちょうどいい分け方だと思ったのですが、昔の住所に変えてマッピングに落とし込むのは、短期間では無理だと断念しました。そこで、代案として二次医療圏という分け方が使えるなと思いついたのです。

二次医療圏:一般的な保健医療を提供する区域。V-RESASでは地理的区分として都道府県・市区町村などの行政区域ではなく、実際の人流・経済活動の実活動を地理的区分する区域として二次医療圏を利用している。(https://v-resas.go.jp/data-index/areas)

時間方向では、全部を前年同期比に仕上げてそろえるのがポイントでした。そこも、用いるデータによっては過去のある年の1月1日などを100とした指標になっていたりします。そうなると同じ数字でも画面やデータの間で意味が違ってきます。

例えば、ホットケーキやクッキーの材料となるプレミックス(調整粉)が売り切れるなどの現象もありましたが、その現象に対する皆さんの関心は、「2019年の同時期と比べてどうなのか」という点にあるのだと思います。前年同期比でそろえたのは、季節性も考慮でき、分析に利用するデータの見え方としては適切だったと思います。

田川: さまざまな現象をビフォーコロナ、ウィズコロナ、アフターコロナの3段階で比較して見るのは、とても面白いですよね。そこで、もう2021年になりましたが、V-RESASでは前年同期比といっても2020年との比較ではなく、あえて2019年同期比にしています。

データも、人流データのように正真正銘のビックデータと呼ばれるものから、比較的データのサンプルサイズの少ないものまでいろいろあり、それらをバランスよくさばく基盤を整えました。

西内: ただし、「イベント」だけは、二次医療圏での比較はできませんでした。例えば、有名ロックスターのコンサートが開かれるのは、やはり大都市圏が中心になります。すると、大都市圏以外のエリアでは、ゼロに張り付いたり、急に数値が上がったりしてしまい、データの解釈が難しくなってしまいます。

スピリッツが売れている理由は、「宅飲み」ではなかった

田川: 西内さんはV-RESAS以外にも、これまでいろいろなところで、このような地域経済に関するデータを見てきたと思います。V-RESASの中で、どのようなデータやエピソードに関心を持ちましたか。

西内: 個人的に興味深かったのが、V-RESASの解像度の高さです。例えば2020年5月に、スピリッツ系のお酒が前年同期比で大きく売り上げを伸ばす現象が起きました。データソースはいろいろあるので、V-RESAS以外でこの現象を見た人もいたでしょう。当時、ニュースの報道では、「『宅飲み』など巣ごもり需要だろう」としていました。私たちはそれを聞いてすぐに、違うと感じました。というのも、私たちはV-RESASで他の酒類のデータも見ていたからです。スピリッツが大きく売れたタイミングでも日本酒、ビールや焼酎の消費は前年同期比でほとんど変わりがありませんでした。スピリッツだけが突出して売れていたのです。ここから宅飲みではなく、ジンやウオッカなどアルコール度数の高いお酒を、品薄となった消毒液の代わりに購入している人が増えているのではないかと推測することができました。

田川: V-RESASのデータから、そういう仮説を立てることもできるわけですね。

西内: V-RESASでは、地域ブロックごとの2019年同週比の推移のグラフに10色ものパレットを用意しています。さまざまな知見を駆使しながら、そこに、いろいろな要素を加えなければなりません。そこでは情報整理がとても重要です。田川さんを持ち上げるわけではないですが、データの整理が大変だった以上にデザイン側の整理についても、普段よりも大変だったのではないですか。

田川: ありがとうございます。たくさんの色を使っていますが、色弱の方でも識別できるように、ユニバーサルデザインにも配慮しました。

また、一つ一つの項目をクリックしなくても、マウスのポインタを移動させるだけでデータが変わるようにもなっています。さらにスマートフォン(スマホ)でも使えるようにしないといけません。スマホのインタラクションとマウスのインタラクションの両方に対応しながら、これだけ複雑なものをできるだけタップなどをしないで自然に導くのは難しい作業でした。

現在は、V-RESASにコロナの新規陽性者数を重ねて見られるようにする機能が追加されています。第一波、第二波、第三波で、それぞれ人の動きの反応が違っていたと思いますが、これが把握できるようになります。

西内: 第一波はセンシティブに反応しましたが、第二波に関しては結構スルーされていたみたいですね。

田川: 第二波では緊急事態宣言が出ませんでしたので、国民の皆さんも、知らないうちに終わった印象があるのではないでしょうか。

西内: 第三波では、緊急事態宣言も再発令されました。ただし、エリアによってだいぶ動きが違っています。首都圏では動きが下がっている一方で、地方ではあまり影響がない印象です。

田川: 感染者数の推移の数字は同じ値を見ているわけですが、政府やメディアを通じたメッセージの受け取り方、そしてそれに対する反応の仕方が、同じ日本国内ですら地域差があるようです。V-RESASの機能アップで、よりコアなデータが見えるようになることで、この辺りの“違い”についても分析可能になります。

写真左|株式会社Takram 代表取締役 田川 欣哉氏

テクノロジーとデザインの幅広い分野に精通するデザインエンジニア。主なプロジェクトに、トヨタ自動車「e-Palette Concept」のプレゼンテーション設計、メルカリのデザインアドバイザーなどがある。東京大学工学部卒業。英国ロイヤル・カレッジ・オブ・アート修了。経済産業省 産業構造審議会 知的財産分科会委員。ロイヤル・カレッジ・オブ・アート名誉フェロー。

写真右|株式会社データビークル代表取締役 西内 啓氏

1981年生まれ。東京大学医学部卒。東京大学助教、ダナファーバーハーバードがん研究センター客員研究員、大学病院医療情報ネットワーク研究センター副センター長等を経てデータビークル代表取締役。現在多くの企業のデータ分析および分析人材の育成に携わる。統計家、Jリーグアドバイザー。著書に『統計学が最強の学問である』(ダイヤモンド社)など。

(取材・TEXT:JBPRESS+稲垣/下原  PHOTO:Inoue Syuhei  編集:野島光太郎)

 
×

メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。


データ活用 Data utilization テクノロジー technology 社会 society ビジネス business ライフ life 特集 Special feature

関連記事Related article

書評記事Book-review

データのじかん公式InstagramInstagram

データのじかん公式Instagram

30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!

おすすめ記事Recommended articles

掲載特集

デジタル・DX・データにまつわる4コマ劇場『タイムくん』 デジタル・DX・データにまつわる4コマ劇場『タイムくん』 データのじかんをもっと詳しくデータのじかんフィーチャーズ データのじかんをもっと詳しく データのじかんフィーチャーズ 「47都道府県47色のDXの在り方」を訪ねる『Local DX Lab』 「47都道府県47色のDXの在り方」を訪ねる『Local DX Lab』 DXの1次情報をを世界から『World DX Journal』 DXの1次情報をを世界から 『World DX Journal』 データで越境するあなたへおすすめの『ブックレビュー』 データで越境するあなたへおすすめの 『ブックレビュー』 BIツールユーザーによる、BIツールユーザーのための、BIツールのトリセツ BIツールユーザーによる、BIツールユーザーのための、BIツールのトリセツ CIOの履歴書 by 一般社団法人CIOシェアリング協議会 CIOの履歴書 by 一般社団法人CIOシェアリング協議会 なぜ、日本企業のIT化が進まないのか――日本のSI構造から考える なぜ、日本企業のIT化が進まないのか――日本のSI構造から考える 日本ビジネスの血流である帳票のトレンドを徹底解説 日本ビジネスの血流である帳票のトレンドを徹底解説 データを武器にした課題解決家「柏木吉基」のあなたの組織がデータを活かせていないワケ データを武器にした課題解決家「柏木吉基」のあなたの組織がデータを活かせていないワケ BI(ビジネスインテリジェンス)のトリセツ BI(ビジネスインテリジェンス)のトリセツ 入社1年目に知っておきたい差が付くKPIマネジメント 入社1年目に知っておきたい 差が付くKPIマネジメント CIOLounge矢島氏が紐解くトップランナーたちのDXの“ホンネ” CIOLounge矢島氏が紐解く トップランナーたちのDXの“ホンネ” データのじかん Resources越境者のためのお役立ち資料集 データのじかん Resources 越境者のためのお役立ち資料集 AI実装の現在地点-トップITベンダーの捉え方 AI実装の現在地点-トップITベンダーの捉え方 データでビジネス、ライフを変える、面白くするDATA LOVERS データでビジネス、ライフを変える、 面白くするDATA LOVERS データマネジメント・ラジオ by データ横丁 データマネジメント・ラジオ by データ横丁 データのじかんNews データのじかんNews データ・情報は生もの!『DX Namamono information』 データ・情報は生もの! 『DX Namamono information』 ちょびっとラビット耳よりラピッドニュース ちょびっとラビット耳よりラピッドニュース AI事務員宮西さん(データ組織立ち上げ編) AI事務員宮西さん(データ組織立ち上げ編) 藤谷先生と一緒に学ぶ、DXリーダーのための危機管理入門 藤谷先生と一緒に学ぶ、DXリーダーのための危機管理入門 生情報取材班AI時代に逆行?ヒトが体感した「生情報」のみをお届け! 生情報取材班AI時代に逆行?ヒトが体感した「生情報」のみをお届け! データはともだち 〜怖くないよ!by UpdataTV Original データはともだち 〜怖くないよ!by UpdataTV Original データ飯店〜データに携わるモノたちの2.5thプレイス by UpdataTV〜 データ飯店〜データに携わるモノたちの2.5thプレイス by UpdataTV〜 インサイトーク〜データで世界を覗いてみたら〜by WingArc1st + IDEATECH インサイトーク〜データで世界を覗いてみたら〜by WingArc1st + IDEATECH
close close