ビッグデータ・AIの活用が進む中、人材不足が問題となっています。例えばデータを分析して新たな知見を導き出すデータサイエンティストは将来的には25万人が不足するという見通しです。これを解決するための手法として広く公募するオープン・データサイエンスが注目を集めています。日本国内でもビッグデータを活用して予測分析精度を競うコンテストやAIのアルゴリズムを競うコンテストが次々と開催されているのです。今回は日本で行われているコンテストの内容とオープン・データサイエンスが注目を集めている理由について紹介します。
業種を問わず様々な産業でビッグデータの活用が進む中、データサイエンティストのニーズは年々高まっています。産学連携でデータサイエンティスト育成の動きは活発になっていますが、その絶対数はまだまだ不足しているといえるでしょう。
このデータサイエンティスト不足を補う方法としてオープン・データサイエンスが注目されています。例えば「Kaggle」などのデータコンテスト・プラットフォームを活用すれば、コンペ方式で課題を提供してオンデマンドでデータサイエンティストを確保することも可能です。また多くの応募が期待でき、その中から選択できるというメリットもあります。しかし、オープンイノベーションで課題を解決しようとすると、貴重なデータを社外の人間に提供することにもなるのです。そのため、どこまでオープンでいくべきなのか、クローズでいくのはどの部分かなど、しっかりと戦略を立ててオープン・データサイエンスを活用することが重要です。
例えば、投資対効果が出にくいと考えられる局面では、オープン・データサイエンスで解決モデルを抽出し、それを元にクローズでさらに精度を高めるという方法もあるでしょう。この方法ですと社内のデータサイエンティストはより上位の仕事に集中できるようになり、データサイエンティスト不足にも対応することが可能です。実際に海外ではトップ企業ほどオープン・データサイエンスを活用しており、米国のNetflix社では賞金100万ドルの懸賞金をかけたコンテストを開催しています。
【引用元】
・日本経済新聞
http://www.nikkei.com/article/DGXNZO57421630X10C13A7EA1000/
・ITpro
http://itpro.nikkeibp.co.jp/article/USNEWS/20061003/249650/
IoT推進ラボと経済産業省は、IoT・ビッグデータ推進の活動として「ビッグデータ分析コンテスト」を開催しています。IoT推進ラボはIoTを推進するためにIoT推進コンソーシアムの下に設置された組織で、企業の連携や資金の支援を行なっています。
第1回のコンテストは2015年12月から2016年1月にかけて「観光」をテーマに開催されました。指定された観光地の一定期間の観光客数を過去の実績やSNSデータ、気象データ、為替データなどから予測するという内容です。分析結果の提出は1日に5回までという制限はあるものの総回数に制限はなく、精度改善のために何回でもチャレンジできるのが特徴で、129人の参加者から2808回の応募がありました。14の観光地の総観光客数を予測する「総合部門」の他、地域特性に即した予測モデルを構築する「地域部門」、交通特性に即した予測モデルを構築する「交通部門」、インバウンド特性に即した予測モデルを構築する「インバウンド部門」の各部門で予測精度が競われました。
ビッグデータ分析コンテスト開催を通じて、参加者は普段触れることの少ない実際のデータやビジネス課題を対象にデータ分析を行うことが可能です。ビッグデータ分析コンテストによって優秀なデータサイエンティストの発掘や育成の効果が期待されています。
第2回ビッグデータ分析コンテストは2016年7月から9月にかけて開催されました。2回目のテーマは「流通・小売」でコンビニエンスストアのローソンから提供される健康菓子26種類、オリジナル菓子47種類のPOSデータや商品特性データ、SNSデータなどを元に予測精度を競うコンテストです。
ローソンのお菓子の売上を予測する「売上予測部門」と商品特性やヒットの傾向から新規商品を提案する「新商品開発部門」の2部門に分かれての参加者募集でした。参加者数は150人、総応募回数は2250回、応募者の半数弱が20代で、学生からの応募も多く見られました。応募者の6割が会社員で、その内6割強がIT系の企業に勤務しています。
「売上予測部門」の最高予測精度賞には勾配ブースティングを用いた売上予測モデルを構築した大学生2人のチームが選ばれました。また「新商品開発部門」のローソン賞は、ビジネス立地に向けた着眼点が鋭く実現性が高い商品として「大麦と玄米のサクッと米菓 上品なチョコレートとともに」が受賞しました。ビッグデータ分析コンテストは学生、社会人、老若男女を問わずに参加することができ、机上の論理ではなく実データを元に実際のビジネス課題に取り組めるとして参加者からも好評です。また企業からも優秀なデータサイエンティストの発掘、採用につながると注目されています。
【引用元】第2回ビッグデータ分析コンテスト
http://www.meti.go.jp/press/2016/07/20160711002/20160711002.html
第3回ビッグデータ分析コンテストは2017年10月から12月にかけて開催されました。3回目のテーマは「電力・気象」コンテスト応募者には、東京電力ホールディングスから3箇所の発電所の発電量データ、気象庁から気象予報データ、アメダスデータ、地上気象観測データの4種類が提供され、そのデータを活用した分析結果を元に審査は行われました。
審査は予測部門と可視化部門に分けて行われ、予測部門は太陽光発電所の発電量の予測の精度(予測部門精度賞)および分析技術のアイデア賞(予測部門アイデア賞)を、そして今回新設された可視化部門では、見える化によりいかに魅力的ストーリーの伝達ができるかが評価の対象となった。予測部門は131人、可視化部門は200人、合計331人からの応募がありました。
関連記事:データサイエンティストに求められるのはデータ分析能力だけではない!第3回ビッグデータ分析コンテスト授賞式の様子
【引用元】第3回ビッグデータ分析コンテスト
http://www.meti.go.jp/press/2017/10/20171002006/20171002006.html
AIチャレンジコンテストはAIの開発やビッグデータ活用の能力を競うことで人材の発掘、育成を目的としています。今回のテーマは「画像認識」で、クックパッドから提供される12万5000の料理画像とレシピを元に「料理領域検出部門」「料理分類部門」の2部門でアルゴリズムの作成に挑戦するものです。AIの進化に伴い画像認識の精度は急速に向上していますが、料理の場合は同じメニューであっても材料や盛り付けによって画像の見た目が大きく違ってくるためアルゴリズム作成が難しい領域と言われています。
第1回AIチャレンジコンテストには600人を超える人が参加して2部門で手法や精度が競われました。AIチャレンジコンテストを通してAI技術の研究開発と成果の社会実装の加速化、優秀な人材の発掘や育成への効果が期待されています。
今回紹介したコンテストやコンテスト・プラットフォームを活用してのコンペ方式など、ビッグデータ・AIに関する公募案件が増えています。このようなオープン・データサイエンスが注目されているのには大きな理由があるのです。
スピーディーな変化や対応が求められるビジネスの世界では答えを出すために時間をかけることは許されません。投資対効果を考えた場合にも、分析や開発にかけられる時間はおのずと限られてきます。またデータ分析やAI開発についてはその時点での限界があり、絶対的な正解はないでしょう。そこで重要になってくるのが、ある程度正解に近い答えを時間をかけずに導き出すヒューリスティクスな方法です。例えばコンテストのような方式をとれば、たくさんの予測モデルやアルゴリズムなどの中から最適なものを選択できるようになります。より精度の高いもの、正解に近いものを選択したうえで、さらにその精度を高めることも可能です。
オープン・データサイエンスは、いわば多くの優秀な人材を並列して広範囲の答えを得ることのできるヒューマンコンピューターともいえるでしょう。これがオープン・データサイエンスが注目されている理由なのです。ビッグデータ・AIの活用が進む中、コンテストやコンペを活用した手法でのアプローチはますます増えていくことでしょう。またオープン・データサイエンスは、データサイエンティストの採用や育成のためにも効果的な手法として期待されています。
齊藤 秀(さいとう・しげる)さん
株式会社SIGNATE/シグネイト
代表取締役社長CEO/CDO
十数年にわたりバイオ・ヘルスケア領域を中心に幅広い業種のデータ分析・共同研究・コンサルテーション業務に従事。 2013年2月 日本初のデータ分析コンペティションサービスを設立。 2013年12月 株式会社オプトにてAI/ビッグデータ研究開発組織、データサイエンスラボ設立。2018年4月 株式会社SIGNATE/シグネイトを設立。代表取締役社長CEO/CDOに就任。
SIGNATE(旧DeepAnalyitics)(https://signate.jp)にて、多数の企業・行政のデータ活用コンペティションを実施。 様々なデータサイエンス・AIプロジェクトにおいて、企画・データ取得・分析・モデリング・運用まで幅広く支援、AI人材育成・採用サービスを展開。
【政府のデータ活用やAI人材育成等の委員活動】
経済産業省 政府衛星データのオープン&フリー化及びデータ利用環境整備に関する検討会 委員 未来投資会議 第4次産業革命 人材育成推進会議 第1回講師 自民党教育再生実行本部 第2回成長戦略のための人材教育部会講師 【AI関連の研究・教育活動】 筑波大学人工知能科学センター 客員教授 理化学研究所 革新知能統合研究センター 客員研究員 国立がん研究センター研究所 客員研究員
メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。
30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!