「Kaggle」とは企業や研究者と、データサイエンティストを結びつけるプラットフォームで、2010年に誕生した企業、「Kaggle」によって運営されています。
データサイエンティストとは、機械学習を用いてビッグデータを分析し、特定のパターンを見つけ出し、仮説を立ててそれを検証する技術者のことをいいます。Kaggleには統計学、情報科学、経済学、数学に精通しているデータサイエンティストが多数登録されており、企業や研究者が投稿した課題をデータ分析して、最適なモデルを導くために競い合っています。Kaggleのシステムはコンペ方式を採用しており、参加者の提示したモデルは即時に採点され、順位が表示されます。
コンペに参加し、最適モデルを提示したデータサイエンティストには企業や研究者から賞金が支払われます。 データサイエンティストがKaggleに登録し、コンペに参加するメリットはいくつかあります。
Kaggleでは自分の導き出した答えが即座に採点されランキングで表示されるため、データサイエンティストはモチベーションがあがり、様々なデータ分析のスキルを学んでランキング上位を目指すことが可能です。また、データサイエンティストにとって多額の賞金ももちろん魅力ですが、有名企業の提示する最新の課題に取り組めることも大きな魅力になっています。
さらに、Kaggleには優秀なデータサイエンティストが集まり、そのフォーラムでは最新や流行の分析手法について活発な情報交換がおこなわれています。そのため、データ分析の初心者には貴重な学習の場にもなります。
Kaggleのトップランカーであるデータサイエンティストの中からは、DataRobot社のような、世界的に有名な企業も生まれています。
企業にとっては、Kaggleのシステムを利用することで、国籍や言語の壁を越えてビッグデータを分析する資質をもったデータサイエンティストに巡り合い、自社の抱えている課題解決の場に参加してもらうことができます。
またKaggleのコンペに参加したデータサイエンティストはランキング付けされ、そのランキングは公表されるため、企業が優秀なデータサイエンティストに声をかけ、リクルートする判断材料にもなっています。
名だたる企業がKaggleに注目している背景は、多くの企業がビッグデータ分析の必要を感じており、そのために必要なデータサイエンティストを求めているという現実があります。日本国内の同様のコミュニティとしては、株式会社オプトのデータサイエンスラボが運営しているSIGNATE(2018年4月DeepAnalyticsはサービス名をSIGNATEへ変更)が、日本最大です。「IoTビッグデータ分析コンテスト」を開催し、データサイエンティストとデータを活用したい企業や団体を結びつける事業・イベント等も実施しています。
ビッグデータの活用は多くの企業が課題として掲げているテーマの一つです。
そのデータ活用の鍵を握るのはデータサイエンティストですが、データサイエンティストは需要に対し、絶対数が足りていない、というのが現状です。その他にもデータサイエンティストに関する課題は山積みになっている状態です。
データサイエンティストを育成していくこと、そしてデータサイエンティストにとって快適な環境を作っていくこともビッグデータ活用に含まれる課題なのではないでしょうか?
(データのじかん編集部)
メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。
30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!