Share!

データサイエンスについての勉強を始めるとKaggleについてよく見聞きします。

「Kaggleで銀メダルを取りました!」といった報告を見てすごいな、自分もいつかは……、と思いつつも敷居が高く感じて参加できていないという方も少なくないのではないでしょうか。

本記事ではまだ参加したことのない“完全初心者向け”にKaggleとは何か、初心者はどのように利用すればいいのかといったポイントを解説します!

Kaggleとは世界中のデータサイエンティストが腕を競い合うプラットフォーム

Kaggleとは13万人以上の参加者数を誇る世界最大の機械学習・データ分析コンペティションのためのプラットフォームです。Kaggleの参加者は「Kaggler(カグラー)」と呼ばれ、Kaggleに登録されたお題にチャレンジし、その成績を競います。

お題の内容は「クレジットカードの貸し倒れリスク予測」「画像によるクジラの識別アルゴリズム構築」「イヌ画像の生成」など多様。期間はおおむね2~3カ月程度で(5カ月など長いものもある)、成績によって参加者は「金メダル」「銀メダル」「銅メダル」「それ以外」にわけられます。

それぞれのメダルの取得条件は以下の通り、大会の参加チーム数によって異なります。

  金メダル 銀メダル 銅メダル
0-99チーム トップ10% トップ20% トップ40%
100-249チーム トップ10 トップ20% トップ40%
250-999チーム トップ10+0.2% トップ50 トップ100
1000チーム以上 トップ10+0.2% トップ50% トップ10%

Kaggle Progression System┃Kaggleより引用

賞金が設定されている大会の場合、最上位の成績を修めた数名(数チーム)の参加者は規定の賞金が受け取れます。その金額は数百万円程度が多く、中には数億円を超えるものまであります。ただし、賞金が設定されておらずKnowledge(知識)やSwag(記念品)、Kudos(賞賛)が賞金という大会も多く存在します。

Kagglerの多くは賞金以上に大会に参加することで得られる知識や経験、ゲーム的楽しさ、社会への貢献を目当てにKaggleに参加しています。

2020年上半期には「感染の拡大予測」など新型コロナウイルスにまつわる大会が多く開催されました。

Kaggleの参加方法と簡単なサイトの見方 >>

1 2 3

Eye Catch Design by C.G.

「データ活用」ランキング

人気のカテゴリ