About us データのじかんとは?
データサイエンスについての勉強を始めるとKaggleについてよく見聞きします。
「Kaggleで銀メダルを取りました!」といった報告を見てすごいな、自分もいつかは……、と思いつつも敷居が高く感じて参加できていないという方も少なくないのではないでしょうか。
本記事ではまだ参加したことのない“完全初心者向け”にKaggleとは何か、初心者はどのように利用すればいいのかといったポイントを解説します!
Kaggleとは13万人以上の参加者数を誇る世界最大の機械学習・データ分析コンペティションのためのプラットフォームです。Kaggleの参加者は「Kaggler(カグラー)」と呼ばれ、Kaggleに登録されたお題にチャレンジし、その成績を競います。
お題の内容は「クレジットカードの貸し倒れリスク予測」「画像によるクジラの識別アルゴリズム構築」「イヌ画像の生成」など多様。期間はおおむね2~3カ月程度で(5カ月など長いものもある)、成績によって参加者は「金メダル」「銀メダル」「銅メダル」「それ以外」にわけられます。
それぞれのメダルの取得条件は以下の通り、大会の参加チーム数によって異なります。
金メダル | 銀メダル | 銅メダル | |
0-99チーム | トップ10% | トップ20% | トップ40% |
100-249チーム | トップ10 | トップ20% | トップ40% |
250-999チーム | トップ10+0.2% | トップ50 | トップ100 |
1000チーム以上 | トップ10+0.2% | トップ50% | トップ10% |
Kaggle Progression System┃Kaggleより引用
賞金が設定されている大会の場合、最上位の成績を修めた数名(数チーム)の参加者は規定の賞金が受け取れます。その金額は数百万円程度が多く、中には数億円を超えるものまであります。ただし、賞金が設定されておらずKnowledge(知識)やSwag(記念品)、Kudos(賞賛)が賞金という大会も多く存在します。
Kagglerの多くは賞金以上に大会に参加することで得られる知識や経験、ゲーム的楽しさ、社会への貢献を目当てにKaggleに参加しています。
2020年上半期には「感染の拡大予測」など新型コロナウイルスにまつわる大会が多く開催されました。
30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!