norishideのブログ

皮肉が散りばめられた真面目な文章を書きたい

Kaggleでコンペを開くには

Kaggleは、データサイエンティストのアウトソーシグプラットフォームだ。企業は多くのデータを抱えており、それらを分析することで新たな洞察を得たりビジネス上の課題を解決したいと思っているが、高度なデータ分析スキルを持った人材がいない。数十万人が登録するこのプラットフォーム上で企業は賞金付きのコンペを開くことで、自社の抱えるデータを良い精度で分析してもらうことができる。その中の回答や数理モデルからコンペ成績の良いものを採用したり、それらを作った優秀な人材をリクルートすることができる。日本語でより詳しい説明を所望の方はこれとかこの記事がわかりやすい。

 

Kaggleは、大体においては、参加者となっていかに良い成績を残して高い賞金*1を得るかという文脈で語られる。なのでここでは企業側の視点から考える。これまでにKaggleでコンペを開いた企業・組織はAmazonFacebookWalmart、GE、MicrosoftFacebook、Ford、NASAairbnb、Merckなど、欧米の大企業、著名なスタートアップ、学術機関などが名を連ねる。コンペを開くためにはまずガイドを読んで、Kaggleに申し込めばいい。画一的な料金があるわけではなく、どんな問題を設定するかなどをスタッフと詰めてコンペを開く。7年で238件のコンペが開催されていて、スタッフは現在20〜30人程度らしい。思ったよりKaggle自体の規模は大きくない。

組織がデータを預けるということがどうして可能なんだろうか。セキュリティに関してはきちんとしたガイドラインの上で交渉を行うようだ。参加者の賞金は大体数百万から一千万だけれど、これだけの投資をするのはなぜだろう。そんなにも良いリターンがあるのだろうか。いくつかのは賞金の代わりにJobを提供するコンペもやっていて、クラウドソーシングというよりは優秀な人材を囲い込みたいからかもしれない。

 

コンペ一覧をざっと見た限りでは、日本の組織を見つけることはできなかった。そもそも日本で全く知名度がない*2。日本でこのようなプラットフォームを実現しようとしているDeep Analyticsというのがあるが、賞金はKaggleに比べると低く規模も小さい。

データが増えることはあっても減ることはないだろうし、解析技術も進歩していくので、このようなプラットフォームやビジネスモデルは今後規模を拡大していくと予想される。その時、日本の企業や組織が(Kaggleのコンペホストたちと同程度には)、データ分析のスキームや結果を正当に評価したり、まっとうな賞金を用意するだろうか。もしそれを実現しようと思ったら、結構骨が折れそうだ。少なくともあと5年はかかるか、でなければ決して訪れないかもしれない。

*1:数百万〜一千万円だけど、賞金少なくねえ?的な議論もある

*2:ジャパンパッシングかもしれない。ジャパンパッシングという言葉の意味はよく知らないけど、世界が日本を無視しているのではなく日本が世界を無視しているようにしか見えない。完全に主観だけど、アメリカ発祥の先端的な技術とか文化とか思想が他先進国がほぼリアルタイムなのに対して大体5−10年遅れで日本に入ってくるように感じることが多い。どなたか良い本があれば教えてください。