Share!

Ponanzaの強さは「データの暴力」

Ponanzaは、人間では物理的に指せないほどの試合数をこなしました。これは圧倒的な経験値、いわばデータの暴力です。コンピュータは1手0.1秒で指すこともできますし、理論上は1試合0.1秒で指すこともできます。もちろん良い試合の方が勉強になるし、良い試合にするにはある程度の時間をかける必要はあるのですが。

将棋プログラムの成長には私自身も驚いています。プロ棋士の間にはいま、プログラムと張り合おうという雰囲気もありません。どの一手で勝負が決まったか本当のところ誰もわからないならば、その一手を決めたのは「神託」としか言いようがないのではないか。いや、そういうものなのだ、という共通理解ができつつあります。

将棋というゲームの奥深さにも驚きました。将棋プログラムの“身長”が4mを超え、羽生さんを超えたとしても、将棋の神の前では弱いまま。しかし一方で、将棋の神とプログラムの差はあまりないかも、と思うことがあります。なぜなら、将棋プログラムのレーティング(強さのレベルを数値化したもの)が上昇し続けているからです。これは本当に驚きです。

日本将棋連盟が提供しているネット対局サイト「将棋倶楽部24」で、将棋プログラムのレーティングは5000にかかるくらいでしょうか。プログラム同士が戦うことでレーティングをどんどん伸ばしています。ちなみに、プロ棋士の最高は3200くらいです。

人間は思い込みの天才である

客観的に見ると、人工知能が1個の事象から学習できることは人間よりずっと少なそうです。だから、将棋プログラムはデータが多いほど強くなります。Ponanzaは古いデータをどんどん捨てていくのですが、19TBのハードディスクがパンクしたほどです。電気とハードディスク、CPUパワー、つまり量で解決するのが現代的なデータサイエンス。その流れを肌身で感じます。

もうひとつ、将棋プログラムが「強化学習できる」ということは自明ではありませんでしたが、Ponanzaによって可能なことがわかりました。その時点で他のプログラムはわかってなかった。これが、Ponanzaが将棋プログラムの世界でリードできた理由のひとつでもありました。最初の1ビットの発見がとても重要なわけです。可能なことが知れわたると、みんな一気に成長しますから。

これは先頭を走るものの辛さですが、データサイエンティストとしてうれしさでもあります。最初はみんな「将棋プログラムは強化学習ができない、向いてない」などと言ってましたが、私は「どうしてできないんだろう?」と思い、ずっと考えていました。人間(の思い込みや先入観)は言い訳を作る天才ですからね。


わかる、とは傲慢だ >>

1 2 3 4

この記事を読んだあなたにおすすめのタグ

この記事を読んだあなたにおすすめのタグ

「テクノロジー」ランキング

人気のカテゴリ