「このとき、やねうら王ライブラリ勢に初めて勝てたんです!」
山岡はGPUを3枚も購入し、それを毎日24時間動かして学習を続けていた。大会ではV100を8台使ったサーバで出場する。
しかし加納はコスト抑えるために無料のColabで学習を行い、大会ではAWSを使用するという戦略を採用した。
これがハマり、次第に上位チームにもポツポツと勝てるようになっていったのだが……。
「ただ、水匠が使用するCPU『Threadripper』が圧倒的に強くて……しかもその強さが伝わると、他のやねうら王ライブラリも次々に使用するようになっていって……」
藤井聡太が購入したことでも話題になった『高級スリッパ』を使用するソフトがどんどん増えることで、詰めたと思った上位との差が、また広がっていった。
「これはいかんと。V100を8台にしても勝てないんです」
加納の戦略は行き詰まった……かに見えたが、『本番でAWSを借りる』という行為を続けたことが、後に意外な形で活かされることになる。
圧倒的な力を持つ水匠。そしてThreadripperを使用するやねうら王ライブラリ勢。
2020年5月の段階では全く歯が立たなかったが……わずか半年後の11月に行われた第1回電竜戦で、GCTは何とそれらを押しのけて優勝してしまう。
ディープラーニング系のソフトが初めて大会で優勝し、変革期の到来を印象づけたその偉業は、どのようにして達成されたのか?
たった半年間で飛躍的に強くなった理由を、加納はこう語る。
「まず大きかったのは『AobaZero』の棋譜を学習させたことです」
「AobaZeroとdlshogiが対戦したときに、山岡さんは『AobaZeroの序盤はかなり強そう』とブログで書かれていて。それで、AobaZeroの棋譜をダウンロードして学習させることにしました」
AobaZeroの棋譜は無料でダウンロードでき、他のディープラーニング系のソフトも学習に使用している。
これには序盤の強化に加えて、教えることが難しい入玉宣言法の学習にも成果があると期待していた。