「終盤に弱いという課題が見つかりました。中終盤を強くしていかないとダメだと……」
「これがきっかけになって、ディープラーニング『だけ』を使ったソフトにするということに拘らなくなりました。拘りを排除し、詰みの部分は既存の技術に頼ることにしたんです」
詰みを見逃さなくなったdlshogiは、自己対局で終盤の精度が高い棋譜を量産していくようになる。
その棋譜を教師データとして学習することで、dlshogiの終盤はどんどん強くなっていった。
『これが詰みの形だよ』ということを教えてあげたわけだ。
既存の技術を取り入れたとはいえ、その方法は他の開発者たちよりも遙かに遠回りだ。
なぜならNNUE系のソフトを開発する場合、優勝ソフトが公開されれば、それをもとに改良するだけでその優勝ソフトと同じ強さで次の大会に出場することができる。
つまり山岡以外の開発者にとって、開発のスタートラインは、優勝ソフトの強さなのだ。
「仕事をしながら、趣味でやっていることですからね……とはいえ、他の開発者の方々よりも、かなり多くの時間を費やしていると思います。2017年から、ほぼ常にずっと自宅のPCを動かし続けて学習させていますから」
「GPUを自分で買って。どんどん増強していって。金額にすると100万円以上はマシンに費やしていますね。GPUは3枚買いました」
終盤が強化されたことでdlshogiは飛躍的に強くなった。
……が、それは以前のdlshogiと比べてというだけのこと。他の将棋ソフトはもっともっと強くなっていた。
2018年の世界コンピュータ将棋選手権では、一次予選は7位で通過できたものの、二次予選では1勝8敗の24位。二次予選に進んだソフトの中では最下位だった。
決勝に残ったソフトは『Apery』を除いて、全てやねうら王のライブラリ勢だった。
そして翌2019年の選手権では、さらに衝撃的な光景を山岡は目にする。