──そういう部分が、やねうら王は洗練されているということでしょうか?
磯崎:
そうです。だから互換エンジンを作る時にも使えて、短い時間で完成しました。
──そのエンジンを使って、定跡を作ったり、学習させていったりする手法を使えば、今までのような方法でディープラーニングのソフトも強くしていくことができるんですか?
磯崎:
はい。定跡については、今までのノウハウが使えます。学習のやりかたは、ちょっと違うんですけど……ノウハウは似通っている部分がありますから。
ディープラーニングで将棋ソフトを作っていたのは、dlshogiの山岡さんと、AobaZeroのチームと、2つしか大きなチームはなかったんです。山岡さんも一人だと手が回らない部分があったんですが、やねうら王はたくさんの人が参加して、もうサンドバッグのようにタコ殴りにされて……。
──いろんな人が手を出して、改良していったというわけですね(笑)。
磯崎:
ある程度、技術が枯れてて。もう雑巾絞れないくらいカチカチになってるんですね。でもdlshogiにはまだまだ伸び代があるんです。改良したら強くなりそうな部分も見えているので……。
──では今後は、やねうら王を改造していた人たちが、ドドドドッとdlshogiに雪崩れ込んで行く可能性が高いと?
磯崎:
これはすごいことになるぞ……という感じではありますね。
──水匠は、評価関数を改良していたんですよね? この図でいうとNNUEという部分を。
杉村:
この図でいうと、やねうら王の評価の部分ですが……その部分の中の更に小さい部分として『教師局面を作成して学習させる』という部分があるんです。
──はい。
杉村:
その教師局面をどうやって作って、それを何か加工したほうがいいのか、加工したほうがいいのならば、どう加工したらいいのか? っていう部分。そこが一番、検証できていた部分なんです。それはおそらく、ディープラーニングでも活きると思います。