1ページ目から読む
23/26ページ目

──そういう部分が、やねうら王は洗練されているということでしょうか?

磯崎:
 そうです。だから互換エンジンを作る時にも使えて、短い時間で完成しました。

──そのエンジンを使って、定跡を作ったり、学習させていったりする手法を使えば、今までのような方法でディープラーニングのソフトも強くしていくことができるんですか?

ADVERTISEMENT

磯崎:
 はい。定跡については、今までのノウハウが使えます。学習のやりかたは、ちょっと違うんですけど……ノウハウは似通っている部分がありますから。

 ディープラーニングで将棋ソフトを作っていたのは、dlshogiの山岡さんと、AobaZeroのチームと、2つしか大きなチームはなかったんです。山岡さんも一人だと手が回らない部分があったんですが、やねうら王はたくさんの人が参加して、もうサンドバッグのようにタコ殴りにされて……。

──いろんな人が手を出して、改良していったというわけですね(笑)。

磯崎:
 ある程度、技術が枯れてて。もう雑巾絞れないくらいカチカチになってるんですね。でもdlshogiにはまだまだ伸び代があるんです。改良したら強くなりそうな部分も見えているので……。

──では今後は、やねうら王を改造していた人たちが、ドドドドッとdlshogiに雪崩れ込んで行く可能性が高いと?

磯崎:
 これはすごいことになるぞ……という感じではありますね

──水匠は、評価関数を改良していたんですよね? この図でいうとNNUEという部分を。

杉村:
 この図でいうと、やねうら王の評価の部分ですが……その部分の中の更に小さい部分として『教師局面を作成して学習させる』という部分があるんです。

──はい。

杉村:
 その教師局面をどうやって作って、それを何か加工したほうがいいのか、加工したほうがいいのならば、どう加工したらいいのか? っていう部分。そこが一番、検証できていた部分なんです。それはおそらく、ディープラーニングでも活きると思います。