文春オンライン

半年後に将棋の神様が現れるかもしれない話──最強将棋ソフト開発者が語る“ディープラーニング勢の台頭による将棋ソフトの進化”

source : 提携メディア

genre : ライフ, 娯楽

note

──??? は……あ?

磯崎:
 将棋って有利を拡大していくゲームだから。期待勝率で見た時に、評価値が高いほうがいいのかというと、なかなかそうは言い切れない面があって。

──まだあんまりピンと来てないんですけど……開発者の方々って、あんまり評価値を信用していらっしゃらないんですね……。

ADVERTISEMENT

磯崎:
 1つの局面でAの指し手を指した時は100点、Bの指し手を指した時は200点なら、おそらくBの指し手のほうが良いでしょう。でも、あまりに離れた2つの局面で、それぞれ100点と200点の評価値である時に、本当に200点のほうの局面のほうが良いのかという……。

 それに、ソフトって終盤になっても0点(互角)を付けることがよくあるんですが、終盤なんだからどっちかが勝ってないとおかしい。仮に序盤で-100点となって、この終盤の0点の局面を目指してそれが定跡だと思って進んで行ってしまったら、定跡を抜けた瞬間に頓死することもあり得るわけです。

──結論づけられないまま0点になってしまっていると。そういう評価値が潜んでいるわけですね。

磯崎:
 ゲームツリー全体で見た時に、果たして評価値を比較してしまっていいのかなというのは、あるんじゃないかなと……。

杉村:
 それは私も思っていて、さっきの居飛車と振り飛車の話に繋がる部分もあるんです。

──ほほう!?

杉村:
 今回の電竜戦で、振り飛車ばかりを指すソフトがQhapaqで、それが3位に入ったんです。その将棋をご覧いただければわかると思うんですが……。

 最初に200点くらい、居飛車側が有利って言ってるんです。ですがその200のまま、ずぅっと200なことが多いんです。けど角換わりとか相掛かりの200点って、10手進んだら400点になってるとか600点になってる可能性って相当大きいんです。だとすると、最初に出てきた……。

──200という数字がおかしい?

杉村:
 振り飛車の200点と、角換わりの200点というのは、同じ評価ではない可能性がある

関連記事