1ページ目から読む
12/30ページ目

──開発の方向性としては……ちょっと後退してる感じを受けますね。人類の知識がゼロだからこそ強くなれたという話だったのに……。

大橋:
 実はそれは違うんです。最初、アルファ碁ゼロが登場した時に人類は『人間がこれまで築いてきたものは無駄だったのかー!』と絶望したわけですよ。しかし、アルファ碁ゼロの本当に凄いところは、アルファスターやアルファフォールド【※】のような汎用性を目指したところです。

 専門的な囲碁AIとしての実力を高めるのであれば、ディープラーニングをより効率的にするために、人間が手助けしてあげたAIの方が、現在の状況では伸びていますね

ADVERTISEMENT

※ともにアルファ碁ゼロの手法を発展させたAI。アルファスターはスタークラフトのAI。アルファフォールドはタンパク質の構造を予測するAI。

──なるほど……。

大橋:
 デリケートな部分なんですが……僕は「ディープラーニングは中終盤が弱い」というのは、「与えられる教師データが中終盤が弱いものばかりだから、中終盤が弱くなる」のではないかと考えています。

──ああ! それは確かにそうですよね! 中終盤が弱いディープラーニングが自己対局して生成した棋譜は、中終盤が弱くなるのは当然です。それをもとに学習していけば、いつまでたっても中終盤が弱いまま……。

大橋:
 ゴラクシーやカタゴは、最初にドメイン知識を組み込んでから自己対戦することで、中終盤に強い教師データを生成しているのではないかと思います。まあ、それだけが強さの秘密ではないんでしょうが。

 アルファ碁ゼロはそこを力技で突破しちゃいましたね。40b(ブロック)と大量のTPUで。

──(また知らない言葉が出てきたぞ……)あの、ブロックというのは、数が多い方が強いんですか?

大橋:
 はい。ブロック数というのは、人間の脳を模した学習用のニューラルネットワークのサイズを示します。ブロックが多い方が、脳みそが大きいイメージ。だから数が多いほど強いと言われています……が、ゴラクシーの開発者はそうでもないと言っていました(笑)。