1ページ目から読む
3/5ページ目

「速い思考」と「遅い思考」を兼ね備えた時、AIは人間の脳に近づく

平野 何をしているのかがわからないのは、人間の脳もそうですよね。今のAIの研究は、原理的に脳に近づけるアプローチが取られているんでしょうか。

松尾 現在のAI研究は2つの方向性があって、1つは、人工物として産業的な応用を目指すAIの開発です。もう1つは、平野さんがおっしゃるような、人間の脳の働きからAIを研究する方向性。こちらは、画像認識が可能になってから盛り上がってきているんですよ。画像認識と合わせてシンボル(記号)の処理をどうやるかが、今のホットトピックなんです。

 人間の知能はどういう働きでできているか、脳のアルゴリズムとは何か、というのは現存する最大のミステリーの1つですよね。僕としては、そこを解き明かしたい気持ちがあります。

ADVERTISEMENT

平野 現状では、どのくらい手応えがありますか?

松尾 僕はけっこう、謎が解き明かされてきていると思っています。僕だけでなく、そう思っている人は世界中にいるようです。象徴的なのは、機械学習系のトップカンファレンスであるNeurlPS2019で、AI界の重鎮であるヨシュア・ベンジオ先生が、“From System 1 Deep Learning to System 2 Deep Learning”というタイトルの講演をおこなったこと。システム1とは記憶や知覚を含む直感的な「速い思考」を、システム2は論理的、意識的にじっくり考える「遅い思考」を指します。

加藤 システム1とシステム2って、行動経済学の研究でノーベル経済学賞を受賞した心理学者ダニエル・カーネマンの『ファスト&スロー』に出てくる概念ですよね。そうか、人間の知能に近づけると考えたら、認知心理学にもつながってくるのか。

松尾 これまでのディープラーニングはシステム1的な処理が得意なんですよね。画像認識や音声認識は、直感的な「速い思考」です。でもシステム1だけでは、人間の知能レベルには届かない。だから、システム2に移行しないといけない。システム1とシステム2の両方のモデルができたら、人間の脳の情報処理にかなり近づくと思います。

加藤 道筋が見えてきたんですね。

 

人間の知能は、知覚運動系と記号系で成り立っている

松尾 考え方自体は、昔からあったんですよ。シンボルグラウンディング問題といって、シンボル、つまり記号(文字列・言葉)をそれが意味するものと結びつけることができるかどうか、という問題はAI研究において難問とされてきました。AIはまだそれができないんです。

 知能において、言葉と知覚系統を連携させることが本質だと主張していた人はたくさんいました。でも、これまでは画像認識など知覚の部分もできていなかったから、意味を理解するどころの話ではなかった。現在はディープラーニングの技術が発展し、知覚系統であるシステム1のモデルが精緻になってきたので、システム2に移行する流れが出てきています。

加藤 システム1は知覚、システム2は言語と捉えることもできるんですね。

平野 人間が「これはペットボトルです」ということを認識するとき、「これはペットボトルです」という文章の文法構造と、見て理解するという動作がリンクしていますよね。これって、身体があるからこそ成り立っている理解だと思うのですが、どうなんでしょう。

松尾 たしかに、身体がないとシンボルとそれを指すものを結びつけることはできない、という説があります。僕も、生物の知能は身体性と不可分だと考えています。

 僕は、人間の知能というものは、知覚運動系のシステムの上に、記号系のシステムが乗る構造になっていると考えているんです。記号系のシステムを外すと、人間はサルとか犬といった動物と同じです。入力されるのは、視覚情報、聴覚情報、触覚情報……身体のセンサーから入ってくる情報です。これが、走るとか吠えるとかのアクチュエータ系の出力として出ていきます。