1ページ目から読む
2/5ページ目

加藤 完璧な再現は無理でも、美空ひばりさんを模した「AI美空ひばり」が歌う姿を見たとき、違和感を覚えつつも、やはり感動してしまいました。

松尾 そう、画像と音声はかなり忠実に再現できますね。

平野 海外では、亡くなったミュージシャンをホログラムで蘇らせたコンサートツアーがおこなわれています。本人が亡くなってからも、AIで動くホログラムが人々の関心を集め、お金を稼ぐということがすでに起きている。

ADVERTISEMENT

加藤貞顕さん

文章もコードも書けるAIが登場した

加藤 最近でいえば、「DeepL(https://www.deepl.com/ja/translator)」という機械翻訳システムの訳が精度が高く自然だ、と話題になりました。これは、AIが意味を理解して翻訳している、というわけではないんですよね?

松尾 自然言語処理は、2017年にGoogleの研究者らが発表した「Transformer」というモデルがすごくよくできていて、ぐっと精度が上がったんですよね。アテンションという機構を独特の使い方をしたもので、大量のデータで、事前学習を行い、翻訳をはじめさまざまなタスクで高精度を出すことができます。これを使うと、ある文が別の文を含意するか、この文の内容はポジティブかネガティブか、といったタスクも処理できるんです。

加藤 文章って、画像と違って情報がすべて明らかになっているわけじゃないから、自然言語処理はむずかしいですよね。

松尾 そうなんです。人間の思考のごく一部が「言葉」として出てきているだけなんですよね。人間は言葉で表出しないような思考もたくさんしているし、無意識の情報処理もやっています。そのあたりも再現しないと、本当に意味を理解するAIはできないと思います。

 

平野 言葉の理解にもレベルがありますよね。例えば、旅行先でホテルにチェックインするとか、レストランで注文するとか、そういう文章は裏に含まれている意味があまりない。でも、哲学書の文章や詩の一節が何を意味しているかといったことは、人間でも共通理解ができているかむずかしいでしょう。

加藤 詩などはコンテクストも把握しないとわからないですもんね。AIの言語処理における「意味がわかる」というのは、「人間のように理解する」ということですよね?

松尾 そうですね。今年はOpenAIという非営利団体が開発した「GPT-3」という言語生成モデルも話題になりました。まるで「人間のように」タスクをこなすことができるんです。GTP-3は約1750億個のパラメータを使用していて、数兆ワードといった膨大なウェブページを学習させると、小説のような文章が書けたりします。他にも、話し言葉で命令したら、そのとおりのウェブページのデザインとページを生成する、なんてことができます。

加藤 GPT-3、すごいですよね。例えば「○○のロゴと検索ボックスと○○○という文章の入ったボタンを入れて」みたいに命令したら、そういうデザインのソースコードをほんの数秒で表示する。デモ動画を見てびっくりしました。

松尾 モデルがあまりに巨大すぎて、もはや何が学習されているのかよくわからないんですよね。