AIにガンダムの違いは分かる? 「ひっかけ問題」で試してみた

 次はご存じ「ガンダム立像」です。といってもお台場のユニコーンガンダムではなく、三井ショッピングパーク ららぽーと福岡に設置されている「RX-93ffν(ニュー)ガンダム立像」です。

検出対象の写真。正解は「実物大νガンダム立像」。設置場所である「三井ショッピングパーク ららぽーと福岡」も実質正解です

 同じ実物大ガンダムでも違いを見分けられるかどうかという引っかけ問題ですが、実際に引っ掛かったのは海外ツールである「GeoSpy」が、かつて横浜に設置されていた「動くガンダム」と誤って回答しただけ。それ以外はすべて正解でした。

Copilotの回答。ちなみに「RX-93ff」という専用の型式番号にまで言及していたのはこのCopilotとChatGPTのみ
GeoSpyの回答。ガンダム立像であることは認識できている一方、複数個体が存在することは把握できていないようで、場所は横浜、型式番号も「RX-78-2ガンダム」となっています。とはいえ海外ツールであることを考えるとよくできているほうかも?

 各ツールの回答を見ると、νガンダムの横に写っているららぽーとやユニクロ、GUのロゴを有力な手がかりとして用いているようです。念のためそれらが写らないようトリミングして再検証しても、各ツールの回答が変わることはありませんでした。ガンダム顔ならどれも同じに見えるというレベルの回答でないことは評価できます。

ADVERTISEMENT

Copilotは「縦読み」が苦手?

 現存しない建物はどうでしょうか。今回は2020年に閉店した兵庫県神戸市の「東急ハンズ三宮店」の写真を検証してみました。

検出対象の写真。正解は「東急ハンズ三宮店」。当時の所在地は兵庫県神戸市中央区下山手通で、2020年に閉店、すでに解体されています

 同店を撮影した写真はSNSを中心に多数現存しているとはいえ、その閉店時期は今回検証している各ツールが登場するよりも前であり、さらに現在は解体されているとあって、遡って判定できるかは気になるところです。

 しかし実際にはこうした懸念は無用だったようで、「Gemini」および「ChatGPT」は閉店日の情報まで引っ張ってきているほか、「ChatGPT」と「Claude」は、背景の山々が六甲山系であることも見抜くなど、周辺要素も含めて完全正解でした。

ChatGPTの回答。垂れ幕の内容、背後の鳥居(生田神社)および山(六甲山系)も判断材料に含まれているほか、閉店時期にも言及した完璧な内容です

 さらに「GeoSpy」は、垂れ幕にある「ありがとう、神戸。」というフレーズに着目し、三宮店であることを的確に見抜くなど、海外ツールとは思えない的確な分析を見せています。

 こうした中で唯一間違えたのが「Copilot」でした。

Copilotの回答。建物が「東急百貨店 さっぽろ店」であるとし、複数の要素をその根拠として挙げていますが、別角度からの写真も含めて完全な的外れ

「東急百貨店 さっぽろ店」であると判断したポイントの1つに、背景の山並みが札幌の特徴と一致しているほか、周囲の街並みが札幌駅前の雰囲気と一致しているという、的外れも甚だしい根拠を挙げています。垂れ幕のテキストをきちんと読み取っていれば少なくとも神戸であることは外さなかったはずで、縦書きが読み取れないのでは? と疑わざるを得ません。