チャットGPT、自信満々の答えは不正解

(2023年6月5日)

2023年5月18日木曜日、ニューヨークで、iPhoneでChatGPTアプリを撮影した写真。この無料アプリは、木曜日に米国内のiPhoneで利用が開始され、その後、Android携帯にも提供される予定。ウェブ版とは異なり、声を使って質問することもできる。(AP Photo/Richard Drew)

By Stephen Dinan – The Washington Times – Monday, May 29, 2023

 対話型AI「チャットGPT」は現代のコンピューター工学の驚異であり、衝撃的なほど優れた英語の使用者かもしれない。ただ、それが正確かは別である。

 この人工知能言語ツールは、歴史、財政、ポップカルチャーなど、さまざまなテーマで事実を間違えて記憶しているようだ。

 現在の無料公開版であるチャットGPT3.5に、2010年に最も人気のあったユーチューブ動画は何かと尋ねると、奇妙なニュース映像の初期ソーシャルメディア音楽のリミックス「ベッド侵入者の歌」と答え、その年の再生回数は6200万回だったという。実際には、ジャスティン・ビーバーの「ベイビー」がこれを大幅に上回る再生回数4億回以上だった。

 赤ちゃんの名前の相対的な人気について尋ねると、ランキングを間違えたり、ある名前を1000位以下と言いながら、実際は何百位も上ということもあった。

 米国とメキシコの国境にある壁の全長を尋ねると、チャットGPTは10年前の数字を出し、ドナルド・トランプ前米大統領が追加した分の長さは含まれていない。

 チャットGPTは言語モデルの人工知能で、膨大な量のデータを消費してユーザーと関わるよう訓練されており、そのデータセットに基づいて答えを出している。

 しかし、その精度は、飲み屋の端っこに座っている知ったかぶりが自信満々に真実と懸け離れた答えを論じているのと変わらないこともある。

 もどかしかったやりとりは、1826年に当時の国務長官ヘンリー・クレイと上院議員ウィリアム・ランドルフによる決闘場所を巡る質問の答えで、チャットGPTは6回も謝ってきた。決闘はチェーンブリッジ近くのポトマック川南側で行われた。

 AIはまず決闘場所はケンタッキー州と答え、次にバージニア州リッチモンド、そしてリッチモンド近郊のアシュランドへと変えた。その後、北に移動し、ワシントンDCを越えた所にあるメリーランド州であると答えた。決闘は実際にはポトマック川の南側で行われたと言っても、チャットGPTはさらに3回の不正解を繰り返し、正解にたどり着けなかった。

 技術政策研究所のナサニエル・ロビン上級研究員は、雑学的知識は言語AIモデルの仕事ではないと指摘した。

 「これらのツールは、『ここに何かに関する五つの文がある。このデータを抽出して』とか、『この文をよりきれいに書き直して』というように使うのが良いと思う」と、ロビン氏は語った。「世界の現実的なモデルを持っているわけではないので、あらゆる物事の詳細をすべて記憶してはいない。次に言われるであろうトークンを予測しているのだ」

 言い換えれば、チャットGPTは記憶装置に戻って正しい答えを見つけようとしているのではない。ユーザーが入力した内容を見て、次に何を言うべきかを推測している。

 「チャットGPTはインターネット全体を読んでいるので物事に対する知識は持っているが、基本的に参照元の情報源は持っていない」と、ロビン氏は述べた。

 チャットGPTの生みの親であるオープンAIにこの記事のためにコメントを求めたが、応じなかった。

 チャットGPT自身に尋ねると、「エラー」「ミス」「何らかの混乱」といった表示の後、謝罪を繰り返した。

CHIPS法廃止求めるトランプ大統領に上院共和党が反発

(2025年03月12日)

トランス選手の女子競技出場停止を求める訴え 連邦判事が却下

(2025年03月07日)

トランプ氏への支持が上昇、米国第一政策を有権者が評価

(2025年03月01日)

トランプ陣営に女性捜査官「ハニーポット」潜入か FBIが捜査開始

(2025年02月28日)

「母親」→「受精した人」 州知事が性別特定する用語の排除提案、反発広がる

(2025年02月26日)

政府機関、トランプ氏SNS利用に消極的

(2025年02月22日)

トランプ大統領の支持率低下、経済政策に疑念

(2025年02月20日)

安全より「環境に優しい」航空管制目指すFAA

(2025年02月19日)

女子スポーツの擁護者、民主党の牙城突破へ

(2025年02月17日)

グーグル、多様性を象徴する記念日をカレンダーから削除

(2025年02月13日)
→その他のニュース