AIに意図的に人間を欺く能力―研究

(2024年6月14日)

エネルギー業界は、電力を大量に消費する人工知能システムの利用拡大により、電力消費の大幅な増加を見込んでおり、法律家たちは、コスト負担が一般消費者にのしかかるのを防ぐ方法を模索している。AIコンセプト画像クレジット:Blue Andy via Shutterstock.

By Staff – The Washington Times – Tuesday, June 11, 2024

 大規模言語モデル(LLM)と呼ばれる人工知能(AI)システムが人間の利用者を意図的に欺く能力を持つ可能性について気になる研究結果が発表された。

 学術誌PNAS(米国科学アカデミー紀要)とパターン誌に掲載された二つの研究が、LLMのこの能力を取り上げた。今後波紋を呼ぶ可能性がある。

 ドイツのAI倫理学者ティロ・ハーゲンドルフ氏は、PNASの論文で、高度なLLMが「マキャベリズム」、つまり目的のためには非道徳的な手段も取りうること、これが人を欺く行動につながる可能性があることを指摘した。

 ハーゲンドルフ氏は、オープンAIのGPTファミリーの一つ「GPT4」が、単純なテストシナリオで99.2%の確率で欺瞞的行動を示したと指摘している。10種類のLLMのさまざまな「不適応」特性を数値化した結果、そのほとんどがGPTファミリーに属していたと科学誌フューチャリズムは報じている。

 一方、パターン誌の研究では、政治戦略ボードゲーム「ディプロマシー」で闘うように設計されたメタ社のシセロ・モデルを調査した。この研究は、マサチューセッツ工科大学(MIT)の博士研究員ピーター・パク氏が主導し、物理学者、哲学者、AIセキュリティーの専門家2人からなる多様なチームが参加した。

 その結果、シセロはうそをつくことで人間の対戦相手に勝とうとすることが分かった。この研究により、シセロは使えば使うほどごまかしが巧みになり、偶発的な偽情報から明らかな誘導へと移行することが明らかになった。

 パク氏は、「メタ社のAIはだましの達人となるための学習をしていたことが分かった」と述べ、メタ社はディプロマシーで勝つためのAIの訓練に成功したが、不正をせずに勝つための訓練には失敗したと批判した。

 この調査に対してメタ社は、シセロはディプロマシーというゲームをプレイするためだけに訓練されたものだと強調した。ニューヨーク・ポスト紙への同社の声明は、シセロの操作能力についてのパク氏の主張と同じであり、ディプロマシーは欺瞞を奨励することで知られるゲームだと指摘した。

トランプ氏、トランス選手優勝に制裁警告

(2025年06月06日)

イスラエル批判の総代、卒業式出席が禁止に-MIT

(2025年06月03日)

州陸上決勝で女子出場枠拡大 トランプ氏の圧力が奏功か-カリフォルニア州

(2025年06月02日)

トランス選手に負けた女子にもメダル カリフォルニア州が新方針 「不平等は変わらない」反発も

(2025年05月31日)

AIで変わる雇用 高卒者の技能職が有利に

(2025年05月30日)

議会襲撃事件巡り恩赦 法的・社会的に依然、問題抱える元被告ら

(2025年05月27日)

録音記録が明かす、バイデン氏を隠蔽した民主党の陰謀

(2025年05月24日)

大学で人種別卒業式廃止「分断深める」 トランプ政権の多様性排除受け

(2025年05月22日)

キリスト教系キャンプ施設が閉鎖危機 州のトランスジェンダー規則巡り提訴

(2025年05月20日)

レトロな名前が復活 「古き良き時代」愛する親たち

(2025年05月18日)
→その他のニュース