AIに意図的に人間を欺く能力―研究

(2024年6月14日)

エネルギー業界は、電力を大量に消費する人工知能システムの利用拡大により、電力消費の大幅な増加を見込んでおり、法律家たちは、コスト負担が一般消費者にのしかかるのを防ぐ方法を模索している。AIコンセプト画像クレジット:Blue Andy via Shutterstock.

By Staff – The Washington Times – Tuesday, June 11, 2024

 大規模言語モデル(LLM)と呼ばれる人工知能(AI)システムが人間の利用者を意図的に欺く能力を持つ可能性について気になる研究結果が発表された。

 学術誌PNAS(米国科学アカデミー紀要)とパターン誌に掲載された二つの研究が、LLMのこの能力を取り上げた。今後波紋を呼ぶ可能性がある。

 ドイツのAI倫理学者ティロ・ハーゲンドルフ氏は、PNASの論文で、高度なLLMが「マキャベリズム」、つまり目的のためには非道徳的な手段も取りうること、これが人を欺く行動につながる可能性があることを指摘した。

 ハーゲンドルフ氏は、オープンAIのGPTファミリーの一つ「GPT4」が、単純なテストシナリオで99.2%の確率で欺瞞的行動を示したと指摘している。10種類のLLMのさまざまな「不適応」特性を数値化した結果、そのほとんどがGPTファミリーに属していたと科学誌フューチャリズムは報じている。

 一方、パターン誌の研究では、政治戦略ボードゲーム「ディプロマシー」で闘うように設計されたメタ社のシセロ・モデルを調査した。この研究は、マサチューセッツ工科大学(MIT)の博士研究員ピーター・パク氏が主導し、物理学者、哲学者、AIセキュリティーの専門家2人からなる多様なチームが参加した。

 その結果、シセロはうそをつくことで人間の対戦相手に勝とうとすることが分かった。この研究により、シセロは使えば使うほどごまかしが巧みになり、偶発的な偽情報から明らかな誘導へと移行することが明らかになった。

 パク氏は、「メタ社のAIはだましの達人となるための学習をしていたことが分かった」と述べ、メタ社はディプロマシーで勝つためのAIの訓練に成功したが、不正をせずに勝つための訓練には失敗したと批判した。

 この調査に対してメタ社は、シセロはディプロマシーというゲームをプレイするためだけに訓練されたものだと強調した。ニューヨーク・ポスト紙への同社の声明は、シセロの操作能力についてのパク氏の主張と同じであり、ディプロマシーは欺瞞を奨励することで知られるゲームだと指摘した。

民主党による民主主義への攻撃

(2025年10月05日)

トランプ政権、先端技術開発で新指針「米国のリーダーシップを確保」

(2025年09月30日)

上院議員、ロマンス詐欺防止強化を出会い系サービスに要請

(2025年09月28日)

トランプ政権の教育再編で対応に追われる大学

(2025年09月25日)

殺害されたC.カーク氏の妻、暗殺者を「許す」

(2025年09月23日)

カーク氏暗殺、暴力あおる左翼集団解体を

(2025年09月20日)

生成AIでの子供の性的会話が増加 政府機関が調査開始

(2025年09月18日)

世界的なうねり巻き起こすカーク氏暗殺

(2025年09月17日)

容疑者は極左集団に傾倒か 弾丸にメッセージ C.カーク氏暗殺

(2025年09月16日)

「夫の活動は継続する」暗殺されたC.カーク氏夫人が表明

(2025年09月15日)
→その他のニュース