見て、聞いて、話す新チャットGPTを開発-オープンAI
By Ryan Lovelace – The Washington Times – Monday, September 25, 2023
オープンAIは25日、同社の対話型人工知能(AI)「チャットGPT」が人と会話するのに必要な人間らしいスキルを身につけたと発表した。
オープンAIは、新しい音声と動画ツールを使った、より人間に近いリアルな製品の開発を目指している。
「チャットGPTは見たり、聞いたり、話したりできるようになった」とした上で、音楽配信大手スポティファイがすでにこのツールを使ってポッドキャストの音声を異なる言語に翻訳していることを明らかにした。
同社は自社のブログで「この新しい音声技術で、わずか数秒の実際の音声からリアルな合成音声を作り出すことができる。創造的で、利用しやすさに重点を置いたさまざまな応用への扉を開くものだ。しかし、これらの機能は、悪意のあるアクターが他人になりすましたり、だましたりする可能性など、新たなリスクももたらす」と指摘した。
また、チャットGPTを利用して子供を寝かしつけるときの物語を作ったり、画像を送って自転車のサドルの調整に関するアドバイスを受けたりする人々の動画を公開し、新しい製品の有益な利用法を紹介している。
音声と視覚に関するこのツールは不正を可能にする可能性があるという懸念があるものの、オープンAIは徐々に機能を展開し、慎重にユーザーや開発者と共有していくことを明らかにしている。
音楽やポッドキャストを配信しているスポティファイは、すでにこの技術を製品の中に生かしている。
ポッドキャストの音声を翻訳する「ボイストランスレーション」を試験的に導入しており、リスナーはオリジナルの録音とは異なる言語で放送を聞くことができるという。
スポティファイは、この技術を一部のポッドキャストに取り入れており、話し方のテンポや構文といった話者の特徴を残しながら、英語の放送を異なる言語で聴くことができる。
スポティファイのパーソナライゼーション担当副社長ジアド・スルタン氏は声明で、「ボイストランスレーションは、クリエイター自身の声に合わせることで、世界中のリスナーが、これまで以上に本物に近い音声で、新しいポッドキャスターを見つけたり、インスピレーションを受けたりすることが可能になる」と述べた。
外見や声を他人になりすますAIツールはすでに存在している。
オープンAIのイリヤ・スツケバー、ヤン・ライカ両氏は7月、AIが人間の知能を凌駕する時代が10年以内に到来し、「人類の絶滅」につながる可能性があると警告した。
これを受けてオープンAIは、この終末を遅らせるための研究者チームを結成すると発表している。
だが、すべての専門家がこのようなツールの到来を悲観しているわけではない。
7月に開催された情報・国家安全保障サミットでは、米コンサルティング会社ブーズ・アレン・ハミルトンのパトリック・ビルトゲン氏が、AIアシスタントの有望性をアピール、米情報将校が複雑な問題を解決するのにも利用できると訴えた。
米政府機関と協力してAIの開発に取り組んでいるビルトゲン氏は、人気のスーパーヒーロー物語「アイアンマン」でAIキャラクター、ジャービスがトニー・スタークを助けるのと同じように、スパイがAIを利用する時が来ることを想定していると語った。