OpenAI、不気味な人間の音声アシスタントを備えた新しい AI モデル ChatGPT-4o を発表

公開日2024 年 5 月 13 日 - 20:10 GMT+2

OpenAI には、アップグレードされた音声アシスタントを備えた新しい ChatGPT モデルがあり、無料ユーザーは初めてカスタムチャットボットにアクセスできるようになります。

OpenAI は、ChatGPT の無料版を含むすべてのユーザーに同じインテリジェンスを提供する新しいモデルと、Amazon の Alexa に匹敵する可能性のある印象的な音声インターフェースをリリースします。

いわゆる「春のアップデート」で、OpenAIは月曜日に最初のメインストリームライブイベントで新しいChatGPT-4oモデルを披露した。

OpenAI の最高技術責任者 Mira Murati 氏は聴衆に対し、以前の ChatGPT-4 モデルよりもはるかに高速であり、テキスト、ビデオ、オーディオが改善されていると語った。

「使いやすさという点では大きな進歩です」と彼女は語り、イタリア語でのスピーチを即座に翻訳できることを実証しました。

この大々的に宣伝されたイベントでは、ユーザーの呼吸の重さなどの体の動きを読み取り、要求に応じてロボットや歌声など、さまざまな感情的なスタイルの音声を生成できる音声モードも発表されました。

コメントに対しても、「便利ですごい」と褒められると「やめて、赤面するよ」と返すなど、人間らしい返答をする。

「私にとって、コンピューターに話しかけることは決して自然なことではありませんでしたが、今では自然に感じられます。（オプションの）パーソナライゼーション、ユーザーの情報へのアクセス、ユーザーに代わってアクションを実行する機能などを追加すると、エキサイティングな未来が本当に見えてきます。私たちはコンピューターを使ってこれまで以上に多くのことを行うことができるようになりました」と OpenAI の CEO 兼共同創設者のサム・アルトマン氏はブログで述べています。

同社によれば、以前のバージョンとは異なり、ユーザーはモデルに割り込むことができ、リアルタイムで応答できるため、2～3秒のタイムラグが短縮されるという。

ChatGPT は、カメラを通して顔を見つめることによって感情を検出できるようになりました。デモ中、彼らは笑顔を見せ、AIは「あなたの良い雰囲気の理由を共有したいですか？」と尋ねました。

ChatGPT は、音声およびビジョン機能を備えたデスクトップアプリもリリースしています。