公開日
この記事をシェアする
以下の記事ビデオ埋め込みリンクをコピーして貼り付けます。コピーされました
OpenAI には、アップグレードされた音声アシスタントを備えた新しい ChatGPT モデルがあり、無料ユーザーは初めてカスタム チャットボットにアクセスできるようになります。
OpenAI は、ChatGPT の無料版を含むすべてのユーザーに同じインテリジェンスを提供する新しいモデルと、Amazon の Alexa に匹敵する可能性のある印象的な音声インターフェースをリリースします。
いわゆる「春のアップデート」で、OpenAIは月曜日に最初のメインストリームライブイベントで新しいChatGPT-4oモデルを披露した。
OpenAI の最高技術責任者 Mira Murati 氏は聴衆に対し、以前の ChatGPT-4 モデルよりもはるかに高速であり、テキスト、ビデオ、オーディオが改善されていると語った。
「使いやすさという点では大きな進歩です」と彼女は語り、イタリア語でのスピーチを即座に翻訳できることを実証しました。
この大々的に宣伝されたイベントでは、ユーザーの呼吸の重さなどの体の動きを読み取り、要求に応じてロボットや歌声など、さまざまな感情的なスタイルの音声を生成できる音声モードも発表されました。
コメントに対しても、「便利ですごい」と褒められると「やめて、赤面するよ」と返すなど、人間らしい返答をする。
「私にとって、コンピューターに話しかけることは決して自然なことではありませんでしたが、今では自然に感じられます。(オプションの)パーソナライゼーション、ユーザーの情報へのアクセス、ユーザーに代わってアクションを実行する機能などを追加すると、エキサイティングな未来が本当に見えてきます。私たちはコンピューターを使ってこれまで以上に多くのことを行うことができるようになりました」と OpenAI の CEO 兼共同創設者のサム・アルトマン氏はブログで述べています。
同社によれば、以前のバージョンとは異なり、ユーザーはモデルに割り込むことができ、リアルタイムで応答できるため、2~3秒のタイムラグが短縮されるという。
ChatGPT は、カメラを通して顔を見つめることによって感情を検出できるようになりました。デモ中、彼らは笑顔を見せ、AIは「あなたの良い雰囲気の理由を共有したいですか?」と尋ねました。
ChatGPT は、音声およびビジョン機能を備えたデスクトップ アプリもリリースしています。
誰でも、より速く利用可能
もう 1 つの大きなアップデートは、モデルが人工知能アプリケーション プログラミング インターフェイス (API) に導入されたことです。これは、開発者が 50% 安い価格で 2 倍の速さでモデルの構築を開始できることを意味します。
ChatGPT-4o は 50 の言語でも利用でき、世界人口の 97 パーセントをカバーしています。
データ保護と倫理?
OpenAIはイベントでユーザーデータを保護するかどうかについては言及しなかった。以前のバージョンでは、オプトアウトしない限り、ChatGPT は会話をトレーニングに使用できました。
生成 AI は、偏見や AI の幻覚 (不正確で誤解を招く応答) で注目を集めています。同社は新モデルでこれをどのように改善するか、あるいは改善するかどうかについては言及しなかった。
OpenAI は現在、人間によるフィードバックからの強化学習 (RLHF) と呼ばれる手法を使用しています。これは、人間がチャットボットの応答のバイアスをレビューするときに行われます。
いつ利用可能になりますか?
OpenAIは、ChatGPT-4oは今後数週間以内にChatGPTユーザーに提供される予定だと述べた。