OpenAI、「思考の連鎖」で推論する o1 モデルをリリース、ただし欠陥がないわけではない

公開日

この記事をシェアする

OpenAIによると、o1は問題を解決しようとするときに思考の連鎖を使うという。

OpenAIは、以前の生成人工知能 (GenAI) モデルよりも「難しい問題を解決できる」という新しいモデル シリーズを発表しました。

カリフォルニアに拠点を置く同社は木曜日、正式にo1-previewとo1-miniと呼ばれるシリーズの初期プレビューをリリースすると発表した。このモデルのコードネームはStrawberryです。

OpenAIによると、テストでは新しいモデルは物理学、化学、生物学の難しい課題では博士課程の学生と同様の成績を収め、数学とコーディングでも良好な成績を収めたという。

同社は、高校の数学コンテストである国際数学オリンピック(IMO)の資格試験でこのモデルをテストしたと発表した。

6 つの難しいアルゴリズムの問​​題を解くのに 10 時間かかり、問題ごとに 50 件の提出が許可されました。

OpenAI によると、o1 モデルは問題の 83% を解決しましたが、GPT-4o は 13% しか解決しませんでした。

欠点は何ですか?

同社は、情報を得るためにインターネットを閲覧したり、ファイルや画像をアップロードしたりするなど、ChatGPT の主な機能をすべて備えているわけではないと述べています。また、追加のテストが行​​われるまで無効化されている画像分析機能もありません。

もう一つの欠点は、非常に高価なことです。新しいモデルは、GPT-4o の入力コストの約 3 倍、出力コストの約 4 倍です。 o1-preview は、100 万入力トークンあたり 15 ドル (13.50 ユーロ)、100 万出力トークンあたり 60 ドル (54 ユーロ) です。トークンは生データであり、100 万トークンは約 750,000 ワードに相当します。

現時点ではユーザーは無料ではないが、同社はo1-miniをすべての無料ChatGPTユーザーに提供する予定だと述べた。

OpenAIはまた、技術論文の中で、テスターからのフィードバックとして、o1はGPT-4oよりも幻覚を起こす(でっちあげ)傾向があると述べた。また、質問に対する答えがないこともあまり認めません。

OpenAIの共同創設者兼最高経営責任者(CEO)のサム・アルトマン氏は、Xに関する投稿の中で、「o1にはまだ欠陥があり、限界があり、時間をかけて使った後よりも、初めて使用したときの方が印象深いように見える」と述べた。

「思考の連鎖」

OpenAIは、このモデルは「人間が難しい質問に答える前に長時間考えるのと同じように機能する」と述べ、「o1は問題を解決しようとするときに一連の思考を使用する」と付け加えた。

OpenAI は、競争上の優位性もあり、この「思考の連鎖」推論がどのように機能するかを正確に示していませんでした。しかし、それは思考の連鎖の「モデルによって生成された要約」を示しました。

政府との連携

OpenAIは、AIの安全性への取り組みを推進するため、最近米国および英国のAI安全性研究所と正式な協定を締結したと述べた。これには、一般公開前に各機関にモデルへの早期アクセスを許可することが含まれている。

OpenAIは連携について言及していない欧州政府

アクセシビリティのショートカットに移動

あなたも気に入るかもしれません