OpenAI の新しいテキストからビデオへのツールである Sora は、興奮と不安を引き起こしています。それについて私たちが知っていることは次のとおりです

Sora は、ChatGPT メーカー OpenAI の新しいテキストからビデオへのジェネレーターです。懸念と興奮を同じくらい引き起こす新しいツールについて私たちが知っていることは次のとおりです。

ChatGPT の作成者は現在、人工知能 (AI) によって作成されたビデオの世界に飛び込んでいます。

Sora をご紹介します - OpenAI の新しいテキストからビデオへのジェネレーターです。サンフランシスコに本拠を置く同社が木曜日に発表したこのツールは、生成 AI を使用して、書かれたコマンドに基づいて短いビデオを瞬時に作成します。

この種のテクノロジーを実証したのはSoraが初めてではない。しかし業界アナリストらは、これまでに表示されたこのツールのビデオの品質の高さを指摘し、その導入はOpenAIとテキストからビデオへの生成全体の将来の両方にとって大きな飛躍を示すものであると指摘している。

それでも、今日急速に成長している AI 分野のあらゆるものと同様に、このようなテクノロジーも潜在的な倫理的および社会的影響についての懸念を引き起こしています。知っておくべきことは次のとおりです。

Sora はテキストからビデオへのジェネレーターであり、生成 AI を使用して書面によるプロンプトに基づいて最大 60 秒の長さのビデオを作成します。このモデルは、既存の静止画像からビデオを生成することもできます。

生成 AI は、何か新しいものを生み出すことができる AI の分野です。例には、OpenAI の ChatGPT などのチャットボットや、DALL-E や Midjourney などの画像ジェネレーターが含まれます。

AI システムでビデオを生成することは新しく、より困難ですが、同じテクノロジーの一部に依存しています。

Sora はまだ一般公開されておらず (OpenAI は、ツールを正式にリリースする前に政策立案者やアーティストと協力していると述べています)、まだわかっていないことがたくさんあります。しかし、木曜日の発表以来、同社はSoraが何ができるかを誇示するため、Soraが生成したビデオの例をいくつか共有してきた。

OpenAI CEO サム・アルトマンまた、以前は Twitter として知られていたプラットフォームである X を利用して、ソーシャル メディア ユーザーに迅速なアイデアの送信を求めました。

彼はその後、「山の頂上でポッドキャストをする2頭のゴールデンレトリバー」や「ドローンカメラの視点で自転車に乗るアスリートとして、さまざまな動物と海上で自転車レースをする」などのプロンプトに応えた、リアルで詳細なビデオを共有した。

Sora が生成したビデオは、複雑で信じられないほど詳細なシーンを描写できますが、空間的要素や因果関係の要素など、まだいくつかの弱点があると OpenAI は指摘しています。

たとえば、OpenAI はウェブサイトで、「人はクッキーをかじったかもしれないが、その後、クッキーには噛み跡が残らない可能性がある」と付け加えています。

AI によって生成されたビデオ ツールには他にどのようなものがありますか?

OpenAI の Sora は、この種の最初のものではありません。 Google、Meta、スタートアップ企業 Runway ML などは、同様のテクノロジーを実証している企業の 1 つです。

それでも、業界アナリストは、これまでに共有されたSoraビデオの明らかな品質と印象的な長さを強調しています。

マッコーリー社の米国AIおよびソフトウェア研究責任者フレッド・ヘイブマイヤー氏は、Soraの発売は業界にとって大きな前進であると述べた。

「最長60秒までの長いビデオを作成できるだけでなく、作成されたビデオはより普通に見え、実際には物理学と現実世界をより尊重しているようです」とヘイブマイヤー氏は述べた。

「ビデオフィードには、不自然に見える『不気味の谷』ビデオや断片がそれほど多くありません。」

昨年11月に導入されたStable Video Diffusionを含め、過去1年間でAI生成ビデオは「驚異的な進歩」を遂げたが、Forresterのシニアアナリスト、ローワン・カラン氏は、そのようなビデオではキャラクターとシーンの一貫性を保つためにより多くの「つなぎ合わせ」が必要になったと述べた。

しかし、ソラのビデオの一貫性と長さは、「クリエイターが AI で生成されたビデオの要素を従来のコンテンツに組み込む新たな機会をもたらし、現在では 1 つまたはいくつかのプロンプトから本格的なナラティブビデオを生成することさえできる」とカラン氏は語った。金曜日にAP通信が電子メールで伝えた。

潜在的なリスクは何ですか?

木曜日の公開以来、ソラの能力は観察者を驚かせてきたが、AIが生成したビデオの使用が倫理的および社会的に与える影響に対する不安も残っている。

ハブマイヤー氏は、例えば2024年の潜在的に危険を伴う選挙サイクルにおける重大なリスクを指摘している。

同氏は、見た目も音もリアルな動画を生成する「潜在的に魔法のような」方法を持つことは、政治内外で多くの問題を引き起こすと付け加え、詐欺、プロパガンダ、誤った情報の懸念を指摘した。

「生成型 AI の負の外部性は、2024 年に議論される重要なテーマになるだろう」とヘイブマイヤー氏は述べた。 「これは、すべての企業とすべての個人が今年直面する必要がある重大な問題です。」

世界中の政府が遅れを取り戻すべく努力する中、AI とそのリスクの管理に関しては依然としてテクノロジー企業が主導権を握っています。

欧州連合は12月、世界初の包括的なAI規則について合意に達したが、同法は最終承認から2年後まで発効しない。

OpenAIは木曜日、Soraを広く利用できるようになる前に重要な安全対策を講じていると発表した。

「私たちは、モデルを敵対的にテストするレッドチーム、つまり誤った情報、憎悪に満ちたコンテンツ、偏見などの分野の専門家と協力しています」と同社は書いている。

「私たちはまた、ビデオがいつ Sora によって生成されたかを知ることができる検出分類子など、誤解を招くコンテンツの検出に役立つツールも構築しています。」

OpenAIのグローバルアフェアーズ担当副社長アンナ・マカンジュ氏は金曜日、ミュンヘンセキュリティカンファレンスで講演した際、このことを繰り返し述べた。そこでは、OpenAIと他のテクノロジー企業19社が自主的に協力して、AIが生成した選挙ディープフェイクとの戦い

同氏は、同社が「非常に慎重な方法で」Soraをリリースしていると指摘した。

同時に、OpenAI は Sora がどのように構築されたかについて限定的な情報を明らかにしました。

OpenAIの技術報告書では、Soraのトレーニングにどのような画像やビデオソースが使用されたかは明らかにされておらず、同社は金曜日にさらなるコメントの要請に応じなかった。

また、Sora のリリースは、ChatGPT のトレーニングに著作権で保護された著作物を使用したことをめぐって、一部の著者とニューヨーク タイムズが OpenAI とそのビジネス パートナーである Microsoft に対して訴訟を起こしている中で発表されました。