Openaiは、著作権で保護されている資料なしでAIを訓練することは「不可能」だと言います

公開日

この記事をシェアする

OpenAI は、著作権で保護された記事、書籍、アートを生成人工知能 (AI) ツールのトレーニングに使用したことをめぐって複数の訴訟に直面しています。

人工知能(AI)チャットボットChatGPTを開発するOpenAIは、著作権で保護された素材を使用せずに自社のAIツールをトレーニングすることは「不可能」だと述べた。

これは、OpenAI が著作権で保護されたコンテンツの使用に関連して複数の訴訟に直面している中で起こった。記事、および ChatGPT をトレーニングするためのアート。他のAI企業も同様の訴訟に直面している。

生成 AI ツールは、インターネットからの大量のコンテンツでトレーニングされ、それを使用してパターンを分析および学習し、新しい人間のようなコンテンツを生成します。

「今日の著作権は、ブログ投稿、写真、フォーラムへの投稿、ソフトウェアコードの断片、政府文書など、事実上あらゆる種類の人間の表現を対象としているため、著作権で保護された素材を使用せずに今日の主要な AI モデルをトレーニングすることは不可能である」と OpenAI は書面で主張した証拠は先月英国貴族院に提出された。

大規模言語モデル (LLM) に関する調査の一環としての同社の対応は、イギリスの新聞によって最初に報じられたテレグラフ紙

OpenAIトレーニングデータをパブリックドメインのコンテンツに「限定」すると、「今日の国民のニーズを満たすAIシステムは提供できない」と主張した。

さらに、同社は「著作権法はトレーニングを禁止していない」と考えているものの、「クリエイターをサポートし、権限を与えるためにはまだやるべきことがある」と認識していると付け加えた。

チャットGPTは 2022 年 11 月にリリースされ、この 1 年間で人気が急上昇したため、AI ツールの進歩が加速しました。

しかし同時に、文章やアートワークを生成するAIツールが複数の業界で雇用を失うのではないかという懸念も広がっている。

ニューヨーク・タイムズは、OpenAIに対して訴訟を起こす著作権侵害をめぐっては、AI企業が「法定および実際の損害として数十億ドル」を支払う義務があると主張した。

69ページにわたる広範な訴訟では、OpenAIがメディア企業と競合するAIシステムを開発するためにニューヨーク・タイムズの著作物を不法に利用したと主張している。

OpenAIのツールは「多数の例で実証されているように、Timesのコンテンツを逐語的に引用し、綿密に要約し、その表現スタイルを模倣する出力」を生成すると訴状​​は主張している。

訴訟の一例には、ニューヨーク・タイムズによるタクシー業界に対するピューリッツァー賞を受賞した2019年の調査に酷似したGPT-4のテキストが示されている。

訴訟では、これらのツールがOpenAIとその最大の投資家であるMicrosoftにとっても非常に儲かっていることが強調されている。

OpenAI は今週、別のブログ投稿米国の新聞社の訴訟に言及し、インターネット上で入手可能な素材を使ってAIモデルをトレーニングすることは「フェアユース」であり、ニューヨーク・タイムズの訴訟は「メリットがない」と主張した。

「相互に有益な機会を生み出す」ために報道機関と提携するよう努めてきたとし、報道機関はAIシステムのトレーニングに使用されるコンテンツの「ほんの一部」であると述べた。

AI 企業は、次のようなメディア企業と契約を結んでいます。AP通信そしてアクセル・スプリンガーは、Politico、Business Insider、Bild、Welt というメディア会社を所有し、自社のコンテンツをトレーニング用にライセンス供与しています。

OpenAIはまた、ブログ投稿の中で、パブリッシャーのWebサイトへのアクセスを防ぐための簡単なオプトアウト機能があると主張した。

さらに、トレーニング内容の暗記や逆戻りは、概念を「新たな問題」に適用することを目的としたシステムの「失敗」であると付け加えた。

アクセシビリティのショートカットに移動

あなたも気に入るかもしれません