AI ツールがどのようにトレーニングされるかについて、クリエイターは懸念を抱いています。著作権法はそれらを阻止するのに十分な障害となるのでしょうか?

ドイツの写真家ロバート・クネシュケ氏は1年前、著作権で保護された写真が人工知能(AI)ツールの訓練に使用されていないかオンラインウェブサイトを利用して確認した際、見つかった数の多さに「唖然とし、衝撃を受けた」という。

彼のポートフォリオから少なくとも 20 枚の透かし入り画像が、安定拡散などの機械学習システムをトレーニングするためにドイツの非営利 AI 組織 LAION によって提供されたデータセットに収集されました。

しかし、写真家が写真を削除するよう求めたとき、LAIONの弁護士は、データベースはインターネット上で公開されている画像へのアクセスを提供しており、そのコピーは保存されていないと主張した。

ハンブルクでの公判期日は4月25日に設定されており、アーティスト、作家、企業がインターネットからスクラップされたコンテンツを学習させたAI企業を相手に訴訟を起こす中、クネシュケ氏の訴訟は欧州におけるこの種の初の裁判の1つとなる。

しかし、専門家らは、著作権で保護された作品をトレーニングに使用するこれらのツールの問題には予見的な結論はなく、今後さらに問題が提起されると、裁判所によってケースバイケースで解釈される可能性が高いと述べている。

著作権侵害は「証明が難しい」

ChatGPT などの生成 AI モデルは、人間のようなコンテンツを作成する方法を学習するために、膨大な量の素材と情報に基づいてトレーニングされます。

「コンテンツを生成するモデルをトレーニングするということは、私がジョン・スタインベックの小説を何冊も読んで、ジョン・スタインベックのスタイルを真似しようとして小説を書くのとよく似ています」と、ワシントン DC のリモン法律事務所のパートナー、マーク・カウフマン氏は言う。

彼がスタインベックの小説と同じストーリーを語る小説を書いた場合、それは著作権侵害となる可能性がありますが、その書き方を模倣した場合は著作権侵害としてカウントされない可能性が高いです。

「スタイルを模倣することは実際には著作権侵害ではありません。記事をコピーすることは著作権侵害です」と彼は言った。

GoogleとOpenAIは昨年末、AIと著作権に関する調査の一環として米国著作権局への個別の回答で、機械学習トレーニングについて同様の主張を行った。

GoogleはAIツールのトレーニングを過去の裁判と比較し、「本を読んでその中の事実や考え方を学ぶ行為」は侵害には当たらないと述べた。

OpenAIは、システムはコピーを保存せず、新しいコンテンツを生成することになっていると強調した。

「応答を求められると、モデルはその重みを使用して、求められるたびに新しい応答を書き込みます」と OpenAI の法務顧問は主張しました。

「トレーニング前のデータから応答をコピーしたり、データベース経由でアクセスしたりすることはありません。本を読んでそれを書き留める人間と同じように、私たちのモデルは、本から学んだ後はトレーニング情報にアクセスできません。」

カウフマン氏は、著作権侵害は「AIモデルの出力」とそれがオリジナルの作品にどれだけ類似しているかに基づいて判断されるべきだと述べており、これは他の専門家も同様の見解だ。

しかし、同氏は、自分が小説を合法的に購入したという思い込みが存在する可能性がある一方、一部のクリエイターはAI企業が自社のアートやテキストをインターネットから直接違法に​​コピーしたと主張する可能性があると主張した。

問題の1つは、自分の素材が使用されたかどうか人々が知らない可能性があり、「保護された著作物はもう存在しないため、証明するのが難しいことです。そこにあるのは単に機械学習の結果であるだけです」と、独立法務専門家のダニエル・ウェストマン氏は述べた。スウェーデンの著作権アドバイザー。

いくつかの著名な著作権訴訟ニューヨーク・タイムズ紙は特に、ChatGPT作成者のOpenAIに対し、その記事をトレーニングに使用したとして「数十億ドルの法定および実際の損害賠償」を求めて訴訟を起こしている。

同紙の弁護士らは、記事の「違法使用」によってAIツールがニューヨーク・タイムズと競合するコンテンツを作成できるようになると主張しており、訴訟には「タイムズの内容をそのまま引用した出力」の具体例も含まれている。

しかし、このような訴訟は、著作物の無許可使用に一定の例外を規定する米国の「フェアユース」条項に左右される可能性があるが、欧州連合では権利者に有利となる可能性のあるいくつかの相違点がある。

EU指令では「オプトアウト」が可能

ストックホルム大学の知的財産専門家マリアン・レビン氏によると、米国と同様の「フェアユース条項」をEU法に組み込む取り組みがあったが、欧州各国は特定の例外を設けてすべてのテーブルについたという。

「(EU著作権指令の)この段落では、さまざまな例外を伴う一種のスモーガスボードができました」と彼女は説明した。

専門家らは、こうした例外の代わりに、AIに関連した著作権訴訟の根拠として、より最近のEU指令を指摘している。

欧州委員会の広報担当者はユーロニュース・ネクストに対し、AIシステムのトレーニングに著作権で保護された作品を使用する場合、原則として「AIの開発者またはユーザーは権利者の同意を求める必要がある」と語った。

欧州委員会は以前、2021年6月からEU加盟国に適用されている2019年の指令を指摘しており、この指令は「テキストおよびデータマイニング」(大量のコンテンツを精査してパターンを見つける自動プロセス)に関するより具体的な条項を規定している。

この指令により、アーティストや作家などのクリエイターは、自分の作品がその目的で使用されることをオプトアウトすることができます。

「現在、ヨーロッパで多くの議論が行われているのは、他人の素材を取得して機械学習に使用する場合にこの例外が適用されるのかどうかということだ」とウェストマン氏は述べたが、現時点では「オプトアウトするための標準化された方法」はないという。あらゆる用途から」というもので、一部の専門家はその適用に疑問を抱いています。

国内市場コミッショナーのティエリー・ブルトン氏は、この指令は米国の「AI コンテキスト」に実際に適用されると述べた。に対する応答2023年3月に欧州議会。

権利者の同意が必要な場合、欧州ではAIツールを訓練するための作品のライセンスが制限される可能性がある。

「芸術音楽協会には当然の主張があります。『しかし、彼らは私たちの作品を使用しているのに、なぜ私たちはお金をもらわないのか?』」とレビン氏は言う。

これは作家と俳優によって強調された懸念の一つでしたハリウッドでのストライキ昨年は数か月間業界が閉鎖されました。しかし、その後の合意は、彼らの作品をAIのトレーニングに使用することを完全に禁止するという結論には至らなかった。

俳優組合SAG-AFTRAは、「これは我々が引き続き監視していくテーマであり、訴訟と調査の結果次第では、裁判所と著作権局がトレーニングに同意が必要であると判断した場合には、このテーマを再検討する可能性がある」と述べた。Webサイト

コンテンツのライセンス契約もすでに始まっており、一部の組織は、たとえばトレーニングに教材を使用するために OpenAI と契約を締結しています。 BILDとWELTを所有するアクセル・スプリンガー発表された2023 年 12 月には ChatGPT メーカーとの提携が予定されています。

ドイツのトレーニング データベース LAION は、人々がパブリック ドメイン ライセンスを使用して AI 企業のデータへのアクセスを提供することで AI 企業を支援できると指摘し、これが業界の民主化と強化に役立つと主張しています。

透明性がさらに高まる?

欧州の新しいAI法には透明性に関する規定が含まれており、企業に対し機械学習モデルの「トレーニングに使用されるコンテンツ」に関する概要の開示を義務付けている。

この法律は発効後 2 年後に適用されます。正式承認ただし、早期に発効する特定の禁止事項を除き、欧州議会で審議されます。

ウェストマン氏は、この種の義務は「権利者にとっては少しは良くなる」かもしれないが、「根本的なレベル」では何も変わらないと述べた。

LAIONデータベースの共同創設者で、今年ドイツ人写真家の訴訟を起こしているジェニア・ジツェフ氏はユーロニュース・ネクストに対し、AI組織は機械学習モデルの透明性を支持していると電子メールで語り、機械学習モデルが唯一の透明性のあるトレーニングを提供していると指摘した。データセット。

欧州委員会の広報担当者は、「AIと著作権の相互作用は複雑であり、継続的な監視が必要」だが、現在の規則は「提起されているさまざまな問題に対処するには概ね十分である」と付け加えた。

彼らは、将来の著作権問題はケースバイケースで判断されるだろうと予想している。

レビン氏は、他のAIツールメーカーが規制当局の追い上げを図る中、AIツールメーカーは多くの点で先駆けとなることで勝利を収めてきたと述べた。

「彼らはすでにスタートしており、一定の距離を保っているので、勝ったと思います」と彼女は語った。