AnthropicがClaudeの学習データとして海賊版書籍を使用した著作権侵害により、史上最大規模となる15億ドルの和解金支払いに合意したケースを詳細に解説する。同社は著作権のフェアユース適用を主張したが裁判所に却下され、AI業界全体に大きな影響を与える判例となった。和解条件には海賊版データの破棄義務も含まれ、今後のAI企業のデータ取得方法に根本的変化をもたらす可能性が高い。

Anthropic史上最大の著作権和解案件
Claudeを開発するAnthropicが、著作権侵害により少なくとも15億ドルの和解金支払いに直面しています。この和解が承認されれば、史上最大の著作権和解となり、人工知能業界の今後に重大な影響を与えることになります。
一体何が起こったのでしょうか。彼らは何をしたのか、それは意図的だったのか、そして業界全体にとってこれは何を意味するのでしょうか。詳しく見ていきましょう。
この動画はSokumiの提供でお送りします。詳細は後ほどお話しします。
訴訟文書の詳細
こちらが訴訟文書です。ご覧の通り、原告側とAnthropicパブリックベネフィット法人が被告として記載されています。最初の文章には「公に報告された著作権回収額として史上最大、他のいかなる著作権集団訴訟の和解や個別の著作権案件の最終判決よりも大きい」と書かれています。
これは巨額です。事件の概要をお話ししますが、詳細についても深く掘り下げていきます。Anthropicはフェアユースになると考えて海賊版の書籍を取得し、モデルの学習に使用しました。しかし裁判官の判断では、それはフェアユースではありませんでした。これにより、AI企業がLibrary GenesisやPirate Library Mirrorなどの海賊版サイトの使用に対して料金を支払う先例となります。
つまり、AI企業が無料使用ではない海賊版サイトを使用している場合の話です。この深刻さを聞いてください。Anthropicの海賊版資料の使用は本質的に取り返しのつかない侵害行為だと判断されています。裁判官の心に、彼らが何か悪いことをしたという疑いはありません。
著作権侵害の詳細
原告の核心的な主張は、Anthropicが疑わしい海賊版データセットから書籍をダウンロードし、商業的に悪用することで大規模な著作権侵害を犯したというものです。
内訳はこうです。彼らは許可なく海賊版サイトから書籍をダウンロードしました。それをClaudeファミリーのモデル用に膨大な学習データを取得するために行いました。Anthropicはフェアユースだと主張しましたが、裁判所はその主張を却下しました。
ではどのように発覚したのでしょうか。原告は証拠開示を通じてそれを突き止めました。彼らはこれが起こっていることを感じ取り、証拠開示に入ってデータセットを調べ、確かにそこにありました。
事件の過程で、原告は20件の証言録取を行い、数十万ページの文書を検討し、少なくとも3テラバイトの学習データの検査を実施しました。これは小さな作業ではありません。
証言録取、データセット検査、メタデータ追跡により、Anthropicのデータセットは違法にダウンロードされた書籍データセットに結びつけられました。その結果、少なくとも15億ドルを支払わなければならなくなりました。これは巨額です。
資金調達と投資家の反応
文脈として、Anthropicは文字通りつい最近大量の資金を調達したばかりです。実際、すべての投資家はおそらくこの和解について知っていました。
彼らは130億ドルのシリーズFを、事後評価額1830億ドルで調達したばかりです。つまり、そのうち少なくとも15億ドルが原告のポケットに直行することになります。もちろん、投資家たちは気にしていません。これをビジネスコストだと見なしているのでしょう。
しかし、それで終わりではありません。Anthropicはそのデータを保持してモデルを使い続けることはできません。支払いの詳細を見る前に、もう少し深く掘り下げてみましょう。
和解金の支払い詳細
作品ベースでは、和解金額は陪審員が裁定できる750ドルの法定損害額の4倍、そしてAnthropicが無害な侵害の抗弁で勝訴した場合の200ドル金額の15倍です。
支払い方法は以下の通りです。裁判所の予備承認命令後5営業日以内に3億ドル。裁判所の最終承認命令後5営業日以内に3億ドル。裁判所の予備承認から12ヶ月以内に4億5000万ドルプラス利息。
つまり、彼らは1億ドル以上になる利息も支払っています。さらに24ヶ月以内に4億5000万ドルプラス利息を支払い、Anthropicの最終支払い時までに発生した利息は1億2640万ドルにも達する可能性があります。
少し一時停止して、今日の動画のスポンサーに感謝したいと思います。ついに、理にかなったAIエージェントマーケットプレイスが登場しました。Sokumiが先日ローンチされ、次のAIエージェントチームメイトを雇う場所となっています。
AIエージェントを構築したり雇ったりしている方は、これを聞いてください。SOKUMIは使いやすく、実際の問題を解決します。企業アカウントを設定し、ビジネス用のAIエージェントを即座にデプロイし、エンタープライズ向けの高品質AIエージェントを即座にデプロイできます。
ビルダーの方は、AIエージェントを構築し、他の企業に販売することで収益化できます。個人開発者でも企業開発者でも可能です。
Sokumiが特別な理由はここにあります。完全に不可知論的です。OpenAI、Gemini、Mistral、どのLLMを使いたくても動作します。また、LangchainからCrew AI、その他使いたいオーケストレーションやツールまで、すでに慣れ親しんでいるフレームワークを使用できます。
さらに、完全にオープンソースです。これは私が大好きなことですね。必要な透明性がすべて得られます。そして、すべてのエージェントはすでにMsumiプロトコルを通じてMCPを使用しています。これは、スケールでのAIエージェントのマーケットプレイスです。
sokumii.comで登録し、今すぐ200のスタートクレジットを取得してください。下の説明にあるコードを使用してください。エージェントを構築したり管理したりしている方は、ぜひチェックしてみてください。どう思うか、そしてビジネスにどう役立つか教えてください。改めてSokumiに感謝します。では動画に戻ります。
和解対象の書籍数
これは少数の書籍ではありません。だからこそ和解金額がこれほど大きいのです。これを聞いてください。作品リストが最終的に50万作品の書籍を超える場合、Anthropicは50万作品を超えてAnthropicが作品リストに追加する作品ごとに追加で3000ドルを支払います。
15億ドルは和解の最小規模です。和解により免責を得ますが、免責自体が制限されています。これを聞いてください。免責は3つの重要な点で制限されています。
第一に、免責は過去の請求にのみ適用され、将来の複製、配布、および/または派生作品の作成に関するいかなる請求にも適用されません。もちろん、これは理にかなっています。悪いことを続ければ、続けて処罰されるでしょう。
第二に、免責はアウトプット請求には全く適用されません。これを想像してください。モデルを学習させました。モデルを破棄する必要はありませんが、もしモデルがそれらの書籍の一つから作品をほぼ逐語的に再現すれば、再び訴えられることになります。
第三に、和解は作品リストにある作品の請求のみを免責します。そのため、原告の一人が複数の作品を所有し、作品の一つだけがリストに載っていて、もう一つが載っていない場合、載っていないものについては責任を負いません、少なくともまだは。それは別の請求です。
データ破棄の義務
興味深いのはここからです。Anthropicは海賊版の書籍、ファイル、それらのファイルのコピーを破棄し、破棄したことの証明を確実にしなければなりません。
ここで、Anthropicは最終判決から30日以内にデータセットを破棄することを約束しています。これにより、Anthropicがそれらの著作権作品を再利用することは実際に防がれますが、Claudeは学習済みのままです。データセットの特定の部分から学習を取り消すことはできません。Anthropicにとって幸運なことに、モデルを破棄して再作成することは求められませんでした。
これは基本的にAnthropicを一夜にして沈めることになったでしょう。
支払い対象者
実際に誰が支払いを受けるのでしょうか。AnthropicがLibGenやPaleiからダウンロードしたバージョンの書籍のコピーを複製する排他的権利の、すべての受益的または法的著作権者です。
そしてここが重要なのですが、これは偶然ではありませんでした。Anthropicは実際にフェアユースだと考えて、意図的にこれらの海賊版書籍をダウンロードしましたが、そうではありませんでした。
なぜ彼らはそれをしたのでしょうか。もちろん、大量のお金を節約するためです。Anthropicが50万冊すべての書籍の権利を購入することを想像してください。それは非常に高価だったでしょう。
しかし、これをしたのは彼らが初めてではありません。Google Booksは明らかにGoogleが持っていたプロジェクトで、中古書籍を買いに出かけ、それらをスキャンして、無料でオンラインに投稿しました。
これは完全に合法でした。なぜなら、無料で海賊版をダウンロードしたのではなく、実際に書籍を購入したからです。商業目的で書籍を複製していたかどうか(私は弁護士ではありませんが、これがフェアユースかそうでないかの判断の一部だと信じています)は議論の余地があります。
私の記憶では、Googleは書籍に料金を請求していませんでしたが、単にGoogleにより多くの注目を集めることで、確実に利益を得ていました。
今後の展望
では、ここからどこに向かうのでしょうか。和解はまだ最終的ではありません。まだ予備承認が必要です。その後通知が出され、最終承認の聴聞会があり、その後にのみ支払いが始まります。
AI業界への影響
AI業界にとってより大きな図として何があるでしょうか。これは確実にAI業界に衝撃波を送っています。改めてこの引用に戻らせてください。この和解は、AI企業がLibrary GenesisやPirate Libraryなどの海賊版サイトの使用に対して料金を支払う先例を作ることになります。
この和解は、全国の大手AI企業に対して係属中のいずれかの著作権訴訟における最初の主要な回収ともなるでしょう。覚えておいてください、New York Timesは、確か、類似の理由でOpenAIをまだ訴えていると思います。
これはすべてフェアユース論争であり、基盤モデル構築の経済学を本当に変えることになるでしょう。フェアユースの主張がより困難になれば、これらのAI企業はモデルを学習させるためにはるかに多くを支払わなければならず、それは私たち、これらのモデルの消費者すべてに下流効果をもたらすことになります。
そのため、これらのグレーマーケットデータセット取得経路から離れる変化が見られ、はるかにライセンス済みデータが使用されることになるでしょう。また、本当に価値があり重要で合法なデータセットの価格上昇もおそらく見られるでしょう。
Reddit、Twitter、すべてのユーザー生成コンテンツ、New York Times、Washington Post、そこにあるすべての出版社を考えてください。これらの作品はもっとずっと価値のあるものになるでしょう。
AIモデル企業は、データセットを調べてデータセットがすべて合法であることを確認し、合法的に取得したデータセットに単一の作品でも偶然に紛れ込まなかったことを確認するために、はるかに多くのお金を費やすことにもなるでしょう。
これは投資家のプレートにもより多くのリスクをもたらします。なぜなら、彼らはこれらのAI企業にお金を注ぎ込んでいるからです。しかし、前方にこれらの数十億ドルの和解があり、これらのモデルを構築することが突然ずっと高価になれば、投資家はROIに見合うように異なる計算をしなければなりません。
まとめ
結論として、Anthropicは確実にこれらの書籍を違法に取得しました。フェアユースだと考えてそうしましたが、そうではないと判断され、現在著作権請求として史上最大の和解金を支払っています。
コメントであなたの考えを教えてください。改めて、この動画をスポンサーしてくれたSokumiに感謝します。リンクは下の説明にあります。この動画を楽しんでいただけたら、いいねとチャンネル登録をお願いします。次の動画でお会いしましょう。


コメント