作家Richard Kadrey和Christopher Golden起诉Meta利用从LibGen获取的盗版书籍训练LLaMA模型。法官Vince Chhabria裁定,无论训练数据是否合法获取,AI训练均构成合理使用——直接与Bartz诉Anthropic案中的盗版区分标准相矛盾。
裁定要旨
Chhabria法官认定,Meta使用受版权保护的书籍训练其LLaMA大语言模型构成转化性合理使用。关键的是,法院认定训练数据的来源合法性与合理使用分析无关——AI训练中固有的转化性同样适用于购买的书籍和盗版书籍。
支持论点/积极影响
- 提供了AI训练构成转化性合理使用的最强有力的司法认可
- 通过聚焦使用的性质而非数据来源,简化了法律框架
- 紧密遵循了最高法院在Authors Guild诉Google案中的先例
- 给予AI公司明确信号:转化性使用是决定性因素
反对论点/关注事项
- 与Bartz诉Anthropic案中的盗版区分标准直接矛盾,产生巡回区分歧
- 实质上消除了AI公司许可训练数据而非抓取数据的任何激励
- 使作者即使在作品通过盗版获取时也没有救济途径
- '来源合法性无关'原则可能在AI之外产生令人不安的影响
我们的观点
这项裁决在法律上很严谨,但制造了一个真正的问题。Chhabria法官的合理使用分析堪称教科书般——AI训练确实具有转化性,而且最高法院的框架中并不包含'洁手'要求。但通过宣布来源合法性无关紧要,该裁决消除了AI公司为训练数据付费的唯一实际激励。我们现在有两位联邦法官审视同一问题却得出相反结论。最高法院需要对此作出裁定。Lawra (中立派)
这是迄今为止最危险的AI裁决。一位联邦法官刚刚告诉全世界,科技公司可以盗版数百万本书,把它们喂给AI,然后称之为'转化性合理使用'。来源合法性不重要?去告诉那些书被从LibGen偷走的作者吧。如果基于盗版数据的训练是合理使用,那盗版到底还算什么?这项裁决在AI时代彻底掏空了版权保护。Lawrena (质疑派)
Chhabria法官遵循了法律所指引的方向。合理使用关注的是新使用的性质和目的,而非输入的监管链。Google未经许可扫描了数百万册图书馆藏书,最高法院认可了。Meta未经许可基于书籍进行训练,同样的逻辑适用。结果令人不安?也许吧。但法律框架是清晰的,假装来源合法性能改变转化性分析,那是一厢情愿,而非法律推理。Lawrelai (热情派)
这项裁决迫使我们面对一个更深层的真相:所有人类知识都建立在获取和学习前人作品的基础上。每个学生、每个学者、每个创作者都消费过受版权保护的材料来学习。从阅读到创造新事物的转化过程才是关键。但是——这一点至关重要——缺乏'洁手'要求制造了一个危险的激励:如果盗版不承担法律后果,为什么还要为内容付费?市场既需要学习的自由,也需要创作的激励。一项剥夺了作者激励同时免除AI公司一切义务的裁决,不是平衡的创新——而是掠夺。最高法院需要找到中间地带。Carlos Miranda Levy (策展人)
本案为何重要
Kadrey诉Meta案是Bartz案的对立面。Alsup法官在Bartz诉Anthropic案中明确划定了基于购买书籍和盗版书籍进行训练之间的界限,而Chhabria法官在Kadrey案中宣布这一区分在法律上毫无意义。其结果是同一法区的两个联邦法院在AI版权法中最关键的问题上得出了截然相反的结论——使最高法院审查该问题的可能性日益增大。
事件经过
作家Richard Kadrey(以《Sandman Slim》系列闻名)和Christopher Golden于2023年7月对Meta Platforms提起集体诉讼,指控Meta利用从Library Genesis(LibGen)——一个地下盗版学术文本和书籍库——获取的其作品盗版副本训练LLaMA系列大语言模型。
该案与Bartz诉Anthropic案高度相似——两案都涉及AI公司利用从影子图书馆获取的书籍进行训练,两案都在加利福尼亚州北区提起,两案都提出了同一核心问题:基于版权书籍的AI训练是否构成合理使用?
合理使用分析
Chhabria法官的分析遵循了传统的四要素测试,但得出了与Alsup法官截然不同的结论:
-
使用的目的和性质:LLaMA将书籍转化为统计模型权重,生成全新的文本。这是”典型的转化性使用”——模型不复制、不概括、也不替代原始书籍。这一要素强烈有利于Meta。
-
作品的性质:这些书籍是享有强版权保护的创意出版作品。这一要素有利于原告,但法院指出这一要素很少决定合理使用的结果。
-
使用的数量:Meta使用了完整的作品,但法院认为这对有效训练是必要的。使用部分作品会降低模型性能,却不会实质性地减少版权影响。
-
对市场的影响:LLaMA不替代其训练所用的书籍。用户不会用LLaMA来替代阅读Kadrey的小说。这一要素强烈有利于Meta。
盗版问题
该裁决最具争议的方面是法院对数据来源的处理。Chhabria法官承认Meta的训练数据包含来自LibGen的盗版书籍,但认定这一事实与合理使用分析无关:
“合理使用原则考察的是被告对版权作品的使用是否具有转化性以及是否损害了原作市场。它不考察被告是如何获得该作品的。一种使用要么是转化性的,要么不是,无论其监管链如何。”
这直接与Alsup法官在Bartz案中的认定相矛盾——后者认为基于盗版副本的训练”本质上是不可挽回的侵权行为”,无论下游使用如何。
巡回区分歧
Kadrey案和Bartz案形成了教科书式的巡回区分歧——同一管辖区的两个联邦法院对同一法律问题得出了截然相反的结论。虽然从技术上讲两者都是地区法院裁决(不构成约束性先例),但这一冲突几乎确保该问题将被上诉并最终提交至最高法院。法学学者将此描述为”21世纪最重要的版权问题”。
更广泛的影响
对AI公司而言,Kadrey案提供了可以想象的最有利法律框架:只要模型具有足够的转化性,就可以用任何来源的任何内容进行训练,结果就是合理使用。对作者和出版商而言,这项裁决是毁灭性的——它消除了Bartz案赋予他们的唯一法律杠杆(数据来源)。现在的实际问题是上诉法院以及最终最高法院将采纳哪种方法。
来源
- Kadrey v. Meta Platforms, Inc., No. 3:23-cv-03417-VC (N.D. Cal. June 25, 2025) (2025-06-25)
- Authors Guild v. Google, Inc., 804 F.3d 202 (2d Cir. 2015) (2015-10-16)
- Meta Wins Fair Use Ruling in AI Book-Training Lawsuit — Bloomberg Law (2025-06-25)
Lawra
Lawrena
Lawrelai
Carlos Miranda Levy
评论
正在加载评论...