导语:一场关乎AI发展伦理与法律边界的“终极拷问”正在旧金山上演。由普利策奖得主领衔的作家群体向 OpenAI、谷歌等六大科技巨头提起集体诉讼,揭露了一条从“影子图书馆”到大模型训练的非法数据链条。这不仅是版权保卫战,更可能重构AI产业的数据供应链。
“双重盗版链条”浮出水面
AI 训练数据的“原罪”问题迎来史上最强法律挑战。两届普利策奖得主约翰·卡雷鲁(John Carreyrou)与数十位知名作家,正式向美国加州北区地方法院提起诉讼。被告名单几乎囊括了硅谷半壁江山:OpenAI、谷歌、Meta、Anthropic、xAI 以及 Perplexity AI。
诉状犀利地指出,这些科技巨头构建了一条清晰的“侵权闭环”:
- 盗版获取:从 LibGen、Z-Library 等所谓的“影子图书馆”批量下载数百万册受版权保护的书籍。
- 模型训练:将这些非法获取的“免费燃料”注入 ChatGPT、Gemini 等大模型,塑造其语言能力与知识深度。
- 商业变现:通过订阅和API服务获利,而作为“智慧基石”的原作者却分文未得。
原告方要求,若“故意版权侵权”罪名成立,每部作品最高索赔15万美元,总赔偿金额或将达到惊人的数十亿甚至上百亿美元。

合理使用 vs 故意侵权
这并非 AI 公司首次面临版权纠纷,但本案的特殊性在于原告聚焦于“盗版本质”。
以往,科技巨头多以“合理使用”(Fair Use)作为抗辩理由,主张 AI 训练属于“转化性使用”。但此次诉讼直指数据源头的非法性——如果训练数据本身就是通过盗版手段获取的,那么“合理使用”的逻辑基础便荡然无存。
目前,旧金山所在的加州北区法院已受理了全美超过50%的同类案件,成为 AI 版权风暴的中心。法院的最终裁决将可能确立全国性的法律先例:一旦认定侵权,AI 公司不仅面临巨额赔偿,甚至可能被迫清洗模型、删除数据。
AI 数据供应链或将重构
无论案件结果如何,行业地震已然发生。
AIbase 观察到,头部 AI 公司正在加速“洗白”数据来源,纷纷寻求与美联社、Shutterstock 等版权方达成正版授权。与此同时,开源模型社区面临严峻的合规压力,“影子图书馆”也可能成为执法部门的重点打击对象。
这场诉讼正在为“数据血汗”定价,也预示着 AI 的野蛮生长时代即将结束,一场深刻的合规革命正在重塑整个行业的未来。
相关推荐

2025 AI 技术峰会

AI 实战课程
热门工具
AI 助手
智能对话,提升效率
智能图像处理
一键美化,智能修图
AI 翻译
多语言实时翻译






评论 (0)
暂无评论,快来发表第一条评论吧!