2026-01-16 20:30:34

谷歌Gemini被控版权侵权出版商要求禁令与赔偿

摘要

阿歇特与圣智学习集团联合起诉谷歌，指控其在训练Gemini时大规模盗用受版权保护书籍，涉及2亿次版权符号，称此举为‘历史性的版权侵权’。案件聚焦人工智能训练数据合法性问题。

周四，阿歇特图书集团和圣智学习集团等主要图书出版商向加州联邦法院提交动议，要求介入针对谷歌的集体诉讼。该诉讼指控谷歌通过“历史性的版权侵权”构建其Gemini人工智能平台，涉嫌在未获授权的情况下复制大量受版权保护的书籍内容。 H2: 谷歌被指系统性绕过版权许可原告指出，谷歌并非通过合法渠道获取内容，而是从Z-Library、b-ok.org、OceanofPDF及WeLib等被美国政府认定为盗版市场的网站下载作品，并在人工智能训练过程中反复复制至内存、格式化后导入模型训练集。诉讼文件显示，谷歌使用的C4数据集包含来自至少28个非法网站的内容，其中部分网站已被查封。 H2: 数据集中现超2亿次版权符号起诉书强调，版权符号（©）在C4数据集中出现超过2亿次，表明大量受保护作品被直接纳入训练流程。尽管谷歌在数据中排除了“使用条款”和“政策声明”警告，却保留了付费墙后内容、盗版作品以及原创创意元素，构成实质性侵权。 H2: 从付费平台规避许可协议出版商还指控谷歌从Scribd.com等订阅制图书馆复制内容，规避了合法授权机制。同时，非营利数据提供商Common Crawl被指采取“责怪受害者”的立场，声称若不希望内容被上网，就不应发布——这一逻辑被批评为无视创作者权益。 H2: Gemini生成内容涉嫌替代原作诉讼进一步指出，当前Gemini输出的产品已具备替代性：包括逐字复制品、详细摘要，甚至抄袭原创结构与创意元素的仿制品，对出版市场构成直接冲击。 H2: 出版商寻求法律救济与数据透明各方诉求包括法定赔偿、永久禁令以阻止未来侵权行为、命令谷歌销毁所有未经授权的副本，并强制披露用于训练Gemini的具体书籍清单。此次动议是在2023年多起作者发起的版权诉讼背景下提出，此前联邦法院对Meta与Anthropic的类似案件作出部分胜诉判决，认定合理使用成立，但批评其长期保留盗版数据库。目前，谷歌与出版商法律顾问均未就此事发表公开回应。此案或将对人工智能训练数据的合法性边界产生深远影响，成为数字时代版权治理的关键判例。