扎克伯格“亲自授权并鼓励”Meta 的版权侵权行为

多家出版商与作家联合起诉 Meta 及其首席执行官马克·扎克伯格，指控其为训练 Llama AI 模型而进行了“史上最大规模”的版权侵权。诉讼的核心论点是，扎克伯格 亲自授权并鼓励 公司放弃合法授权途径，转而非法复制数百万受版权保护的书籍和文章。Meta 则以 AI 训练属于“合理使用”为由进行辩护，一场关于 AI 发展与知识产权界限的法律战就此展开。

核心指控：系统性的侵权行为

原告指控 Meta 的行为并非无心之失，而是一系列有预谋的侵权活动。具体行为包括：

非法复制： 未经授权复制了数百万本书籍、期刊文章及其他文字作品。
规避保护： 故意绕过版权保护机制。
移除信息： 删除了作品中的版权管理信息，以掩盖其训练数据的来源。
侵权规模巨大： 据称，被盗用的数据量高达 267 TB，相当于美国国会图书馆纸质馆藏的数倍。

扎克伯格的直接参与

诉讼将矛头直接指向了公司最高层，声称扎克伯格本人是侵权行为的关键决策者。

根据诉讼文件，Meta 曾短暂考虑过与出版商达成授权协议，并讨论将“数据集授权”预算增加至 2 亿美元。然而，在 2023 年 4 月初，这一策略突然中止。

“是否继续授权还是盗用（受版权保护的材料）的问题被‘上报’给了扎克伯格。在此之后，Meta 的业务发展团队收到了停止授权工作的口头指示。”

诉讼引用一名 Meta 员工的观点，解释了这一转变的动机：“如果我们哪怕只授权了一本书，我们就无法再依赖‘合理使用’的策略了。” 这表明，侵权决策是为了 保留法律上的辩护空间 而做出的战略选择。

对盗版来源的明知故犯

诉讼指出，Meta 员工清楚地知道他们使用的某些数据集存在法律风险。一份内部备忘录曾讨论过使用 LibGen（一个知名的盗版材料库）的风险，称其为“一个我们知道是盗版的数据集”，并建议“我们不会披露使用了 LibGen 数据集进行训练”。

尽管内部存在担忧，但这些警告最终未被采纳。诉讼称，扎克伯格和其他高管最终 授权并指示下载了大量盗版材料。

侵权带来的后果

原告认为，Meta 的 AI 系统通过学习这些被侵权的作品，现在已经能够大规模、高速度地生成原作的替代品。这些替代品的形式多种多样，包括：

逐字或近乎逐字的复制
学术教科书的替代章节
著名小说和文章的摘要或改编版本
模仿原作创意元素的衍生作品

更重要的是，Llama AI 甚至可以 模仿特定作者的表达方式和创作选择，这直接损害了原作者的独有权利。Meta 的回应是，AI 训练在法院已被认定可能属于“合理使用”，公司将对此案积极应诉。