Synth Daily

扎克伯格“亲自授权并鼓励”Meta 的版权侵权行为

多家出版商与作家联合起诉 Meta 及其首席执行官马克·扎克伯格,指控其为训练 Llama AI 模型而进行了“史上最大规模”的版权侵权。诉讼的核心论点是,扎克伯格 亲自授权并鼓励 公司放弃合法授权途径,转而非法复制数百万受版权保护的书籍和文章。Meta 则以 AI 训练属于“合理使用”为由进行辩护,一场关于 AI 发展与知识产权界限的法律战就此展开。

核心指控:系统性的侵权行为

原告指控 Meta 的行为并非无心之失,而是一系列有预谋的侵权活动。具体行为包括:

  • 非法复制: 未经授权复制了数百万本书籍、期刊文章及其他文字作品。
  • 规避保护: 故意绕过版权保护机制。
  • 移除信息: 删除了作品中的版权管理信息,以掩盖其训练数据的来源。
  • 侵权规模巨大: 据称,被盗用的数据量高达 267 TB,相当于美国国会图书馆纸质馆藏的数倍。

扎克伯格的直接参与

诉讼将矛头直接指向了公司最高层,声称扎克伯格本人是侵权行为的关键决策者。

根据诉讼文件,Meta 曾短暂考虑过与出版商达成授权协议,并讨论将“数据集授权”预算增加至 2 亿美元。然而,在 2023 年 4 月初,这一策略突然中止。

“是否继续授权还是盗用(受版权保护的材料)的问题被‘上报’给了扎克伯格。在此之后,Meta 的业务发展团队收到了停止授权工作的口头指示。”

诉讼引用一名 Meta 员工的观点,解释了这一转变的动机:“如果我们哪怕只授权了一本书,我们就无法再依赖‘合理使用’的策略了。” 这表明,侵权决策是为了 保留法律上的辩护空间 而做出的战略选择。

对盗版来源的明知故犯

诉讼指出,Meta 员工清楚地知道他们使用的某些数据集存在法律风险。一份内部备忘录曾讨论过使用 LibGen(一个知名的盗版材料库)的风险,称其为“一个我们知道是盗版的数据集”,并建议“我们不会披露使用了 LibGen 数据集进行训练”。

尽管内部存在担忧,但这些警告最终未被采纳。诉讼称,扎克伯格和其他高管最终 授权并指示下载了大量盗版材料

侵权带来的后果

原告认为,Meta 的 AI 系统通过学习这些被侵权的作品,现在已经能够大规模、高速度地生成原作的替代品。这些替代品的形式多种多样,包括:

  • 逐字或近乎逐字的复制
  • 学术教科书的替代章节
  • 著名小说和文章的摘要或改编版本
  • 模仿原作创意元素的衍生作品

更重要的是,Llama AI 甚至可以 模仿特定作者的表达方式和创作选择,这直接损害了原作者的独有权利。Meta 的回应是,AI 训练在法院已被认定可能属于“合理使用”,公司将对此案积极应诉。