Reddit起诉Perplexity及另外三家公司，指控其“白嫖”内容

Reddit 正在起诉 Perplexity 及另外三家数据公司，指控它们未经许可，通过抓取搜索引擎结果来“白嫖”其平台内容，以规避为 AI 训练数据支付授权费。Reddit 不仅要求经济赔偿，还寻求法院发布永久禁令，阻止这些公司继续使用其数据。

诉讼的核心：绕过付费墙

自 2023 年起，Reddit 开始向希望访问其内容的公司收费，旨在将其庞大的用户数据商业化，尤其是在 AI 训练领域。

此次诉讼涉及多家公司，但矛头尤其指向了 AI 公司 Perplexity。

数据抓取公司： SerApi、OxyLabs 和 AWMProxy 都是以从搜索结果中收集并销售数据为核心业务的公司。
AI 公司 Perplexity： 作为一家 AI 公司，Perplexity 需要大量数据来训练其模型。它此前已被指控未经授权复制内容，并无视网站的 robots.txt 协议（一种网站用于告知爬虫不要抓取其内容的标准）。

Reddit 称其掌握了 Perplexity 非法抓取内容的直接证据。在发出停止侵权函后，Perplexity 一方面否认使用 Reddit 数据，另一方面其聊天机器人却继续引用 Reddit 的内容。

为了证实这一点，Reddit 进行了一个实验：

诉讼文件指出：“Perplexity 能够获取该 Reddit 内容并将其用于其‘问答引擎’的唯一途径，就是它或其共同被告从谷歌（搜索结果）中抓取了该内容，然后迅速将其整合到自己的引擎中。”

在被要求置评时，Perplexity 发表了以下声明：

Perplexity 尚未收到诉讼文件，但我们将始终为用户自由、公平地获取公共知识的权利而积极抗争。我们提供带有准确 AI 的事实性答案，我们的方法始终是原则性和负责任的，我们不会容忍对开放性和公共利益的威胁。