通过 BitTorrent 上传盗版书籍也算合理使用？Meta 如是辩称

Meta 因使用盗版书籍训练其 Llama 模型而陷入法律纠纷。尽管法院此前裁定“训练模型”本身属于合理使用，但 Meta 通过 BitTorrent 协议下载并自动上传这些书籍的行为，被作者方指控为直接侵权。Meta 对此提出辩护：在 BitTorrent 网络中，上传是下载过程中不可避免的技术特征，因此这种伴随性的分发也应被视为合理使用的一部分。此案的最终结果将对 AI 行业如何获取和使用大规模训练数据集产生深远影响。

争议焦点：技术机制与版权侵权

Meta 承认通过 Anna’s Archive 等“影子图书馆”获取书籍，并使用了 BitTorrent 协议。争议在于该协议的工作原理：

自动分享机制： BitTorrent 在下载文件的同时，会自动向其他用户上传已下载的部分。
直接侵权指控： 原告作者认为，这种主动向他人分发版权书籍的行为构成了直接版权侵权。
Meta 的立场： 这种上传并非 Meta 的主动选择，而是技术的必然结果。

Meta 的核心辩护逻辑

Meta 的律师认为，既然训练 AI 本身是合法的“转换性使用”，那么实现这一目标所必需的技术手段也应受到保护：

效率与唯一性： Meta 称 BitTorrent 是获取海量数据的最有效方式，且某些数据集仅能通过此渠道批量获取。
合法的延伸： 如果下载是为了“合理使用”的训练目的，那么作为下载过程一部分的上传行为，也应共享这一法律性质。

Meta 使用 BitTorrent 是因为它是获取数据集更高效、可靠的手段……这在本质上是下载过程的一部分，旨在促进 Meta 的转换性合理使用目的。

程序争议与作者的反击

原告作者对 Meta 在诉讼后期才提出这一辩护理由表示强烈不满：

程序违规： 作者方律师致信法官，指责 Meta 试图在证据交换截止日期后绕过程序增加新的辩护理由。
蓄意隐瞒： 他们指出，Meta 至少从 2024 年 11 月起就知晓上传指控，却一直未曾提及“合理使用”这一辩护点。

对现实影响的评估

Meta 试图通过淡化实际损害来支撑其论点。在证词中，几位知名作者承认：

无侵权输出： 他们无法证明 Meta 的模型输出了与原著重复的内容。
市场损害轻微： Meta 认为，既然作者无法证明 AI 导致了销量损失或直接抄袭，那么这起诉讼更多是在挑战训练过程本身，而这一过程此前已被判为合法。

Meta 进一步将此案上升到国家战略高度，声称对 AI 的投资有助于确立美国在全球的领先地位，案件的走向将关乎国家竞争优势。