Synth Daily

今天的 PR 垃圾信息,看起来就像 2000 年代初的电子邮件垃圾邮件。

AI 编码工具的普及让开源项目的贡献数量激增,但也带来了大量低质量、重复的“刷屏式”提交,导致代码合并率大幅下降。这预示着未来开源社区将更依赖贡献者的信誉和身份验证机制。当所有人都使用相似的 AI 工具时,贡献思路会趋于同质化,最终真正有价值并被采纳的,是那些需要深度理解代码库、依赖人类经验和判断力的改动,而非 AI 就能完成的简单功能。

PR 将需要发送者信誉

如今的 PR 垃圾信息,看起来就像 2000 年代初的电子邮件垃圾邮件。

以 OpenClaw 项目为例,它曾在一夜之间成为 GitHub 上增长最快的代码库。这种增长带来了惊人的变化:

  • 贡献量激增: Pull Request (PR) 数量从去年 12 月的每周 2 个,飙升到今年 2 月的每周 3,400 个。
  • 合并率暴跌: 在此之前,约 48% 的 PR 会被合并;之后,这一比例降至不足 9.3%。

许多被拒绝的 PR 都是由 AI 编码代理生成的低质量内容。例如,一名贡献者在一天内提交了 106 个 PR,提交间隔的中位数仅为 3 秒。

当发送成本接近于零,而人们又信任平台时,就会出现问题。这正是 2000 年代初电子邮件面临的状况,也是今天 PR 遇到的问题。

解决方案也与当年的电子邮件类似:建立黑名单、基于可信度的过滤器和发送者声誉基础设施。如今,你的邮件能否进入收件箱,取决于你是谁以及你的发送历史

OpenClaw 项目已经开始根据贡献者的声誉进行筛选:

  • 首次贡献者的合并率为 8.2%
  • 提交过 2-5 次 PR 的贡献者,合并率为 10.3%
  • 提交超过 5 次的老手,合并率则达到 18.6%

为了应对 AI 生成的低质量 PR,一些项目甚至开始开发专门的信任管理系统(如 Vouch),它会明确标记不良行为者,未经验证的用户则无法提交贡献。这本质上就是开源领域的发送者信誉评分

如果想法都一样,人再多也没用

Linux 的创造者 Linus Torvalds 有一句名言:“只要有足够多的眼睛,所有 bug 都无处遁形。”

这句话的前提是,更多的眼睛能带来多样化的视角。但当所有人都开始使用 Claude、Devin 等相似的 AI 工具时,这个前提可能就不成立了。

在 OpenClaw 项目中出现了以下情况:

  • 4 名贡献者提交了标题完全相同的 PR:“feat(web-search): add SearXNG as a search provider”。
  • 6 个人独立修复了同一个 Brave 搜索的 bug,其中两人提交的 PR 标题一模一样,时间仅相隔 94 分钟。
  • 5 个人独立发现了代理运行器中同一个超时死锁问题。

尽管关注 OpenClaw 的眼睛比以往任何时候都多,但他们的视角却被 AI 工具过滤和趋同了。如果大多数贡献者使用相同的 AI、输入相似的提示,他们的贡献自然也会变得相似。开源的优势在于思想的多样性,而 AI 的滥用正在削弱它。

什么内容真正被合并了?

在 OpenClaw 的数据中,不同类型的 PR 合并率差异巨大:

  • 新功能 (features) 的合并率为 9%
  • 代码重构 (refactors) 的合并率高达 35%

思考比敲代码重要得多。

数据显示,需要深度理解现有代码库的贡献,其价值是普通新功能贡献的近 4 倍。这就像建筑行业从“总设计师兼建造师”演变为“建筑师”和“施工队”一样。今天,在软件开发中,那些能被合并的贡献,越来越多的是像建筑师一样的工作——需要对现有系统进行深入理解和判断,而不是 AI 就能独自完成的施工任务。

一个真正研究过代码库的开发者,会比一个不了解背景的人给出更精准的 AI 提示,从而得到质量更高的输出。

未来会怎样?

开源社区正以前所未有的速度构建工具。这种速度带来的新问题,将推动我们在身份、声誉和贡献验证方面建立更好的机制。虽然 AI 带来了混乱,但也证明了社区的强大潜力。开源社区过去曾解决过更棘手的问题,这次也不例外。