在过去一年里,基于大型语言模型(LLM)的编程智能体取得了巨大进步,能完成约九成的代码编写工作。这不仅颠覆了传统集成开发环境(IDE)的地位,也让开发者重新拥抱轻量级编辑器。文章认为,尽管目前仍需依赖最昂贵的顶尖模型,且内置沙箱功能不可靠,但智能体极大地提升了编程效率和乐趣。开发者应拥抱这一变革,推动软件设计回归到更贴近程序员需求的本质,从而实现更高效、更具创造性的开发体验。
智能体在一年内飞速发展
大型语言模型在编码能力上的进步是显而易见的。一年前,最好的模型大约能写 四分之一 的代码;而现在,最新的模型已经能编写 九成 的代码。虽然所有代码仍需人工审查和调整,但现在连调整工作也可以交给模型来完成。
这种进步并非源于模型的结构性突变,而是持续的、巨大的增量改进。这直接改变了开发者的工作模式:
- 在大公司: 过去代码阅读与编写的比例是 80:20。
- 在初创公司: 过去这个比例接近 50:50。
- 现在使用智能体: 这个比例变成了 95:5,开发者绝大部分时间都在阅读和指导,而非亲手编写。
IDE 的衰落
曾几何时,集成开发环境(IDE)及其集成的 Copilot 功能被认为是编程的未来,因为它们极大地提升了“打字”效率。然而,功能更强大的智能体的出现迅速改变了这一局面。
“我对 Copilot 未来的确定性,以及不到四年后智能体就给了我一个更好工具所带来的惊人反转,至今仍让我感到惊讶。”
如今,开发者不再需要功能臃肿的 IDE。唯一常用的 IDE 特性,如“跳转到定义”(go-to-def),像 Vi/Neovim 这样的轻量级编辑器也能轻松实现。因此,在诞生 50 年后,Vi 又回来了。
必须使用最前沿的模型
在智能体领域,一个明确的法则是:使用任何非顶尖模型都是在浪费时间,甚至是有害的。
为了省钱而使用廉价模型,或者尝试性能不佳的本地模型,不仅会让你对智能体的能力产生错误的认知,还会学到错误的经验。虽然本地模型最终会迎头赶上,但在那之前,要了解这项技术的真正潜力,就必须使用最好、最贵的模型,例如 Opus 或最新的 GPT 系列。
别用内置沙箱
当前主流智能体内置的沙箱功能非常不可靠,它们要么不断请求权限,要么无法执行基本操作。正确的做法是 关掉内置沙箱,使用自己的。
最推荐的方案是:使用一个全新的、独立的虚拟机(VM)环境。这能为智能体提供一个无限制且安全的操作空间。
拥抱新工具,重塑软件开发
智能体的出现正在深刻地改变软件的形态。许多现有的软件产品和服务都显得“形状不对”。例如,与其使用 Stripe Sigma 内置的、功能有限的 LLM 来查询数据库,不如直接让智能体通过标准 API 拉取数据,在本地自行搭建一个查询系统。完成这一切,可能只需要向智能体输入三句话。
这种变化也催生了新的编程哲学:
最适合智能体的软件,就是最适合程序员的软件。过去,产品经理总是告诉工程师:“你不是用户。” 现在,这一切都被颠覆了。每个用户都会有一个智能体为他们编写代码。打造程序员喜爱的产品,用户自然会随之而来。
这种转变不仅没有带来恐惧,反而让编程变得比以往任何时候都更有趣。它让无数“希望有时间写的”程序变成了现实,带来了巨大的探索乐趣和成就感。对于那些对 LLM 持强硬反对态度的人,这种观点可能难以理解,就像争论木工是否应该禁用电锯一样。工具的进步是为了更高效地解决问题。