Synth Daily

迄今为止,我在 Opus 4.5 上的体验,和以往常规的 AI Agent 完全不一样

最初对 AI 编码能力的怀疑,在体验了 Claude Opus 4.5 后转变为确信。这个模型展现了前所未有的自主开发能力,能够独立完成从简单的桌面工具到包含后端服务的复杂移动应用。它不仅能编写代码,还能自动调试、修复错误并部署资源。作者通过构建四个不同复杂度的项目,证明了 AI 能够处理真实世界的开发任务。尽管开发者可能不完全理解 AI 生成的每一行代码,但通过采用一种为 AI 优化的编码规范,可以确保代码质量和可维护性。结论是,AI 正在根本性地改变软件开发,开发者应当拥抱这一变革,利用 AI 加速创造,同时警惕其带来的安全风险。

与众不同的 Opus 4.5

过去的 AI 编程助手体验通常令人失望,它们往往:

  • 生成混乱无序的“意大利面式代码”。
  • 在反复的复制粘贴和错误修复后,反而会破坏现有的代码库。
  • 浪费大量时间,最终成果寥寥。

然而,Opus 4.5 感觉像是 AI 承诺的真正兑现。它在初次尝试时就能做对大部分事情,并且当遇到错误时,它会自行读取错误日志、分析问题并迭代修正,直到问题解决。

项目实战:从简单工具到全栈应用

为了验证 Opus 4.5 的能力,我用它构建了几个真实世界的项目。

项目一:Windows 图像转换工具

这是一个简单的桌面应用,允许用户通过右键菜单转换图片格式。

  • 快速实现: Opus 4.5 几乎一次性就完成了核心功能。
  • 自主调试: 它能通过命令行工具 dotnet CLI 自动检测并修复编译错误。
  • 完整交付: 它还创建了项目网站、打包了安装程序,并配置了 GitHub Actions 自动化发布流程。

项目二:屏幕录制与编辑工具

受第一个项目的鼓舞,我决定构建一个更复杂的应用,类似于 GIF 录屏工具。

  • 功能扩展: 项目从简单的 GIF 录制轻松扩展到视频录制、静态图像捕捉、添加图形、裁剪和模糊等高级编辑功能。
  • 惊人效率: 在短短 数小时内 就取得了巨大进展。

这证明了 Opus 4.5 不仅能处理简单的任务,还能构建功能丰富的桌面应用程序。

项目三:AI 社交媒体发布应用

这是一个全栈移动应用,旨在解决实际的业务问题:为我妻子的公司自动生成和发布 Facebook 帖子。

  • 处理复杂性: 该项目涉及多个棘手部分,包括 Facebook 身份验证、用户认证、后端数据库、文件存储和定时任务。
  • 后端自主管理: Opus 4.5 选择了 Firebase 作为后端,并使用其命令行工具自主创建和配置所需的所有云资源,甚至能自动读取云函数日志来定位和修复后端错误。
  • 完整功能: 在我安装百叶窗的几个小时里,Opus 4.5 构建了一个功能齐全的 iOS 应用和一个配套的后台管理仪表盘。

项目四:订单追踪与路线规划

这个应用进一步扩展,旨在取代我妻子正在使用的两个付费 App。

  • 集成外部服务: 应用需要解析 Gmail 邮件来获取订单,并集成地图服务进行路线优化和驾驶时间追踪。
  • 无缝对接: Opus 4.5 再次轻松处理了复杂的 Google 身份验证和邮件集成,这些任务手动完成通常非常痛苦。

“但你不懂代码”:一个不再重要的问题

我确实不完全了解这些应用(尤其是 Swift 写的 iOS 应用)的内部工作原理。过去,这会是一个巨大的障碍,因为我无法在出现问题时进行诊断。但现在,Opus 4.5 总能自己发现并修复它自己的 bug

真正的问题是代码质量。如果人类不阅读代码,我们如何保证其质量?我的观点是:我们可能不再需要为人类的可读性而优化代码了。当 AI 负责编写、维护和解释代码时,优化的目标也随之改变。

你好,我是一名 AI 优先的软件工程师。我假设所有代码都将由 LLM 编写和维护,而不是人类。请为模型的推理、重新生成和调试进行优化,而不是为了人类的美学。

我使用这样的自定义指令来引导 Opus 4.5 编写更适合 AI 维护的代码。其核心原则包括:

  • 结构简单: 使用扁平、明确的代码,避免复杂的抽象。
  • 低耦合: 确保文件可以被安全地重写而不破坏系统。
  • 流程线性: 保持控制流程简单直接。
  • 明确日志: 在关键边界输出详细的结构化日志,使错误明确且信息丰富。

重构与安全:新的挑战

尽管 Opus 4.5 表现出色,但仍需要人类监督,尤其是在重构和安全方面。我会定期让它检查代码库,找出可以简化、删除或重构的部分。

然而,最令人担忧的是安全问题。API 密钥在哪里?登录处理是否正确?敏感数据是否安全存储?这部分仍然需要大量手动检查,而我目前对这些 AI 生成应用的安全性只有大约 80% 的信心。

我不确定自己是应该为现在几小时内就能构建的东西感到兴奋,还是为我花了一辈子学习的技能现在对计算机来说微不足道而感到沮丧。两者都是真的。

现实是,AI 正在改变一切。与其试图弄清自己在 AI 优先世界中的位置,不如开始动手创造。现在,你可以比以往任何时候都更快地将想法变为现实。

只要确保你知道你的 API 密钥放在哪里就行。