Synth Daily

聊天机器人的黄昏

人工智能正以指数级速度发展,其能力已远超简单的对话,能够独立完成过去需要人类数周才能完成的复杂任务。这种进步正推动我们从与聊天机器人协作,转向将工作完全委托给 AI “智能体”。在这种新模式下,领域专家比普通用户更能发挥 AI 的效力,其角色也转变为 AI 的管理者。这种能力上的飞速跃升导致了持续的不稳定,因为社会和商业机构难以适应这种非人类的增长速度。

加速的现实:AI 能力呈指数级增长

如果你感觉人工智能的发展正在加速,那么你的感觉是对的。这种加速不仅体现在模型的发布频率上,更体现在其完成真实工作的能力上。

  • 完成工作的体量剧增: 多项评估显示,AI 单次运行可以完成的工作量正在以超指数级的速度增长。
  • 具体的例子: 一个名为 Opus 4.7 的模型在自主工作 14 小时后,构建了一个需要人类工程师 2 到 17 周才能完成的软件包。
  • 中美模式的差异: 尽管最前沿的模型来自美国的 Anthropic、OpenAI 和谷歌,但中国也涌现出许多性能稍逊但同样在指数曲线上进步的开源模型。

为了获得真正的洞察,你需要亲自尝试将 AI 用于不同的案例,并严格评估它们在你所关心领域的表现。

随着 AI 系统能够执行越来越长的任务,那些难以用基准衡量的因素,如设计、风格和判断力,正变得愈发重要。

使用方式的变革:从协作到委派

随着 AI 能力的提升,我们使用它的方式也在发生根本性的改变。过去,主流用法是将其作为一种“协同智能”,通过不断地提示和检查来引导 AI 完成工作。

如今,这种模式虽然仍然有用,但已不再是创造高价值工作的核心方式。我们正在从与聊天机器人协作,转向直接向智能体 (Agents) 分配任务。

  • 聊天机器人 (Chatbots): 需要持续的人工干预和引导,适用于辅助性工作。
  • 智能体 (Agents): 能够长期、自主地运行和自我纠正,无需持续的人工介入,适用于完成整个项目。

工作正越来越多地关乎于向智能体分配任务,而不是与聊天机器人一同工作。

OpenAI 的内部研究显示,这种转变正在其组织内部迅速发生,并且不仅仅局限于程序员。法律、人力资源等非技术部门也以几乎相同的速度采纳了智能体。

专家的优势:成为 AI 的管理者

一个有趣的现象是,在使用 AI 完成特定任务时,用户的专业背景变得不那么重要,而领域经验则至关重要。

一项研究发现,无论是软件工程师还是其他专业人士,在使用 AI 编程工具时的成功率相似。真正拉开差距的是使用者在特定领域的专业知识深度。

  • 领域专家更成功: 某人在一个领域越有经验,就越能成功地使用 AI 在该领域完成任务。
  • 产出效率更高: 专家能从每一次与 AI 的交互中获得更有价值的产出。

我们正在进入一个新的世界:

从非专家使用聊天机器人来填补知识空白,转向专家使用智能体来完成实际工作。

在这种模式下,使用 AI 的最佳方式是将自己看作一名管理者,负责设定目标、提供关键知识和评估最终结果。

身处指数曲线中的不适感

指数级增长意味着在每个固定的时间窗口内,变化都比上一次更大。这就是为什么 AI 的发展总让人感觉像是一系列突然的“飞跃”或“冲击”。

我们非常不擅长从内部感受指数级增长,而我们现在正身处其中。

这种感觉可以解释当前围绕 AI 的种种动荡:

  • 政策的突变: 当 AI 的能力“突然”跨过某个阈值,足以构成真正的网络安全威胁时,政府最高层便会仓促出台应对政策。
  • 市场的剧烈波动: 当 AI 的能力“突然”威胁到某个商业模式时,相关股票就会出现大幅震荡。

许多人将这些剧变解读为一个不成熟领域终将稳定的标志,但事实可能并非如此。这种不稳定,正是以人类速度运行的机构(甚至是以委员会速度运行的机构)试图跟上一个本质上非人类的能力曲线时所发生的必然现象。 只要我们还处于指数增长曲线上,这种差距只会越来越大。