聊天机器人的黄昏

人工智能正以指数级速度发展，其能力已远超简单的对话，能够独立完成过去需要人类数周才能完成的复杂任务。这种进步正推动我们从与聊天机器人协作，转向将工作完全委托给 AI “智能体”。在这种新模式下，领域专家比普通用户更能发挥 AI 的效力，其角色也转变为 AI 的管理者。这种能力上的飞速跃升导致了持续的不稳定，因为社会和商业机构难以适应这种非人类的增长速度。

加速的现实：AI 能力呈指数级增长

如果你感觉人工智能的发展正在加速，那么你的感觉是对的。这种加速不仅体现在模型的发布频率上，更体现在其完成真实工作的能力上。

完成工作的体量剧增： 多项评估显示，AI 单次运行可以完成的工作量正在以超指数级的速度增长。
具体的例子： 一个名为 Opus 4.7 的模型在自主工作 14 小时后，构建了一个需要人类工程师 2 到 17 周才能完成的软件包。
中美模式的差异： 尽管最前沿的模型来自美国的 Anthropic、OpenAI 和谷歌，但中国也涌现出许多性能稍逊但同样在指数曲线上进步的开源模型。

为了获得真正的洞察，你需要亲自尝试将 AI 用于不同的案例，并严格评估它们在你所关心领域的表现。

随着 AI 系统能够执行越来越长的任务，那些难以用基准衡量的因素，如设计、风格和判断力，正变得愈发重要。

使用方式的变革：从协作到委派

随着 AI 能力的提升，我们使用它的方式也在发生根本性的改变。过去，主流用法是将其作为一种“协同智能”，通过不断地提示和检查来引导 AI 完成工作。

如今，这种模式虽然仍然有用，但已不再是创造高价值工作的核心方式。我们正在从与聊天机器人协作，转向直接向智能体 (Agents) 分配任务。

聊天机器人 (Chatbots): 需要持续的人工干预和引导，适用于辅助性工作。
智能体 (Agents): 能够长期、自主地运行和自我纠正，无需持续的人工介入，适用于完成整个项目。

工作正越来越多地关乎于向智能体分配任务，而不是与聊天机器人一同工作。

OpenAI 的内部研究显示，这种转变正在其组织内部迅速发生，并且不仅仅局限于程序员。法律、人力资源等非技术部门也以几乎相同的速度采纳了智能体。

专家的优势：成为 AI 的管理者

一个有趣的现象是，在使用 AI 完成特定任务时，用户的专业背景变得不那么重要，而领域经验则至关重要。

一项研究发现，无论是软件工程师还是其他专业人士，在使用 AI 编程工具时的成功率相似。真正拉开差距的是使用者在特定领域的专业知识深度。

领域专家更成功： 某人在一个领域越有经验，就越能成功地使用 AI 在该领域完成任务。
产出效率更高： 专家能从每一次与 AI 的交互中获得更有价值的产出。

我们正在进入一个新的世界：

从非专家使用聊天机器人来填补知识空白，转向专家使用智能体来完成实际工作。

在这种模式下，使用 AI 的最佳方式是将自己看作一名管理者，负责设定目标、提供关键知识和评估最终结果。

身处指数曲线中的不适感

指数级增长意味着在每个固定的时间窗口内，变化都比上一次更大。这就是为什么 AI 的发展总让人感觉像是一系列突然的“飞跃”或“冲击”。

我们非常不擅长从内部感受指数级增长，而我们现在正身处其中。

这种感觉可以解释当前围绕 AI 的种种动荡：

政策的突变： 当 AI 的能力“突然”跨过某个阈值，足以构成真正的网络安全威胁时，政府最高层便会仓促出台应对政策。
市场的剧烈波动： 当 AI 的能力“突然”威胁到某个商业模式时，相关股票就会出现大幅震荡。

许多人将这些剧变解读为一个不成熟领域终将稳定的标志，但事实可能并非如此。这种不稳定，正是以人类速度运行的机构（甚至是以委员会速度运行的机构）试图跟上一个本质上非人类的能力曲线时所发生的必然现象。 只要我们还处于指数增长曲线上，这种差距只会越来越大。