平平无奇才是真
对大型语言模型 (LLMs) 的狂热正在降温,因为大多数公司尚未从中看到实际成效。我们常常被其流畅的语言能力所迷惑,高估了它们的真实智能。然而,这项技术的未来并非黯淡,而是将走向一个更“无聊”但极为实用的方向:小型语言模型 (SLMs) 将被用于处理低级别的、基于语法的语言任务,最终成为可靠的基础设施,通过自下而上的方式增强我们的工作,而非试图实现不切实际的自上而下的自动化。
热情退却:我们为何感到困惑
最初对 LLM 的狂热正在消退,这是有充分理由的。一份麻省理工学院的报告显示,实施这项技术的公司中有 95% 尚未看到积极成果。我们之所以会陷入这种困境,很大程度上是因为我们自己。
- 混淆了流畅与智能: 我们将 LLM 流畅的语言表达能力误解为真正的智能。它们实际上是“破解”了我们的社交协议,让我们误以为它们比实际更聪明。
- 泡沫正在破裂: 随着技术问题的暴露和炒作的降温,我们正在进入“幻灭的低谷期”。现在的问题是,当尘埃落定后,什么有价值的东西会留下来?
启示一:技术总是向下流动
技术的成熟过程往往伴随着形态的巨大变化,就像历史上的发电机一样。
早期的工厂依赖于一个巨大的中央发电机,通过复杂的滑轮系统为整个工厂供能,这使得工作流程非常受限。但随着发电机变得更小、更便宜,工厂可以将多个小型发电机放置在需要的地方,从而催生了流水线。动力开始适应工作流程,而不是反过来。
这个从大型、集中式到小型、分布式的模式正在 LLM 领域重演。
- 小型语言模型 (SLMs) 的兴起: 开源社区正在推动 LLM 的小型化,创造出各种挑战“越大越好”观念的模型。这些模型训练数据更少、参数更少,甚至可以在普通的个人电脑上高效运行。
- 关注更简单的任务: 我们不需要模型去通过律师资格考试。相反,许多公司开始将 SLM 用于更小、甚至“隐形”的任务,例如在后台重写搜索查询以提供更好的结果。用户甚至不知道 AI 的参与。
- SLMs 的优势: 这种专注于低级别语法任务的用法,不仅避免了“幻觉”的产生,还带来了额外的好处:它们更容易进行合乎道德的训练,并且运行成本极低。
启示二:我们通常从错误的道路开始
历史上,每当新技术出现时,我们总会因为担心落后而仓促地将其应用于错误的地方。从 80 年代的数据库到 90 年代末的互联网泡沫,我们总是先走上错误的道路,然后才慢慢摸索出正确的方向。
作者本人也曾试图用 LLM 来“自动写作”,结果并不理想。写作是一个艰难的过程,因为它迫使你去理解自己尚不理解的东西。试图用 AI 跳过这个充满“痛苦”的思考过程是行不通的。
然而,当他转变思路,将 LLM 用于更小的、辅助性的任务时,却取得了成功。
我在使用 LLM 方面取得了成功,是通过争取更小的胜利,利用其潜在的超能力:语言性的、语法驱动的语言任务。这主要用于校对和精简我杂乱的语音笔记。
这种用法没有让 LLM 代替思考,而是减轻了繁重的工作,提高了最终的产出质量。
走向平淡而正确的未来
LLM 并非智能体,我们也应该停止要求它们做“智能的事”。我们当前的错误在于,总是试图用它来进行自上而下的自动化,而实际上它更适合用来进行自下而上的增强。
将以上两个启示结合起来,我们未来的方向将是一个更高效但也更“无聊”的场景:使用 SLMs 来处理低级别的语言任务。当 AI 泡沫破裂后,这项技术将向下流动,融入更小、更高效、更可靠的组件中。
一项成熟的技术看起来不像魔法,它看起来像基础设施。 它会变得更小、更可靠,也更无趣。
我们的目标是解决问题,而不是看起来很酷。LLM 的真正价值在于成为我们工作中平平无奇但稳定可靠的一部分。