开发者为何偏爱老牌AI模型？数据给出答案

对 Sonnet 4.5、Sonnet 4.0 和 GPT-5 三款 AI 模型在真实编程场景下的使用数据进行分析后发现，开发者已不再盲目追求最新版本。相反，他们开始根据具体任务选择最合适的模型：Sonnet 4.5 擅长深度推理和处理复杂的多文件任务，但响应较慢；Sonnet 4.0 则因其快速、稳定的表现，成为自动化和结构化任务的首选；GPT-5 在代码解释和文档撰写方面表现出色。这一趋势表明，AI 模型正进入一个功能专精的阶段，未来的重点是为任务匹配最合适的“认知风格”，而不是寻找一个全能的“最强模型”。

模型选择出现分化，而非简单升级

数据显示，在 2025 年 10 月的第一周，最新模型 Sonnet 4.5 的使用份额从 66% 下降到 52%，而旧版 Sonnet 4.0 的份额则从 23% 上升至 37%。GPT-5 的使用率保持在 10-12% 左右。

如果开发者只是简单地升级到最新版本，那么 Sonnet 4.5 的使用率应该持续上升。但事实恰恰相反，这表明开发者将新旧模型视为不同用途的替代品，而非简单的迭代品。这标志着 AI 在实际生产环境中开始走向专业化分工。

不同模型的行为差异：深度思考 vs. 快速行动

尽管 Sonnet 4.5 生成的总内容更多，但它在处理每个用户请求时调用工具的次数却比 Sonnet 4.0 少。

Sonnet 4.5：想得更多，做得更少。 它在行动前会进行更多的内部推理，这使得它的回应更具上下文关联性，但响应速度较慢。
Sonnet 4.0：想得更少，做得更快。 它倾向于频繁、快速地执行任务，而不是进行长时间的思考。
GPT-5：偏向解释。 它的行为模式接近 Sonnet 4.5，但更倾向于使用自然语言进行推理，而不是调用工具。

这种“多思考，少行动”的模式是否能带来更好的结果，还有待观察。如果更高的内部推理能力确实能提高任务成功率，那么 Sonnet 4.5 的策略就是有效的。

系统资源消耗的转变

从系统层面看，不同模型的资源消耗模式也存在差异。Sonnet 4.5 处理的数据量更大，其缓存读取量也远高于其他模型。

这可能意味着，随着模型推理能力的增强，更多的计算资源被用于管理和复用上下文信息，而不仅仅是生成新的文本。推理强度和缓存利用率正成为衡量模型性能的核心指标。

功能专精：每个模型的独特优势

开发者的使用习惯清晰地揭示了每个模型的特定优势领域。

Sonnet 4.5
- 强项: 长上下文推理、多文件理解、自主规划。
- 典型用途: 代码重构、复杂问题调试、系统设计。
- 用户反馈: 思维缜密，但在简单任务上可能显得“想太多”或响应慢。
Sonnet 4.0
- 强项: 输出结果稳定、格式一致、对工具调用友好。
- 典型用途: API 生成、结构化编辑、基于规则的转换。
- 用户反馈: 快速、可靠，是自动化任务的“安全默认选项”。
GPT-5
- 强项: 解释流畅、通用推理能力强、擅长结合代码与文档。
- 典型用途: 代码讲解、内容摘要、开发者教学。
- 用户反馈: 在解释和文档撰写方面表现出色，但在需要大量工具执行的任务中稍显逊色。

核心要点总结

从这些数据中可以得出三个初步结论：

选择正在多样化，而非趋同。 新模型并不总是在所有工作场景中都优于旧模型。
行为差异是可衡量的。 Sonnet 4.5 更倾向于深度思考，而 Sonnet 4.0 更倾向于频繁行动。
系统成本的关注点正在转移。 推理的深度和缓存的利用效率，正成为新的关键性能指标。

这里的关键信息不是哪个模型更好，而是每个模型都在发展自己的专长。成功的关键不再是追求一个最强的通用模型，而是为手头的任务找到最匹配的认知风格。