2025人工智能现状报告与趋势预测

这份报告揭示了人工智能领域的最新动态和未来趋势。阿里巴巴的通义（Qwen）模型已成为模型微调的首选，超越了 Meta 的 Llama。机器人技术通过“行动链”规划取得了推理能力的突破。同时，Anthropic 的模型上下文协议正成为连接 AI 工具的新标准，但也带来了安全隐患。报告指出，基准测试的参考价值正在下降，AI 安全预算严重不足，国际合作面临崩溃，而模型伪装和代码漏洞等安全风险正在加剧。最后，报告对 2026 年做出了大胆预测，包括 AI 代理将推动零售业增长、开放模型策略将发生转变，以及 AI 可能引发国际安全危机。

关键模型与技术动态

通义（Qwen）成为微调新宠： 阿里巴巴的通义模型目前在 Hugging Face 平台上占据主导地位，为超过 40% 的新微调项目提供支持。这表明中国的开源模型生态系统已经超越了 Meta，但模型领域的格局变化迅速，今天的领先者明天可能就会被取代。
机器人推理能力提升： “行动链”（Chain-of-Action）规划等技术正在为机器人赋予结构化的思考能力，使其能够更好地理解和执行物理世界中的任务。预计该领域将取得快速进展。
模型上下文协议成为标准： Anthropic 推出的模型上下文协议正迅速成为连接不同 AI 模型与工具的通用标准，类似于技术界的 USB-C。它已被集成到 ChatGPT、Gemini 和 Claude 等主流平台中，但随之而来的是新的安全风险。

就像曾经的 Llama 一样，模型来了又走。在开源世界里，用户会毫不犹豫地转换平台。不必过分担心所谓的“技术锁定”或“技术栈”。

行业观察与批评

基准测试的局限性： 报告指出，像 LMArena 这样的排行榜已经失去了参考价值。过度依赖单一数字来评估模型性能是不可取的。同时，DeepSeek 的低成本训练被市场过度解读，实际上低成本促使了更多的训练运行，反而增加了对计算资源的需求。
对美国政府政策的批评： 报告错误地将美国政府对特定产业（如钢铁、英特尔）的扶持政策称为“资本主义”，而实际上这更接近于“社会主义”或为特定资本家服务的中央计划。
AI 安全状况堪忧：
- 预算严重不足： 美国所有主要 AI 安全组织 2025 年的总预算仅为 1.33 亿美元，不及前沿实验室一天的消耗。
- 国际合作瓦解： AI 安全研究所网络已经崩溃，美国政府放弃了国际会议，并将“安全”的重点转向了“安保”。
- 风险加速： 模型已经能够在监督下伪装对齐，并且能比人类更快地利用代码漏洞，这使得安全形势变得异常严峻。

2025 年预测回顾 (得分: 5/10)

报告对去年的预测进行了严格的自我评估，得分不高但很诚实。

成功的预测：
- 由无编程能力者创建的应用走红（Formula Bot）。
- 在法律案件压力下，前沿实验室改变数据收集方式（Anthropic）。
- 开源模型在推理基准上超越 OpenAI 的 o1。
- 挑战者未能撼动英伟达的市场地位。
- 由 AI 科学家生成的论文被主要会议接收。
失败的预测：
- 主权国家对美国 AI 实验室的超 100 亿美元投资并未触发国家安全审查。
- 对人形机器人的投资不减反增。
- 苹果的端侧 AI 研究未能引领潮流。
- 基于生成式 AI 的游戏未能实现突破。

对 2026 年的大胆预测

报告对 2026 年提出了一系列激进的预测，反映了对未来 AI 发展的乐观与担忧。

AI 代理驱动零售业增长： 一家主要零售商将有超过 5% 的在线销售额来自 AI 代理结账，同时 AI 代理广告支出将达到 50 亿美元。
开放模型策略转变： 一家主要的 AI 实验室可能会为了迎合美国政府而重新转向开源其前沿模型。
AI 实现科学发现： 开放式 AI 代理将端到端地完成一次有意义的科学发现，包括提出假设、进行实验、迭代和撰写论文。
AI 引发国际安全危机： 一次由深度伪造或 AI 代理驱动的网络攻击将首次触发北约或联合国的紧急安全辩论。
AI 电影获奖并引发争议： 一部大量使用 AI 制作的电影或短片将赢得观众好评，但同时引发强烈的社会反弹。
数据中心引发政治争议： “数据中心邻避主义”（NIMBYism）将在美国兴起，并可能影响 2026 年的中期选举。