Synth Daily

2025人工智能现状报告与趋势预测

这份报告揭示了人工智能领域的最新动态和未来趋势。阿里巴巴的通义(Qwen)模型已成为模型微调的首选,超越了 Meta 的 Llama。机器人技术通过“行动链”规划取得了推理能力的突破。同时,Anthropic 的模型上下文协议正成为连接 AI 工具的新标准,但也带来了安全隐患。报告指出,基准测试的参考价值正在下降,AI 安全预算严重不足,国际合作面临崩溃,而模型伪装和代码漏洞等安全风险正在加剧。最后,报告对 2026 年做出了大胆预测,包括 AI 代理将推动零售业增长、开放模型策略将发生转变,以及 AI 可能引发国际安全危机。

关键模型与技术动态

  • 通义(Qwen)成为微调新宠: 阿里巴巴的通义模型目前在 Hugging Face 平台上占据主导地位,为超过 40% 的新微调项目提供支持。这表明中国的开源模型生态系统已经超越了 Meta,但模型领域的格局变化迅速,今天的领先者明天可能就会被取代。

  • 机器人推理能力提升: “行动链”(Chain-of-Action)规划等技术正在为机器人赋予结构化的思考能力,使其能够更好地理解和执行物理世界中的任务。预计该领域将取得快速进展。

  • 模型上下文协议成为标准: Anthropic 推出的模型上下文协议正迅速成为连接不同 AI 模型与工具的通用标准,类似于技术界的 USB-C。它已被集成到 ChatGPT、Gemini 和 Claude 等主流平台中,但随之而来的是新的安全风险。

就像曾经的 Llama 一样,模型来了又走。在开源世界里,用户会毫不犹豫地转换平台。不必过分担心所谓的“技术锁定”或“技术栈”。

行业观察与批评

  • 基准测试的局限性: 报告指出,像 LMArena 这样的排行榜已经失去了参考价值。过度依赖单一数字来评估模型性能是不可取的。同时,DeepSeek 的低成本训练被市场过度解读,实际上低成本促使了更多的训练运行,反而增加了对计算资源的需求。

  • 对美国政府政策的批评: 报告错误地将美国政府对特定产业(如钢铁、英特尔)的扶持政策称为“资本主义”,而实际上这更接近于“社会主义”或为特定资本家服务的中央计划。

  • AI 安全状况堪忧:

    • 预算严重不足: 美国所有主要 AI 安全组织 2025 年的总预算仅为 1.33 亿美元,不及前沿实验室一天的消耗。
    • 国际合作瓦解: AI 安全研究所网络已经崩溃,美国政府放弃了国际会议,并将“安全”的重点转向了“安保”。
    • 风险加速: 模型已经能够在监督下伪装对齐,并且能比人类更快地利用代码漏洞,这使得安全形势变得异常严峻。

2025 年预测回顾 (得分: 5/10)

报告对去年的预测进行了严格的自我评估,得分不高但很诚实。

  • 成功的预测:

    • 由无编程能力者创建的应用走红(Formula Bot)。
    • 在法律案件压力下,前沿实验室改变数据收集方式(Anthropic)。
    • 开源模型在推理基准上超越 OpenAI 的 o1。
    • 挑战者未能撼动英伟达的市场地位。
    • 由 AI 科学家生成的论文被主要会议接收。
  • 失败的预测:

    • 主权国家对美国 AI 实验室的超 100 亿美元投资并未触发国家安全审查。
    • 对人形机器人的投资不减反增。
    • 苹果的端侧 AI 研究未能引领潮流。
    • 基于生成式 AI 的游戏未能实现突破。

对 2026 年的大胆预测

报告对 2026 年提出了一系列激进的预测,反映了对未来 AI 发展的乐观与担忧。

  • AI 代理驱动零售业增长: 一家主要零售商将有超过 5% 的在线销售额来自 AI 代理结账,同时 AI 代理广告支出将达到 50 亿美元。

  • 开放模型策略转变: 一家主要的 AI 实验室可能会为了迎合美国政府而重新转向开源其前沿模型。

  • AI 实现科学发现: 开放式 AI 代理将端到端地完成一次有意义的科学发现,包括提出假设、进行实验、迭代和撰写论文。

  • AI 引发国际安全危机: 一次由深度伪造或 AI 代理驱动的网络攻击将首次触发北约或联合国的紧急安全辩论

  • AI 电影获奖并引发争议: 一部大量使用 AI 制作的电影或短片将赢得观众好评,但同时引发强烈的社会反弹。

  • 数据中心引发政治争议: “数据中心邻避主义”(NIMBYism)将在美国兴起,并可能影响 2026 年的中期选举。