Google 和 Anthropic 的大模型之路分道而行

面对 OpenAI 的竞争压力,谷歌和 Anthropic 正沿着截然不同的路径发展大模型。谷歌凭借其强大的工程能力和自主研发的 TPU 芯片,专注于打造规模庞大且成本低廉的模型,如 Gemini 3,旨在通过广泛集成到现有产品中取胜。与此同时,Anthropic 则更注重模型的深层设计和创新方法,其 Claude Opus 4.5 模型在商业客户中广受欢迎,代表了一种更侧重于模型内在质量的发展思路。

竞争加剧的 AI 领域

近期,人工智能领域的竞争日益激烈,OpenAI 感受到了来自谷歌和 Anthropic 的双重压力。

    • 来自谷歌的威胁: 其 Gemini 聊天机器人的月活跃用户数迅速增长,从 7 月的 4.5 亿增至 11 月的 6.5 亿。
    • 来自 Anthropic 的压力: 该公司的模型在商业客户群体中越来越受欢迎。

为了应对挑战,谷歌发布了 Gemini 3,而 Anthropic 紧随其后推出了 Claude Opus 4.5,两者均在多个基准测试中创下新纪录。

谷歌的工程实力

谷歌的成功很大程度上源于其根深蒂固的工程技术导向文化。该公司将构建大语言模型视为一个工程问题,致力于以最低成本训练出最大规模的模型。

“Gemini 3 是世界上最好的模型之一,并且完全在 TPU 上进行训练。”

谷歌的核心优势在于其自研的 TPU (张量处理器单元) 及其整体系统架构。通过设计高效的机架和网络系统,谷歌能够最大限度地发挥成千上万个芯片的性能。这种工程实力带来了显著成果:

    • 极具竞争力的成本: Gemini 2.5 Flash-Lite 处理一百万个输入词元仅需 10 美分,是 Anthropic 最便宜模型 Claude Haiku 4.5 成本的十分之一。
    • 卓越的性能: 在衡量模型回忆冷僻知识能力的 SimpleQA 基准测试中,Gemini 3 表现出色。这被认为是其庞大规模和海量参数知识的体现。
    • 庞大的用户基础: 尽管 Gemini 3 可能缺乏鲜明的“个性”,但谷歌可以将这个“足够好”的模型集成到搜索、Gmail 等拥有数十亿用户的产品中,从而赢得市场。

一位 Reddit 评论者指出:“我的解读是,Gemini 3 Pro 在 SimpleQA 上的进步表明它是一个绝对巨大的模型,拥有海量的参数知识。谷歌使用自己的 TPU 硬件进行训练和推理,所以他们有能力做到这一点。”

Anthropic:对模型的深度思考

与谷歌专注于规模和成本不同,Anthropic 的方法更侧重于对模型本身的深度思考和设计

尽管 Claude Opus 4.5 同样在谷歌的 TPU 上进行训练,但其发布后获得的积极反响与 Gemini 3 有着不同的“氛围”。这暗示了 Anthropic 的产品文化更倾向于探索模型的内在机制和哲学层面,而非单纯追求工程上的规模化。这两种不同的文化和方法,共同塑造了当前人工智能领域多元化的发展格局。