亚马逊正凭借其自研的 AI 芯片 Trainium,在由英伟达主导的市场中成功开拓出价值数十亿美元的业务。其现有芯片 Trainium2 已通过价格和性能优势吸引了大量云客户,尤其是合作伙伴 Anthropic 的大规模采用,证明了其强大的市场竞争力。尽管撼动英伟达的地位充满挑战,但亚马逊通过发布性能更强的 Trainium3 和规划兼容英伟达 GPU 的 Trainium4,显示了其巩固并扩大市场份额的明确战略。
抢占数十亿美元的市场份额
亚马逊 CEO 安迪·贾西指出,尽管英伟达在 AI 芯片领域地位稳固,但市场规模巨大,足以让其他公司分得一杯羹并创造数百亿美元的收入。
对于那些能够从市场中分得一杯羹的公司来说,这里有价值数百亿美元的收入机会。
为此,亚马逊在 AWS re:Invent 大会上发布了其新一代自研 AI 芯片 Trainium3。据称,这款新芯片比当前版本 快四倍,同时能耗更低。
Trainium2 已取得显著成功
贾西透露,当前的 Trainium2 芯片业务已经取得了巨大成功,证明了亚马逊在自研芯片领域的实力。
- 业务规模: 已达到 数十亿美元 的年收入水平。
- 部署规模: 有超过 100万颗 芯片投入生产。
- 客户基础: 超过 10万家 公司正在使用,占据了亚马逊 AI 应用开发工具 Bedrock 的大部分用量。
亚马逊的经典策略是提供性价比更高的自研技术。贾西表示,Trainium 芯片之所以能在公司的云客户中广受欢迎,正是因为它“相比其他 GPU 选项具有令人信服的性价比优势”。
关键合作伙伴:Anthropic
AWS 的 CEO 马特·加曼透露,合作伙伴 Anthropic 是 Trainium 数十亿美元收入的重要贡献者。
通过名为 “雷尼尔计划”(Project Rainier) 的合作,亚马逊部署了超过 50万颗 Trainium2 芯片,专门用于帮助 Anthropic 构建其下一代 Claude 模型。作为 Anthropic 的主要投资者,亚马逊确保了 AWS 成为其模型训练的首选云平台。
相比之下,虽然 OpenAI 也在使用 AWS,但其合作主要运行在英伟达的芯片上,因此对 Trainium 的收入贡献不大。
挑战英伟达的壁垒
要真正与英伟达竞争,需要克服巨大的技术壁垒,只有少数公司具备所需的所有条件。
- 技术积累: 包括芯片设计、自研高速互联和网络技术。英伟达在 2019 年通过收购 Mellanox 掌握了关键的高性能网络技术。
- 软件生态: 英伟达专有的 CUDA 软件架构是其核心护城河。AI 应用如果基于 CUDA 开发,要迁移到非 CUDA 芯片上,重写成本极高。
亚马逊的未来规划
尽管挑战重重,亚马逊已为未来做好准备。下一代芯片 Trainium4 将被设计为能够与英伟达的 GPU 在同一系统中协同工作。这一策略究竟会削弱英伟达的业务,还是仅仅在 AWS 云上巩固其主导地位,仍有待观察。
然而,对于亚马逊而言,这可能并不重要。Trainium2 已经创造了数十亿美元的收入,而新一代芯片性能将更加强大,这足以让亚马逊成为 AI 芯片市场中的一个重要赢家。