Synth Daily

亚马逊发布 Trainium3

亚马逊云服务(AWS)发布了其第三代AI训练芯片 Trainium3,性能和内存均提升4倍,能效提高40%,并能支持百万级芯片的大规模集群。这一升级旨在显著降低客户的AI推理成本。同时,AWS透露正在开发的 Trainium4 将支持 Nvidia 的技术,实现与Nvidia GPU的互操作,以吸引更广泛的AI应用生态。

Trainium3 的核心升级

AWS 在其 re:Invent 2025 大会上正式推出了搭载 Trainium3 芯片的 UltraServer 系统。与上一代相比,新系统在AI训练和推理方面实现了巨大飞跃。

  • 性能提升: 速度比前代快 4倍
  • 内存增加: 内存容量增加 4倍
  • 集群规模: 支持将数千台 UltraServer 连接在一起,形成包含高达 100万颗 Trainium3 芯片的超级集群,是上一代规模的10倍。
  • 能效更高: 能效比上一代产品提升了 40%

降低成本与能耗

AWS 的一个明确目标是构建消耗更少能源的数据中心系统。这种对效率的追求不仅符合 AWS 自身的利益,也直接为客户带来了好处。

通过提升能效,Trainium3 系统能够帮助客户 显著削减AI推理成本。像 Anthropic、Karakuri 等公司已经在使用新系统,并证实了其在成本节约上的优势。

展望未来:Trainium4 与 Nvidia 的融合

AWS 还公布了其下一代芯片 Trainium4 的开发计划,该芯片将再次实现性能的大幅提升。

最值得关注的是,Trainium4 将支持 Nvidia 的 NVLink Fusion 高速互联技术。

这意味着,未来的 Trainium4 系统将能够与 Nvidia GPU 实现互操作。这一举措不仅能扩展系统性能,还将使 AWS 云平台对那些基于 Nvidia CUDA 架构构建的AI应用更具吸引力。

目前,AWS 尚未公布 Trainium4 的具体发布时间。