Synth Daily

英伟达发布全新强悍 Rubin 芯片架构

英伟达发布了名为 Rubin 的全新计算架构,旨在满足人工智能(AI)领域急剧增长的算力需求。该架构由六个协同工作的芯片组成,包括一个新的 Vera CPU,显著提升了存储、互联和推理性能。Rubin 架构现已全面投产,其训练速度是前代 Blackwell 架构的 3.5 倍,推理速度是其 5 倍,同时能效提升了 8 倍,已被各大云服务商和超级计算机项目采用。

为 AI 算力需求而生

英伟达 CEO 黄仁勋指出,推出 Rubin 架构是为了应对一个根本性挑战。

“AI 所需的计算量正在急剧增长。”

作为英伟达硬件快速迭代周期的最新成果,Rubin 架构将接替 Blackwell 架构,延续了从 Hopper 和 Lovelace 架构以来的发展路线。

Rubin 架构的核心组成

Rubin 架构以 Rubin GPU 为中心,并整合了其他五个芯片来解决数据存储和互联中的瓶颈。其关键组件包括:

  • Vera CPU: 一款专为智能体推理等新型工作流程设计的新型中央处理器。
  • Bluefield 和 NVLink 系统: 分别对存储和互联系统进行了新的改进。
  • 新增外部存储层: 为了应对智能体 AI 等任务对内存(KV 缓存)提出的巨大压力,该架构引入了一个连接到计算设备外部的新存储层,从而可以更高效地扩展存储池。

性能与效率的飞跃

与前代产品相比,Rubin 架构在速度和能效上实现了显著提升。根据英伟达的测试数据:

  • 模型训练速度: 比 Blackwell 架构快 3.5 倍
  • 推理任务速度: 比 Blackwell 架构快 5 倍,最高可达 50 petaflops。
  • 功耗效率: 每瓦支持的推理计算能力提升了 8 倍

广泛的市场应用

Rubin 架构目前已全面投产,并计划在今年下半年加速推广。它的应用已覆盖多个领域:

  • 几乎所有主要云服务商,包括与 Anthropic、OpenAI 和亚马逊 AWS 的高调合作。
  • HPE 的 Blue Lion 超级计算机
  • 劳伦斯伯克利国家实验室即将推出的 Doudna 超级计算机