AI浪潮加速芯片网络竞速

随着人工智能对数据中心的需求激增,芯片行业正在加速开发新的网络技术,特别是光子技术,以连接服务器和芯片。传统的电子互连已无法满足 AI 工作负载所需的高带宽,这促使英伟达(Nvidia)等巨头和 Lightmatter 等初创公司大力投资光子学。尽管光子网络被视为计算的未来,但其高昂的成本和复杂性依然是主要障碍,行业正朝着更定制化、高效的解决方案发展,而光子技术的广泛应用仍需时日。

AI 时代的网络瓶颈

在技术行业向 AI 数据中心投入数十亿美元的背景下,连接芯片与芯片、服务器机架与机架之间的网络技术正成为创新的焦点。传统的网络技术依赖电子传输,已难以跟上 AI 工作负载对高带宽日益增长的需求。

“回顾历史,网络技术曾非常乏味,因为它只是在交换数据包。现在,由于人工智能的出现,它必须处理相当庞大的工作负载,这就是你看到速度方面创新的原因。”

— Creative Strategies 公司 CEO, Ben Bajarin

行业巨头的布局

芯片巨头们早已预见到网络技术的重要性,并提前进行了战略布局。

  • 英伟达 (Nvidia): 多年前就通过两次关键收购奠定了基础。

      • 2020年,以近70亿美元收购了以色列公司 Mellanox Technologies,该公司为服务器和数据中心提供高速网络解决方案。
      • 随后收购了 Cumulus Networks,为其基于 Linux 的网络软件系统提供支持。
      • 英伟达的策略是,通过将多个 GPU 集群化,可以使其并行计算能力变得更加强大。
  • 博通 (Broadcom): 已成为定制芯片加速器和高速网络技术领域的关键参与者。

      • 与谷歌、Meta 以及 OpenAI 等公司在数据中心芯片方面有紧密合作。
      • 硅光子学领域处于领先地位,并准备推出一款名为 Thor Ultra 的新型网络芯片。
    • ARM: 宣布收购网络公司 DreamBig,该公司与三星合作生产 AI 芯片模块(chiplets),这些模块对于实现大规模网络扩展至关重要。

光子技术的兴起

光子学,即光学技术,正迎来它的“成年礼”。一些初创公司正利用光来加速高速计算,吸引了大量投资。

“计算的未来实际上与光有关。在这个计算水平上,你需要新的想法,而计算机新领域的一大部分都涉及光。”

— Lightmatter CEO, Nick Harris

AI 所需的计算能力现在每三个月翻一番,远超摩尔定律的预测。当芯片尺寸达到极限时,所有性能的提升都来自于将芯片连接在一起

    • Lightmatter: 该公司构建硅光子器件来连接芯片,声称拥有世界上最快的用于 AI 芯片的光子引擎。在过去两年中,已从谷歌风投(GV)等投资者处筹集了超过5亿美元。
    • Celestial AI: 因其光学互连技术获得了广泛关注,从富达、贝莱德等公司筹集了2.5亿美元。
    • PsiQuantum: 利用光学技术为量子计算机制造芯片,目前估值已达70亿美元。

挑战与遥远的未来

尽管前景广阔,但光子网络技术并非一帆风顺。它面临着显著的挑战,这减缓了其普及速度。

    • 成本高昂: 建造光学网络需要昂贵的投入和高度专业化的设备。
    • 系统兼容性: 它必须能够“插入”现有的电气系统中才能发挥作用。
    • 规模化难题: 像博通这样的大公司拥有与超大规模数据中心合作的专业知识和资源,能够满足其特定的定制需求。这对小型初创公司来说是一个巨大的挑战。

尽管对更快数据速度的需求不断增长,但实验性初创公司的回报可能还需要数年时间才能实现。

“我们都相信世界会有一个光子学的未来,但这仍然遥远。”