芯片初创公司 XCENA 近期获得了 1.35 亿美元融资,其核心论点是当前人工智能发展的最大瓶颈并非算力,而是内存。该公司正在研发一款名为 MX1 的芯片,通过将计算功能直接集成到内存模块中,来处理数据预处理等任务,从而大幅减少数据在 CPU、GPU 和内存之间的低效往返,旨在降低 AI 基础设施的成本和功耗。
AI 运行中的结构性瓶颈
每当用户向 AI 模型(如 ChatGPT)提问时,数据都需要在内存、CPU 和 GPU 之间来回传递。这个过程被称为“数据接力赛”,具体流程如下:
- 信息离开 内存。
- 进入 CPU 进行预处理。
- 传输到 GPU 进行大规模计算。
- 处理结果再返回内存。
这个循环在 AI 生成每一个词时都会重复发生。这种结构性瓶颈不仅效率低下,而且极其耗电,因为它依赖于行业中最昂贵、最耗能的几种芯片。
XCENA 的解决方案:让内存变得“更智能”
XCENA 公司的目标是打破这种低效循环。公司创始人认为,过去几十年 CPU 和 GPU 变得越来越智能,而内存却始终停留在“被动存储”的角色。XCENA 希望改变这一现状。
其核心产品 MX1 芯片 的工作原理是“将计算带到数据旁边,而不是让数据到处跑”:
- 技术路径: MX1 芯片通过 CXL(一种连接处理器和内存的高速通道)接入系统。
- 核心功能: 它将计算能力直接置于 DRAM(动态随机存取存储器)附近,使一些常规数据操作可以在内存模块内部直接完成。
- 处理任务: 这些任务包括数据预处理、KV 缓存管理(用于存储对话上下文)和数据缓存,而无需再绕道 CPU。
该公司声称,通过这种方式,原本需要 10 台服务器 才能完成的工作,未来可能只需要 1 台 就能运行。
推理不仅仅是一个算力问题,它越来越成为一个内存扩展问题。
市场与商业策略
随着 AI 应用的普及,内存需求自去年下半年以来激增。三星、SK 海力士和美光这三大内存芯片巨头的市值均已突破万亿美元,这表明市场正转向以内存为中心的架构。
XCENA 的商业模式清晰地瞄准了这一趋势:
- 目标客户: 每年在 AI 基础设施上投入数百亿美元的 超大规模云服务商。对这些巨头而言,即便是内存效率的小幅提升,也意味着数亿美元的成本节约。
- 产品阶段: MX1 芯片目前仍处于原型阶段。
- 发展规划: 计划于 2026 年底 实现量产,并从 2027 年 开始产生收入。
技术优势与竞争
XCENA 并不直接与英伟达在 AI 训练领域竞争,而是专注于优化其下方的内存密集型层面。
与 Astera Labs 和 Marvell 等同样致力于下一代内存连接技术的公司相比,XCENA 的主要优势在于其独特的知识产权和设计理念:
- 多核架构: 拥有 数千个 基于开源 RISC-V 架构设计的微小高效核心,专门用于数据处理。相比之下,竞争对手更多依赖少数通用核心。
- 垂直整合: 公司自主设计内部的内存层级、互连总线和 DRAM 控制器,实现了高度的垂直整合,而大多数芯片公司通常会将这些部分外包。