大显卡未必要配大主机

本文探讨了在树莓派 5 上外接高性能显卡的可行性与实际表现。通过对 AMD、Intel 及 Nvidia 多款显卡在媒体转码、GPU 渲染和 AI 推理等方面的测试,并与现代桌面 PC 对比,发现尽管树莓派的 PCIe 带宽极为有限,但在许多 GPU 密集型任务中,其性能与 PC 相差无几,甚至在能效比上展现出巨大优势。尤其是在多 GPU 协同工作时,性能损失极小。结论是,对于追求极致性能和易用性的用户,传统 PC 仍是首选;但对于 GPU 密集但带宽要求不高,且注重低功耗和成本的特定应用场景,树莓派是一个出乎意料的强大选项。

为什么要用树莓派连接显卡?

一个核心疑问是,将高端显卡连接到仅有 一条 PCIe Gen 3 通道 的树莓派上到底有什么意义?毕竟现代 PC 至少拥有 16 条 PCIe Gen 5 通道,理论带宽相差悬殊。然而,实验的出发点在于验证一个猜想:带宽并非在所有情况下都是决定性因素

测试围绕四个核心应用展开,旨在比较树莓派 5 和现代 PC 在外接各种显卡时的表现:

    • 媒体转码 (Jellyfin)
    • 纯 GPU 渲染 (GravityMark)
    • AI 大语言模型性能
    • 多 GPU 应用

令人惊讶的结论是:在许多情况下,树莓派的表现不落下风,如果你愿意牺牲 2-5% 的峰值性能,它在 能效比 上甚至遥遥领先。

多 GPU 的惊人表现

最令人震惊的发现来自于一个多 GPU 实验。通过外接 PCIe 交换机,有人成功将四块 Nvidia RTX A5000 显卡连接到一台树莓派上,用于运行 Llama 3 70b 模型。

    • 树莓派平台: 11.83 tokens/秒
    • 现代服务器平台(使用相同 GPU): 12 tokens/秒

性能差距 不到 2%。这是因为外接的 PCIe 交换机允许显卡之间直接高速共享数据,绕开了树莓派那条缓慢的 PCIe 通道。即使不使用这种技巧,单显卡在树莓派上的表现也常常能与 PC 匹敌。

成本与功耗优势

除了性能,成本和效率也是重要考量因素(价格均不含显卡):

  • 树莓派 eGPU 方案:

      • 总成本:约 350-400 美元
      • 闲置功耗:4-5 瓦
  • Intel PC 方案:

      • 总成本:约 1500-2000 美元
      • 闲置功耗:30 瓦

显然,在成本和待机能耗方面,树莓派拥有巨大的优势。

单显卡性能对比:树莓派 vs. Intel PC

测试一:媒体转码 (Jellyfin)

对于需要处理原始视频流的基准测试,PC 的高 I/O 速度使其大获全胜。树莓派的 PCIe 和 USB 接口成为瓶颈。

然而,在 实际应用场景 中,例如使用 Jellyfin 或 Plex 进行家庭媒体串流,情况完全不同。

    • 树莓派可以流畅地对 1080p 甚至 4K H.265 视频进行实时转码,随意拖动进度条也毫无延迟。
    • 即使 同时处理两个视频流(一个 4K,一个 1080p),系统依然运行流畅。

结论是,虽然 PC 在原始吞吐量上胜出,但对于大多数日常转码任务,树莓派已经完全足够

测试二:GPU 渲染 (GravityMark)

在纯粹依赖 GPU 计算的 3D 渲染测试中,PC 的优势微乎其微。

    • 当使用较新的 AMD 显卡时,PC 仅略微领先。
    • 当换用一块较老的 RX 460 (PCIe Gen 3) 显卡时,树莓派的性能甚至反超了 PC

更重要的是 能效比(每瓦性能得分),树莓派系统展现了压倒性的优势。

测试三:人工智能 (AI)

AI 推理是另一项能体现 GPU 价值的任务。

    • 使用 Nvidia RTX 3060 显卡时,树莓派的表现与 PC 不相上下,在 Llama 2 13B 模型上甚至更快。
    • 即便是面对 RTX 4090 这样的顶级显卡,树莓派在多数模型上依然能保持竞争力,例如在 Qwen3 30B 模型上,性能差距不到 5%。

在能效方面,结果再次令人意外。尽管 RTX 4090 功耗巨大,但在运行较大型模型时,整个树莓派系统的 能效比依然高于 PC

双显卡测试

通过 PCIe 互联板,可以实现双显卡协同工作。这允许你运行需要更大显存的 AI 模型,但性能并非简单叠加。

由于数据需要通过树莓派的 CPU 和慢速 PCIe 通道进行协调,双显卡配置的 运行速度反而比单个更强大的显卡要慢

主要结论是:多 GPU 方案可以 扩展显存容量,让你能运行更大的模型,但它会比使用 单个拥有足够显存的 GPU 更慢、效率更低

结论:谁是赢家?

没有绝对的赢家,选择取决于你的需求。

    • PC 是赢家:如果你追求 极致的原始性能、最佳兼容性和简单的设置过程

    • 树莓派是赢家:如果你属于一个特定的用户群体,你的工作负载 高度依赖 GPU 计算但对 PCIe 带宽不敏感,并且你非常看重 低闲置功耗、低成本和高能效比

最终,这个实验证明了在特定条件下,一个低成本、低功耗的平台也能有效驱动高性能硬件,挑战了“大显卡必须配大主机”的传统观念。