大显卡未必要配大主机
本文探讨了在树莓派 5 上外接高性能显卡的可行性与实际表现。通过对 AMD、Intel 及 Nvidia 多款显卡在媒体转码、GPU 渲染和 AI 推理等方面的测试,并与现代桌面 PC 对比,发现尽管树莓派的 PCIe 带宽极为有限,但在许多 GPU 密集型任务中,其性能与 PC 相差无几,甚至在能效比上展现出巨大优势。尤其是在多 GPU 协同工作时,性能损失极小。结论是,对于追求极致性能和易用性的用户,传统 PC 仍是首选;但对于 GPU 密集但带宽要求不高,且注重低功耗和成本的特定应用场景,树莓派是一个出乎意料的强大选项。
为什么要用树莓派连接显卡?
一个核心疑问是,将高端显卡连接到仅有 一条 PCIe Gen 3 通道 的树莓派上到底有什么意义?毕竟现代 PC 至少拥有 16 条 PCIe Gen 5 通道,理论带宽相差悬殊。然而,实验的出发点在于验证一个猜想:带宽并非在所有情况下都是决定性因素。
测试围绕四个核心应用展开,旨在比较树莓派 5 和现代 PC 在外接各种显卡时的表现:
- 媒体转码 (Jellyfin)
- 纯 GPU 渲染 (GravityMark)
- AI 大语言模型性能
- 多 GPU 应用
令人惊讶的结论是:在许多情况下,树莓派的表现不落下风,如果你愿意牺牲 2-5% 的峰值性能,它在 能效比 上甚至遥遥领先。
多 GPU 的惊人表现
最令人震惊的发现来自于一个多 GPU 实验。通过外接 PCIe 交换机,有人成功将四块 Nvidia RTX A5000 显卡连接到一台树莓派上,用于运行 Llama 3 70b 模型。
- 树莓派平台: 11.83 tokens/秒
- 现代服务器平台(使用相同 GPU): 12 tokens/秒
性能差距 不到 2%。这是因为外接的 PCIe 交换机允许显卡之间直接高速共享数据,绕开了树莓派那条缓慢的 PCIe 通道。即使不使用这种技巧,单显卡在树莓派上的表现也常常能与 PC 匹敌。
成本与功耗优势
除了性能,成本和效率也是重要考量因素(价格均不含显卡):
树莓派 eGPU 方案:
- 总成本:约 350-400 美元
- 闲置功耗:4-5 瓦
Intel PC 方案:
- 总成本:约 1500-2000 美元
- 闲置功耗:30 瓦
显然,在成本和待机能耗方面,树莓派拥有巨大的优势。
单显卡性能对比:树莓派 vs. Intel PC
测试一:媒体转码 (Jellyfin)
对于需要处理原始视频流的基准测试,PC 的高 I/O 速度使其大获全胜。树莓派的 PCIe 和 USB 接口成为瓶颈。
然而,在 实际应用场景 中,例如使用 Jellyfin 或 Plex 进行家庭媒体串流,情况完全不同。
- 树莓派可以流畅地对 1080p 甚至 4K H.265 视频进行实时转码,随意拖动进度条也毫无延迟。
- 即使 同时处理两个视频流(一个 4K,一个 1080p),系统依然运行流畅。
结论是,虽然 PC 在原始吞吐量上胜出,但对于大多数日常转码任务,树莓派已经完全足够。
测试二:GPU 渲染 (GravityMark)
在纯粹依赖 GPU 计算的 3D 渲染测试中,PC 的优势微乎其微。
- 当使用较新的 AMD 显卡时,PC 仅略微领先。
- 当换用一块较老的 RX 460 (PCIe Gen 3) 显卡时,树莓派的性能甚至反超了 PC。
更重要的是 能效比(每瓦性能得分),树莓派系统展现了压倒性的优势。
测试三:人工智能 (AI)
AI 推理是另一项能体现 GPU 价值的任务。
- 使用 Nvidia RTX 3060 显卡时,树莓派的表现与 PC 不相上下,在 Llama 2 13B 模型上甚至更快。
- 即便是面对 RTX 4090 这样的顶级显卡,树莓派在多数模型上依然能保持竞争力,例如在 Qwen3 30B 模型上,性能差距不到 5%。
在能效方面,结果再次令人意外。尽管 RTX 4090 功耗巨大,但在运行较大型模型时,整个树莓派系统的 能效比依然高于 PC。
双显卡测试
通过 PCIe 互联板,可以实现双显卡协同工作。这允许你运行需要更大显存的 AI 模型,但性能并非简单叠加。
由于数据需要通过树莓派的 CPU 和慢速 PCIe 通道进行协调,双显卡配置的 运行速度反而比单个更强大的显卡要慢。
主要结论是:多 GPU 方案可以 扩展显存容量,让你能运行更大的模型,但它会比使用 单个拥有足够显存的 GPU 更慢、效率更低。
结论:谁是赢家?
没有绝对的赢家,选择取决于你的需求。
PC 是赢家:如果你追求 极致的原始性能、最佳兼容性和简单的设置过程。
树莓派是赢家:如果你属于一个特定的用户群体,你的工作负载 高度依赖 GPU 计算但对 PCIe 带宽不敏感,并且你非常看重 低闲置功耗、低成本和高能效比。
最终,这个实验证明了在特定条件下,一个低成本、低功耗的平台也能有效驱动高性能硬件,挑战了“大显卡必须配大主机”的传统观念。