互联网档案馆通过自研的 PetaBox 存储系统,以极低的成本实现了海量数据的长期保存。其核心策略是:使用自有硬件和开源软件,利用自然气候冷却并回收余热,以及接受并围绕硬件故障来设计系统。文章指出,长期数据保存本质上是一个经济问题而非技术问题,而解决这一问题的关键在于根据数据访问频率进行合理的分层存储,从而最大限度地降低成本。
PetaBox:不断进化的存储核心
互联网档案馆的存储基础是其自研的 PetaBox 系统,该系统在密度和效率上持续迭代。
- 2004 年 - 第一代 PetaBox: 单个机架容量达到 100TB,在当时是存储密度的一大突破,而功耗仅为 6 千瓦。
- 2010 年 - 第四代 PetaBox: 转向 4U 系统,每个机架可容纳 240 个 2TB 的硬盘。
- 2025 年 - 当前系统: 通过使用 8TB、16TB 甚至 22TB 的大容量硬盘,单个机架的存储容量跃升至 1.4PB。尽管总容量大幅增加,但硬盘驱动器的总数却保持相对稳定。
创新的节能与成本控制
档案馆通过独特的设计,将环境因素转化为运营优势,极大地降低了能源成本。
档案馆的主要数据中心位于旧金山以多雾和凉爽海洋气候著称的里士满区。大楼利用这种环境空气进行冷却。PetaBox 机房没有传统的空调。相反,服务器被设计为在稍高的运行温度下工作,而旋转磁盘产生的多余热量则被捕获并再循环,用于在潮湿的旧金山冬季为大楼供暖。
这种方法不仅避免了昂贵的空调费用,还通过回收服务器余热来供暖,实现了能源的二次利用。
为失败而设计:务实的硬件策略
面对数万个硬盘持续运行的现实,硬件故障是必然发生的统计事件,而非意外。因此,档案馆的策略不是追求永不损坏的硬件,而是构建一个能够容忍并快速恢复故障的系统。
- 接受故障: 拥有超过 28,000 个运行中的磁盘,驱动器故障是一种常态。
- 成本效益分析: 与其花费巨资将故障率从 2% 降低到 1%,不如接受较高的故障率。降低故障率节省的人力成本(约 5,000 美元)与为数百万美元的硬盘采购更昂贵的硬件相比,微不足道。
- 数据优先: 系统设计的重点是优先保障数据采集和存储的效率,而不是追求单个硬件的极致可靠性。丢失数据的根本原因更多是因为未能采集,而非采集后丢失。
“为失败而设计,并购买你能找到的最便宜的组件。”
长期保存的经济学本质
文章的核心观点是,长期数据保存的挑战 根本上是经济问题,而非技术问题。在预算充足的情况下,技术实现相对简单;真正的挑战在于如何在有限的预算内完成任务。
档案馆通过以下方式实现了远低于商业云服务的成本效益:
- 拥有自己的硬件
- 采用高密度的 PetaBox 架构
- 避免空调成本
- 使用开源软件
将档案馆的存储成本与亚马逊 S3 等商业服务直接比较存在误导,因为它们服务的场景不同。S3 提供即时访问的热存储,而档案馆的大部分数据访问频率极低。
解决方案:分层存储
降低存储成本的关键在于 分层 (Tiering),即根据数据的访问频率将其迁移到不同成本的存储介质上。
将不常访问的数据移动到更便宜的“冷存储”层,可以显著降低总体费用。成功的关键在于准确分析和预测数据的使用模式,从而将数据匹配到性能和成本最合适的存储层级。