Synth Daily

Cloudflare 全球网络出现故障

2025年11月18日,Cloudflare 发生了一次内部服务故障,导致其全球网络中的多项核心服务出现中断或性能下降。受影响的服务包括 Access、WARP、CDN 缓存和防火墙等。经过数小时的紧急修复,工程团队逐步恢复了各项服务,错误率和网络延迟最终回归正常水平。官方确认事件已解决,并建议用户重新启用在故障期间临时关闭的服务。

故障概述

事件始于一次内部服务性能下降,迅速演变为对客户可见的广泛影响。用户在使用多项 Cloudflare 服务时,可能会遇到间歇性的高错误率和延迟。

主要受影响的服务包括:

  • Access
  • Bot 管理
  • CDN 缓存
  • 仪表盘 (Dashboard)
  • 防火墙 (WAF)
  • 网络服务
  • WARP
  • Workers

关键时间线与修复过程

整个事件从发现问题到完全解决,持续了大约8个小时。团队的应对措施可分为几个关键阶段。

  • 初步调查与临时措施:

    • 在故障初期,为协助修复,团队 暂时禁用了伦敦地区的 WARP 接入
    • 工程团队持续进行调查以定位问题的根本原因。
  • 定位问题与部署修复:

    • 问题根源被识别后,团队立即开始实施修复方案。
    • Cloudflare Access 和 WARP 服务率先恢复,其错误率回到正常水平。
    • 随后,通过一次变更部署,仪表盘服务也恢复了正常
  • 全面恢复与监控:

    • 在修复部署后,团队持续监控系统,处理残余问题。
    • 在此期间,错误率和延迟持续下降,但仍有间歇性问题报告,例如 Bot 分数受到短暂影响
    • 团队专注于稳定所有服务,并加速全球网络的全面恢复。

最终状态

目前,该事件已得到完全解决,所有服务均已正常运行。

Cloudflare 服务当前运行正常。我们不再观察到网络上出现错误率升高或延迟的情况。

最终结论与建议:

  • 所有服务的 错误率和延迟已恢复到正常水平
  • 工程团队将继续监控平台,并对事件原因进行更深入的调查。
  • 官方认为,现在可以 安全地重新启用 在故障期间被临时禁用的任何 Cloudflare 服务。