几天前,Cloudflare 遭遇中断。 2025年2月6日星期四,美国公司触发全身功能障碍其许多服务。 Cloudflare 在其网站上的一份报告中表示,中断持续了不到一个小时。
在崩溃的根源上,我们发现了一个“人为错误”。显然,一名员工想要对网络钓鱼网站采取行动。他想阻止恶意网站的 URL 作为攻击的一部分“定期纠正滥用行为”。 Cloudflare 收到了有关在线存储服务 Cloudflare R2 上存在该网站的投诉。
另请阅读:
不幸的是,这名员工犯了一个错误。它没有阻止被识别为恶意的 URL,但禁用了整个 R2 网关服务,该服务管理对存储文件的访问。换句话说,该员工禁用了所有文件的网关,而不仅仅是一个端点。
Cloudflare 解释说“验证检查不足”导致该服务被停用,从而中断了依赖此基础设施的所有系统。许多 Cloudflare 服务崩溃或无法正常工作近一个小时。然而,“该事件并未导致存储数据丢失或损坏”。
“我们对这起由于多项控制措施失败而导致的事件深感遗憾。我们正在优先考虑在我们的系统中添加额外的机制,不仅是为了改善滥用处理,而且是为了限制任何可能导致 Cloudflare 生产服务意外停用的行为(无论是人为还是自动)的影响。”Cloudflare 在其报告中指出。
另请阅读:
Cloudflare 采取预防措施
该公司承认失败是由于“多个系统级检查失败”和一个问题“操作员培训”造成堵塞的责任。这次失败之后,Cloudflare 已采取行动,例如删除滥用管理界面中禁用系统的选项,以及在管理 API 中添加限制。同样,Cloudflare 将应用更严格的访问控制,并对任何高风险操作引入两步验证。这些添加内容应该可以防止员工将来意外阻塞整个系统。
这是Cloudflare 遭受第二次中断在几个月的时间里。 2024 年 11 月,某些团体服务发现无法访问超过三个小时。在此期间,发送给客户端的一些日志丢失了。为了解释这次中断,该公司解释说它遇到了 Logpush 中的一个错误,Logpush 是一项允许自动发送的服务莱斯日志第三方存储或分析平台。
来源 : 云耀









