互联网上的资源过于集中绝对不是一个好主意,昨天(2 月 28 日)晚上 Amazon Web Services 数据中心发生的大规模中断再次证明了这一点。事实上,这家在线销售巨头的云子公司的 S3 存储服务宕机了几个小时。“S3 上有很多错误率。我们正在努力恢复服务”,我们可以在晚上 8:17 在 Twitter 上阅读。直到晚上11点左右才恢复正常。
S3 的错误率很高。我们正在努力康复。
— 亚马逊网络服务 (@awscloud)2017 年 2 月 28 日
此次停电主要影响美国东海岸。许多依赖 Amazon S3 的在线服务突然无法访问。尤其是 Slack(专业消息传递)、Medium(博客平台)、Trello(项目管理)、IFTTT(小程序创建)、Quora(问答)、Splitwise(成本分摊)、HipChat(消息传递) 、Expensify(费用管理)等即使是 Snapchat、Expedia 或 BuzzFeed 等“大”玩家也受到了影响。
下降探测器也下降之前的屏幕截图pic.twitter.com/O2llrKkhPd
- 刀(@knifedog311)2017 年 2 月 28 日
根据吉兹莫多,此故障可能与位于弗吉尼亚州北部的数据中心的一次重大停电有关。它将成为亚马逊最古老的数据中心之一。迄今为止,供应商尚未提供更多细节。
亚马逊网络服务,关键参与者
不幸的是,这一切并不令人意外。近年来,亚马逊网络服务已成为互联网服务的重要提供商,尤其是对于年轻的科技初创公司而言。借助亚马逊的云及其数十种基础设施服务,他们可以快速部署自己的产品并开展业务。 2012年,一篇文章来自有线已经指定亚马逊“托管 1% 的网络”。 S3存储特别受欢迎。根据最近的分析加特纳公司,该服务存储的业务数据比所有竞争对手(例如 Microsoft、Google、IBM 或 Rackspace)的总和还要多。允许管理此存储的底层协议甚至已成为事实上的标准。
这并不是第一次服务提供商的故障导致网络发生重大动荡。 2016 年 10 月,一大规模拒绝服务攻击导致 Dyn 的 DNS 服务瘫痪,导致 Twitter、Spotify、Github、Soundcloud、Box 和 Paypal 等大量客户端网站无法访问。对于这种类型的故障有一个简单的解决方案:不要把鸡蛋放在同一个篮子里。如果公司制定了冗余的基础设施和业务恢复计划,他们就不会成为服务提供商失败的受害者。显然,这代表着一定的成本。
Opera One - AI 驱动的网络浏览器
作者:歌剧