今年到目前为止,云中断已经影响到包括苹果、微软和谷歌在内的大型科技公司。
到目前为止,苹果iCloud、微软Azure和谷歌云是在2022年经历重大云中断的技术供应商之一。
供应商遇到的问题包括光纤电缆切断、编码更改以及数据中心的空气系统关闭。
云计算时代导致了更频繁的中断,但严重程度较低。
以下是迄今为止在2022年袭击全球的一些最大的云中断信息。
延伸阅读:2022年物联网统计数据
一月苹果停电
根据中断跟踪网站Downdetector的数据,苹果的iCloud云存储服务和其他服务在1月份出现中断,影响了全球的一些用户。
据Downdetector称,截至美国东部时间晚上8点,共有866起停机报告。其他Apple服务也出现中断,包括AppleStore、AppStore和Apple支持。
这家总部位于加利福尼亚州库比蒂诺的科技巨头自己的系统状态页面显示,iCloud备份、iCloud存储升级、iMessage、iCloud邮件和照片一直存在问题。一些用户也无法登录他们的iCloud帐户。目前尚不清楚这些问题有多广泛。
一月的两次IBM中断
这家科技巨头表示,IBMCloud今年开局艰难,其经典基础架构网络存在问题,该网络“在全球60多个IBMCloud数据中心和28个接入点(PoP)中提供连接”。
据报道,总部位于纽约州阿蒙克的IBM于1月2日开始调查该问题,并在大约5小时内解决了该问题。达拉斯地区的IBMCloud服务用户受到影响。
据该公司称,第二天,IBM虚拟私有云产品的问题持续了大约一个小时。该问题影响了华盛顿特区的用户;日本;伦敦;达拉斯;多伦多;根据IBM的一份报告,德国和其他地区。
二月Slack停电
这家协作工具公司在Slack网站的状态页面上证实,2月份,Slack用户遭遇重大中断。
太平洋时间当天上午11:24,Salesforce的子公司Slack宣布问题已解决。
“我们已经解决了这个问题,所有受影响的客户现在都应该能够访问Slack,”根据Slack状态页面上的一篇帖子。“您可能需要重新加载Slack(Cmd/Ctrl+Shift+R)才能看到最终的修复。如果这不起作用,请尝试清除缓存(帮助>故障排除>清除缓存并从应用程序菜单重新启动)。感谢您对我们的包容,对于打扰您的工作日,我们深表歉意!”
Slack关于这个问题的第一条消息是在太平洋时间上午6点25分发出的。“我们正在调查某些用户无法加载Slack的问题,”消息称。“我们正在调查原因,并会尽快提供更多信息。”
周二上午6点19分,Downdetector上记录了近11,000份Slack中断报告。
三月GoogleCloud中断
据这家云巨头称,3月8日,谷歌TrafficDirector工具的用户经历了“2小时35分钟的升级服务错误”。Spotify和Discord等服务受到中断的影响。
总部位于加利福尼亚州山景城的谷歌在一篇帖子中写道:“处理配置的TrafficDirector代码的更改已更新”。“代码更改假设配置数据格式迁移已完全完成。事实上,数据迁移还没有完成。
该帖子继续说:“它会无意中删除导致下游客户端丢失编程并取消配置数据平面的配置。”
三月苹果停电
3月份,苹果的几项主要服务出现了下滑,包括其AppStore、AppleMaps、AppleTV和许多其他关键产品。
苹果的企业和零售系统也出现故障,导致企业员工无法在家工作。苹果公司告诉员工,此次中断源于域名系统(DNS)问题。
苹果证实其系统状态更新出现中断,并表示“部分用户”有15项服务中断。当天东部时间下午1点后,用户开始收到报告,苹果公司在下午2点30分显示服务仍处于关闭状态。
这家总部位于加利福尼亚州库比蒂诺的科技巨头在其客户支持账户的Twitter消息中表示,它已意识到此次中断,并且正在“努力尽快解决问题”。到当天东部时间下午5点,所有服务都已恢复。
四月Atlassian中断
据该公司称,Atlassian中断从4月5日开始,一些客户在4月8日之前恢复服务,其余的则等到4月18日。
这家在澳大利亚和旧金山设有办事处的云工具提供商表示,此次中断是由于致力于删除独立遗留应用程序的团队之间存在“沟通鸿沟”,以及“系统警告不足”。
“虽然这是一起重大事件,但没有客户丢失超过五分钟的数据,”该公司表示,该公司最著名的产品包括Jira和Trello。“此外,超过99.6%的客户和用户在恢复活动期间继续使用我们的云产品,没有任何中断。”
为防止将来出现此问题,该公司计划在所有系统中进行通用“软删除”;将更多客户添加到其针对多站点、多产品删除事件的自动恢复程序;并创建大规模事件通信手册。
五月Mimecast中断
总部位于英国的云网络安全服务提供商Mimecast在5月份表示,“重大停电”导致其北美电网出现问题,导致客户出现延误和“服务质量下降”。
“我们可以确认,我们在美国的一个数据中心经历了一次重大停电,影响了所有电源,包括备用发电机,这反过来又导致了级联问题并导致性能下降,”Mimecast当时在其网站上表示。状态页面。
“在我们的灾难恢复过程中,电力恢复了,这使我们的恢复能力变得复杂。截至目前,服务可用,我们正在处理电子邮件,但在积压清除之前,客户可能仍会遇到延迟。我们对长时间的停电和造成的中断表示诚挚的歉意,”它继续说道。
六月GoogleCloud
据这家科技巨头称,6月7日,谷歌云中东网络的两次光纤中断“影响了多条海底电缆的端到端路径,降低了包括谷歌在内的许多电信和科技公司的容量”。
尽管美国以外的用户首当其冲,但谷歌虚拟私有云的用户需要在北美-东北(加拿大)、北美-东南和所有美国-东部地区(包括南卡罗来纳、北弗吉尼亚和根据GoogleCloud的一份报告,俄亥俄州)“将经历高达50%的数据包丢失”大约两个小时,然后“网络延迟增加”另外两个小时。
报告称:“对于在此次停电期间受到影响的客户,我们深表歉意。”“我们正在进行内部调查,并正在采取措施改善。”
六月MicrosoftAzure和M365在线中断
据微软称,6月7日,客户无法连接到位于弗吉尼亚州的美国东部2地区托管的资源。该问题持续了大约12小时,应该不会影响到具有始终可用或区域冗余服务的客户。
根据微软的一份报告,这家总部位于华盛顿州雷德蒙德的科技巨头将此次停电归咎于“我们在美国东部2地区的一个可用区内的一个数据中心出现了计划外的电力波动”。
它继续说:“我们冗余电源系统的组件产生了意外的电气瞬变,导致空气处理单元(AHU)检测到潜在故障,因此在手动复位之前自行关闭。”
报告称,中断影响了ApplicationInsights、LogAnalytics、托管身份服务、媒体服务和NetApp文件。
报告称,微软正在研究如何“改进我们的工具和流程以更快地标记异常”并“微调我们的警报,以更全面地通知现场数据中心操作员”。
该公司还“与我们的行业合作伙伴合作,制定故障注入测试相关关键环境系统的计划,以更加主动地识别和修复潜在风险”并“扩大支持可用区的Azure服务数量,以便客户可以选择自动复制和/或构建自己的跨服务弹性。”
6月21日,微软在推特上表示正在调查ExchangeOnline的延迟和连接问题。大约两小时后,该公司在推特上表示,它“确定多个Microsoft365服务出现延迟、连接和搜索问题”,并通过重新路由流量做出回应。
大约九小时后,微软在推特上表示,“重新路由流量与有针对性的基础设施重启相结合,成功恢复了服务访问和功能。”
延伸阅读:5 家全球热门数据中心芯片供应商
六月Cloudflare中断
6月份Cloudflare的一次意外中断导致互联网大片区域出现重大中断,据报道影响了Discord、Shopify、Grindr、Fitbit和Peloton等热门网站。
这家总部位于旧金山的供应商为云部署提供安全和性能服务,称该问题是“我们的错误”造成的,并在大约1小时15分钟内得到解决。
Cloudflare在一篇博文中表示,周二凌晨的停电影响了其19个数据中心的流量。
“不幸的是,这19个地点处理了我们全球流量的很大一部分,”该公司表示。“这些位置的网络配置更改导致了从UTC时间06:27开始的中断。世界标准时间06:58时,第一个数据中心重新上线,到世界标准时间07:42时,所有数据中心都已上线并正常工作。”
该公司在其博客文章的介绍中总结道:“我们对这次中断感到非常抱歉。这是我们的错误,而不是攻击或恶意活动的结果。”