• 服务瘫痪数日,是火灾的锅还是Kakao的锅?


    韩国数据中心发生火灾

    10月15日下午3点33分,SK C&C的板桥数据中心(A栋电气室,三层以下)发生火灾,这里存储着Kakao、Naver等企业的海量数据。

    Kakao Talk是韩国最受欢迎的即时通讯应用,有韩国的“微信”之称,月活跃用户达到4300万名(韩国人口总数约5100万)。除此之外,Kakao旗下还有移动支付应用Kakao Pay、银行服务 Kakao Bank 、游戏应用Kakao Games、电商平台Zigzag、门户网站Daum和交通服务应用程序Kakao T等。

    NAVER是著名社交软件LINE的母公司,世界第五大(仅次于谷歌、雅虎、百度和必应)搜索引擎网站 ,也是韩国最大的搜索引擎和门户网站,韩国股票市场上市值最大的互联网公司。

    截至2022年9月,Kakao Talk的MAU为4580万,Naver 的即时通讯应用 Line 每月有大约 160 万活跃用户。发生火灾的数据中心是Kakao的主要数据中心,此次事故导致Kakao的32,000台服务器下线。Naver在通过该数据中心提供的相关服务也被迫中断。

    大火在晚上11点46分被扑灭,到第二天上午9点,90%受影响的服务器恢复了供电。

    同一个数据中心,不同的灾难应对方式

    事故发生后,Naver紧急启用了在春川等其他数据中心分散储存的业务数据,让被迫中断的业务得以在几个小时内恢复。其股价在周一开盘时仅下跌2%。

    Kakao方面解释说:“为了应对外部状况带来的障碍,我们拥有二元化系统(即备份系统)。”但仅让聊天部分的功能恢复就花费了10个小时,导致依赖Kakao Talk为客户提供预定管理等服务的企业造成巨大损失。而Kakao的其他服务则出现了长达20个小时的业务中断,使韩国全国各地接连受到损失。

     

    业务中断时间越长,企业损失越大

    1、市场份额缩小

    韩国总统尹锡悦于16日曾为Kakao Talk网络服务中断一事向公众表示歉意,并于一天后表示,为了维护国民利益,国家需干预市场垄断行为。Kakao在韩国的市场份额也将受到影响。

    2、经济损失

    在周一股市开盘后,Kakao的股价下跌了9%以上,预计Kakao第4季度的收入将损失220亿韩元(约合人民币1亿元)。若包括向受影响的用户支付的赔偿金额,Kakao的损失金额预计会更大。

    3、企业高层动荡

    19日上午,联席首席执行官南宫燻因数据中心发生火灾导致服务中断数日,引咎辞职。

    正确灾备,保障业务连续性

    在2012年4月,Kakao就因数据中心电力供应中断而中断4个小时服务。当时就有人批评Kakao公司没有使用分布式存储。十年间,Kakao的子公司数膨胀到130多个,成为了用于沟通、打车、结算的国民聊天工具,总市值排名前10位的大企业。

    对外声明已配备备份系统的Kakao为何服务瘫痪数日之久,我们不得而知。只能在此为大家再次强调:在事故发生时,如何让灾备系统快速恢复业务?

     注 意 事 项 : 

    1. 企业需要具备将生产系统即时恢复到异地灾备中心的能力

    2. 对核心业务系统的RPO,RTO指标有明确要求,以部署合适的灾备方案

    3. 针对核心业务系统的灾备演练规划并定期进行容灾演练

    如何操作?

    · Step 1

    进入https://hyperbdr.oneprocloud.com/login,注册并登录。

    △根据页面向导式操作,完成灾备系统的部署。

    HyperBDR®云容灾独有的Boot in Cloud™技术,内嵌的云端编排能力,可自动创建云资源,实现云端一键拉起主机,接管业务到可用状态。当事故发生时,极大程度缩短业务RTO。

    · Step 2

    容灾演练是保证业务连续性的另一个关键动作。很多企业误以为灾备系统部署完毕便可高枕无忧。随着公司的业务壮大,或是技术升级,企业需要定期进行容灾演练,才能保证事故发生时,灾备系统高可用。

    HyperBDR®云容灾可自定义快照策略,并选择时间点的快照进行快速恢复,还原对应业务系统数据和状态。

    HperBDR®云容灾使用云端备份数据,利用演练卷拉起业务系统,对源端无影响。

    企业可利用HperBDR®云容灾按演练需要启动相应云端资源,与容灾接管分离。

    · Step  3

    当事故真正发生时,进行过多次容灾演练的灾备系统,因为已经提前配置好了所有配置项,(如IP地址、计算资源、磁盘类型等),现在只需要选择好恢复的主机,再点击“容灾接管”并确定就即可。

     

    数据经济的时代,企业更需要加强对灾备解决方案的投资,以保障业务数据的稳定运行,避免企业因不可预知的灾难事故而造成重大损失。

  • 相关阅读:
    PDO:插入示例
    《SpringBoot篇》05.超详细日志配置介绍
    Python史上最全种类数据库操作方法,你能想到的数据库类型都在里面!甚至还有云数据库!
    仓颉语言HelloWorld内测【仅需三步】
    TikTok快速起号技巧(上篇)
    5个高清图片素材网站,无水印,免费商用。
    LVGL V8.2 嵌入式Linux平台使用tslib实现输入接口(以SSD212为例)
    C++继承、多态与虚函数(二)
    [附源码]Python计算机毕业设计Django的云网盘设计
    Go 如何实现多态
  • 原文地址:https://blog.csdn.net/OneProCloud/article/details/127431936