免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123
最近访问板块 发新帖
楼主: 王楠w_n
打印 上一主题 下一主题

【大话IT】由炉石传说数据库事故说起!你的数据如何备份?(获奖名单已公布) [复制链接]

论坛徽章:
223
2022北京冬奥会纪念版徽章
日期:2015-08-10 16:30:32操作系统版块每日发帖之星
日期:2016-05-10 19:22:58操作系统版块每日发帖之星
日期:2016-02-18 06:20:00操作系统版块每日发帖之星
日期:2016-03-01 06:20:00操作系统版块每日发帖之星
日期:2016-03-02 06:20:0015-16赛季CBA联赛之上海
日期:2019-09-20 12:29:3219周年集字徽章-周
日期:2019-10-01 20:47:4815-16赛季CBA联赛之八一
日期:2020-10-23 18:30:5320周年集字徽章-20	
日期:2020-10-28 14:14:2615-16赛季CBA联赛之广夏
日期:2023-02-25 16:26:26CU十四周年纪念徽章
日期:2023-04-13 12:23:10操作系统版块每日发帖之星
日期:2016-05-10 19:22:58
21 [报告]
发表于 2017-02-17 11:07 |只看该作者
吹牛的本事都有,关键游戏跟互联网属于不同的业务,有些技术还是有些差异的。


简单说,互联网备份容易,游戏备份麻烦些,毕竟涉及一个实时性的问题,游戏大神设计师又未必考虑到这块死角

论坛徽章:
0
22 [报告]
发表于 2017-02-17 19:35 |只看该作者
冰冻三尺非一日之寒!

论坛徽章:
40
水瓶座
日期:2013-08-15 11:26:422015年辞旧岁徽章
日期:2015-03-03 16:54:152015年亚洲杯之乌兹别克斯坦
日期:2015-03-27 14:01:172015年亚洲杯之约旦
日期:2015-03-31 15:06:442015亚冠之首尔
日期:2015-06-16 23:24:37IT运维版块每日发帖之星
日期:2015-07-01 22:20:002015亚冠之德黑兰石油
日期:2015-07-08 09:32:07IT运维版块每日发帖之星
日期:2015-08-29 06:20:00IT运维版块每日发帖之星
日期:2015-08-29 06:20:00IT运维版块每日发帖之星
日期:2015-10-10 06:20:00IT运维版块每日发帖之星
日期:2015-10-11 06:20:00IT运维版块每日发帖之星
日期:2015-11-10 06:20:00
23 [报告]
发表于 2017-02-17 19:55 |只看该作者
终于出了个大新闻 多重安全机制下都没有保住数据

论坛徽章:
9
程序设计版块每日发帖之星
日期:2015-10-18 06:20:00程序设计版块每日发帖之星
日期:2015-11-01 06:20:00程序设计版块每日发帖之星
日期:2015-11-02 06:20:00每日论坛发贴之星
日期:2015-11-02 06:20:00程序设计版块每日发帖之星
日期:2015-11-03 06:20:00程序设计版块每日发帖之星
日期:2015-11-04 06:20:00程序设计版块每日发帖之星
日期:2015-11-06 06:20:00数据库技术版块每周发帖之星
日期:2015-12-02 15:02:47数据库技术版块每日发帖之星
日期:2015-12-08 06:20:00
24 [报告]
发表于 2017-02-20 19:37 |只看该作者
简单的说,就是备份的东西,自己没有做过恢复测试,类似的事情多了,
各种原因都有,
共同的特点就是:只做了备份,但是从来没有试过恢复,不重视运维造成的后果。

另外就是在备份的机制上没有做远程异地备份。

论坛徽章:
10
处女座
日期:2015-01-22 16:08:50技术图书徽章
日期:2018-09-13 11:25:52技术图书徽章
日期:2018-09-13 11:25:45技术图书徽章
日期:2018-09-13 11:25:37技术图书徽章
日期:2018-09-13 11:25:29黑曼巴
日期:2018-06-04 09:03:192017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:03:402015年迎新春徽章
日期:2015-03-04 09:50:28技术图书徽章
日期:2018-09-13 11:26:01
25 [报告]
发表于 2017-02-20 22:55 |只看该作者
    其实话说回来,我真心不太关注它这次问题的原因,作为一个资深的IT运维人员,我更关注的是它事件本身后面隐藏的本质。
    首先,每一个人都不得不接受一个现实就是,世界上没有不出问题的系统,所以我们制定了各种各样的措施来去降低出问题的几率,如更换更好的机器、使用Raid做硬盘保护、应用层面采用集群架构等等;同时,我们也会制定各种各样的流程制度办法来提高解决问题的时效,如数据库HA、存储级快照、自动化重启应用的脚本等等。这世界上的IT系统,无非如此,今天不出问题,不代表明天不出问题,并不是系统本身不行了,而且业务的发展超过了系统本身的承载力,不合时宜了。
    所以,明白这个现实之后,就会明白我们对系统本身所做的一系列优化措施是干什么用的,比如说备份,就是为了当数据意外丢失时,用来保命的手段,这是底线。就炉石传说而言,有主库,有备库,主库故障时,理论上备库应该起到作用的,为什么没起到作用?无非两点,要么备库也坏了,要么备库的数据太旧了。按照实际来说,我更相信是前者,即备库也坏了。一般来说,主备库为了保持数据一致性,是会保持数据同步的(即便不是实时,也会是准实时),那么一旦主库被人为破坏,那么被破坏的数据也会实时同步到备库,则备库也会损坏,从而导致主备均不可用,这就是备库也不可用的原因。这样的架构再配上频次较高的离线备份,就可以比较好的避免此类情况发生,而实际来看,暴雪是没有这样的措施的。
    所以出了问题不可怕,可怕是本可以快速恢复故障的手段也失效了,这才是我们要重视和下大力气改进的,本地高可用架构,应用集群化访问、离线高频次备份(异地),这样才能真正避免数据丢失的可怕情况,希望网易可以认真吸取此次教训,不要让玩家们再次失望。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP