忘记密码   免费注册 查看新帖 | 论坛精华区

ChinaUnix.net

  平台 论坛 博客 认证专区 大话IT 视频 徽章 文库 沙龙 自测 下载 频道自动化运维 虚拟化 储存备份 C/C++ PHP MySQL 嵌入式 Linux系统
123
最近访问板块 发新帖
楼主: 王楠w_n

【大话IT】由炉石传说数据库事故说起!你的数据如何备份? [复制链接]

论坛徽章:
207
2022北京冬奥会纪念版徽章
日期:2015-08-10 16:30:322015亚冠之全北现代
日期:2016-05-11 17:05:27操作系统版块每日发帖之星
日期:2016-05-10 19:23:04操作系统版块每日发帖之星
日期:2016-05-10 19:23:04操作系统版块每日发帖之星
日期:2016-05-10 19:23:04操作系统版块每日发帖之星
日期:2016-05-10 19:23:04操作系统版块每日发帖之星
日期:2016-05-10 19:22:58数据库技术版块每日发帖之星
日期:2016-05-10 19:23:04数据库技术版块每日发帖之星
日期:2016-05-10 19:23:04操作系统版块每日发帖之星
日期:2016-05-10 19:22:58操作系统版块每日发帖之星
日期:2016-05-10 19:22:58操作系统版块每日发帖之星
日期:2016-05-10 19:22:58
发表于 2017-02-17 11:07 |显示全部楼层
吹牛的本事都有,关键游戏跟互联网属于不同的业务,有些技术还是有些差异的。


简单说,互联网备份容易,游戏备份麻烦些,毕竟涉及一个实时性的问题,游戏大神设计师又未必考虑到这块死角
来自安卓客户端来自客户端

论坛徽章:
0
发表于 2017-02-17 19:35 |显示全部楼层
冰冻三尺非一日之寒!

论坛徽章:
39
水瓶座
日期:2013-08-15 11:26:422015年辞旧岁徽章
日期:2015-03-03 16:54:152015年亚洲杯之乌兹别克斯坦
日期:2015-03-27 14:01:172015年亚洲杯之约旦
日期:2015-03-31 15:06:442015亚冠之首尔
日期:2015-06-16 23:24:37IT运维版块每日发帖之星
日期:2015-07-01 22:20:002015亚冠之德黑兰石油
日期:2015-07-08 09:32:07IT运维版块每日发帖之星
日期:2015-08-29 06:20:00IT运维版块每日发帖之星
日期:2015-08-29 06:20:00IT运维版块每日发帖之星
日期:2015-10-10 06:20:00IT运维版块每日发帖之星
日期:2015-10-11 06:20:00IT运维版块每日发帖之星
日期:2015-11-10 06:20:00
发表于 2017-02-17 19:55 |显示全部楼层
终于出了个大新闻 多重安全机制下都没有保住数据

论坛徽章:
9
程序设计版块每日发帖之星
日期:2015-10-18 06:20:00程序设计版块每日发帖之星
日期:2015-11-01 06:20:00程序设计版块每日发帖之星
日期:2015-11-02 06:20:00每日论坛发贴之星
日期:2015-11-02 06:20:00程序设计版块每日发帖之星
日期:2015-11-03 06:20:00程序设计版块每日发帖之星
日期:2015-11-04 06:20:00程序设计版块每日发帖之星
日期:2015-11-06 06:20:00数据库技术版块每周发帖之星
日期:2015-12-02 15:02:47数据库技术版块每日发帖之星
日期:2015-12-08 06:20:00
发表于 2017-02-20 19:37 |显示全部楼层
简单的说,就是备份的东西,自己没有做过恢复测试,类似的事情多了,
各种原因都有,
共同的特点就是:只做了备份,但是从来没有试过恢复,不重视运维造成的后果。

另外就是在备份的机制上没有做远程异地备份。

论坛徽章:
4
处女座
日期:2015-01-22 16:08:502015年迎新春徽章
日期:2015-03-04 09:50:28极客徽章
日期:2016-12-07 14:03:402017金鸡报晓
日期:2017-01-10 15:19:56
发表于 2017-02-20 22:55 |显示全部楼层
    其实话说回来,我真心不太关注它这次问题的原因,作为一个资深的IT运维人员,我更关注的是它事件本身后面隐藏的本质。
    首先,每一个人都不得不接受一个现实就是,世界上没有不出问题的系统,所以我们制定了各种各样的措施来去降低出问题的几率,如更换更好的机器、使用Raid做硬盘保护、应用层面采用集群架构等等;同时,我们也会制定各种各样的流程制度办法来提高解决问题的时效,如数据库HA、存储级快照、自动化重启应用的脚本等等。这世界上的IT系统,无非如此,今天不出问题,不代表明天不出问题,并不是系统本身不行了,而且业务的发展超过了系统本身的承载力,不合时宜了。
    所以,明白这个现实之后,就会明白我们对系统本身所做的一系列优化措施是干什么用的,比如说备份,就是为了当数据意外丢失时,用来保命的手段,这是底线。就炉石传说而言,有主库,有备库,主库故障时,理论上备库应该起到作用的,为什么没起到作用?无非两点,要么备库也坏了,要么备库的数据太旧了。按照实际来说,我更相信是前者,即备库也坏了。一般来说,主备库为了保持数据一致性,是会保持数据同步的(即便不是实时,也会是准实时),那么一旦主库被人为破坏,那么被破坏的数据也会实时同步到备库,则备库也会损坏,从而导致主备均不可用,这就是备库也不可用的原因。这样的架构再配上频次较高的离线备份,就可以比较好的避免此类情况发生,而实际来看,暴雪是没有这样的措施的。
    所以出了问题不可怕,可怕是本可以快速恢复故障的手段也失效了,这才是我们要重视和下大力气改进的,本地高可用架构,应用集群化访问、离线高频次备份(异地),这样才能真正避免数据丢失的可怕情况,希望网易可以认真吸取此次教训,不要让玩家们再次失望。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

  

北京皓辰网域网络信息技术有限公司. 版权所有 京ICP证:060528号 北京市公安局海淀分局网监中心备案编号:1101082001
广播电视节目制作经营许可证(京) 字第1234号 中国互联网协会会员  联系我们:
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP