免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12345下一页
最近访问板块 发新帖
查看: 16586 | 回复: 46

【话题讨论】从6·23工行事件 谈企业IT系统灾备问题(获奖名单已公布-2013-7-25) [复制链接]

论坛徽章:
8
巨蟹座
日期:2013-08-12 09:41:40IT运维版块每日发帖之星
日期:2015-12-09 06:20:00寅虎
日期:2013-12-25 14:59:40天秤座
日期:2013-12-06 14:04:55酉鸡
日期:2013-11-28 10:22:22水瓶座
日期:2013-08-26 15:40:54巨蟹座
日期:2013-08-12 09:42:01每日论坛发贴之星
日期:2015-12-09 06:20:00
发表于 2013-07-09 13:26 |显示全部楼层
获奖名单已公布,详情请看:http://bbs.chinaunix.net/thread-4092342-1-1.html

近日,工商银行信息科技部就6月23日工行系统故障事件(以下简称“6·23事件”)正式作出内部通报。通报称,工行数据中心(上海)主机系统出现故障,是由于IBM提供的主机DB2V10版本内存清理机制存在缺陷引发,但针对通报中提及的“经IBM公司正式确认”,IBM公司并未给予回应。

据了解,在技术问题之外,工行本身的管理问题以及国内银行业信息系统落后的沉疴可能也是此次事件的诱因。比如,通报也提及了一些管理问题,但表述颇为模糊,通报称,(数据中心上海)没有按照‘第一时间恢复生产’的要求采取果断措施及时进行回退,并且回退过程不坚决,耗时较长。业内人士指出,银行的IT系统永远面临信息安全的挑战,但悲哀的是,银行在IT系统和灾难备份中不计成本,但遇到这样的大面积的安全问题依然无法在短时间内恢复系统。

讨论话题:
1,你认为这次事故后,灾备系统无法迅速恢复系统的原因是什么?
2,你认为目前银行的IT系统建设目前存在哪些问题?
3,你认为灾备系统的有效性如何得以实现?


讨论时间:2013.7.9--2013.7.23

讨论奖励:活动结束后将会抽取5位会员赠送社区精美笔记本一件。
092739ojz0ovv0y500bo50.jpg


论坛徽章:
18
巳蛇
日期:2014-12-03 08:27:5115-16赛季CBA联赛之吉林
日期:2016-04-18 15:24:24qiaoba
日期:2016-06-17 17:41:1615-16赛季CBA联赛之八一
日期:2016-06-20 15:13:1415-16赛季CBA联赛之广夏
日期:2016-06-29 10:38:28极客徽章
日期:2016-12-07 14:03:4015-16赛季CBA联赛之吉林
日期:2017-03-06 13:47:55
发表于 2013-07-09 13:51 |显示全部楼层
悲哀个毛
哪个灾备中心能短时间内恢复系统?


灾备中心演练一次都要几天时间

论坛徽章:
0
发表于 2013-07-09 14:04 |显示全部楼层

请问业内资深人士,18摸这次是替罪羊么?

论坛徽章:
22
CU大牛徽章
日期:2013-09-18 15:22:06白羊座
日期:2014-04-14 22:56:32午马
日期:2014-05-16 17:18:08巳蛇
日期:2014-05-30 20:53:19寅虎
日期:2014-06-03 10:53:34未羊
日期:2014-08-12 22:15:31神斗士
日期:2015-11-20 17:26:2515-16赛季CBA联赛之浙江
日期:2016-03-15 18:27:4215-16赛季CBA联赛之同曦
日期:2016-03-22 09:21:0115-16赛季CBA联赛之北控
日期:2017-03-26 21:47:12技术图书徽章
日期:2014-04-03 16:47:26摩羯座
日期:2014-03-25 23:51:36
发表于 2013-07-09 14:20 |显示全部楼层
本帖最后由 GB_juno 于 2013-07-09 14:20 编辑

银行对灾备方面不是一直都是投了很多钱进去的么?什么两地三中心之类的。。
这方面也不太懂,凑个热闹。

论坛徽章:
8
巨蟹座
日期:2013-08-12 09:41:40IT运维版块每日发帖之星
日期:2015-12-09 06:20:00寅虎
日期:2013-12-25 14:59:40天秤座
日期:2013-12-06 14:04:55酉鸡
日期:2013-11-28 10:22:22水瓶座
日期:2013-08-26 15:40:54巨蟹座
日期:2013-08-12 09:42:01每日论坛发贴之星
日期:2015-12-09 06:20:00
发表于 2013-07-09 14:32 |显示全部楼层
我觉得现在软硬件及核心技术受制于人是企业面临的首要问题,而且这次的业务恢复机制做的确实不怎么样。个人观点,嘿嘿/回复 2# gilet


   

论坛徽章:
381
CU十二周年纪念徽章
日期:2014-01-04 22:46:58CU大牛徽章
日期:2013-03-13 15:32:35CU大牛徽章
日期:2013-03-13 15:38:15CU大牛徽章
日期:2013-03-13 15:38:52CU大牛徽章
日期:2013-03-14 14:08:55CU大牛徽章
日期:2013-04-17 11:17:19CU大牛徽章
日期:2013-04-17 11:17:32CU大牛徽章
日期:2013-04-17 11:17:37CU大牛徽章
日期:2013-04-17 11:17:42CU大牛徽章
日期:2013-04-17 11:17:47CU大牛徽章
日期:2013-04-17 11:17:52CU大牛徽章
日期:2013-04-17 11:17:56
发表于 2013-07-09 15:00 |显示全部楼层
感觉银行之类的行业,灾备水平应该是最高级别的,肯定至少是异地灾备吧,事件发生后,恢复事件漫长,确实很令人费解
1,你认为这次事故后,灾备系统无法迅速恢复系统的原因是什么?
  1楼已经提到了,回退的过程执行的不坚决,造成系统瘫痪的时间拖长,这个应该是这次事件的主要原因.
2,你认为目前银行的IT系统建设目前存在哪些问题?
  银行应该向电商学习,升级/调试系统分阶段实施,小规模测试通过再加大升级机器数量.出现问题,影响的面要小很多.
3,你认为灾备系统的有效性如何得以实现?
  象银行这样的行业,备份应该是实时的,保证数据有效性应该通过硬件校验数据实现,同时,通过监控存储的状态,及时处理数据差错.

论坛徽章:
31
CU大牛徽章
日期:2013-05-20 10:45:13每日论坛发贴之星
日期:2015-09-07 06:20:00每日论坛发贴之星
日期:2015-09-07 06:20:00数据库技术版块每日发帖之星
日期:2015-12-13 06:20:0015-16赛季CBA联赛之江苏
日期:2016-03-03 11:56:13IT运维版块每日发帖之星
日期:2016-03-06 06:20:00fulanqi
日期:2016-06-17 17:54:25IT运维版块每日发帖之星
日期:2016-07-23 06:20:0015-16赛季CBA联赛之佛山
日期:2016-08-11 18:06:41JAVA
日期:2016-10-25 16:09:072017金鸡报晓
日期:2017-01-10 15:13:292017金鸡报晓
日期:2017-02-08 10:33:21
发表于 2013-07-09 15:15 |显示全部楼层
关于工行623事件,前几天正好看到一个相关的笑话,与大家分享:

工行某高级工程师:
跟工行数据中心一位领导聊天。提到前几天的数据库坍塌事故,他说也算是好事,大boss们平时不觉得IT重要,这次柜台、ATM、网银全宕,影响太大太坏,大boss才知道原来IT这么重要!又问我大数据到底是什么?我瞎说了一番,他说,行长要我们思考如何做大数据下的共产党员。这是我听说过的最牛大数据应用!

论坛徽章:
137
2022北京冬奥会纪念版徽章
日期:2015-08-07 17:10:5719周年集字徽章-庆
日期:2019-08-27 13:28:5615-16赛季CBA联赛之福建
日期:2019-09-10 11:43:2519周年集字徽章-周
日期:2019-12-12 10:54:07
发表于 2013-07-09 15:53 |显示全部楼层
行长要我们思考如何做大数据下的共产党员

论坛徽章:
8
巨蟹座
日期:2013-08-12 09:41:40IT运维版块每日发帖之星
日期:2015-12-09 06:20:00寅虎
日期:2013-12-25 14:59:40天秤座
日期:2013-12-06 14:04:55酉鸡
日期:2013-11-28 10:22:22水瓶座
日期:2013-08-26 15:40:54巨蟹座
日期:2013-08-12 09:42:01每日论坛发贴之星
日期:2015-12-09 06:20:00
发表于 2013-07-09 16:16 |显示全部楼层
大数据时代下的党员回复 7# jieforest


   

论坛徽章:
0
发表于 2013-07-09 16:42 |显示全部楼层
本帖最后由 yaozhibing41001 于 2013-07-09 16:55 编辑

1,你认为这次事故后,灾备系统无法迅速恢复系统的原因是什么?
  
作为史上最赚钱的银行的技术人员,他们的技术,我们不能否认,作为技术人员,平常还是要考虑到线上系统在出现问题时的解决办法,要时常练兵,这样在出现问题时,不会手忙脚乱。说到底,也就是没有突发事件处理方法。不知道怎么办。临时想办法,这个是最忌讳的。

2,你认为目前银行的IT系统建设目前存在哪些问题?

银行里面存的都是老百姓的血汗钱,不管银行怎么看待这些数据,作为技术人员,数据可就是技术人员的生命,所以,备份,备份,结合第一点说的,缺少流程,技术人员缺少经验,缺少应急问题处理方法。

3,你认为灾备系统的有效性如何得以实现?

本地镜像备份,本地实时备份,异地镜像备份,异地实时备份,如果出现数据丢失,这样我们也能临时切换走,然后恢复本地数据,不过之前肯定要做好一些准备工作,比如异地的数据能不能支撑银行的访问量,切换异地时如何保障网络访问等。
按照我们公司的一套做法,就是:本地机房有两套数据库,电信机房有一套数据库,网通机房一套数据库,平常一套跑线上业务,另外几套就是备份,数据是同步的。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

DTCC2020中国数据库技术大会

【架构革新 高效可控】2020年12月21日-23日第十一届中国数据库技术大会将在北京隆重召开。

大会设置2大主会场,20+技术专场,将邀请超百位行业专家,重点围绕数据架构、AI与大数据、传统企业数据库实践和国产开源数据库等内容展开分享和探讨,为广大数据领域从业人士提供一场年度盛会和交流平台。

http://dtcc.it168.com


大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP