mike1979 发表于 2014-08-14 16:02

宁夏银行故障后续



这次的通报比上次要详细。不过还是有模糊的地方
CDP存储性能差-->业务慢-->为解决性能问题,“中断CDP备份系统录像功能”-->备份系统数据损坏-->LVM镜像将损坏的数据同步到主存储。
问题在于“中断CDP备份系统录像功能”是怎么做的,为什么会导致备份系统数据损坏?是操作不当,还是产品内在缺陷?不过至少说明中断录像功能并不是在主机层面将LVM镜像切开,应该是在存储层的操作。
至于“LVM镜像将损坏的数据同步到主存储”也很奇怪。这句话是说虽然备份系统数据损坏了,但是系统层面认为主存储和备份系统的数据都正常,都能正常读写,否则也没法把错误数据同步到主存储上。那备份系统的数据损坏就应该是逻辑层面的,也就是说虽然还能正常访问,但数据不是原来的数据了。在CDP存储上什么操作会有这个效果?

q1208c 发表于 2014-08-14 16:59

小声问下, "飞康CDP" 是个什么东东?

rtm009 发表于 2014-08-14 19:30

还在纠结技术问题呢 无语中:outu:

bbjmmj 发表于 2014-08-14 20:50

LVM创建镜像的时候默认(-M n)是随机指定主设备,后挂上去的LUN可能会无意中成为主设备,在“备份系统数据损坏”的情况下,刷坏生产系统很正常。:mrgreen:

mike1979 发表于 2014-08-14 20:50

回复 3# rtm009
要是技术上不出问题的话,事故就没那么严重。


   

bbjmmj 发表于 2014-08-14 20:53

踢出物理卷会导致minor号发生变化,如果数据库捆绑minor号,启动不了事正常的。

ChinaUnixViewer 发表于 2014-08-15 10:36

回复 1# mike1979

宁夏银行这种情况,正确的处理方式是?先关闭数据库再处理存储问题?


   

bbjmmj 发表于 2014-08-15 12:44

回复 7# ChinaUnixViewer


    不仅要关闭数据库,还要UMOUNT被镜像的卷,成功UMOUNT之后才能做别的处理。

lbseraph 发表于 2014-08-15 21:01

配置问题(拿性能相差大的存储来做CDP?),原有的电池故障也没及时处理。

allway 发表于 2014-08-16 19:01

用的设备购低端
页: [1] 2 3
查看完整版本: 宁夏银行故障后续