免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123
最近访问板块 发新帖
楼主: mike1979
打印 上一主题 下一主题

[容灾] 宁夏银行故障后续 [复制链接]

论坛徽章:
0
21 [报告]
发表于 2014-10-18 11:30 |只看该作者
这就是典型的脑残方案和弱爆了的DBA,浪费呀

论坛徽章:
0
22 [报告]
发表于 2014-11-19 13:58 |只看该作者
同意你的说法。
飞康CDP的保护方式有两种,一种是生产存储的镜像保护,在UNIX平台就是借助于操作系统的LVM来实现的,就是飞康后边另外挂一套存储,配置跟生产LUN匹配的备份LUN,然后再UNIX操作系统层面通过LVM实现卷镜像功能,以便在生产存储出现问题的时候备份存储能够无缝接管,对业务来说是透明的。

另外一种就是基于镜像卷的录像功能,旨在记录生产LUN的block级别的变化,用来实现飞康号称的24小时内任意时间点恢复。

明确了如上两种保护机制,就知道所谓的“中断CDP备份系统录像功能”导致核心数据库宕机加数据损坏的说法肯定是不成立了。
拿么实际问题最有可能就是由于当初部属飞康CDP镜像保护的时候,LVM的默认策略及相关配置参数没有进行优化导致,由于备份存储性能差,读写响应延时,飞康CDP网关的缓存撑爆,导致备份存储LUN与生产LUN的数据不一致,而LVM策略是parallel的,于是导致生产数据库宕机,同时带来的还有数据损坏。


phanx 发表于 2014-08-19 01:05
这个项目实施中肯定有问题。飞康难道没有把控过?
这种两个存储镜像的LV,sched policy 应该设置成sequent ...


论坛徽章:
1
辰龙
日期:2014-08-14 16:06:06
23 [报告]
发表于 2014-11-19 23:32 |只看该作者
eragonkiss 发表于 2014-11-19 13:58
由于备份存储性能差,读写响应延时,飞康CDP网关的缓存撑爆,导致备份存储LUN与生产LUN的数据不一致,而LVM策略是parallel的,于是导致生产数据库宕机,同时带来的还有数据损坏

要深究的话,这个说法也未必成立。
其实就是快存储和慢存储搭配,做并发写的LVM镜像。系统向两份存储同时写数据,都收到写成功后才向应用返回写成功。这种情况下只要慢存储能返回写成功,还是保证数据在两份存储上是相同的,不过快存储被拖累了,发挥不出性能。如果慢存储超时,或者返回写失败了,那系统就把慢存储上的这个PP标记为stale,不会再访问它了。stale PP多了,可能整个PV被标记为stale。此时虽然数据现在只在快存储上,但从应用的角度看,数据还是完好一致的。
现在这个情况好像是慢存储返回成功,但实际没有落地。比如慢存储将数据写入缓存就返回写成功,然后在数据落地到磁盘前缓存坏了,可存储却又还能访问。这种情况下两份数据就不一致了。只是缓存撑满只会导致写操作响应慢,不会导致数据不一致。

论坛徽章:
0
24 [报告]
发表于 2014-12-02 01:06 |只看该作者
同步做的是双向??以前有同事配置同步时干掉过生产卷。

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
25 [报告]
发表于 2015-02-17 08:56 |只看该作者
数据层就不应该有主、备自动切换,这是作死的节奏

论坛徽章:
0
26 [报告]
发表于 2017-06-16 09:06 |只看该作者
回复 1# mike1979

你说的很对,中断录像是在飞康控制台上进行的,据说当时飞康的缓存已满,录像延时很严重。

论坛徽章:
0
27 [报告]
发表于 2017-12-02 14:25 |只看该作者
Did you not want to tell 'em it's the end
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP