免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: sofsys
打印 上一主题 下一主题

[备份软件] CDP是什么东东?与正常的备份有什么区别? [复制链接]

论坛徽章:
0
51 [报告]
发表于 2009-10-31 17:49 |只看该作者
原帖由 spook 于 2009-10-31 15:57 发表
LSI 的 G-Mirror算不算 CDP啊

IBM的 PPRC呢?

wyddg  强调的是硬件CDP一定会丢数据,冬瓜说的是两边写的数据是一样的,丢了也是应用的事情……

没什么冲突啊……

还有,CDP是被注册的技术名词吗?: ...


我强调的是硬件CDP,为了保证一致性点,不可能做的时间间隔很小,也就不是CDP了!

真正意义的CDP只能应用来做!

论坛徽章:
0
52 [报告]
发表于 2009-10-31 17:53 |只看该作者
原帖由 冬瓜头 于 2009-10-31 16:00 发表
数据库的CDP最小粒度应该是事务,这点你没有异议吧?
》当然没有异议。

基于数据库本身才有可能以事务为单位进行同步,底层CDP能做到吗?
》之前贴明确说过,底层cdp一样需要上层replay,上层不管是日志同 ...


基于数据库自身技术的同步可以通过挖掘日志等手段,直接同步事务,当然事务也是很多SQL组成,如果出现问题也会回滚到以前

的状态。

基于存储阵列等底层设备的同步完全跟事务没有任何关系,本身同步粒度上就有缺陷了,

为了保持一致性还要靠再开发专门的应用快照代理等等, 在快照点保持

数据的一致性,而快照点还需要刷内存,改变应用运行状态等等,对应用影响很大,所以不能做的太频繁,不能做的太频繁

那还能叫CDP吗?

论坛徽章:
2
2015年迎新春徽章
日期:2015-03-04 09:49:45IT运维版块每日发帖之星
日期:2016-07-29 06:20:00
53 [报告]
发表于 2009-10-31 18:57 |只看该作者
你我正好反过来了,底层的每一个写io都被镜像的话,当然也就镜像了每一笔transaction,至于最后的一致性点在哪里,这个不用关心,只要每一个写io都保存了,还怕什么?replay一下恢复到最后的一致点就好了。这一样叫做cdp。应用层的cdp同样也得replay,你能replay,你能叫cdp,底层就不能叫?
不管应用层还是底层,都一样。

论坛徽章:
0
54 [报告]
发表于 2009-10-31 23:11 |只看该作者
哇塞,几天不见,这么多人关注,我也学到不少,多谢大家啦。

嘿Chnod ,CH-DPS的测试软件我下载了,我工程师说用起来感觉就像配置电脑差不多,速度还挺快,操作起来挺方便的。

多谢啦!

论坛徽章:
0
55 [报告]
发表于 2009-11-01 12:06 |只看该作者
原帖由 冬瓜头 于 2009-10-31 18:57 发表
你我正好反过来了,底层的每一个写io都被镜像的话,当然也就镜像了每一笔transaction,至于最后的一致性点在哪里,这个不用关心,只要每一个写io都保存了,还怕什么?replay一下恢复到最后的一致点就好了。这一 ...


你也认可数据库CDP最小的粒度是事务,数据库的事务,上层数据库应用的事务

我想问的是底层的IO记录下来之后,如何去按照事务恢复数据库?底层的IO和上层的数据库事务有什么联系?如何转换?

论坛徽章:
2
2015年迎新春徽章
日期:2015-03-04 09:49:45IT运维版块每日发帖之星
日期:2016-07-29 06:20:00
56 [报告]
发表于 2009-11-01 15:09 |只看该作者
这个很明显啊,上层replay啊,要靠应用程序来检测最后的一致点在哪里,底层只管所有io都给你同步了就行了。举例来讲,你突然关机,文件系统起来会fsck,数据库同样也会redo和undo啊。

论坛徽章:
0
57 [报告]
发表于 2009-11-01 23:51 |只看该作者
原帖由 冬瓜头 于 2009-11-1 15:09 发表
这个很明显啊,上层replay啊,要靠应用程序来检测最后的一致点在哪里,底层只管所有io都给你同步了就行了。举例来讲,你突然关机,文件系统起来会fsck,数据库同样也会redo和undo啊。


。。。。。。

这种数据不一致的replay是不可靠的,应用也不会承诺一定会成功,存在根本业务起不来的风险,或者即使应用能起来,也要耗费大量的时间,文件系统的fsck就需要耗费大量时间,

使用CDP的客户都是高端客户,根本不可能接受这种风险和时间的耗费,所以现在底层的CDP都需要结合快照确定一些一致性点,然后就恢复这些快照点,

飞康CDP绝大部分(也是飞康公司自己的推荐)都是恢复快照点数据的,

所以底层CDP的劣势很明显:如果任意恢复,不能保证数据一致性,需要上层replay,存在风险和时间耗费;如果恢复快照点的一致性数据,这些快照点又不可能时间间隔很小,所以也就

不能称之为CDP了

论坛徽章:
0
58 [报告]
发表于 2009-11-02 00:08 |只看该作者

回复 #57 wyddg 的帖子

有道理,CH-DPS也是通过镜像或者叫快照方式管理,至于细节嘛,俺做SALES的就不瞎说了,事实能证明一切,这才是硬道理。

论坛徽章:
2
2015年迎新春徽章
日期:2015-03-04 09:49:45IT运维版块每日发帖之星
日期:2016-07-29 06:20:00
59 [报告]
发表于 2009-11-02 08:02 |只看该作者
原帖由 wyddg 于 2009-11-1 23:51 发表


。。。。。。

这种数据不一致的replay是不可靠的,应用也不会承诺一定会成功,存在根本业务起不来的风险,或者即使应用能起来,也要耗费大量的时间,文件系统的fsck就需要耗费大量时间,

使用CDP的客 ...


裸回复只是一种方法而已,起不来的风险是有的,但是至少不是每次都起不来。另外,恢复粒度方面,自然有对应的办法,飞康emc都有,它们底层会将应用的一致点映射过来,相比上层来说是近似的,所以底层的粒度只会比上层选择更多。

论坛徽章:
0
60 [报告]
发表于 2009-11-02 09:48 |只看该作者
二位达人,兄弟掺合一下哦。

我想二位可能忽略了一点,CDP为什么只有在存储这个板块里被讨论?(或者是兄弟寡闻,不知道在应用方面有没有类似的说法)

就好比冬瓜兄说过的一句:如果服务器突然Down机了,文件系统和应用还不是要靠自己去搞定那些在Down之前没有来得及从内存中刷到硬盘上去的数据?CDP解决的就是存储层的问题,尽可能保证你的存储上的数据是可恢复的,而且是具有时间戳可回滚恢复能力的。真的出问题了,靠文件系统和应用自己搞定一致性问题去吧。偶尔会提供一致性检查点的标示,只是为了让你能够确保某一时间点的数据是一致的,而且也必须通过主机Agent等方式解决,这种工作方式和Shareplex等软件其实也没有不同,只是不可能做到基于应用事务那么小的颗粒度而已。

所以,完全没有必要纠结在底层还是应用层上,真正需要应用层的用户不会考虑存储层的CDP解决方案(例如,他需要目标端应用是活的可以随时访问),那些真正看中存储CDP解决方案的,也不一定就会完全接受应用层的复制(例如,Shareplex就搞不定文件系统的连续复制)。

那些用镜像加快照方式实现的解决方案就没有必要讨论了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP