免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
1234下一页
最近访问板块 发新帖
查看: 31669 | 回复: 35
打印 上一主题 下一主题

[容灾] 参加同有飞骥NRS容灾系统青岛研讨会纪实,爆一爆NRS系统底层细节。 [复制链接]

论坛徽章:
2
2015年迎新春徽章
日期:2015-03-04 09:49:45IT运维版块每日发帖之星
日期:2016-07-29 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-09-03 20:51 |只看该作者 |倒序浏览
9月3日下午两点半,本人闲来无事,去参加了一下同有飞骥公司NRS容灾系统宣讲会,总体感觉不错,功能演示做的也很成功。这里随便写一点见闻,主要是爆一爆NRS系统的具体技术原理。
    入场前登记,人家问我要名片,比较糗,从毕业以来鄙人尚无片,看来以后我得自己印一下个人片了,呵呵。厚着脸皮拿着材料进场,坐最后一排。开始是位总经理讲了些大方面,没听,看了看资料,说实话,资料做的不咋地,NRS介绍部分图片太小看不清。随后产品经理上台讲了讲NRS的具体内容,底层原理几乎没讲,我边听边把心里的疑问记了下来,大概十七八个问题。最后一部分就是演示了,演示本身比较成功,互动环节我还上去拔了个盘模拟灾难,弄个了小奖品。
    会后我拿着两张纸找同有的技术人员讨教了一翻,几个深问题还讨教了研发,最后和产品经理也就是演讲那位交流了一下,穷根问底,想蒙我是不行地,呵呵。
    总体感觉这个NRS容灾系统还是很实用的,snapshot+cdp更是业界前沿的技术,不过成本应该很高了,相当于数据全镜像了一份。



用几句话总结一下什么是NRS:

1.物理部分:服务器机头+扩展柜。
2.软件部分:对后端做RAID,做volume,做snapshot,做CDP,可以两台NRS之间互相同步数据。
3.应用情形:将NRS接入现有的后端san,在NRS上做好与主机上原来用的lun大小相当的volume,需要大一些因为需要cdp和snapshot空间。主机上使用诸如lvm之类的卷镜像软件,将主机原来使用的卷与NRS上的卷进行镜像同步,这样相当于将主存储上的数据镜像了一份在NRS盘阵上。NRS上提供snapshot,cdp功能,可以保存原数据任何时间点的镜像,并且snapshot和cdp镜像可写,这样,当主存储挂掉,或者数据误操作之后,直接mountNRS上的快照恢复数据,而且还可以直接让主机从snapshot和cdp镜像启动起来,snapshot可写,主存储恢复之后,主机上的镜像软件重新同步NRS上的数据到主存储上。主站点和备份站点可以部署两台nrs,之间数据同步,达到异地容灾。

卖点和劣势总结:
噱头1:rpo=0,rto很小,十分钟。演示过程也确实如此,只要在nrs配置界面将某snapshot映射给主机,主机直接可以从这个镜像启动。
噱头2:支持异构平台,不管主存储什么型号,因为使用了主机端镜像软件,比如lvm。

劣势1:仍然使用了主机端的卷镜像软件,对主机性能有影响。一开始我以为主机上的agent作用在很底层比如driver层,因为材料上说“捕获数据操作”,这个很雷,我甚至以为是在交换机上用某种方式来捕获数据,最后才知道其实就是lvm。
劣势2:如果主机端镜像软件严格保持同步,也就是rpo=0,那么nrs的性能必须大于等于主存储的性能,这一点应该是比较难的。所以,要么牺牲rpo来保证性能,要么牺牲性能来保证rpo了。
劣势3:相对于传统磁带备份,这系统更烧钱。


下面是我期间总结的几个问题。Q&A:

Q.通过agent将数据同步到nrs,还是通过switch来所谓“捕获”
A:主机端agent,所谓agent,就是lvm或者同有自研disksafe(不知道是不是自研)

Q.数据同步是使用与连接主存储的同一个hba么?如果这样,岂不是性能减半。
A:通常情况下是这样,但是可以使用单独的hba(不知道是否这样,理论上当然可以)

Q.那么说nrs的容量必须大于等于主存储的容量了。
A:是的。

Q.可以直接那nrs当主存储么?
A:可以

Q.nrs可以接扩展柜么?sas还是fc?
A:可以接扩展柜,sas还是fc尚无解。

Q.比如我用了某品牌主存储,也提供snapshot等功能,我再买一台也实现同样的共那个,那么我有什么理由选择nrs?
A:nrs可以屏蔽不同品牌的主存储,可以融入异构平台,而如果不用nrs,则需要为每个品牌都再买一台镜像,不划算了。

Q:如果我再随便买一台带snapshot之类的存储,主机端也用lvm镜像,出了问题,也mount个snapshot,岂不是也可以?
A:其他厂家这些功能加起来,价格昂贵。

Q.主存储的话支持本地盘对吧,也可以同步到nrs上。
A:对

Q.两台nrs之间的数据同步,支持同步和异步?异常断开后如何再次快速同步。
A:同异步都支持。bitmap方式。

Q.演示机怎么没看到挂硬盘。
A:挂了,让前面板挡住了。

Q.nrs是否支持第三方备份软件直接备份snapshot或者cdp镜像,有没有api。
A:支持,有。

Q.snapshot是copy on write还是write redirect模式
A:copy on write。

论坛徽章:
1
CU十二周年纪念徽章
日期:2013-10-24 15:41:34
2 [报告]
发表于 2009-09-03 21:10 |只看该作者
应该就是O的飞康吧

论坛徽章:
2
2015年迎新春徽章
日期:2015-03-04 09:49:45IT运维版块每日发帖之星
日期:2016-07-29 06:20:00
3 [报告]
发表于 2009-09-03 21:14 |只看该作者
很有可能。

论坛徽章:
0
4 [报告]
发表于 2009-09-04 08:57 |只看该作者
不是就是,根本就是.最大弱点就是自身软件安全问题.

论坛徽章:
2
2015年迎新春徽章
日期:2015-03-04 09:49:45IT运维版块每日发帖之星
日期:2016-07-29 06:20:00
5 [报告]
发表于 2009-09-04 09:16 |只看该作者
整个一飞康的复刻版啊。自身安全问题,这个能具体说一下么?

论坛徽章:
1
CU十二周年纪念徽章
日期:2013-10-24 15:41:34
6 [报告]
发表于 2009-09-04 10:01 |只看该作者
O的不彻底,管理软件的安装路径还是飞康的。

论坛徽章:
0
7 [报告]
发表于 2009-09-04 14:51 |只看该作者
看看,不参与讨论.

论坛徽章:
0
8 [报告]
发表于 2009-09-04 15:23 |只看该作者

回复 #1 冬瓜头 的帖子

实际上与传统的磁带备份相比,这种方式不一定烧钱,如果客户只保留最近的十几个历史版本,之前的数据全部不要,不需要太大的存储容量,何况现在的SATA磁盘也很便宜,飞康的CDP定位就是中低端的产品。

LVM同步数据的方式太土了,无法提供很多快照,否则影响生产的写性能,根本谈不上什么RPO=0了,飞康至少在Windows环境下还有个DiskSafe。

即使能够同步数据,进行快照,也远远达不到RPO=0,因为实际上只有快照点的数据才保证一致性(通过一些客户端代理Think内存之类),非快照点数据虽然也同步过来了,但是数据一致性无法保证,也许还是可用(通过应用本身非正常的启动起来),肯定存在数据丢失的情况

实际上不管是飞康的CDP还是同有的NRS(看样子多半的OEM飞康的),CDP功能只是一个噱头,真正实用的功能有2点:

1、一是与传统的备份方式相比支持快速恢复业务,也就是很快的先把快照挂起来用

2、二是2台之间远程复制进行容灾的时候,只有第一次同步数据量较大,后续只需要同步快照之间的变化数据,可以说永远是增量,数据量较小,而且远程复制的是生产数据,复制多少次都无所谓。而传统备份的基础上进行容灾就很麻烦了,即使远程复制也是备份数据,还有周期性的全备数据,数据量太大,几乎没有可操作性,所以传统备份还需要结合阵列自身的远程镜像功能等方式来实现容灾。而部署一套飞康的东东基本就可以把备份容灾搞定了

劣势是:
1、存储容量限制,无法保存太多历史版本,要导入物理带库还需要结合备份软件来实现,而且我的理解导入带库的数据应该不是虚拟快照的方式,应该是以克隆方式导入的,数据量也会非常大,对于很多对备份要求很高的需求其实不是很合适

2、只对Windows支持较好,应该是利用了很多现有的VSS框架接口,对非W环境的LVM同步方式基本不可用

3、操作系统保护较差,所谓的SAN BOOT功能需要iSCSI HBA卡,成本较高,而且网络将系统拉起来之后性能较差,只能是暂时的,要将生产系统的操作系统真正恢复时间较长,一般小时级别,这与很多传统备份软件的裸机恢复(几分钟恢复操作系统)相比,还是差了不少


所以总的来说,飞康的那套CDP追求的是性价比,中低端应用采用这种方式比较适合,高端应用基本不会采用这种方式

[ 本帖最后由 wyddg 于 2009-9-4 15:54 编辑 ]

论坛徽章:
2
2015年迎新春徽章
日期:2015-03-04 09:49:45IT运维版块每日发帖之星
日期:2016-07-29 06:20:00
9 [报告]
发表于 2009-09-04 15:53 |只看该作者
恩,所谓烧钱就是花了更多的钱去挽救那一两次的灾难,这系统首先容量上得大于等于原来的容量,而且都是在线容量,虽然可以用sata,但是一方面电费人工维护费用硬盘损坏,折旧,另一方面性能也拖了后腿,这块算作费用的话也是一块增加。总体来说,使rto大大减小,付出的代价就是高昂的。

至于rpo,存在一个误解,副存上的数据是主存完整的镜像,snapshot和cdp只是额外附加的功能,是为了解决数据逻辑上的误操作而生的,并不全是为了解决数据丢失。在完全同步的情况下,主存的数据是可以无遗漏的镜像到副存上的,rpo从这一点来讲是0的。千分之一秒粒度的cdp并不能保证逻辑上的一致,此时只能靠replay应用层的日志来redo或者undo,这一点来说,数据也并没有丢失。 但是完全同步情况下,除非原有系统对性能要求也不是很高,与副存规格差不多,否则得考虑异步了,也就导致rpo大于0了。

论坛徽章:
0
10 [报告]
发表于 2009-09-04 16:00 |只看该作者

回复 #9 冬瓜头 的帖子

呵呵 只有为了防止主阵列物理故障(逻辑故障还不行,因为错误数据也同步过来了),才可能使用副存上的实时同步数据,而这种需求随便找个磁盘阵列和主存用LVM一连就OK了,没飞康CDP和同有NRS什么事儿

飞康CDP和同有NRS定位还是备份容灾设备,不是高可用设备,主要是为了恢复历史版本的,所谓CDP就是恢复的时间点越近越好,CDP的实现原理是连续快照结合journal实现的,快照数据是一致的,有快照客户端保证,journal数据不能保证一致性,所以一般的使用是恢复到上一个快照点,这个时间远大于0,实际上journal功能用户基本不开
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP