免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: send_linux
打印 上一主题 下一主题

企业IT系统高可用和备份--从单点到整体部署后的思考(获奖名单已公布-2013-12-4) [复制链接]

论坛徽章:
3
季节之章:冬
日期:2015-01-15 10:36:57IT运维版块每日发帖之星
日期:2015-09-24 06:20:00IT运维版块每日发帖之星
日期:2015-10-24 06:20:00
31 [报告]
发表于 2013-11-13 19:33 |只看该作者
明天参加。。

论坛徽章:
3
季节之章:冬
日期:2015-01-15 10:36:57IT运维版块每日发帖之星
日期:2015-09-24 06:20:00IT运维版块每日发帖之星
日期:2015-10-24 06:20:00
32 [报告]
发表于 2013-11-15 08:22 |只看该作者
业务环境:以Windwos  Server系统平台为基础,以SQL Server2008和2000为核心的数据库应用系统。涉及到OA协同、采购、金蝶财务模块及其他零售、酒店、连锁等业务应用系统等等。。。
一、为什么要高可用?
我们担心的又以下几点,其中部分遇到过本来是可以避免的业务中断:(第4和第5我们遇到的情况居多)
(1)        进程错误,比如用户应用与文件数据库的连接异常中断或用户进程发生错误。
(2)        文件系统故障,由于异常操作或其它原因造成文件系统内部部分信息丢失或不一致。
(3)        操作系统故障,操作系统本身的系统调用问题及底层的应用驱动在安装或更新出现冲突;
(4)        网络线缆故障。
(5)        介质问题,网络连接或物理硬盘也可能会出现问题。
二、考虑的应对方案:
1、带共享存储双机方案
带共享存储双机方案

2、软件方式的双机

三、方案选择
最后两个方案都有采用,数据量大的、自己开发的系统采用的是共享存储双机方案。前端还应用了tomcat集群,对前端的访问做负载。
其他的有一部分较为重要的外购系统采用软件方式的双机方案。

四、这里重点介绍下软件方式的(因为rose也是第三方软件方式)
1、我们当时采用的是PlusWell 软件实现。top图参考以上方式。
这里我们采用的是active/standy方式,没有采用active和active的方式,防止有一台挂机的情况下,一台顶不住。
Server1是主“激活”节点,Server2是次“备用”节点。如果Server1发生故障了,它的被保护资源由Server2 节点来恢复。当节点Server1恢复后, 资源可以被Server1重新获得。这样的方式不会降低用户的体验,但是存在资源的浪费。
2、PlusWell技术原理
(1)心跳检测
通过IP做心跳检测时,主备机会通过此心跳路径,周期性的发出相互检测的测试包,如果此时主机出现故障,备机在连续丢失设定数目的检测包后,会认为主机出现故障,这时备会自动检测设置中是否有第二种心跳,如果没有第二种心跳的话,备机则根据已设定的规则,启动备机的相关服务,完成双机热备的切换。
这里有设置第二种心跳检测,是为了防止脑裂的情况。
(2)IP工作过程
使用虚拟IP地址的方法来实现,
    正常情况下,虚拟IP地址(即访问IP:192.168.1.33)指向主机的实IP(192.168.1.11)地址,用户通过虚拟IP地址访问主机,这时,HA软件将虚拟IP地址解析到主机实IP地址。
    服务器切换过程的情况下,虚拟IP(即访问IP192.168.1.33)地址通过PlusWell热备份软件自动将虚拟IP地址解析到备机的实IP(192.168.1.22)地址上,这时,虚拟IP地址指向备机的实IP地址。但对用户来说,用户访问的仍然是虚拟IP地址。所以用户只会在切换的过程中发现有短暂的通信中断,经过一个短暂的时间,就可以恢复通信。
(3)应用及网络故障切换过程
   检测到操作系统的故障并及时将服务切到备用服务器。
    操作系统正常的情况下,数据库系统出现意外故障,这时双机容错软件可以及时发现并将其切到备用服务器,使服务不致于停止。
   操作系统和数据库系统全都正常的情况下,服务器网络出现故障,这时双机热备软件,可以将系统切到正常的备用服务器上。

目前运行还比较稳定,没有出现因为服务器故障而导致应用长时间中断的情况。

五、总结反思
为什么不采用windowsserver自带的高可用解决方案?
1、不想被它绑定,微软的解释太复杂,尤其是版权和访问数方面,每问一个代理商的解释不一样,又不给你权威的解答,存在法律风险;
2、有一定的局限性,比方说高可用的服务器数量方面,只允许两台,而随着企业的发展,单两台服务器的高可用不一定满足要求,需要扩展的时候就麻烦了;
3、最终用户再怎么专业,也比不上专业人士见多识广,从第三方获得支持,可以确保项目的顺利完成,提高项目成功的几率。
还有什么可以优化的?
1、如何带共享存储的方案可以跟软件方式的结合就可以取长补短了。
2、共享的存储没有高可用,还是把希望寄托在存储的所谓的稳定性上,希望有可以大规模使用的,存储双机方案。



论坛徽章:
459
亥猪
日期:2014-05-31 12:08:03亥猪
日期:2014-05-31 12:07:38亥猪
日期:2014-05-31 12:08:04亥猪
日期:2014-05-31 12:07:43亥猪
日期:2014-05-31 12:07:52亥猪
日期:2014-05-31 12:08:09亥猪
日期:2014-05-31 12:07:51亥猪
日期:2014-05-31 12:08:02亥猪
日期:2014-05-31 12:07:59亥猪
日期:2014-05-31 12:07:37亥猪
日期:2014-05-31 12:07:50亥猪
日期:2014-05-31 12:07:39
33 [报告]
发表于 2013-11-15 16:19 |只看该作者
本帖最后由 2009532140 于 2013-12-05 12:36 编辑

支持

论坛徽章:
18
卯兔
日期:2013-09-27 17:41:0615-16赛季CBA联赛之佛山
日期:2016-07-09 17:34:45操作系统版块每周发帖之星
日期:2015-12-02 15:01:04IT运维版块每日发帖之星
日期:2015-12-02 06:20:00IT运维版块每日发帖之星
日期:2015-10-07 06:20:00IT运维版块每日发帖之星
日期:2015-10-03 06:20:00IT运维版块每日发帖之星
日期:2015-10-01 06:20:00羊年新春福章
日期:2015-04-01 17:56:06拜羊年徽章
日期:2015-04-01 17:56:062015年迎新春徽章
日期:2015-03-04 09:49:452015年辞旧岁徽章
日期:2015-03-03 16:54:15天秤座
日期:2015-01-14 06:39:28
34 [报告]
发表于 2013-11-16 09:59 |只看该作者
回复 32# ylky_2000


    哥们说的够详细啊!

论坛徽章:
0
35 [报告]
发表于 2013-11-20 17:14 |只看该作者
本帖最后由 gxlviolee 于 2013-11-21 09:22 编辑

我们公司在四川成都,最近有个系统也有双机热备的需求,目前我们请的数据库工程师是用MSCS直接帮我们做的双机热备,这个我们自己的技术人员维护起来就有点困难,所以想请问是否您们是否可以实际帮忙分析下,用您们产品的可行性以及再次投入等呢?

论坛徽章:
0
36 [报告]
发表于 2013-11-20 17:48 |只看该作者
Rose的双机热备,很多年了,比较好用。

论坛徽章:
0
37 [报告]
发表于 2013-11-20 17:50 |只看该作者
Rose的服务与支持很到位

论坛徽章:
0
38 [报告]
发表于 2013-11-20 17:54 |只看该作者
在市场上生存了20年了,旗帜不倒还是有独到之处,我只说这么多了哈!

论坛徽章:
0
39 [报告]
发表于 2013-11-21 13:39 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
7
摩羯座
日期:2013-12-05 10:42:57辰龙
日期:2013-12-27 13:40:49亥猪
日期:2014-01-15 09:10:37天秤座
日期:2014-01-20 11:22:20辰龙
日期:2014-01-26 17:02:25午马
日期:2014-01-27 14:22:34水瓶座
日期:2014-02-19 09:36:40
40 [报告]
发表于 2013-11-21 19:55 |只看该作者
公司的主要业务是电信相关,所以高可用相当重要,每个关键点不能存在单节故障,大部分都是以集群的形式运行,偶尔有一些要用HA来解决。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP