免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: fenglimian
打印 上一主题 下一主题

[集群与高可用] 用VCS的兄弟多么?有问题一起讨论讨论. [复制链接]

论坛徽章:
0
11 [报告]
发表于 2010-07-20 11:32 |只看该作者
个人觉得所有的HA软件的出发点都是一样,都是为了做到应用的高可用,因此就需要考虑到这些应用出现故障是在哪些方面,由此用一些程序/脚本来检测这些方面,用另外一些脚本来停止/启动这些应用,以便应用能在满足条件的节点正常启动.

可能每个厂家的ha最大的不同就是界面上的不同的,在处理同一类型故障方面可能也会有一些自己的考虑而不尽相同,比如心跳丢失后的下一层仲裁,有的会用票盘,VCS是用fencing.

VCS的基本概念我在看VCS的手册,等手头新来的活处理完了我就开始动手写,算是自己用了一段时间VCS的总结.

论坛徽章:
10
处女座
日期:2015-01-22 16:08:50技术图书徽章
日期:2018-09-13 11:25:52技术图书徽章
日期:2018-09-13 11:25:45技术图书徽章
日期:2018-09-13 11:25:37技术图书徽章
日期:2018-09-13 11:25:29黑曼巴
日期:2018-06-04 09:03:192017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:03:402015年迎新春徽章
日期:2015-03-04 09:50:28技术图书徽章
日期:2018-09-13 11:26:01
12 [报告]
发表于 2010-07-20 12:20 |只看该作者
用VCS估计不多,因为价格不便宜
用os自带的比较多,因为免费

论坛徽章:
10
处女座
日期:2015-01-22 16:08:50技术图书徽章
日期:2018-09-13 11:25:52技术图书徽章
日期:2018-09-13 11:25:45技术图书徽章
日期:2018-09-13 11:25:37技术图书徽章
日期:2018-09-13 11:25:29黑曼巴
日期:2018-06-04 09:03:192017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:03:402015年迎新春徽章
日期:2015-03-04 09:50:28技术图书徽章
日期:2018-09-13 11:26:01
13 [报告]
发表于 2010-07-20 12:23 |只看该作者
个人觉得所有的HA软件的出发点都是一样,都是为了做到应用的高可用,因此就需要考虑到这些应用出现故障是在哪 ...
fenglimian 发表于 2010-07-20 11:32



    原理基本一致,不过是实现的方式可能会略有差异。

等兄弟的学习手册了

论坛徽章:
1
CU十二周年纪念徽章
日期:2013-10-24 15:41:34
14 [报告]
发表于 2010-07-20 22:09 |只看该作者
啥时候上手册呀?

论坛徽章:
0
15 [报告]
发表于 2010-07-21 09:14 |只看该作者
手册手册手册

论坛徽章:
0
16 [报告]
发表于 2010-07-21 09:31 |只看该作者
本帖最后由 fenglimian 于 2010-07-21 15:09 编辑

我简单看完了第一章,先贴出来,准备下一步先加main.cf和type.cf的一些说明,然后就是VCS常用的命令:
物理组件:
1.        节点:有自身单独OS的一个物理机器,或者是一个虚拟机,分区等等,同一个VCS中的各个节点应该是运行同样的OS.
2.        网络:心跳网络以及提供客户机使用的网络.
3.        共享存储:共享存储保证了一个节点出现故障后应用还能在其他节点上使用到这个存储资源,当然不是所有的应用都会用到共享存储.

逻辑组件:
1.        资源和资源的依赖关系:资源是应用使用到的硬件和软件,比如文件系统,网卡,应用所使用的程序等等.资源的依赖关系是资源的启动可能会依赖到起来的资源,比如IP地址就需要存在网卡才能存在.通过依赖关系决定了应用启动中资源启动/停止的先后顺序.
2.        资源的类别:有on-off,on-only,persistent三类,不是很清楚搞这么细有什么实质的作用.
3.        资源的类型:VCS会定义其所管理的没一种资源类型,比如网卡,文件系统等等,VCS已经包含了一些预先定义的资源类型,VCS管理员手册里面的agent和VCS bundle agent手册里面有这些资源的说明.
4.        服务组(Service group,SG):VCS所管理的一个应用的所有硬件和软件资源的集合,同一个节点上的SG可以是独立的,也就是一个SG的切换不应该影响到另一个SG;同时SG也可以存在依赖关系,这种情况下,被依赖SG的切换就会导致上层SG的切换.
5.        SG的类别:Failober—同一时刻只能在一个节点启动,arallel—同一时刻可以在多个节点启动;Hybrid—这个我也没有配过,大概是说这个是failover和parallel的混合模式,具体我得看完文档再更新.


管理接口:
1.        管理console:基于web的管理接口,需要安装软件,我没有用过.
2.        Java console: 这个是说的hagui启动的这个界面,也是可以跨平台管理多个cluster,我比较喜欢用这个东西,尤其是配资源的依赖关系非常直观.
3.        CLI:本地操作,有些VCS的命令好像还只能用命令行来做,比如修改agent的一些属性什么的,我还没有在Java Console上找到过.


VCS配置相关的文件:
1.        main.cf---定义了VCS管理的所有资源和SG
2.        types.cf—定义了资源的类型
这两个文件都存放在/opt/VRTSvcs/conf/config路径,第一个启动的节点将读取main.cf文件来做VCS的配置,后启动的节点将会从第一个节点获得这些配置信息.

如果是手动修改main.cf,那么只有在VCS重新启动时候才能生效,不过我们可以时候用命令行和其他的管理接口来做VCS的在线配置改动.

关于main.cf:
Include部分:这里包含了VCS使用到的资源的各种属性的定义,也就是main.cf里面提到的资源都需要在include部分的这些.cf文件里面有预先定义;
Cluster定义部分:定义了cluster的ID,名字,已经管理等用户的名字和密码;
节点部分:VCS管理的节点列表;
SG部分:这个部分包含了SG信息, 资源和资源的依赖关系
SG的依赖关系
我们可以使用hacf verify /etc/VRTSvcs/conf/config来检查main.cf是否正确, 如果main.cf有错误,在VCS启动时候将会运行进入admin_wait状态

论坛徽章:
0
17 [报告]
发表于 2010-07-21 16:27 |只看该作者
VCS的启动:
先说说LLT,GAB,HAD
LLT---VCS使用的心跳协议,其作用一个是做节点之间信息的交换(GAB信息交换的载体),另一个就是心跳.
1./etc/llthosts----这个文件记录了VCS管理的节点列表;
2./etc/llttab---llt使用到的网络设备,cluster ID,本地节点名称
lltconfig –a list可以看到cluster当前有哪些节点.

GAB—负责VCS节点关系和VCS信息的交换,当一个节点不再收到其他节点的心跳信息时候,LLT就会传输心跳丢失的信息给GAB, GAB就会标记对应的节点已经离线,并从cluster里面把这个节点踢掉;VCS信息的交换是GAB给HAD提供可靠的配置信息改变---需要HAD对接收到的信息进行确认,类似数据库的事务,commit后才会返回(我看得还有些糊涂,得慢慢再看).
/etc/gabtab---其中的nx表示了cluster有几个节点,gab模块起来后如果发现它看不到对应数量的节点,就会一直停留在等待状态,需要使用gabconfig –x来忽略节点不够的情况.

HAD---这个就是VCS的守护进程了,cluster的所有节点都运行同样的HAD的拷贝,HAD维护本地节点的资源,并将信息发送到其他所有的节点,同时也会根据其他节点发送过来的信息更新.有时候had挂了,had的守护进程hashadow会把had再启动起来,有时候我们会发现had和hashadow进程都不在了,应用还跑的好好的,除了应用是人工手动起来之外,另一个就是有人用了hastop –force来杀掉了这两个进程,hastop –force是不停任何资源,它只是标记SG已经离线,然后就关闭had/hashadow进程.

节点OS启动后, LLT,GAB,HAD依次启动.

论坛徽章:
0
18 [报告]
发表于 2010-07-26 16:06 |只看该作者
回复  牛奶加蛋
HA用VCS?
我觉得直接用MSCS+OFS,简单、直接。。。
aib 发表于 2010-07-16 20:32



    但是没办法做存储双高可用。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP