- 论坛徽章:
- 0
|
原帖由 xiaozhaoz 于 2006-3-29 13:28 发表
对不起,我一般把Availability 翻译成可靠性,可能按您说得翻译成可用性比较合适。 不过电信设备中,没看到说reliability的。所以就把Availability 翻译成可靠性。
我也知道 Availability 不能只靠Cluster来实 ...
Hello,
1. Availability , Reliability
可靠性指的是一套系统或元器件或软件组件健康运行的能力
可用性是指一套系统持续对外提供服务的能力.
有一套可靠性较高的元器件组成的硬件组件/软件未必有合格的可用性.
同样,用一些可靠性并不高的硬件组件/软件也能够作出一套可用性比较高的.
追求可靠性的顶峰就是容错机,追求可用性的顶峰就是容灾.
我并非是要故意来讨论概念,只不过这2个方向实在是差别很大,进一步讨论的基础前提是我们在讨论同一个东西.
2. HA cluster , HA , CGL
HA Cluster 是通过多个节点集群的方式来解决可用性的要求
HA 系统是通过硬件,软件设计,在应用层面解决可用性的要求
CGL 的规范包含了 HA 和 HA cluster的重要部分.
3. OCF , SA Forums
OCF定义的是高可用集群的设计定义, 包括 node, group, resource, lock, external interface),熟悉HA集群的对这个不会陌生.
SA Forums 的specification 定义的是高可用系统的API 层的规范.包括硬件接口(HPI),应用软件接口(AIS),系统管理的接口(SMI).
拿CGL规范来看,就可以分清楚两者的区别了.
CGL大概有120多个定义,主要分几个部分.
基础标准: 比如POSIX,SNMP, SCTP等
平台: 定义了阵列,热插拔/添加,故障转移, 还有涉及管理的IPMI(很多现在的服务器都开始提供IPMI了), SA Forum定义的 HPI规范, SMI规范就被CGL在这里引用了很多. 包括对温度,风扇等控制
另外在这里还定义了故障隔离,网络终端的操作,引导周期中的检测.
可用性: 这里定义的实际上是我在上面 2里面提到的 HA系统. 比如从硬件的内存容错,ECC,动态调整,系统的event log, 还有linux操作系统的kernel monitoring, NFS failover, 等等
为了清晰化标准,CGL WG把 高可用集群单独列出去了.
可服务性: 主要是精细定义SNMP和CIMOM (用SLES的朋友看得到这个packge)
可扩展性: 定义了CGL支持大量并发异步事件的扩展能力。Linux kernel的软件real time定义也在这里被扩展定义.主要是电信环境的要求所驱动的. 这部分的附加内容也添加到了cluster的章节
性能: cpu, VM, scheduling, I/O , soft real time等系统组成的性能定义要求在这里规范
工具集: 定义为CGL环境需要采用的debugger
Cluster: 定义CGL的高可用集群规范,应用了OCF和SA forums关于集群和节点的部分规范.
安全: CGL环境的安全,比如IKE, PKI, LSM之类的.
OCF定义了可用性集群规范, SA Forum 定义的是硬件软件架构设计的接口规范,这种规范是用来满足服务可用性要求的.
上面信息仅供参考.
[ 本帖最后由 nntp 于 2006-3-29 15:21 编辑 ] |
|