免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3654 | 回复: 14
打印 上一主题 下一主题

[集群与高可用] UNIX集群功能高可用性竞争分析报告 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2003-07-28 15:41 |只看该作者 |倒序浏览
概述
---- 作为全球著名的研究咨询机构,D.H.Brown Associates,Inc.(以下简称DHBA)的主要业务范围是信息产业战略分析、技术评估、产品与市场趋势分析和预测,并致力于密切跟踪、深入了解信息产业核心技术及其未来趋势的发展。为了更细致地研究集群技术在实际应用领域所能实现的可用性,不久前,DHBA公司对来自康柏公司的Tru64 UNIX和 TruCluster服务器软件、通用数据公司(Data General)的DG/UX和DG/UX Clusters、惠普公司的HP/UX和MC/ServiceGuard、IBM公司的AIX和HACMP、Sequent公司的 Dynix/ptx和ptx/CLUSTERS以及Sun公司的Solaris和Sun Clusters等主流UNIX集群技术的高可用性进行了一次较为完整的测试和分析。
----为了尽可能全面、综合地反映不同集群产品在为用户提供高可用性计算环境方面所具有的能力和特性,DHBA的专家们根据企业计算用户在实际应用中对集群系统的需求把整个分析过程划分成了6个单项,它们是:集群备份与恢复、集群故障恢复配置能力、集群并行数据库存取、集群高可用性管理、集群的单系统映像以及灾难恢复。

----在对6家厂商的UNIX操作系统和集群软件的数百个特性和功能进行认真分析和评估后,DHBA按照6个与集群相关的功能类目对它们依次记分排序。根据DHBA提供的研究数据,康柏公司的Tru64 UNIX和Tru Cluster服务器软件以 53.5分的最高成绩,摘取综合评分桂冠,并在“集群并行数据存取”、“集群高可用性管理”和“集群单系统映像”等三个单项评比中获得第一名。IBM以51.8分的总分位居第二。

----DHBA的专家们根据企业计算用户在实际应用中对集群系统的需求,为6个单项分别确定了不同的加权值,其中:集群备份与恢复加权值20%、集群故障恢复配置能力加权值20%、集群并行数据库存取加权值10%、集群高可用性管理加权值5%、集群的单系统映像加权值5%、灾难恢复加权值5%。由于本报告加权值的总和为65%,因此,在本评估报告中可实现的最高结果是65%。

评测分析
----· 集群备份和恢复
----由于检测和恢复机制是系统实现高可用性的首要目标之一,因此在综合评分中“集群备份和恢复”获得了20%的加权值。评估系统的“集群备份和恢复”能力,着重从故障恢复模式、检测方法和恢复选项以及备份和恢复选项等几个方面着手,同时需要考虑系统服务备份的分配、选择本地与故障恢复的灵活性、并行与串行恢复,以及一系列诸如故障和资源短期等集群系统可检测的条件。

----在这个重要项目中,较高的综合得分和较小差异说明:各公司的集群解决方案在这一领域都比较成熟。

----HP的MC/ServiceGuard在这一单项中获得最高分,除了拥有其他系统的共性外,HP还支持动态备份选择功能。HP通过本地和故障恢复来支持从 WAN适配器故障中进行恢复的功能。而且,HP还提供了监控CPU队列长度和文件系统自由空间的代理程序。HP的MC/ServiceGuard还支持通过人工干预来确认故障恢复及在接管前配置阈值的能力,通过为监控低交换空间条件提供代理来使系统得到进一步改进。另外,MC/ServiceGuard可监控代理故障,并可自动重启发生故障的代理。虽然 MC/ServiceGuard并不支持集群的文件系统,但是HP仍然可以无需重新安装即可满足磁盘卷所有的改变。

----康柏的TruCluster以0.6分的差距屈居第二。康柏能够以本地或通过故障恢复来支持从WAN适配器故障中进行恢复的功能。康柏的集群文件系统无需重新安装即可改变磁盘卷的所有权,TruCluster软件采用了动态备份选择。与HP一样,TruCluster软件使用部署在每一个节点上的资源组数作为决定哪一个节点接管资源组的标准。

----· 集群故障恢复配置能力

----对“集群故障恢复配置能力”的考察,主要是针对系统故障恢复、自动配置硬件和系统软件资源的能力。集群系统硬件配置能力决定于系统对于不同种类的服务器、磁盘和用于心跳和客户机连接的网络配置能力;集群软件配置能力则主要决定于系统对混合操作系统版本(能够在运行中升级)、可供选择的中间件和RAID 软件的配置能力。本项目的考察重点涉及:节点/心跳媒体、RAID、中间件/NFS、TCP/IP 地址接管和磁盘互连。

----灵活的配置能力可帮助用户保护在外设、LAN、服务器和应用过程中的投资,而“集群故障恢复配置能力”在提高配置集群灵活性方面具有重要的意义,因此该项目获得总评分20%的加权值。

评估项目中的得分情况
----所有厂商的集群系统都支持4个或更多节点,基于硬件的RAID 1和RAID 5,以及在快速以太网、FDDI、令牌环和ATM网络上的TCP/IP地址接管。这就意味着所有参加评测的集群系统均支持大型、灵活的配置,可满足用户广泛的应用要求,而且都支持SCSI磁盘及至少一台TP监视器。同时,参加评测的系统均不支持单个启动服务器或无磁盘集群节点。
----但在支持大节点数量、支持心跳讯息媒体、心跳协议优化、 TCP/IP地址故障恢复、磁盘互连支持、WAN线路和磁带驱动器切换、基于软件的RAID 5 以及支持混合操作系统版本等方面,各厂商所采用的解决方案并不相同。

----IBM以91.6分获得本项目的第一名。除了具备所有厂商共有的特性之外,IBM在故障恢复配置中可支持16个以上的节点,从而获得了很高的信任度。在参加评测的产品中,只有IBM 的HACMP可支持多达32个节点。如果使用24 路SMPRS/6000S80,HACMP集群系统最多可配置768个CPU。

----HP的MC/ServiceGuard获得本项目的第二名。HP的集群系统可支持多达16个节点,使用32路SMPV类服务器,最多可部署512个CPU。 MC/ServiceGuard心跳讯息可以在以太网、快速以太网、FDDI、令牌环和串行线路上传输。对于混合的操作系统版本,MC/ServiceGuard还支持混合心跳媒体。另外,HP还支持集群节点之间专用X.25和SNAWAN线路的故障恢复和磁盘互联,FC交换式多路径例外。

----与HP得分非常接近的康柏TruCluster最多可支持8个节点,使用32路SMP服务器可部署多达256个CPU。TruCluster服务器集群软件可在以太网、快速以太网、FDDI、ATMLAN、串行线路以及通过磁盘传输心跳讯息,康柏内存通道互连技术也采用了为心跳优化的协议。TruCluster支持混合心跳的媒体,同时也能够使用基于LAN的路由器在专用的X.25和SNAWAN线路上进行故障恢复。另外, TruCluster还支持共享启动盘,可使用SCSI或UltraSCSI磁盘互连,支持共享磁盘驱动器的故障恢复。

集群并行数据库访问
----并行访问允许多个集群节点共享一个物理数据库。它要求Distributed Lock Manager(DLM)来协调并行的请求以更新共享的数据,这样多个用户就不会互相覆盖彼此的更新。并行访问可以加强可伸缩性,并可进行更快速的恢复,从而提升可用性优势。
----本项目涉及集群配置、虚拟原磁盘访问和锁定管理,在综合评分中的加权值为10%。

项目中的得分情况
----所有厂商都支持4个或更多的节点,提供共享磁盘和无共享的数据库、冗余DLM讯息路径、多线程DLM、混合式故障排除(HA)和并行访问模式以及基于硬件的RAID 5。但在支持的节点数、虚拟原磁盘、DAM、DLM讯息基于内存的互联、DLM讯息的优化协议和基于软件的RAID 5方面有所差别。
----康柏的TruClusterServer软件以90.2分的绝对优势获得了该项目的冠军。TruCluster在并行数据库访问配置中支持的节点多达8个。利用了虚拟原磁盘访问,以及类似于康柏内存通道技术的高速节点互联的TruCluster,在提供并行数据访问支持方面表现出了突出的优势。康柏的TruCluster支持虚拟原磁盘,使用DAM (使用康柏内存通道节点互联)和具有物理磁盘连接主机间请求的动态负载平衡。目前,其他厂商中只有IBM提供类似的技术。

----IBM的HACMP位居第二。HACMP在并行数据库访问模式中可支持8个节点对的配置,IBM具有DLM讯息的优化协议、基于核心的DLM 和用户应用的DLMAPI。

----· 集群高可用性管理

----本项目主要侧重于对系统在简化整个系统管理以及为高可用性环境提供在线管理工具等方面能力的评估。本项目主要涉及的特性包括:管理界面、恢复脚本、负载平衡和在线集群修改。在综合评分中的加权值为5%。

项目中的得分情况
----在本项目中各厂商的分数接近,说明各厂商在集群高可用性管理方面的优势也接近。所有参加评测的集群系统均支持基于GUI的界面,用于执行命令和监控、将配置截获到文件、从单点进行多个集群的管理以及将资源集中到故障恢复组中。同时它们还都为数据库和LAN的恢复提供恢复脚本,并支持手动负载平衡以及在线集群管理。所有参加评测的系统都提供处理资源分配管理、在线为集群添加/ 删除服务和节点以及运行中操作系统自动升级的能力。
----在复制配置、基于浏览器的界面、命令行界面、 SNMP陷阱、应用恢复脚本、负载平衡、配置更改审查、运行中集群软件升级、按时自动故障恢复、管理离线节点以及提供工具监控和跟踪可用性等方面,各厂商的集群系统表现有所不同。

----虽然各家公司在该项目的得分差距不大,但康柏仍然以较突出的优势赢得了单项桂冠。康柏TruCluster支持评估过程中所有要求的命令和监控界面。TruClusterServer将Web、GUI和命令行管理界面放在一个单一的管理应用上,并为评估中用到的所有资源提供TruClusterServer脚本。TruCluster还具有配置复制和拖放手动负载平衡的能力,同时还支持集群MIB、SNMP陷阱以及操作系统和集群软件在运行过程中的自动升级。TruCluster可通过在共享集群文件系统上部署系统和集群配置信息;在离线节点上执行系统管理;并提供故障恢复到动态备份选择特性之下的负载平衡。

----· 集群单系统映像

----“集群单系统映像”指集群系统把分布式集群资源作为单一服务器资源简化使用和管理的能力。在本项目涉及“集群文件系统”和“其他集群范围的资源”,在综合评分中的加权值为5%。

项目中的得分情况
----参加评测的集群产品得分偏低,说明这一领域是目前各厂商面临的艰巨挑战。所有厂商的集群产品均具有单启动点(为集群节点)、单点集群定义、共享磁带驱动器(逻辑共享)、时间同步以及打印队列的能力。在支持集群设备、集群共享内存(即流/管道)、单启动服务器或非本地交换分区等方面,各厂商均没有突出的表现。在集群文件系统支持、对集群文件系统的直接和间接物理访问、使所有设备作为本地设备出现、单个口令和IP主机表、分布式处理启动、跨节点维护的互处理关系、自任何节点的同一存储路径名、集群内处理状态以及本地启动磁盘和交换分区要求等方面,各厂商的表现有所不同。
----康柏在这一项目中继续赢得桂冠。TruCluster支持具有POSIX语义的集群文件系统(CFS)。康柏的Advanced File System(AdvFS)启用CFS 的日 ,无需在崩溃后执行费时的FSCK(文件系统检查)。通过在CFS上部署根文件系统,TruCluster可以使用单个共享逻辑启动磁盘部署。目前,只有康柏的TruCluster允许使用Device Request Dispatcher(DRD)对CFS进行直接和间接的访问。TruCluster拥有到文件系统物理路径的节点,可以在其他间接访问使用DRD(即请求由具有物理路径的节点提供服务)时使用该路径。康柏TruCluster还支持集群内的口令文件、IP主机表、集群别名、单个安全域、处理状态和卷管理,并与康柏Tru64 UNIX操作系统默契配合,对所有集群节点的存储设备提供一致的路径名。

----在所有参加评估的产品中,DG公司的 DG/UXClusters是最早提供CFS支持的集群系统。DG/UXClusters允许所有集群节点共享同一个根磁盘文件系统,支持单启动磁盘。另外,DG/UX Cluster还支持集群内口令文件、 IP主机表、集群别名、单个安全域、处理状态、卷管理以及一致的路径名。

----· 灾难恢复

----“灾难恢复”主要用于检验集群系统在应用中对远程数据复制和远程(广域)故障恢复的能力。由于灾难出现的几率相对较小,在综合评分中,此项目的加权值设为5%。对集群系统“灾难恢复”的考察涉及:广域故障恢复和并行访问、远程数据复制/镜像、磁盘/节点间的距离限制。

测试项目中的得分情况
----从上图可以看出,在“灾难恢复和远程数据复制” 领域,各厂商的平均得分偏低,而且分数差距较大。所有厂商均支持由数据库厂商提供的数据库复制产品,同时还支持单启动控制台,以及不同服务器与磁盘之间、集群节点之间的各种连接距离,支持基于硬件的远程镜像。目前,没有厂商提供对广域并行访问的支持。
----不是所有的厂商都能提供高级界面,以便将静态数据分发到分布的节点上,而且也不都具有实时镜像到多个远程站点中两个站点的能力。在对远程节点提供逻辑文件系统共和逻辑卷的远程应用方面,各厂商也有所不同。

----IBM 获得了此项目的第一名。IBM的HAGEO产品允许在具有无限距离的节点间进行故障恢复。利用HAGEO中的GeoMirror功能,可把文件系统和数据库通过广域连接更新到远程系统。HAGEO不依靠共享的磁盘电缆,因为这会限制地理位置相差较大的情况下的故障恢复。利用Enterprise Storage System(ESS), IBM允许使用光纤连接距离为103km的服务器与其磁盘驱动器。当离灾难地点103km的距离内,IBM的故障恢复解决方案可以帮助系统迅速恢复。

----位居第二的Sun Campus Cluster,支持灾难恢复的节点间距最大可到10km。Sun 的StorEdge A7000智能存储服务器的远程双拷贝(RDC)功能允许各A7000阵列之间的最大距离为50km。

----虽然康柏在此项评比中处于劣势,但我们仍然非常看好康柏在这一领域的发展前景。由于我们进行此次评测时,康柏提供的仅是14路Alpha 服务器作为测试平台,其CPU的数量大大低于其他厂商提供的硬件平台,如果使用康柏在5月份发布的新一代Alpha GS系列服务器,康柏可能在这一领域会出现奇迹般的表现。

论坛徽章:
0
2 [报告]
发表于 2003-07-28 15:54 |只看该作者

UNIX集群功能高可用性竞争分析报告

不错不错。

论坛徽章:
0
3 [报告]
发表于 2003-07-28 16:03 |只看该作者

UNIX集群功能高可用性竞争分析报告

rt

论坛徽章:
0
4 [报告]
发表于 2003-07-28 16:29 |只看该作者

UNIX集群功能高可用性竞争分析报告

分析的不错

论坛徽章:
0
5 [报告]
发表于 2003-07-28 17:47 |只看该作者

UNIX集群功能高可用性竞争分析报告

HP下的True64还能走多远?sigh...

论坛徽章:
0
6 [报告]
发表于 2003-07-28 17:52 |只看该作者

UNIX集群功能高可用性竞争分析报告

是很久以前做的评测

论坛徽章:
0
7 [报告]
发表于 2003-07-28 20:27 |只看该作者

UNIX集群功能高可用性竞争分析报告

就是,怎么就精华了,连VCS都没算上。。。。

论坛徽章:
0
8 [报告]
发表于 2003-07-28 20:39 |只看该作者

UNIX集群功能高可用性竞争分析报告

没有VCS难道就不好。

尽管没有VCS,但分析得确实不错。

也许是很早的东西,但是确实还有很多可取的地方

论坛徽章:
0
9 [报告]
发表于 2003-07-28 20:57 |只看该作者

UNIX集群功能高可用性竞争分析报告

good

论坛徽章:
0
10 [报告]
发表于 2003-07-29 11:13 |只看该作者

UNIX集群功能高可用性竞争分析报告

太老了吧,CU上早就有了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP