- 论坛徽章:
- 0
|
原帖由 cbhfxy 于 2006-1-9 14:25 发表
非常感谢nntp,再问问老大是否用过IBM的RDM远程管理软件吗,该软件是否能远程分发OS,实现xcat的功能。
我用的HP RDP, 性质和RDM一样的,也是Altiris based. 不过IBM RDM出来才没有多少时间,hp RDP从compaq的时代就存在了.
不过hpc 集群,我不喜欢用RDP之类的,不是技术原因,就是个人工作习惯。如果一个这个事情我直接用ROCKS 内置的pxe+dhcp+kickstart+inser-ether 搞得定定的,我就不愿意在整个部署中再引入另外一种方案。
但是不管你是RDM还是RDP, 如果你用来做OS deploy都是非常方便的,但是有一点要注意,就是RDM或RDP会在分发好node OS之后,默认附带安装上support pack, 基本上是一些utilities, drivers, agents(snmp based)。 RDM/RDP/Altiris 都是针对企业环境的服务器群的部署的,所以这些东西对企业应用是有很好的帮助的,特别是有一些技术人员的技术路线很野,安装部署服务器的时候完全凭自己的经验来做,总是会埋下这样或者那样的问题,用RDM/RDP就可以一定程度上克服掉这些问题。
但是hpc 除了头节点/存储节点/登陆节点之外,计算节点上OS要尽可能的保持干净,避免所有不需要的service起来,还有不要启动任何和计算没有关系的agent之类的东西,port也是越少开越好。所以上面提到的那个默认安装方式显然是不符合这种要求的。虽然在管理和使用上RDM/RDP比大部分的大规模科学计算集群管理系统有分发管理上的优势,但是就是这个原因,我不愿意在hpc中用.
我看你还是try try ROCKS吧,这里有朋友曾经写了自己的观点觉得ROCKS比较容易使用,但是适合初学者,并且只能一个管理node对一批compute node 等等,我对这样的观点表示理解,但是我是完全不认可的. 原因你仔细的看rocks的官方站点或者和他们圣地亚哥超级计算中心的人沟通一下就知道了.
如果你们现在的系统已近部署好了,节点也很多,不适宜干掉重新来。我建议你研究一下RDM/RDP,修改默认安装的rule set,不要把support pack安装上,基本上只要update 磁盘控制器/raid controller driver, firmware, SYSROM, 还有 NIC firmware, NIC driver就好了,其他的什么乱七八糟的东西在compute node上都不要安装.
如果你是x86或em64t的机器,不要忘记把hypertheading关掉. amd64的机器不要忘记确认NuMA kernel起来了.
有空读一下曙光的曹振南写的hpc/linkpack 性能调优,写的还是相当不错的 |
|