免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: tracert1979
打印 上一主题 下一主题

##感谢贴##请教wysilly有关xCAT1.3+HS21集群问题,现场实施中... ... [复制链接]

论坛徽章:
0
11 [报告]
发表于 2008-11-21 17:42 |只看该作者
对的,环境不同,你现在的环境每个节点上只有eth0与eth1两个网卡,没有infinband卡,与我的环境不同,我在文档中将数据以流的方式来描述就是希望不要在环境不同的情况下出现混淆。

1.对的。
2.不对,交换模块其实只用于SOL了。系统分发也通过直通模块。
计算也是通过直通模块。

就硬件来说,如果不用SOL用VNC模式也可将交换模块作为CLUSTER vlan,直通模块作为计算用,这时,交换模块就要连接到交换机上,关于这种方式的安装,我的文档没有模述。

论坛徽章:
0
12 [报告]
发表于 2008-11-21 20:17 |只看该作者

回复 #1 tracert1979 的帖子

不同的平台的刀片是有区别的,不过还是有一定的借鉴

论坛徽章:
0
13 [报告]
发表于 2008-11-21 20:28 |只看该作者
原帖由 wysilly 于 2008-11-21 17:42 发表
对的,环境不同,你现在的环境每个节点上只有eth0与eth1两个网卡,没有infinband卡,与我的环境不同,我在文档中将数据以流的方式来描述就是希望不要在环境不同的情况下出现混淆。

1.对的。
2.不对,交换模 ...


谢谢您的回复,现在思路越来越清楚了。我们今晚抓紧时间做一些相关的测试,遇到问题在向您请教。

谢谢,非常感谢!!

论坛徽章:
0
14 [报告]
发表于 2008-11-21 20:53 |只看该作者
经过wysilly的指点,我们现在已经能开始节点的自动安装,通过运行:wininstall compute的命令也可以从管理机上看到安装的进度界面。看来离成功已经很近了,非常感谢wysilly的指点。
现在还有几个问题比较疑惑:

1、运行rbootseq compute c,f,n,hd0 的时候出现错误提示:HTTP login fail ,404 no found;
2、在运行mpname compute 的时候也出现相同的错误:HTTP login fail ,404 no found
3、我们运行:gensshkey root 的时候没有任何反映,用了makesshgkh (主机名)来代用了,不知道会出现什么状况。

问题1中的那条命令是什么意思呢? 是安装完操作系统后重启后更改引导顺序的吗?如果是这样的话,为何网络引导在硬盘之前呢?(现在安装完重新引导后,又回再重新安装一遍)
问题2中的命令表示的是什么意思?

谢谢。

[ 本帖最后由 tracert1979 于 2008-11-21 20:56 编辑 ]

论坛徽章:
0
15 [报告]
发表于 2008-11-22 00:50 |只看该作者
1和2的问题都是一样的,可能是AMM的HTTP服务有问题或/opt/xcat/etc/下的配置文件没配对.
1是更改引导顺序.因为安装完成后的postscript脚本要用rbootseq命令更改启动顺序,rbootseq不正常,所以不停的重新安装.
2的意思是将AMM中的blade的名称改为你定义的compute组中的节点名称.
3将bash -xv gensshkey root的输出贴出来.

论坛徽章:
0
16 [报告]
发表于 2008-11-22 11:20 |只看该作者
原帖由 wysilly 于 2008-11-22 00:50 发表
1和2的问题都是一样的,可能是AMM的HTTP服务有问题或/opt/xcat/etc/下的配置文件没配对.
1是更改引导顺序.因为安装完成后的postscript脚本要用rbootseq命令更改启动顺序,rbootseq不正常,所以不停的重新安装.
2 ...


感谢wysilly的热情回复,我们今天正从另外一台管理机上理顺思路按照我们的规划重新来做,现在有这么几个问题:
1、这两台管理用的x3650是否需要做HA?如果不做的话是否可以呢?比如仅仅将某个应用比如dns啥的做成双机?

2、有关我上个问题中的错误提示如果AMM的HTTP没问题的话,在/opt/xcat/etc下最有可能出问题的是哪个配置脚本?
    --------关于这个问题刚才我们又研究了一下,发现在mpa.tab中有相关的定义(bmc01 bc,mm1,NA,http,http,http,NA,NA,NA),现在的问题是应该通过web页面将刀片中心的那个名字改成bmc01和mm1,刚才我们将MM CONTROL中的第一项general setting 中的MM information 改成了bmc01,将network interface 下的primary management module 修改成了mm1,重启AMM后再试更改引导顺序的命令还是失败了。:em11:

3、如果mpname运行不成功,我们通过AMM的WEB界面来修改是否会影响以后软件的调度?

4、刀片中因有两块硬盘,有没有方式将他们自动做成raid1?只能手工一个一个配置么?

5、有关SSH的相关信息,贴上如下:
~~~晕,帖不了这么多~~~
压缩一下: ssh info.rar (9.8 KB, 下载次数: 23)

[ 本帖最后由 tracert1979 于 2008-11-22 12:24 编辑 ]

论坛徽章:
0
17 [报告]
发表于 2008-11-22 12:03 |只看该作者
1.是否做HA要视需求而定.有很多方面要考虑,如调度管理服务的HA等等.
2.将/opt/xcat/etc打包,我发现根据你的描述,相关的tab文件的配置彼此之间不匹配.还有/etc/hosts文件.
3.不影响,只是命名,AMM中看起来方便.
4.可以定制kickstart的安装脚本.(软raid), 硬raid要一个一个配.
5.在site.tab中gkhfile没配置?

[ 本帖最后由 wysilly 于 2008-11-22 12:24 编辑 ]

论坛徽章:
0
18 [报告]
发表于 2008-11-22 12:47 |只看该作者
谢谢,刚才试着修改了AMM中的名字也没成功。

现在我们仅仅是用了一台刀片中心上的两台刀片做测试,附件中是具体的配置文件。

烦请wysilly告知具体是哪些参数匹配的有问题,谢谢!
etc_hosts.rar (9.13 KB, 下载次数: 16)

论坛徽章:
0
19 [报告]
发表于 2008-11-22 13:30 |只看该作者
在请教一下,如果makedns不成功的话,和那个脚本有关系呢?

论坛徽章:
0
20 [报告]
发表于 2008-11-22 14:03 |只看该作者
1.配置没有问题,使用mpacheck检查一下,看一下信息。
2 .gensshkeys这第19步没问题.makesshgkh这步生成gkh文件.
今天仔细想了想,按照你现在的集群规模及规划,用sol就要浪费一个网卡对你将来的应用会有很大的影响。

IBM不建议在SOL的网卡上走其它的数据流(虽然可以).所以如果用户有钱,加一些配件吧,或将SOL弃用.

[ 本帖最后由 wysilly 于 2008-11-22 14:33 编辑 ]
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP