免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 14422 | 回复: 54
打印 上一主题 下一主题

##感谢贴##请教wysilly有关xCAT1.3+HS21集群问题,现场实施中... ... [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-11-21 15:27 |只看该作者 |倒序浏览
###经过wysilly在我们实施过程中的全程指导,现在本项目已经基本宣告结束。非常感谢wysilly的无私热情的帮助,如果没有wysilly的帮助我们不知道要捣鼓到什么时候才能有点进展,论坛中有像您这样的高人驻守,肯定会越来越火,非常感谢!!###



感谢wysilly在博客中给我的回复,按照您的提示我们现在可以从管理机中看到刀片的启动信息,现将其他问题再罗列一下:
下面引自wysilly的博客:
您好,wysilly,拜读了你写的这篇文章后,对我们的帮助很大使我们的项目实施有了一些进展(我们现在正在实施现场),但是现在还有几个问题,真是彻底搞不明白。以前没弄过这方面的东西,完全属于入门级选手,希望能得到您的帮助,谢谢:
我们现在的环境:10个刀片中心(配备一个6口的交换模块,一个直通模块,一个AMM模块)+128台刀片(HS21);2个管理机x3650;8台接存储的x3650;另有用于计算的交换机C300一台和接管理主机的S25一台。使用OS-AS4.6;XCAT1.3;目前困惑的地方主要有如下几个问题:
0、目前进度:可以控制刀片电源的开启和关闭,也能获取到mac地址。
1、有关SOL的实现:我们现在是用一根网线接在交换模块的第一个口上,然后连到了cluster vlan上,不知道这样接是否正确?当执行rbootseq compute c,f,n,hd0这条命令的时候老提示出错:出错信息——http login failed, 404 no found.我想请问这条命令是利用sol的功能来实现的吗?
2、在你的文章中配置有关SOL的信息的时候(第22页),是在管理机器上配的?还是通过KVM切换到具体的刀片配置的?
3、DHCP已经配置完毕,我用笔记本测试了也能获取到IP地址,但是刀片重启后用pxe功能的时候却获取不到正确的IP,请问这是怎么回事呢?
4、目前进行到您文章中的第21步,死活进行不下去了,不知道是什么地方出现了问题。其中第19步也没有执行成功。

——不好意思,手太生,希望能得到你的一些指点,谢谢啦。

wysilly给的回复:
我给分析一下:你使用的都是网络设备,按配置,只应存在两个VLAN,一个是管理VLAN,一个是CLUSTER vlan(中间即走数据流又走节点交互信息
1.我文档中有连线及下面的ip地址描述,AMM管理模块上的接口要连在管理VLAN上,并且管理节点上要有一个网卡也在此vlan中用于管理目的。你的存储结点较多,若3650有多余网卡,可将板载网卡上的IPMI打开,接入管理VLAN.

2.配置SOL,第一次通过KVM来做,文档中只是做为告诉你改那些项。

3.配置好了SOL后,可通过在管理机器上打开rconsole来看。问题最可能出在dhcp服务没有正确的VLAN里.

4.19步的出错信息.
********************************************************************************************
工程进度及问题:
(详见各回复...)

[ 本帖最后由 tracert1979 于 2008-12-15 19:49 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2008-11-21 15:32 |只看该作者
现在进行到那一步了?

论坛徽章:
0
3 [报告]
发表于 2008-11-21 15:43 |只看该作者
详细说明一下:
配备一个6口的交换模块主要用于启用sol(每节点上的eth0)。交换模块要么彼此独立(彼此不能通讯),要么在AMM模块中将相关配置配好,使各刀片中心上的各交换模块彼此不会在连通时互相影响(ip冲突等)
一个直通模块用于cluster vlan(每节点上的eth1).
AMM模块,刀片中心上的管理模块,上有网络接口,连接到管理vlan.

论坛徽章:
0
4 [报告]
发表于 2008-11-21 15:57 |只看该作者
工程进度及问题:
1、现在利用rcons bladex 确实能看到终端的启动的界面,说明SOL已经工作正常,目前正在解决DHCP不能获取地址的问题...现在先请教wysilly一个问题:按照您说的划分成两个vlan的话,节点(刀片hs21)操作系统的安装是通过cluster vlan 来实现安装的吧?
2、在交换模块的第一个口上我用一根网线插到了cluster vlan上,这样这个网线既传输SOL信息又负责分发操作系统的安装操作,这样理解是正确的吧?
3、有关19步的出错信息:运行gensshkeys root命令的时候没有任何的提示,并且/opt/xcat/etc下面并没有生成gkh文件。
4、其他问题想办法处理中... ...

论坛徽章:
0
5 [报告]
发表于 2008-11-21 16:13 |只看该作者
1.是通过cluster vlan来发装的.
2.交换模块对应节点上的eth0,用于sol,不应连接在cluser vlan上。是直接模块为对应节点上的eth1,用来安装操作系统。
所以你的理解错误。
3.#export XCATROOT=/opt/xcat  && /opt/xcat/sbin/gensshkeys root 看看,若不行,查看gensshkeys这个脚本,看那部分有问题.
#bash -xv  /opt/xcat/sbin/gensshkeys root用来检查服本

[ 本帖最后由 wysilly 于 2008-11-21 17:15 编辑 ]

论坛徽章:
0
6 [报告]
发表于 2008-11-21 16:34 |只看该作者
说实在的我确实有点晕。我们规划这个以前是详细参考了您文档中的那个连线拓扑,我们现在仅拿了一个刀片中心上的两台刀片做测试,我们理解的图如下:

这是我们参考了您文档中的连线图做成的,在你的文档中IB LAN想必是用于计算吧,但是并没有连接到管理机上。


我再请问一下,在你的图片中IB LAN连接的是刀片的直通模块吗?cluster vlan连接的是刀片的交换模块吗?

针对我们的草图麻烦wysilly给出一些具体的指导吧,谢谢。

论坛徽章:
0
7 [报告]
发表于 2008-11-21 16:36 |只看该作者
IB lan 是用于计算的吗?

[ 本帖最后由 tracert1979 于 2008-11-21 16:48 编辑 ]

论坛徽章:
0
8 [报告]
发表于 2008-11-21 16:58 |只看该作者
IB vlan 连接的是IB直通模块,还有一个叫网络直通模块,在图上vlan 70是接在网络直通模块上的。 在你的配置中vlan30与vlan20应是同一vlan(eth1)

[ 本帖最后由 wysilly 于 2008-11-21 17:12 编辑 ]

20081121_ae5b42a5d1482c271f3dpL9zQXMXHlQG副本.jpg (27.47 KB, 下载次数: 35)

20081121_ae5b42a5d1482c271f3dpL9zQXMXHlQG副本.jpg

论坛徽章:
0
9 [报告]
发表于 2008-11-21 17:01 |只看该作者
ib vlan是用于计算的,我还用它来走存储数据。

论坛徽章:
0
10 [报告]
发表于 2008-11-21 17:28 |只看该作者
非常感谢wysilly 的回复。我刚才测试了一下发现我的这个交换模块不插线果然SOl功能是可用的(晕了,颠覆了我们前些天的一贯理解)。
就目前来说我们这个环境莫非交换模块上不需要插线? 然后网络直通模块插到高性能的交换机上既负责操作系统的分发(cluster vlan)又负责计算(计算vlan)?也就是说交换模块只干SOL这一份工作?
——按照您刚才替我们修改的图片来看,交换模块就不在使用了(仅实现SOL的功能),直通模块用来连接高速交换机,既实现操作系统分发的功能又要实现计算的功能,是这样的吗?

我们现在的刀片中心有一个交换模块,一个直通模块,一个AMM再没有其他的可选模块了,是不是应该这样:
1、将网络直通模块插在高性能的交换机上用于计算,并且此vlan内还应连接相关的存储节点;
2、交换模块上仍旧插线作为cluster vlan用于操作系统的分发;



另:在您的文档中提到了有个6口的交换模块,那么在您实施的时候是不是这个6口的交换模块没有插线,仅仅是用来完成sol的功能的?如果是这样的话,那么我们现在的环境和你的稍有不同,我们这边没有ib直通模块。是不是用这个6口的交换模块来实现cluster vlan的功能了能更好一些?

刚才测试了一下,这个6口的交换模块竟然不能实现交换的功能? 不知道为何?上面的电源指示灯都是亮的。但是刀片得不到IP地址,我从外部的6个口上插了一台笔记本来测试同样得不到IP地址,真是奇怪。

请wysilly有空指点一下, 谢谢! 命苦今晚又要加班了。

[ 本帖最后由 tracert1979 于 2008-11-21 19:36 编辑 ]
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP