免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2905 | 回复: 7
打印 上一主题 下一主题

关于集群监控系统ganglia的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-05-23 14:18 |只看该作者 |倒序浏览
我们这里的一套集群,全部装上了ganglia,给管理节点的两块网卡分别配了一个外网ip,和一个内网ip。其他节点如果全部设置为内网,/etc/gmond.conf中的trust_hosts 设置为管理节点的内网ip,则在监控页面上机器状态显示为down,偶尔某个节点的状态就显示正常了,但是时间不长就又显示down了。
但是如果其他节点全部设置为外网的话,/etc/gmond.conf中的trust_hosts设置为gmetad所在主机的外网ip,则其在监控页面的状态才一直显示正常!
为什么会这样?
有人对这方面了解不?
管理节点的网卡配置:
eth0:192.168.0.5
eth1:202.117.54.135
计算节点的网卡配置:
eth0:192.168.0.6
管理节点的/etc/gmond.conf文件中关键几行为:
name  "xjtu Dawning4000L cluster"
mcast_if  eth0
trusted_hosts 202.117.54.130    //202.117.54.130此IP为GANGLIA WEB FRONTEND 所在节点的IP
计算节点的/etc/gmond.conf文件中关键几行为:
name  "xjtu Dawning4000L cluster"
mcast_if  eth0
trusted_hosts 192.168.0.5


这就是具体的配置情况,请问哪里配置有错?

说明:我在我们另一个集群里就是这样配置的,每个节点的监控情况都是正常的,而这个集群中只有管理节点的状态显示是正常的,如果把计算节点eth0改为外部IP,且其trusted_hosts 设置为202.117.54.130 则监控信息就显示正常了!

这是怎么回事呢?期待高手答复!

[ 本帖最后由 ltq_yaliang 于 2009-5-23 18:42 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2009-05-23 15:25 |只看该作者
贴出配置信息.应该是配置错误.

论坛徽章:
0
3 [报告]
发表于 2009-05-23 18:47 |只看该作者

回复 #2 wysilly 的帖子

配置信息我已经贴出来了,您给分析分析是哪里的原因,我阅读了一下安装说明中的README文件,里面有一段话:
Kernel multicast support
        Currently ganglia will only run on machines with multicast support.
        The vast majority of machines have multicast support by default. If
        you have problems with ganglia this is a core issue. Later versions
        of ganglia will not have the multicast requirement.
我想这套集群出现的这种问题是不是由于服务器不支持multicast造成的?

[ 本帖最后由 ltq_yaliang 于 2009-5-23 18:48 编辑 ]

论坛徽章:
0
4 [报告]
发表于 2009-05-25 10:21 |只看该作者
管理节点的/etc/gmond.conf文件中关键几行为:
name  "xjtu Dawning4000L cluster"
mcast_if  eth0
trusted_hosts 192.168.0.0/24    //202.117.54.130此IP为GANGLIA WEB FRONTEND 所在节点的IP

手边没有ganglia, 你按照粗体字改一下试试看

论坛徽章:
0
5 [报告]
发表于 2009-05-25 13:59 |只看该作者

回复 #4 straw 的帖子

这样肯定不行。
如果把管理节点上的trust_hosts 改为192.168.0.0/24 那么在监控页面部分就显示不出来这套集群的任何信息了呀!
我改后试了一下,也验证了上面的结论!

论坛徽章:
0
6 [报告]
发表于 2009-05-25 15:13 |只看该作者
我搞错了,我以为web-frontend在你的管理机器上呢

论坛徽章:
0
7 [报告]
发表于 2009-05-25 15:14 |只看该作者
你把 202.117.54.130 192.168.0.0/24都加上吧

论坛徽章:
0
8 [报告]
发表于 2009-05-25 15:16 |只看该作者
还有,rrd更新可能有一点延时,不能立马看到节点的状态
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP