qwe4311 发表于 2011-08-13 23:07

Ganglia详解

Ganglia是UC Berkeley发起的一个开源集群监视项目,设计用于测量数以千计的节点。Ganglia的核心包含gmond、gmetad以及一个Web前端。主要是用来监控系统性能,如:cpu 、mem、硬盘利用率, I/O负载、网络流量情况等,通过曲线很容易见到每个节点的工作状态,对合理调整、分配系统资源,提高系统整体性能起到重要作用。
  gmetad可以部署在集群内任一台节点或者通过网络连接到集群的独立主机,它通过单播路由的方式与gmond通信,收集区域内节点的状态信息,并以XML数据的形式,保存在数据库中。
每台计算机都运行一个收集和发送度量数据的名为 gmond 的守护进程。接收所有度量数据的主机可以显示这些数据并且可以将这些数据的精简表单传递到层次结构中。正因为有这种层次结构模式,才使得 Ganglia 可以实现良好的扩展。gmond 带来的系统负载非常少,这使得它成为在集群中各台计算机上运行的一段代码,而不会影响用户性能。所有这些数据多次收集会影响节点性能。网络中的 “抖动”发生在大量小消息同时出现时,可以通过将节点时钟保持一致,来避免这个问题。
  
由RRDTool工具处理数据,并生成相应的的图形显示,以Web方式直观的提供给客户端。

在这样、都滚 发表于 2011-11-10 15:23

哇哦好复杂呀

我也来给大家推荐一个

   Crecloud 云网管。这个软件很不错的
我们公司一直有在用的
简单 方便    你可以百度一下 看看他的好评

malio-alex 发表于 2011-11-10 23:36

我觉得追求实际效果,不如自己写一个

redlert 发表于 2011-12-08 17:03

就这么点内容,也叫详解?标题党害人啊

n04045430 发表于 2014-05-08 18:00

ganglia我搭建完了,但是碰到些问题,比如负载的单位是m ,平时在机器上看都是1分钟 五分钟 15分钟的负载,ganglia监控绘出的图怎么换算,第二就是,在我删除了一些节点之后,节点还在页面上,并且红色显示断开,很难看, 不知道怎么清除掉。

wjw870907 发表于 2014-06-30 17:31

回复 5# n04045430


    ganglia load取的是load fifteen .看下这个http://blog.csdn.net/xiao_qiang_/article/details/8671699
图像删除我也不是很清楚,我的办法是这样的,先删除summary里某台机器的rrd,然后再删除这台rrd
最后gmtead重启下
页: [1]
查看完整版本: Ganglia详解