免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: send_linux

集群监控工具十八般兵器,哪个您最拿手?(获奖名单已公布-10-24) [复制链接]

论坛徽章:
0
发表于 2013-09-21 15:50 |显示全部楼层
ganglia 觉得不怎么好用,哈哈,不过还算可以,勉强推荐一下!

论坛徽章:
6
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-03 17:33:522015元宵节徽章
日期:2015-03-06 15:50:39IT运维版块每日发帖之星
日期:2016-01-11 06:20:00IT运维版块每日发帖之星
日期:2016-03-19 06:20:0019周年集字徽章-19
日期:2019-09-06 18:56:11
发表于 2013-09-22 00:23 |显示全部楼层
ganglia在集群监控上面应用很广。

论坛徽章:
4
CU十二周年纪念徽章
日期:2013-10-24 15:41:34狮子座
日期:2014-02-10 17:22:57技术图书徽章
日期:2014-02-18 08:44:12技术图书徽章
日期:2014-04-29 14:15:42
发表于 2013-09-22 12:53 |显示全部楼层
只用过cacti和nagios,
自己瞎捣鼓的,研究不深,可能有些功能没发现.
用cacti做统计cpu,内存,磁盘,网络都有统计,还可以把收集到的数据保存起来,便于分析. 但好像没有警报的功能.
所以加上了nagios做警报. nagios好像又不能把收集到的数据保存到数据库.
所以目前采用了cacti+nagios
Ganglia没用过, 马上装个测试一下,如果能兼有统计和警报就太好了

论坛徽章:
0
发表于 2013-09-22 15:36 |显示全部楼层
本帖最后由 tengh 于 2013-09-22 15:40 编辑

目前刚刚在实验室的服务器上把ganglia 3.5安装好,我们现在有16台机架式服务器,做量化计算的。

现在的感觉是ganglia安装好之后查看机器状态方便了,通过图形界面即可,cpu,内存、网络、磁盘等信息一目了然。
grid.png

这个对于我们来说另一个用途就是有一个机器状态历史记录信息,知道机器的运行状态,提供更有说服力的数据。对申请项目也是有益的。

由于了解不深,所以现在基本上都是按照默认设置,等有时间了在慢慢看manual。

现在正在看ganglia、Nagios和Splunk结合使用,这套监控体系,具备错误报警、性能调优、问题追踪和自动生成运维报表的功能。

论坛徽章:
3
CU十二周年纪念徽章
日期:2013-10-24 15:41:34双子座
日期:2014-03-02 00:11:39fulanqi
日期:2016-06-17 17:54:25
发表于 2013-09-22 15:47 |显示全部楼层
运维工程师很擅长这个。

论坛徽章:
0
发表于 2013-09-23 09:30 |显示全部楼层
服务器不多  暂时只用Cacti的路过   其余的监控软件还在学习摸索中

论坛徽章:
4
CU大牛徽章
日期:2013-03-13 15:29:07CU大牛徽章
日期:2013-03-13 15:29:49CU大牛徽章
日期:2013-03-13 15:30:19处女座
日期:2014-03-04 14:36:58
发表于 2013-09-23 10:21 |显示全部楼层
nagios +ganglia

nagios是监控服务状态的信息与报警功能。


ganglia  查看资源利用率,方便合理分配机器的资源。

正好这2个产品可以互补,各自发挥自己的特点。

怎么才能能到奖品啊,正好可以系统学习下ganglia, 看到大家写了好多啊。

论坛徽章:
0
发表于 2013-09-23 10:40 |显示全部楼层
我都自己写的集群监控。。。。。。

论坛徽章:
4
ChinaUnix专家徽章
日期:2015-07-27 10:05:26IT运维版块每日发帖之星
日期:2015-09-01 06:20:00IT运维版块每日发帖之星
日期:2016-07-29 06:20:00PHP
日期:2016-10-25 16:08:01
发表于 2013-09-23 12:28 |显示全部楼层
nagios+cacti 这个是王道,特别是nagios+nrpe非常灵活,而且跨平台监控也很方便,写个脚本就OK了。

论坛徽章:
1
水瓶座
日期:2013-09-25 10:36:33
发表于 2013-09-24 14:57 |显示全部楼层
那些常用的你们都说完了,我也没啥好说的了。我就说个不常见的吧。
   之前一直用cacti+nagios,但是现在换公司了。公司要求高,现在用的是HP的Arcsight产品。分ESM、Logger、SmartConnector和SupperConnector等几个组件,来采集分析各种类型的设备日志进行监控。结果可以备份到存储上或本地,方便日后调查和还原。
  整个环境通过connector收取日志发送到ESM上,通过管理员定义的规则ESM自动分析出结果,然后以报表和仪表板的方式展现出来。仪表板展现时时的,报表展现周报,月报或年报。控制方式可以是console控制台或web方式,方便灵活。
这款软件可以做到,监控硬件信息,设备运行状态,各种形式的攻击,门禁,交易信息,用户登录等等所有的事情。其他监控软件能做到的,没有Arcsight做不到的。
  非常可惜的是Arcsight收费的,而且不是一般的贵。这款监控软件是金融和电信行业的首选。
不足之处:收费太高,安装部署繁琐,需要HP派专业团队实施,且实施耗时较长,4人团队大概要半年时间。
心得:即使如此,用过Arcsight之后,觉得没有任何一款监控软件能和Arcsight相媲美。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP