免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 7595 | 回复: 18
打印 上一主题 下一主题

综合监控工具软件列表 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-10-09 11:19 |只看该作者 |倒序浏览
zabbix
随着IDC的服务器越来越多,一直都想用套软件来承担日常的运维监控工作,但是普通的网管软件基本上都是基于SNMP的,监控的层次比较低,特别是对于我们运维来说应用方面的监控是主要工作。做为我想要的运维监控软件,它应该满足一下一些要求:

1。对于主机基本情况的监控。如CPU、文件系统、MEM等;
2。对于主流应用系统的监控,比如http、mysql、mail等,同时它对于应用系统的监控必须能够细化到如http进程、mysql当前有多少query打开多少table等等这些情况;
3。它必须有良好的扩展性,比如对于webst这样少见的应用最好自己可以定制脚本来抓取连接信息等;
4。web监控和灵活的图表定制能力,我可以根据服务器或者某个应用来自由定制曲线图;
5。它还需要有灵活的预警功能,对于服务器down应用down等预设阀进行预警处理,同时预警功能最好具有拓展性,比如能通过我们现有的短信平台发送。

nagios
nagios的实现方式:nagios采用分布-集中的管理模式。在nagios服务器上安装nagios主程序,
在被监控主机上安装nagios代理程序。通过nagios主程序和nagios代理程序之间的通讯,监视主机状态。
主程序和代理程序之间有两种工作方式,一种是主程序-->Active-->代理程序;另一种是主程序-->passive-->代理程序;顾名思义,是以一方向另一方主动提出通讯需求来划分的。

之前已经理解了Nagios的服务-命令-插件的工作关系,因此也明确了基本的Nagios服务是无法实现对远程系统的状况进行监测的,基本的Nagios 监测服务只能是本地系统监测以及对远程主机的连通性监测。为了使Nagios的监测服务器能够远程对被监测主机系统上的信息进行获取,比如远程系统上的进程数、磁盘空间使用状况、所运行的服务等等这些必须要登录远程主机系统上才能了解的信息的话,就必须要依靠NRPE这个核心扩展插件程序,NRPE作为中间的代理程序,扮演着一手接受着Nagios监测服务器发来的请求,另一手在远程主机系统上获取指定的信息的中间人角色。

论坛徽章:
0
2 [报告]
发表于 2008-10-09 11:32 |只看该作者
太少了点吧,呵呵,不过还是顶

论坛徽章:
0
3 [报告]
发表于 2008-10-09 12:57 |只看该作者
zabbix比较爽

论坛徽章:
0
4 [报告]
发表于 2008-10-09 13:12 |只看该作者

回复 #1 ygl23 的帖子

对nagios的介绍也太简单了,nagios基本是现在监控系统事实上的标准,有强大的调度逻辑,强大的事件处理机制.
nagios本身只是一个调度框架,不做任何监控的事情,所有监控都是通过插件的方式完成,自带的nagios-plugin有一些基本的服务监控方式,其他的就需要自己去定制了,nrpe只是一种方式,ssh,snmp都可以替代,再复杂点的,自己写个agent去监控,把结果送给nagios也是可以的.

nagios也可以实现分布式架构,比如多个机房,每个机房一个slave机器负责采集数据,集中到一台中心nagios出处理事件.

不过nagios也有它的缺点:
1, 界面不怎么样,还是C写的cgi,改起来麻烦. 数据分析/报表几乎空白
2, 最大的问题是不支持数据库,文本方式维护大量的配置相当痛苦(有很多第三方的插件实现数据库配置,但效果都不怎么好).
3, 还有一个致命的问题就是性能,当被监控的机器到达5000台,无能怎么玩都game over.

另nagios的开发人员现在做了nagios.com,是商业化的,也就是说开发者现在主要的精力放在商业化的,而不是开发, 最终肯能变成zenoss那样的模式,核心内容开源,其他的附加东西都是收费的。

论坛徽章:
0
5 [报告]
发表于 2008-10-09 13:41 |只看该作者
很久以前接触到的BMC PATROL貌似能够达到上述要求

论坛徽章:
0
6 [报告]
发表于 2008-10-09 14:58 |只看该作者

关于监控

监控的类别大概分两种:
1.操作系统级信息监控
cpu,mem,disk,process status
2.应用系统级信息监控
web,db的连接状态,访问速度,可访问性等

可能出现的情况是,操作系统级的监控一切正常,但是应用确在外部无法正常访问。比如,网络出品断掉,或者访问量大造成的网络堵塞,这些都是操作系统级监控无法检测的,只能由应用系统级监控来完成。
现在的问题是操作系统级监控可以使用 mrtg,zabbix,Nagios 等来实现。可是应用系统级的监控是由哪些软件呢?应用系统监控的基本操作,类似于loadrunner ,通过录制脚本然后由监控软件来执行脚本,来实现收集需要的数据。是有一些商业的应用系统监控软件(SolarWinds),但是现在我没钱,我需要一个免费的,各位能否推荐一个?

[ 本帖最后由 ygl23 于 2008-10-9 16:01 编辑 ]

论坛徽章:
0
7 [报告]
发表于 2008-10-09 15:04 |只看该作者

回复 #4 sysit 的帖子

zabbix监控我建立了,操作很简洁,很容易实现,而且有网络结构布局,实时图表,实时提醒。但是没有月报表功能,没有定制统计功能。
nagios还没试用,不过看了配置的文档,比较麻烦。
简单比较了一下,nagios能实现的zabbix都能实现。

论坛徽章:
0
8 [报告]
发表于 2008-10-09 15:46 |只看该作者
Zenoss有用过的吗?这个怎么样,看了文章,功能挺强大的。

论坛徽章:
0
9 [报告]
发表于 2008-10-09 23:02 |只看该作者
nagios 还是很强的,对于监控平台,还有个sitescope. 不过跟nagios比的话,还差之甚远.

论坛徽章:
0
10 [报告]
发表于 2008-10-10 09:32 |只看该作者
nagios是开源的么?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP