Chinaunix

标题: 综合监控工具软件列表 [打印本页]

作者: ygl23    时间: 2008-10-09 11:19
标题: 综合监控工具软件列表
zabbix
随着IDC的服务器越来越多,一直都想用套软件来承担日常的运维监控工作,但是普通的网管软件基本上都是基于SNMP的,监控的层次比较低,特别是对于我们运维来说应用方面的监控是主要工作。做为我想要的运维监控软件,它应该满足一下一些要求:

1。对于主机基本情况的监控。如CPU、文件系统、MEM等;
2。对于主流应用系统的监控,比如http、mysql、mail等,同时它对于应用系统的监控必须能够细化到如http进程、mysql当前有多少query打开多少table等等这些情况;
3。它必须有良好的扩展性,比如对于webst这样少见的应用最好自己可以定制脚本来抓取连接信息等;
4。web监控和灵活的图表定制能力,我可以根据服务器或者某个应用来自由定制曲线图;
5。它还需要有灵活的预警功能,对于服务器down应用down等预设阀进行预警处理,同时预警功能最好具有拓展性,比如能通过我们现有的短信平台发送。

nagios
nagios的实现方式:nagios采用分布-集中的管理模式。在nagios服务器上安装nagios主程序,
在被监控主机上安装nagios代理程序。通过nagios主程序和nagios代理程序之间的通讯,监视主机状态。
主程序和代理程序之间有两种工作方式,一种是主程序-->Active-->代理程序;另一种是主程序-->passive-->代理程序;顾名思义,是以一方向另一方主动提出通讯需求来划分的。

之前已经理解了Nagios的服务-命令-插件的工作关系,因此也明确了基本的Nagios服务是无法实现对远程系统的状况进行监测的,基本的Nagios 监测服务只能是本地系统监测以及对远程主机的连通性监测。为了使Nagios的监测服务器能够远程对被监测主机系统上的信息进行获取,比如远程系统上的进程数、磁盘空间使用状况、所运行的服务等等这些必须要登录远程主机系统上才能了解的信息的话,就必须要依靠NRPE这个核心扩展插件程序,NRPE作为中间的代理程序,扮演着一手接受着Nagios监测服务器发来的请求,另一手在远程主机系统上获取指定的信息的中间人角色。
作者: heizi21    时间: 2008-10-09 11:32
太少了点吧,呵呵,不过还是顶
作者: jason0127    时间: 2008-10-09 12:57
zabbix比较爽
作者: sysit    时间: 2008-10-09 13:12
标题: 回复 #1 ygl23 的帖子
对nagios的介绍也太简单了,nagios基本是现在监控系统事实上的标准,有强大的调度逻辑,强大的事件处理机制.
nagios本身只是一个调度框架,不做任何监控的事情,所有监控都是通过插件的方式完成,自带的nagios-plugin有一些基本的服务监控方式,其他的就需要自己去定制了,nrpe只是一种方式,ssh,snmp都可以替代,再复杂点的,自己写个agent去监控,把结果送给nagios也是可以的.

nagios也可以实现分布式架构,比如多个机房,每个机房一个slave机器负责采集数据,集中到一台中心nagios出处理事件.

不过nagios也有它的缺点:
1, 界面不怎么样,还是C写的cgi,改起来麻烦. 数据分析/报表几乎空白
2, 最大的问题是不支持数据库,文本方式维护大量的配置相当痛苦(有很多第三方的插件实现数据库配置,但效果都不怎么好).
3, 还有一个致命的问题就是性能,当被监控的机器到达5000台,无能怎么玩都game over.

另nagios的开发人员现在做了nagios.com,是商业化的,也就是说开发者现在主要的精力放在商业化的,而不是开发, 最终肯能变成zenoss那样的模式,核心内容开源,其他的附加东西都是收费的。
作者: 胖子G    时间: 2008-10-09 13:41
很久以前接触到的BMC PATROL貌似能够达到上述要求
作者: ygl23    时间: 2008-10-09 14:58
标题: 关于监控
监控的类别大概分两种:
1.操作系统级信息监控
cpu,mem,disk,process status
2.应用系统级信息监控
web,db的连接状态,访问速度,可访问性等

可能出现的情况是,操作系统级的监控一切正常,但是应用确在外部无法正常访问。比如,网络出品断掉,或者访问量大造成的网络堵塞,这些都是操作系统级监控无法检测的,只能由应用系统级监控来完成。
现在的问题是操作系统级监控可以使用 mrtg,zabbix,Nagios 等来实现。可是应用系统级的监控是由哪些软件呢?应用系统监控的基本操作,类似于loadrunner ,通过录制脚本然后由监控软件来执行脚本,来实现收集需要的数据。是有一些商业的应用系统监控软件(SolarWinds),但是现在我没钱,我需要一个免费的,各位能否推荐一个?

[ 本帖最后由 ygl23 于 2008-10-9 16:01 编辑 ]
作者: ygl23    时间: 2008-10-09 15:04
标题: 回复 #4 sysit 的帖子
zabbix监控我建立了,操作很简洁,很容易实现,而且有网络结构布局,实时图表,实时提醒。但是没有月报表功能,没有定制统计功能。
nagios还没试用,不过看了配置的文档,比较麻烦。
简单比较了一下,nagios能实现的zabbix都能实现。
作者: ygl23    时间: 2008-10-09 15:46
Zenoss有用过的吗?这个怎么样,看了文章,功能挺强大的。
作者: agen_0502    时间: 2008-10-09 23:02
nagios 还是很强的,对于监控平台,还有个sitescope. 不过跟nagios比的话,还差之甚远.
作者: wintersday    时间: 2008-10-10 09:32
nagios是开源的么?
作者: pei5    时间: 2008-10-10 11:32
我刚刚完成了一套楼主所说的程序,同时支持windows和linux,拥有完美的监控可扩展属性,自己公司在用,不过目前还不支持图表功能,其他的基本都已经实现了,实现方式也是分散到集中,支持外网单ip对应内网多台机器的nat模式网

[ 本帖最后由 pei5 于 2008-10-10 11:37 编辑 ]
作者: songpure520    时间: 2008-10-15 15:24
最进考虑用什么监控程序,看了这篇帖子了解了很多哦!!顶顶!!
作者: andrefun    时间: 2008-10-15 16:03
Cacti呢?
作者: minuteman    时间: 2008-10-16 10:40
有没有傻瓜型的好用的监控软件啊
开源的觉得都那么麻烦,嘿嘿
收费的呢,solarwinds够强够傻瓜,但资源耗得很厉害,web那个慢啊
作者: bbjmmj    时间: 2008-10-16 14:56
不错!
作者: ygl23    时间: 2008-10-16 15:35
标题: 回复 #14 minuteman 的帖子
zabbix可以完成系统级的监控,不只是基本。
作者: ly_cyz    时间: 2008-10-16 17:40
zabbix不错!
作者: yd_xzn    时间: 2008-10-31 11:31
NND,刚想下载个zabbix,sourceforge.net却又被封了。
作者: jefferey    时间: 2008-11-02 00:04
nagios+自定义监控脚本+短信报警,一般能满足上面提供的监控需求。
但有些服务会出现假死情况, 所以需要配合自定义脚本来监控(通过模拟客户端去抓取信息)
感觉nagios还是挺方便。 推荐服务器比较多的情况下使用。
觉得nagios复杂的可以试下windows下的监控软件what's up之类也能满足




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2