- 论坛徽章:
- 27
|
本帖最后由 yifangyou 于 2013-08-18 10:28 编辑
1,上述的各种监控工具的优缺点比较
答:nagios:优点:报警体系非常完备,支持各种方式的报警方式,缺点:一台普通pc上的nagios只能同时监控50到100台机器,负载比较重,没有很好的图形化,这样的话不能够分析出故障要发生的苗头。
MRTG:优点:比较成熟,可以监控路由器,交换机,有历史曲线图,缺点:监控指标固定,无法自己扩展
Cacti:是mrtg的扩展,展示的图形更丰富
ganglia:优点:区别其它监控工具的是它的分层结构,使用分层结构可以在几个web界面上查看上万台机器的报告,图形化展示历史数据,可以从中分析出故障苗头,也可分析故障发生原因,缺点:缺少报警机制
Zabbix:优点:可以定制化的监控方式,报警方式,报表,图形化的历史数据,很方便查询,缺点:单台服务器支撑的监控客户端有限,而且服务端负载比较大
2,您在使用何种监控工具和平台,监控到故障时的一些故障处理机制
答:我使用的是zabbix,若是监控到硬盘报警,自己手动删除不必要的文件,
若是监控到内存占用较大,检查出那个进程有问题,关掉非必要的进程
3,谈谈您在处理故障过程中的一些心得及将来的规划
答:系统有时会因为网络原因引起一段时间没有数据,而误报
出现故障要分析原因,最直观的是从历史数据的曲线中分析主要是由哪方面引起的
将来规划
其实我最喜欢的ganglia,ganglia能够监控的机器多,负载轻,但是缺陷是缺少报警机制,若是将来ganglia增加了报警机制,我考虑把zabbix换成ganglia |
|