201209171411 发表于 2013-04-28 20:52

zabbix网卡流量变化率监控

监控软件:zabbix

需求分析:从系统层面的监控看,现在CPU持续超过80%会报警,流量曲线达到阀值才会报警,但是流量在短时间内起伏很大,肯定是有问题的,目前主要还是依靠人看,肯定有滞后性,如果能定一个规则出来,根据短时间流量变化的百分比,判断并发出报警提醒,就能够提前发现业务异常或者攻击

被监控系统:windows linux都有

各位大神如果搞过类似的监控,或者有一些思路或者想法,出来发表一下看法,给出个方案,本人在此不胜感激!

本人QQ:493590151欢迎交流

osapub 发表于 2013-05-20 10:19

本帖最后由 osapub 于 2013-05-20 10:22 编辑

回复 1# 201209171411

从系统层面的监控看,现在CPU持续超过80%会报警,流量曲线达到阀值才会报警,但是流量在短时间内起伏很大,肯定是有问题的


这个可以加重试解决,重试次数取决于你业务可靠性的要求,对于可靠性要求较高的系统,突发流量也是需要监控和报警的。

分享下我们日常运维的一些阀值:

   单个CPU使用率持续10分钟用户态(%User)使用率超过90%时,我们会开始分析占用这些CPU资源的进程,判断是否需要进一步处理。

   

ccyhaoran 发表于 2013-05-22 11:47

楼上正解,无论是zabbix或者nagios,都能定义时间段。

zdszdszds 发表于 2013-06-05 17:07

本帖最后由 zdszdszds 于 2013-06-05 17:10 编辑

这个问题很好搞定啊,看一下我以前写的文档:
http://wenku.baidu.com/view/8de79aed0975f46527d3e171.html
页: [1]
查看完整版本: zabbix网卡流量变化率监控