zabbix网卡流量变化率监控
监控软件:zabbix需求分析:从系统层面的监控看,现在CPU持续超过80%会报警,流量曲线达到阀值才会报警,但是流量在短时间内起伏很大,肯定是有问题的,目前主要还是依靠人看,肯定有滞后性,如果能定一个规则出来,根据短时间流量变化的百分比,判断并发出报警提醒,就能够提前发现业务异常或者攻击
被监控系统:windows linux都有
各位大神如果搞过类似的监控,或者有一些思路或者想法,出来发表一下看法,给出个方案,本人在此不胜感激!
本人QQ:493590151欢迎交流 本帖最后由 osapub 于 2013-05-20 10:22 编辑
回复 1# 201209171411
从系统层面的监控看,现在CPU持续超过80%会报警,流量曲线达到阀值才会报警,但是流量在短时间内起伏很大,肯定是有问题的
这个可以加重试解决,重试次数取决于你业务可靠性的要求,对于可靠性要求较高的系统,突发流量也是需要监控和报警的。
分享下我们日常运维的一些阀值:
单个CPU使用率持续10分钟用户态(%User)使用率超过90%时,我们会开始分析占用这些CPU资源的进程,判断是否需要进一步处理。
楼上正解,无论是zabbix或者nagios,都能定义时间段。 本帖最后由 zdszdszds 于 2013-06-05 17:10 编辑
这个问题很好搞定啊,看一下我以前写的文档:
http://wenku.baidu.com/view/8de79aed0975f46527d3e171.html
页:
[1]