免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4859 | 回复: 5
打印 上一主题 下一主题

【请教】如何加快nagios 即时报警速度... [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-01-15 12:12 |只看该作者 |倒序浏览
最近配置了个nagios,不过由于nagios发现故障速度太慢,做了以下配置,速度快了不少,5分钟内报警短信能出来,不过还是达不到即时发现要求,
晒下配置参数,不足之处希望大家多指点,

nagios.cfg 主配置文件
状态文件刷新间隔
status_update_interval=5
最大主机检测间隔(不知道理解对不,默认30M改为3M)
max_host_check_spread=3
服务重新检测间隔(60改为 10 )
service_freshness_check_interval=10

我想Nagios能做到即时监控,不知道可行否?

[ 本帖最后由 妖哥 于 2009-1-15 20:35 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2009-01-15 20:12 |只看该作者
nagios的强项本来就是即时监控。建议仔细找些nagios的帖子看看主配置每行的意思。你的这几个理解都不太对。(现在nagios的配置帖子已经非常多了。)
status_update_interval跟调度没关系,不用修改。
freshness是个新鲜度,推荐不要使用。
如果你的监控点在3000以内,那么理顺各配置文件,基本不会有多大延时,实在觉得调度太慢,可以修改service_inter_check_delay_method=n(监控点再多就不推荐修改了),提醒service_interleave_factor这个离散因子不要调。监控点3000以上,搭分布式环境吧。总之主动调度要保证performance info中的平均调度时延别超过5s,基本就算符合监控的要求了。

[ 本帖最后由 exp07 于 2009-1-15 20:16 编辑 ]

论坛徽章:
0
3 [报告]
发表于 2009-01-15 20:37 |只看该作者
感谢楼上的回复...,我试下,

论坛徽章:
0
4 [报告]
发表于 2009-01-16 09:54 |只看该作者
原帖由 妖哥 于 2009-1-15 12:12 发表
最近配置了个nagios,不过由于nagios发现故障速度太慢,做了以下配置,速度快了不少,5分钟内报警短信能出来,不过还是达不到即时发现要求,
晒下配置参数,不足之处希望大家多指点,

nagios.cfg 主配置文件 ...



其实我觉得对报警速度影响最大的是services.cfg这个参数:
max_check_attempts    4
每次检测都有时间周期,这个参数是4次的检测全部错误,才会发报警,一般我的核心应用都是2次(1次有可能会误报),这样速度会快很多。
这两个参数也会有影响:
    normal_check_interval 3
       retry_check_interval  2

论坛徽章:
0
5 [报告]
发表于 2009-01-16 20:17 |只看该作者
除非分布式的。

论坛徽章:
0
6 [报告]
发表于 2009-01-19 13:32 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP