免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3091 | 回复: 4
打印 上一主题 下一主题

[Web] 细节是时间堆积出来的(推荐一款监控tomcat/mysql/lighttpd/apache的共享软件) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-11-20 16:29 |只看该作者 |倒序浏览
很多时候细节体现的可能不只是一种改进,更多的是一种态度,一种对自己品牌的在意。听一辆宝马的关车门声音和本田的那就可以明显感觉到差距。
    我们做的是运维监控领域,看似热热闹闹,今天这个软件厂商进来搞一把,明天那个山头的进来桶一棍子。这让很多人觉得开发一个监控软件,并不那么难。确实从技术上说,开发一套监控软件并不是多么难,但大家有没有发现一个现象,像OpenNMS这样的开源组织,都已经有10年了,这就很说明一个问题。大浪淘沙,剩下的只能是钻的最深的那些,而浮在上面的,可能早就不知道在哪个角落了。
   那如何能使自己产品钻的更深,目前看有两条途径:创新、细节;我们这里分享一款我们的共享版监控软件,它能够对目前主流的开源软件如tomcat、mysql、apache httpd、jboss、lighttpd进行运维监控;细节的追求往往是没有底的,这里罗列一下我们几个监控小细节:
1、‘立即采集一次’和异常采集原因
很多监控软件都是基于轮训的方式进行数据采集,如每隔2分钟采集一次数据,但有些时候,当我们在分析故障的时候,想立刻知道一下当前的情况,那立即采集一次这个细节就很有必要了。另外一个如果采集失败,是不是要告诉我们失败的原因是什么。下图是我们的这两个细节:  

2、阀值设置
阀值可能是目前大部分监控软件都有的功能,但很多时候,阀值的设置其实应该很灵活的,如:
场景1:网站访问量在一个时间点超过10000没关系,就怕一会高一会低,波浪形的变化,通过对EOMP        设置一个’在上午9:00-11:00,如果在15分钟内至少(不用连续)发生3次,监控值超过10000,则发生一条严重级别告警’。
场景2:磁盘利用率在70-80%之间则发生注意级别告警,在80%-90%之间则发生问题级别告警,在90以上则发生严重级别告警。
下图是我们的阀值设置界面:

3、采集频率
时间间隔轮训应该只是一种采集监控数据的策略,很多情况下,可能需要更灵活的方式,如定点采集,如想要对服务器的某个文件夹里的文件上传数量是否在每天晚上9点前上传完毕进行监控,那就可以采用定时采集,把采集时间点定在每天晚上8点和8点15,如果那时文件上传还没到位,则有充分的时间进行处理,下图是我们的设置界面:

   您如果需要监控tomcat/mysql/jboss等, 可以无偿下载我们的共享版监控软件,更重要的细节期待你的体会。
下载地址 www.yunweitec.com
(如果您感觉这款共享软件能给你工作带来一点帮助,希望您推广给更多的人使用,因为我们相信只有用的人多了,产品才可能做的更好,反过来也才能给您的工作带来更大的帮助。

论坛徽章:
0
2 [报告]
发表于 2010-11-21 11:29 |只看该作者
用了下,感觉还可以,顶一下,希望能长期提供。

论坛徽章:
0
3 [报告]
发表于 2010-11-24 12:40 |只看该作者
{:3_198:} 广告贴。。。删。。。。删。。。。。删.......删.......删........

论坛徽章:
0
4 [报告]
发表于 2010-11-26 10:58 |只看该作者
EOMPV_2.1推出最新共享版,该版本修复了一些bug,并推出英文版本,欢迎大家使用,并提出宝贵意见。

论坛徽章:
0
5 [报告]
发表于 2010-11-30 14:10 |只看该作者
写的不错
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP