免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2342 | 回复: 2
打印 上一主题 下一主题

企业级监控解决方案随想 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-01-28 18:18 |只看该作者 |倒序浏览
1.  引言

对于一个提供实时服务的互联网企业,尽量保证7*24的不间断服务是我们追求的目标之一,尽管我们做了非常多的努力,但是由于某些不可预知的因素产生的异常还是常常发生,为了及时的发现异常,避免问题进一步辐散扩大,我们可能需要一些工具或者方法来发现异常、发现问题。这时候,我们就引入了一个原本和业务可能不太相关的技术—监控。

本文就针对当前百度公司业务中所提炼出的一些监控方法、监控方式及一些监控平台的实现简单讲述一下对于监控的理解。



2.  为什么要做监控?

为什么要做监控,先从监控的定义说起吧:对装备及系统的工作状态不间断地实时监测,并根据反馈信息自动对系统中异常部位实施相应措施的闭合自动控制作用,这个是监控的定义之一。这里的主要关键点有: 不间断、实时、监测、针对异常实施相应措施。


那我们的监控是什么?

能够不间断的实时监控当前业务,并且根据异常能够自动执行相应的预案或者自动操作,最大限度的减少服务损失及人工参与程度,最大程度的自动化处理,这个应该是我们对于监控的理解,也是我们做监控的目标之一。



3.  应该监控哪些内容?

简单来讲,所有对于业务有直接或者间接影响的要素,都应该被监控。那这些要素包括什么呢?

1、       支撑业务运行的外部环境:

这里具体又包括:

a.   IDC监控:

      i.    机房环境,如电力供应、空调、温度、湿度等;

b.  网络设备:

      i.    光纤、路由器、交换机等;

c.   服务器硬件:

      i.    磁盘、主机板、电源、内存、CPU等;

d.  操作系统:

      i.    资源使用、系统异常等;

因为长度受限:http://hi.baidu.com/ops_bd/blog/item/c7ad1f8fb777df87a5c2722f.html

论坛徽章:
0
2 [报告]
发表于 2011-01-30 21:21 |只看该作者

论坛徽章:
0
3 [报告]
发表于 2011-02-07 10:57 |只看该作者
学习了,谢谢!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP