mikosoulinside 发表于 2015-06-16 16:54

关于服务器和数据库性能监控告警等级

新人拜坛,请多指教!


近期公司上了一套IT设备自动化性能监控系统,可以针对服务器、数据库进行性能监控
然则我原是一研发
被临时指派来前期调研 服务器和数据库 性能监控 中 告警等级方面 的工作,一头雾水@_@

目前有以下2大问题
1.倾向于设置一般告警 严重告警 紧急告警等3个级别,不知如此设置是否足够和合理?
2.烦请诸位前辈从自身经验出发,指点一下在进行服务器性能监控时,如何设置设备的告警等级
像是
==========服务器方面==============
CPU使用率(一般告警 严重告警 紧急告警分别设置为多少%?)
物理内存使用率(一般告警 严重告警 紧急告警分别设置为多少%?)
虚拟内存使用率(这个是否需要?等级应该如何设置?)
磁盘空间使用率(一般告警 严重告警 紧急告警分别设置为多少%?)
ping失败(这个失败个2~3次直接就是严重告警了吧?)
进程数(这个是否需要?等级应该如何设置?)

==========数据库方面==============
应该监控哪些指标?
目前可以采集到DB的缓存命中率(oracle,mysql,sqlserver)、连接数等等
然而这些命中率连接数一般是看具体应用来判断是否有问题的,我该如何设置告警等级呢?

不是很有头绪,请前辈们指点!
页: [1]
查看完整版本: 关于服务器和数据库性能监控告警等级