服务器硬件监控方式
服务器硬件监控使用方式比较好?监控内存条是否坏了,CPU是否有问题了等等。 我的服务器是惠普的,利用ipmitool工具调用ilo接口监控服务器硬件,在linux下写成shell脚本定时监控报警。监控CPU,电源,内存,风扇,网卡……都可以 太高档了,我就用lm_sensors 监控一下cpu主板温度啥的。 一般服务器好像自带的有监控工具吧 高级货,硬件管理里配置一下就可以 有现成的,也可以自己写.1,HP服务器
安装HP的PSP包,有hpasmcli可以对主板的各种信息进行提取,hpacucli可以对RAID卡的各种信息进行提取,如果你使用nagios监控,也以安装check_hpasm插件,功能极完善.
2,DELL服务器
安装DELL官方的openmanage软件包,可以使用check_openmanage插件.
openmanage需要额外安装吗
dell上的esxi的监控有人做过吗 回复 2# GangLin_Lan
求ipmitool的使用方法和脚本,谢谢!
想要发现硬件是否有坏可以用ipmitool 找 system log:
ipmitool -H 172.16.2.229 -U root -P xxxx sel elist
将会得到以下信息:
8 | 10/18/2012 | 14:38:24 | Memory Mem ECC Warning | Transition to Non-critical from OK
9 | 10/25/2012 | 17:33:22 | Memory Mem ECC Warning | Transition to Critical from less severe
这其实已经表明内存有坏了! 回复 6# dgvri
nagios看来还是比较主流的{:3_188:}
页:
[1]
2