- 论坛徽章:
- 0
|
ISEE的工作原理大致如下
1. EMS监控到EVENT, 写入 /var/opt/resmon/log/event.log
2. 根据/var/stm/config/tools/monitor/下*.clcfg *.sapcfg中的规则filter出符合条件的EVENT,写入 /var/opt/resmon/log/rst.log并将EVENT DATA发往1402 PORT
3. ISEE EMS LISTENER DAEMON 监听1402 PORT的信息,一旦有数据收到,forward to mad DAEMON
mad process负责将EVENT INFO发给HP ISEE Server,相关信息写入/var/opt/hpservices/log/mad.log
由上面的ISEE工作原理,大致就可以确定判断ISEE是否正常工作的几个CHECKPOINT
1. 判断EMS是否正常运行
ps –ef|grep stm
2. 判断EMS LISTENER是否正常运行
ps –ef|grep rst
3. 判断mad是否正常运行
ps –ef|grep mad
可以做一个ISEE的TEST,模拟一个EMS事件,例如
send_test_event –a sysstat_em
观察在涉及的日志中是否有相关的记录,从而确定出问题的环节,(正常的话可以在ISEE UI界面中看到相关的incident信息,如果UI界面有问题无法正常显示,亦可以在/opt/hpservices/incidents目录下找到新产生的一个暴长的目录,这个目录下有一个incident.dat文件,里面会有incident状态的描述,例如“正在CE队列中”、“发送失败”等描述,如果有新的incident目录产生,说明isee在host端的工作是正常的,如果server没有收到相关的信息,问题应该是出在网络连接上)
确定问题后就可以采取相应的措施:
1. 手工start EMS listener
/sbin/init.d/rstemsListener stop
/sbin/init.d/rstemsListener start
2. 手工start ISEE UI
/sbin/init.d/hpservices stop
/sbin/init.d/hpservices start
另外可以用以下命令测试ISEE client端到HP SERVER的网络连接是否正常
/opt/hpservices/RemoteSupport/bin/iseeConnectivityTest.sh
它的返回结果中有新产生的Incident no
根据这个no进入/opt/hpservices/incidents/下相应的目录中观察Incident.dat,如果中间有一个类似 resultkey的字段没有异常报错,可以确认网络连接OK.
本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/6683/showart_274246.html |
|