免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4319 | 回复: 8
打印 上一主题 下一主题

[新手入门] 请教:解决CONTROLLER HEALTH CHECK FAILURE的思路 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-10-09 14:29 |只看该作者 |倒序浏览
ibm aix5.3, p650 和 p630连接到 fast600上面,没有做双机。
最近发现以下错误:
#errpt -d H -T PERM

BC669AA7   1008150208 P H dac0           CONTROLLER HEALTH CHECK FAILURE


#errpt -aj BC669AA7

---------------------------------------------------------------------------
LABEL:                FCP_ARRAY_ERR7
IDENTIFIER:        BC669AA7

Date/Time:       Wed Oct  8 15:02:34 BEIS
Sequence Number: 114934
Machine Id:      005D0A3F4C00
Node Id:         erpsera
Class:           H
Type:            PERM
Resource Name:   dac0            
Resource Class:  array
Resource Type:   ibm-dac-V4
Location:        U0.1-P2-I5/Q1-W200600A0B8137390
VPD:            
        Manufacturer................IBM     
        Machine Type and Model......1722-600        
        Part Number.................348-0049472     
        ROS Level and ID............0520
        Serial Number...............1T40346480      
        Device Specific.(Z1)........2D363030
        Device Specific.(Z2)........6F6E7472
        Device Specific.(Z3)........20202020

Description
CONTROLLER HEALTH CHECK FAILURE

Probable Causes
ARRAY CONTROLLER
CABLES AND CONNECTIONS
ARRAY DASD MEDIA

Failure Causes
DASD MEDIA
ARRAY CONTROLLER
CABLES AND CONNECTIONS

        Recommended Actions
        PERFORM PROBLEM DETERMINATION PROCEDURES

Detail Data
SENSE DATA
0600 0000 0000 0000 0000 0004 0000 0000 0000 0000 0000 0000 0200 0400 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 315F E000 F205 2101 0000 0000 0000 0000 0000 0000 0040 0000 0000 0010
FFFF FFFF
---------------------------------------------------------------------------

分析:
操作系统和应用都可以正常使用,每隔10多分钟就报以上错误。
P650和630都报这样的错误,不可能两台服务器的光纤卡都有问题,可以排除是光纤卡的问题。
能正常使用,说明了光纤连接线 和 硬盘 是ok的。
难道是光纤交换机 或者 盘柜的原因?但是用sm 软件看,盘柜里面没有错误信息。

接下去应该怎样判断是 交换机还是盘柜的问题?  交换机和盘柜指示灯都正常。
之前,盘柜亮黄灯,换过电池,不亮黄灯了。难道跟电池有关? 听大侠说过,电池不对,会导致硬盘微码问题。

接触aix不久,谢了!

[ 本帖最后由 unixware 于 2008-10-9 14:30 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2008-10-10 09:31 |只看该作者
用storage manager登录上去看看
存储有问题的可能大

论坛徽章:
0
3 [报告]
发表于 2008-10-10 10:21 |只看该作者
电池不对,会导致硬盘微码问题
这么挑剔呀

论坛徽章:
0
4 [报告]
发表于 2008-10-10 11:06 |只看该作者
没听说电池会造成这个

论坛徽章:
0
5 [报告]
发表于 2008-10-10 11:23 |只看该作者
原帖由 dongli 于 2008-10-10 10:21 发表
电池不对,会导致硬盘微码问题
这么挑剔呀


听说而已

论坛徽章:
0
6 [报告]
发表于 2008-10-10 11:26 |只看该作者
会不会是 disk array control 有问题?
650报dac0 有问题,630报dac1有问题,实际上是同一个dac。
如果确定盘柜上的array control 有问题,在aix 上用什么命令?
用 fget_config –Av 看不出来。

论坛徽章:
0
7 [报告]
发表于 2008-10-10 11:26 |只看该作者
原帖由 unixware 于 2008-10-9 14:29 发表

Description
CONTROLLER HEALTH CHECK FAILURE

Probable Causes
ARRAY CONTROLLER
CABLES AND CONNECTIONS
ARRAY DASD MEDIA

#errpt -aj BC66 ...



用SM登陆上去,看看电池的可用时间!!!!!!!

两个电池的可用时间(day),是否相同,剩余多少day!!!

论坛徽章:
0
8 [报告]
发表于 2008-10-10 11:38 |只看该作者
原帖由 dfxsoft 于 2008-10-10 11:26 发表



用SM登陆上去,看看电池的可用时间!!!!!!!

两个电池的可用时间(day),是否相同,剩余多少day!!!


电池life是ok的。如果电池不行会亮黄灯的。现在显示的灯是正常。sm里面也没有报错,这个非常邪门。

论坛徽章:
0
9 [报告]
发表于 2008-10-14 14:13 |只看该作者
问题解决了,把所有设备重启一遍就没有这个错误了。
估计是上次换了电池没有重启盘柜的原因。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP