免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: jlttt
打印 上一主题 下一主题

[故障求助] errpt报错(困惑中) [复制链接]

论坛徽章:
0
31 [报告]
发表于 2008-02-26 16:11 |只看该作者
谢谢yanbing了,太感谢了,眼泪哗哗滴~~

经检查,发现
1。/etc/hosts
#127.0.0.1              net0sample      # loopback (lo0) name/address
2。etc/netsvc.conf
里面全是空的
3。# lssrc -g nfs
Subsystem         Group            PID          Status
biod             nfs              622698          active
rpc.lockd        nfs              446574       active
nfsd             nfs                                 inoperative
rpc.mountd       nfs                           inoperative
nfsrgyd          nfs                              inoperative
gssd             nfs                               inoperative
rpc.statd        nfs                              inoperative

再次附上errpt
# errpt
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
F89FB899   0225150008 P O dumpcheck      The copy directory is too small.
2F3E09A4   0225111908 I H sysplanar0     REPAIR ACTION
8B88700A   0223164208 T H hdisk2         CACHE BATTERY CHARGE BELOW 87.5%
A6DF45AA   0223162808 I O RMCdaemon      The daemon is started.
1BA7DF4E   0223162808 P S SRC            SOFTWARE PROGRAM ERROR
BA431EB7   0223162808 P S SRC            SOFTWARE PROGRAM ERROR
BA431EB7   0223162808 P S SRC            SOFTWARE PROGRAM ERROR
EC0BCCD4   0223162708 T H ent1           ETHERNET DOWN
2BFA76F6   0222192008 T S SYSPROC        SYSTEM SHUTDOWN BY USER
9DBCFDEE   0223162708 T O errdemon       ERROR LOGGING TURNED ON
192AC071   0222191808 T O errdemon       ERROR LOGGING TURNED OFF
8B88700A   0128212708 T H hdisk2         CACHE BATTERY CHARGE BELOW 87.5%
A6DF45AA   0128211408 I O RMCdaemon      The daemon is started.
1BA7DF4E   0128211408 P S SRC            SOFTWARE PROGRAM ERROR
BA431EB7   0128211408 P S SRC            SOFTWARE PROGRAM ERROR
BA431EB7   0128211408 P S SRC            SOFTWARE PROGRAM ERROR
EC0BCCD4   0128211308 T H ent1           ETHERNET DOWN
9DBCFDEE   0128211308 T O errdemon       ERROR LOGGING TURNED ON
8B88700A   1129145107 T H hdisk3         CACHE BATTERY CHARGE BELOW 87.5%
8B88700A   1129145007 T H hdisk2         CACHE BATTERY CHARGE BELOW 87.5%

可以看到最早的一次报错信息是在2007年11月29日
我还有几个问题困惑不解:
1。这次报警灯亮是因为电池充电低于87.5%或SOFTWARE PROGRAM ERROR造成的,通过errpt可以看到2008年1月28日也曾停过电并且也有这2个错误,为什么1月28日系统启动正常后报警灯没有亮?补充:发生The copy directory is too small时,报警灯已经亮了。
2。上面/etc/hosts和 etc/netsvc.conf里的设置问题,相信在2年前系统上线时就已经是这样了,并且在这2年里也停过很多次电,为什么没有之前的SOFTWARE PROGRAM ERROR相关报错信息?难道errpt被清空过?
上述疑问还请yanbing给予解答,谢谢了,有空一定请你吃饭。

[ 本帖最后由 jlttt 于 2008-2-26 16:54 编辑 ]

论坛徽章:
0
32 [报告]
发表于 2008-02-26 17:40 |只看该作者
df -i
看看是不是inode用完了
或者你直接
touch a
看看能不能新建文件

论坛徽章:
0
33 [报告]
发表于 2008-02-26 18:57 |只看该作者
回答1:LED就是这次dump设备太小引起的黄灯,errpt里面写出来的info是整点写入,而LED是发现问题就会亮。

    2。给你看看下面的数据就知道了:


A。历史开关机时间记录
*********************************************************************
Chronological Summary of Key Errors

666 Sat Feb 23 02:27:54 2008 gdcxdb ERRLOG_ON ERROR LOGGING TURNED ON

665 Fri Feb 22 05:18:01 2008 gdcxdb ERRLOG_OFF ERROR LOGGING TURNED OFF

656 Mon Jan 28 07:13:35 2008 gdcxdb ERRLOG_ON ERROR LOGGING TURNED ON

369 Sun Jan  8 06:30:40 2006 gdcxdb ERRLOG_ON ERROR LOGGING TURNED ON

369 Sun Jan  8 06:30:40 2006 gdcxdb ERRLOG_ON ERROR LOGGING TURNED ON

368 Sun Jan  8 06:25:55 2006 gdcxdb ERRLOG_OFF ERROR LOGGING TURNED OFF

368 Sun Jan  8 06:25:55 2006 gdcxdb ERRLOG_OFF ERROR LOGGING TURNED OFF

361 Sun Jan  8 06:10:51 2006 gdcxdb ERRLOG_ON ERROR LOGGING TURNED ON

360 Sun Jan  8 06:06:05 2006 gdcxdb ERRLOG_OFF ERROR LOGGING TURNED OFF

344 Sat Dec 24 04:41:20 2005 gdcxdb ERRLOG_ON ERROR LOGGING TURNED ON

343 Sat Dec 24 04:28:54 2005 gdcxdb ERRLOG_OFF ERROR LOGGING TURNED OFF

251 Wed Nov  2 14:17:36 2005 localhost ERRLOG_ON ERROR LOGGING TURNED ON
*********************************************************************


2。各种类型的错误按种类计数。
Summary of Entries

Entries on Node gdcxdb
  Errors with no Resource Type
       Error DMPCHK_NOSPACE (F89FB899) on resource dumpcheck appeared 3 times
       The copy directory is too small.
       Error ERRLOG_OFF (192AC071) on resource errdemon appeared 5 times
       ERROR LOGGING TURNED OFF
       Error ERRLOG_ON (9DBCFDEE) on resource errdemon appeared 6 times
       ERROR LOGGING TURNED ON
       Error RMCD_INFO_0_ST (A6DF45AA) on resource RMCdaemon appeared 49 times
       The daemon is started.
       Error JFS_FS_FULL (369D049B) on resource SYSPFS appeared 1 times
       UNABLE TO ALLOCATE SPACE IN FILE SYSTEM
       Error JFS_FS_FRAGMENTED (5DFED6F1) on resource SYSPFS appeared 1 times
       UNABLE TO ALLOCATE SPACE IN FILE SYSTEM
  Errors on Resource Type 030102
       Error USB_DEVICE_ERROR (18087FF0) on resource mouse0 appeared 2 times
       DEVICE ERROR
  Errors on Resource Type 14108902
       Error GOENT_LINK_DOWN (EC0BCCD4) on resource ent1 appeared 2 times
       ETHERNET DOWN
  Errors on Resource Type array
       Error FCP_ARRAY_ERR16 (8B88700A) on resource hdisk2 appeared 3 times
       CACHE BATTERY CHARGE BELOW 87.5%
       Error FCP_ARRAY_ERR16 (8B88700A) on resource hdisk3 appeared 1 times
       CACHE BATTERY CHARGE BELOW 87.5%
  Errors on Resource Type NONE
       Error NONES_FULL (CAC5259E) on resource SYSJ2 appeared 1 times
       Unknown
  Errors on Resource Type sysplanar_rspc
       Error REPLACED_FRU (2F3E09A4) on resource sysplanar0 appeared 1 times
       REPAIR ACTION
Entries on Node localhost
  Errors with no Resource Type
       Error ERRLOG_ON (9DBCFDEE) on resource errdemon appeared 1 times
       ERROR LOGGING TURNED ON
       Error RMCD_INFO_0_ST (A6DF45AA) on resource RMCdaemon appeared 1 times
       The daemon is started.
  Errors on Resource Type df1000fa
       Error FCS_ERR4 (B8113DD1) on resource fcs0 appeared 1 times
       No sync
       Error FCS_ERR2 (825849BF) on resource fcs0 appeared 39 times
       Double speed 2 Gb/s (2.125 Gb/s)
       Error FCS_ERR4 (B8113DD1) on resource fcs1 appeared 1 times
       No sync
       Error FCS_ERR2 (825849BF) on resource fcs1 appeared 30 times
       Double speed 2 Gb/s (2.125 Gb/s)
  Errors on Resource Type efscsi
       Error FSCSI_ERR4 (3074FEB7) on resource fscsi0 appeared 1 times
       A command entry point relogin command has failed.
       Error FSCSI_ERR4 (3074FEB7) on resource fscsi0 appeared 5 times
       Adapter drivers cmd entry point rejected a relogin operation.
       Error FSCSI_ERR4 (3074FEB7) on resource fscsi1 appeared 20 times
       Adapter drivers cmd entry point rejected a relogin operation.
  Errors on Resource Type ibm-dac-V4
       Error FCP_ARRAY_ERR9 (8B79A4BD) on resource dac0 appeared 8 times
       ARRAY CONTROLLER SWITCH FAILURE
       Error FCP_ARRAY_ERR3 (D9770360) on resource dac0 appeared 5 times
       ARRAY OPERATION ERROR
       Error FCP_ARRAY_ERR3 (D9770360) on resource dac1 appeared 4 times
       ARRAY OPERATION ERROR
       Error FCP_ARRAY_ERR9 (8B79A4BD) on resource dac1 appeared 8 times
       ARRAY CONTROLLER SWITCH FAILURE

这些东西在一个简单的errpt里面是看不到的。

心意我领了,饭就不用吃了,谢谢!

论坛徽章:
0
34 [报告]
发表于 2008-02-26 19:09 |只看该作者
补充一句,你现在应该要关心的是早点找人把盘阵的电池换掉,拖得时间久了对你没好处。

这设备的历史情况并不是想你说的或者想得那样没什么问题,而是关于FCP ARRAY问题不断。你还放任的话,可能会碰到麻烦事情。

论坛徽章:
0
35 [报告]
发表于 2008-02-26 19:15 |只看该作者
如果要更换的话,我得出具一个更换报告,阐明原因,在我们这种单位有的时候的按照条文来办事。
我的理由就是CACHE BATTERY CHARGE BELOW 87.5%这么简单么?yanbing还有什么要补充的。

论坛徽章:
0
36 [报告]
发表于 2008-02-26 19:23 |只看该作者
要补充的内容用errpt -a就能看到。

论坛徽章:
0
37 [报告]
发表于 2008-02-26 19:35 |只看该作者
谢谢,我会尽快去做的。
不过,我还想知道,你是如何判断出由于dump设备太小引起的黄灯。

论坛徽章:
0
38 [报告]
发表于 2008-02-26 20:07 |只看该作者
我猜的。

论坛徽章:
0
39 [报告]
发表于 2008-02-26 20:14 |只看该作者
谢谢yanbing,以后多加交流。

论坛徽章:
0
40 [报告]
发表于 2008-02-26 20:15 |只看该作者
一个很简单的问题,大家都花费了很多的精力和时间,但是你并没有关注到涉及系统安全稳定性的核心关键问题,而是在一个很无谓的简单问题上反复琢磨,转来转去。这是琢磨技术的最佳方式吗?

一直在说,这个领域只有知道和不知道的区别,没有高手和新手的划分,同样的信息,你看到的和我看到的感受就是不同的,我们察觉到的重点也是不同的。

我用自己的业余时间帮大家关注到我所认为的重点上,你可以认同,亦可以不认同。我也不可能凡事都正确,没有人可以做到这一点。

所以,也可以换个角度来说,我给你的建议或者意见只是比其他几位满嘴跑飞机的哥们说的认真点。

别在这里瞎琢磨了,看看盘阵是否在保内,赶快打电话报修好了。假设今天是最后一天出保的日子,你就毁在你的琢磨劲上了。

你问我为什么觉得是dump device偏小会亮灯,我告诉你我见过至少50次这种情况,可以说明问题么?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP