免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1874 | 回复: 8
打印 上一主题 下一主题

我的机器常报这个错(每天), 大家看看 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-07-20 18:38 |只看该作者 |倒序浏览
Jul 20 00:45:23 suzhou01 SUNW,UltraSPARC-II: [ID 965232 kern.info] [AFT0] Corrected Memory Error detected by CPU8, errID 0x0001a3cd.
5f99e234
Jul 20 00:45:23 suzhou01     AFSR 0x00000000.00100000<CE> AFAR 0x00000001.5999cc60
Jul 20 00:45:23 suzhou01     AFSR.PSYND 0x0000(Score 05) AFSR.ETS 0x00 Fault_PC 0x10026048
Jul 20 00:45:23 suzhou01     UDBH Syndrome 0x13 Memory Module Board 2 J3700
Jul 20 00:45:23 suzhou01 SUNW,UltraSPARC-II: [ID 177866 kern.info] [AFT0] errID 0x0001a3cd.5f99e234 Corrected Memory Error on Board
2 J3700 is Persistent
Jul 20 00:45:23 suzhou01 SUNW,UltraSPARC-II: [ID 287923 kern.info] [AFT0] errID 0x0001a3cd.5f99e234 ECC Data Bit 32 was in error and
corrected
以上的今天才有的错

以下的每天同一时间发生
Jul 20 03:33:00 suzhou01 root: [ID 702911 daemon.notice] Legato Single Server Version Savegroup: (info) starting Default (with 1 cli
ent(s))
Jul 20 03:33:04 suzhou01 root: [ID 702911 daemon.notice] Legato Single Server Version Savegroup: (info) suzhou01:/nsr/res/nsrdb: No
full backups of this save set were found in the media database; performing a full backup
Jul 20 03:33:04 suzhou01 root: [ID 702911 daemon.notice] Legato Single Server Version media: (notice) no matching devices; check sto
rage nodes, devices or pools for save of client `suzhou01'
Jul 20 03:33:04 suzhou01 last message repeated 1 time
Jul 20 03:33:04 suzhou01 root: [ID 702911 daemon.notice] Legato Single Server Version Savegroup: (info) suzhou01:index:suzhou01: No
full backups of this save set were found in the media database; performing a full backup
Jul 20 03:33:05 suzhou01 root: [ID 702911 daemon.notice] Legato Single Server Version media: (notice) no matching devices; check sto
rage nodes, devices or pools for save of client `suzhou01'
Jul 20 03:33:05 suzhou01 last message repeated 3 times
Jul 20 03:33:05 suzhou01 root: [ID 702911 daemon.notice] Legato Single Server Version Savegroup: (alert) Default completed, 1 client
(s) (suzhou01 Failed)
Jul 20 03:33:05 suzhou01 root: [ID 702911 daemon.notice] Start time:   Thu Jul 20 03:33:00 2006
Jul 20 03:33:05 suzhou01 root: [ID 702911 daemon.notice] End time:     Thu Jul 20 03:33:05 2006
Jul 20 03:33:05 suzhou01 root: [ID 702911 daemon.notice]
Jul 20 03:33:05 suzhou01 root: [ID 702911 daemon.notice] --- Unsuccessful Save Sets ---
Jul 20 03:33:05 suzhou01 root: [ID 702911 daemon.notice]
Jul 20 03:33:05 suzhou01 root: [ID 702911 daemon.notice]   suzhou01:/nsr/res/nsrdb: No full backups of this save set were found in t
he media database; performing a full backup
Jul 20 03:33:05 suzhou01 root: [ID 702911 daemon.notice] * suzhou01:/nsr/res/nsrdb save: RAP error: system error
Jul 20 03:33:05 suzhou01 root: [ID 702911 daemon.notice] * suzhou01:/nsr/res/nsrdb save: Cannot open save session with suzhou01
Jul 20 03:33:05 suzhou01 root: [ID 702911 daemon.notice]   suzhou01:index:suzhou01: No full backups of this save set were found in t
he media database; performing a full backup
Jul 20 03:33:05 suzhou01 root: [ID 702911 daemon.notice] * suzhou01:index save: RAP error: system error
Jul 20 03:33:05 suzhou01 root: [ID 702911 daemon.notice] * suzhou01:index save: Cannot open save session with suzhou01
Jul 20 03:33:05 suzhou01 root: [ID 702911 daemon.notice] * suzhou01:bootstrap save: RAP error: system error
Jul 20 03:33:05 suzhou01 root: [ID 702911 daemon.notice] * suzhou01:bootstrap save: Cannot open save session with suzhou01
Jul 20 03:33:05 suzhou01 root: [ID 702911 daemon.notice]
Jul 20 03:33:06 suzhou01 root: [ID 702911 daemon.notice] Legato Single Server Version index: (notice) nsrim has finished cross check
ing the media db

论坛徽章:
0
2 [报告]
发表于 2006-07-20 21:03 |只看该作者
认为两种可能,一是内存板有硬件问题,二是高层应用对内存管理调度存在部分问题导致,建议打下最新补丁!

论坛徽章:
0
3 [报告]
发表于 2006-07-21 08:36 |只看该作者
后面那个产生的日志是你备份软件产生的把。下面的不用管的。你用的备份软件是 Legato的neworker吧。你去networker下面的logs目录下,可以找到更详细的信息。感觉跟你的OS没有啥关系。

论坛徽章:
0
4 [报告]
发表于 2006-07-21 09:56 |只看该作者
Jul 20 00:45:23 suzhou01 SUNW,UltraSPARC-II: [ID 177866 kern.info] [AFT0] errID 0x0001a3cd.5f99e234 Corrected Memory Error on Board
2 J3700 is Persistent

根据这句话,我建议你换内存吧,如果方便的话把prtdiag -v的信息贴出来看看!

论坛徽章:
0
5 [报告]
发表于 2006-07-21 20:38 |只看该作者
原帖由 maike_xiao 于 2006-7-21 09:56 发表
Jul 20 00:45:23 suzhou01 SUNW,UltraSPARC-II: [ID 177866 kern.info] [AFT0] errID 0x0001a3cd.5f99e234 Corrected Memory Error on Board
2 J3700 is Persistent

根据这句话,我建议你换内存吧,如果方便 ...

root@suzhou01 # prtdiag -v
System Configuration:  Sun Microsystems  sun4u 8-slot Sun Enterprise E4500/E5500
System clock frequency: 84 MHz
Memory size: 8192Mb

========================= CPUs =========================

                    Run   Ecache   CPU    CPU
Brd  CPU   Module   MHz     MB    Impl.   Mask
---  ---  -------  -----  ------  ------  ----
0     0     0      336     4.0   US-II    2.0
0     1     1      336     4.0   US-II    2.0
2     4     0      336     4.0   US-II    2.0
2     5     1      336     4.0   US-II    2.0
4     8     0      336     4.0   US-II    2.0
4     9     1      336     4.0   US-II    2.0
6    12     0      336     4.0   US-II    2.0
6    13     1      336     4.0   US-II    2.0


========================= Memory =========================

                                              Intrlv.  Intrlv.
Brd   Bank   MB    Status   Condition  Speed   Factor   With
---  -----  ----  -------  ----------  -----  -------  -------
0     0    1024   Active      OK       60ns    8-way     A
0     1    1024   Active      OK       60ns    8-way     A
2     0    1024   Active      OK       60ns    8-way     A
2     1    1024   Active      OK       60ns    8-way     A
4     0    1024   Active      OK       60ns    8-way     A
4     1    1024   Active      OK       60ns    8-way     A
6     0    1024   Active      OK       60ns    8-way     A
6     1    1024   Active      OK       60ns    8-way     A

========================= IO Cards =========================

     Bus   Freq
Brd  Type  MHz   Slot        Name                          Model
---  ----  ----  ----------  ----------------------------  --------------------
1   SBus   25            0  QLGC,isp/sd (block)           QLGC,ISP1000      
1   SBus   25            1  QLGC,isp/sd (block)           QLGC,ISP1000      
1   SBus   25            2  cgsix                         SUNW,501-2325      
1   SBus   25            3  SUNW,hme                                         
1   SBus   25            3  SUNW,fas/sd (block)                              
1   SBus   25           13  SUNW,socal/sf (scsi-3)        501-3060           
7   SBus   25            0  QLGC,isp/sd (block)           QLGC,ISP1000U      
7   SBus   25            3  SUNW,hme                                         
7   SBus   25            3  SUNW,fas/sd (block)                              
7   SBus   25           13  SUNW,socal/sf (scsi-3)        501-3060           

Detached Boards
===============
  Slot  State       Type           Info
  ----  ---------   ------         -----------------------------------------
    3    disabled   disk           Disk 0: Target: 10   Disk 1: Target: 11   

No failures found in System
===========================

No System Faults found
======================

Most recent AC Power Failure:
=============================
Tue Jul  4 16:25:51 2006


========================= Environmental Status =========================
Keyswitch position is in Normal Mode
System Power Status: Redundant
System LED Status:    GREEN     YELLOW     GREEN
Normal                 ON        OFF       BLINKING


Fans:
-----
Unit   Status
----   ------
Rack    OK
Key     OK
AC      OK

System Temperatures (Celsius):
------------------------------
Brd   State   Current  Min  Max  Trend
---  -------  -------  ---  ---  -----
0      OK       56     51   58  stable
1      OK       41     35   44  stable
2      OK       53     47   56  stable
4      OK       45     39   49  stable
6      OK       53     46   56  stable
7      OK       47     43   51  stable
CLK     OK       33     29   37  stable


Power Supplies:
---------------
Supply                        Status
---------                     ------
0                                OK
1                                OK
2                                OK
3                                OK
PPS                              OK
    System 3.3v                  OK
    System 5.0v                  OK
    Peripheral 5.0v              OK
    Peripheral 12v               OK
    Auxilary 5.0v                OK
    Peripheral 5.0v precharge    OK
    Peripheral 12v precharge     OK
    System 3.3v precharge        OK
    System 5.0v precharge        OK
AC Power                         OK


========================= HW Revisions =========================

ASIC Revisions:
---------------
Brd  FHC  AC  SBus0  SBus1  PCI0  PCI1  FEPS  Board Type      Attributes
---  ---  --  -----  -----  ----  ----  ----  ----------      ----------
0    1    5                                  CPU             100MHz Capable
1    1    5    1      1                 22   Dual-SBus-SOC+  100MHz Capable
2    1    5                                  CPU             100MHz Capable
3                                            Unknown         100MHz Capable
4    1    5                                  CPU             100MHz Capable
6    1    5                                  CPU             100MHz Capable
7    1    5    1      1                 22   Dual-SBus-SOC+  100MHz Capable

System Board PROM revisions:
----------------------------
Board  0:   OBP   3.2.30 2002/10/25 14:03   POST  3.9.30 2002/10/25 14:04
Board  1:   FCODE 1.8.30 2002/10/25 14:02   iPOST 3.4.30 2002/10/25 14:03
Board  2:   OBP   3.2.30 2002/10/25 14:03   POST  3.9.30 2002/10/25 14:04
Board  4:   OBP   3.2.30 2002/10/25 14:03   POST  3.9.30 2002/10/25 14:04
Board  6:   OBP   3.2.30 2002/10/25 14:03   POST  3.9.30 2002/10/25 14:04
Board  7:   FCODE 1.8.30 2002/10/25 14:02   iPOST 3.4.30 2002/10/25 14:03

论坛徽章:
0
6 [报告]
发表于 2006-07-21 22:49 |只看该作者
好像是I/O方面的问题,你看看你的I/O板的状态,以及你的系统盘的状态.(个人看法)

论坛徽章:
0
7 [报告]
发表于 2006-07-22 14:00 |只看该作者
Corrected Memory Error "CE" 如果只是出现一次,没有任何关系。

论坛徽章:
0
8 [报告]
发表于 2006-07-22 14:05 |只看该作者
不一定是内存问题!

论坛徽章:
0
9 [报告]
发表于 2006-07-22 16:26 |只看该作者
原帖由 solarislog 于 2006-7-22 14:00 发表
Corrected Memory Error "CE" 如果只是出现一次,没有任何关系。



只有一次
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP