免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 16257 | 回复: 23
打印 上一主题 下一主题

Solaris fmd下面的errlog不停的增长 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-04-28 02:04 |只看该作者 |倒序浏览
今天检查机器发现根目录已经100%了,检查后发现/var/fm/fmd/目录下的errlog文件已经40个G了。

先把errlog删除,然后把fmd重启,空间释放了,但是errlog文件一直在涨,请各位大拿帮忙分析是什么原因导致的,如何解决。

root@test240-b # svcs -d svc:/system/fmd:default
STATE          STIME    FMRI
disabled        7月_22  svc:/platform/sun4u/dscp:default
online          7月_22  svc:/system/filesystem/minimal:default
online          7月_22  svc:/system/sysevent:default
online          7月_22  svc:/network/rpc/bind:default
online          7月_22  svc:/system/dumpadm:default


root@test240-b # svcprop  svc:/system/fmd:default
dscp_fmd/entities fmri svc:/platform/sun4u/dscp
dscp_fmd/external boolean true
dscp_fmd/grouping astring optional_all
dscp_fmd/restart_on astring none
dscp_fmd/type astring service
general/enabled boolean true
general/entity_stability astring Evolving
general/single_instance boolean true
SUNWfmd/entities fmri file://localhost/usr/lib/fm/fmd/fmd
SUNWfmd/grouping astring require_all
SUNWfmd/restart_on astring none
SUNWfmd/type astring path
startup_req/entities fmri svc:/system/sysevent svc:/system/filesystem/minimal svc:/system/dumpadm
startup_req/grouping astring require_all
startup_req/restart_on astring none
startup_req/type astring service
startup_opt/entities fmri svc:/network/rpc/bind
startup_opt/grouping astring optional_all
startup_opt/restart_on astring none
startup_opt/type astring service
start/exec astring /usr/lib/fm/fmd/fmd
start/timeout_seconds count 0
start/type astring method
stop/exec astring :kill
stop/timeout_seconds count 60
stop/type astring method
tm_common_name/C ustring Solaris\ Fault\ Manager
tm_man_fmd/manpath astring /usr/share/man
tm_man_fmd/section astring 1M
tm_man_fmd/title astring fmd
restarter/logfile astring /var/svc/log/system-fmd:default.log
restarter/contract count 40282
restarter/start_pid count 11410
restarter/start_method_timestamp time 1272348217.487233000
restarter/start_method_waitstatus integer 0
restarter/auxiliary_state astring none
restarter/next_state astring none
restarter/state astring online
restarter/state_timestamp time 1272348217.529152000
restarter_actions/restart integer

root@test240-b # fmadm faulty
--------------- ------------------------------------  -------------- ---------
TIME            EVENT-ID                              MSG-ID         SEVERITY
--------------- ------------------------------------  -------------- ---------
Apr 27 15:13:59 ff2121d7-703c-4d1a-8502-b7eac3eece4e  SUN4U-8000-2S  Major   

Fault class : fault.memory.dimm 95%
Affects     : mem:///unum=MB/P0/B0/D0:B0/D0
                  degraded but still in service
FRU         : mem:///unum=MB/P0/B0/D0:B0/D0 95%
                  faulty
Serial ID.  :

Description : The number of errors associated with this memory module has
              exceeded acceptable levels.  Refer to
              http://sun.com/msg/SUN4U-8000-2S for more information.

Response    : Pages of memory associated with this memory module are being
              removed from service as errors are reported.

Impact      : Total system memory capacity will be reduced as pages are
              retired.

Action      : Schedule a repair procedure to replace the affected memory
              module. Use fmdump -v -u <EVENT_ID> to identify the module.


root@test240-b # ls -lrth  /var/fm/fmd/
总数 1157252
drwx------   2 root     sys          512 2009   7月22 xprt
drwx------   3 root     sys          512 11月 11日17:57 ckpt
drwx------   2 root     sys         593K  4月 28日 01:56 rsrc
-rw-r--r--   1 root     root        4.6M  4月28日 01:56 fltlog
-rw-r--r--   1 root     root        560M  4月 28日 01:57 errlog

论坛徽章:
0
2 [报告]
发表于 2010-04-28 02:41 |只看该作者
请给出fmdump以及fmdump -e的输出,看看头尾的错误信息。

论坛徽章:
0
3 [报告]
发表于 2010-04-28 03:16 |只看该作者
多谢楼上!!!

看规律,是每6秒刷一次。

root@test240-b # fmdump
TIME                 UUID                                 SUNW-MSG-ID
Apr 27 15:13:59.1845 ff2121d7-703c-4d1a-8502-b7eac3eece4e SUN4U-8000-2S


root@test240-b # fmdump -e |more
TIME                 CLASS
Apr 27 14:03:25.6303 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:25.6303 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:25.6303 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:25.6303 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:25.6303 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:25.6303 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:25.6303 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:25.6304 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:25.6304 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:25.6305 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:25.6401 ereport.io.tom.ecc.s-drce      
Apr 27 14:03:25.6401 ereport.io.tom.ecc.drce         
Apr 27 14:03:25.7001 ereport.io.tom.ecc.s-drce      
Apr 27 14:03:25.7001 ereport.io.tom.ecc.drce         
Apr 27 14:03:31.6301 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:31.6301 ereport.cpu.ultraSPARC-IIIi.frc
Apr 27 14:03:31.6301 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:31.6301 ereport.cpu.ultraSPARC-IIIi.frc
Apr 27 14:03:31.6303 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:31.6303 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:31.6304 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:31.6304 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:31.6304 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:31.6304 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:31.6304 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:31.6304 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:31.6304 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:31.6305 ereport.cpu.ultraSPARC-IIIi.ce  
Apr 27 14:03:31.6401 ereport.io.tom.ecc.s-drce      
Apr 27 14:03:31.6401 ereport.io.tom.ecc.drce         
Apr 27 14:03:31.7000 ereport.io.tom.ecc.s-drce      
Apr 27 14:03:31.7000 ereport.io.tom.ecc.drce

论坛徽章:
0
4 [报告]
发表于 2010-04-28 04:10 |只看该作者
原来是这样喔

论坛徽章:
0
5 [报告]
发表于 2010-04-28 09:50 |只看该作者
最近两天fm的问题不少啊

论坛徽章:
0
6 [报告]
发表于 2010-04-28 09:56 |只看该作者
换内存

论坛徽章:
0
7 [报告]
发表于 2010-04-28 10:14 |只看该作者
先把硬件问题解决啊,要不一直报下去

论坛徽章:
0
8 [报告]
发表于 2010-04-28 11:36 |只看该作者
:wink:
帮忙确认下,是否是硬件问题。

一台老设备已经过报了。

论坛徽章:
0
9 [报告]
发表于 2010-04-28 20:06 |只看该作者
我晕,这么多内存的ce你还不换内存,还确认什么?
fmdump -eV自己看看

论坛徽章:
0
10 [报告]
发表于 2010-04-28 20:50 |只看该作者


OK,明白了,联系维修~~
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP