免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2296 | 回复: 3

[硬件问题] 求助/var/log/mcelog文件达到40G的原因 [复制链接]

论坛徽章:
8
双鱼座
日期:2014-07-30 09:28:14辰龙
日期:2014-08-22 14:14:43水瓶座
日期:2014-12-02 15:36:392015年亚洲杯之朝鲜
日期:2015-02-06 09:28:592015亚冠之全北现代
日期:2015-09-10 14:40:18青铜圣斗士
日期:2015-11-18 09:22:56黄金圣斗士
日期:2015-11-26 09:17:2615-16赛季CBA联赛之新疆
日期:2016-08-15 17:00:22
发表于 2017-11-20 10:40 |显示全部楼层
dell7910工作站,redhat 6.5操作系统,

[root@jj log]# df
Filesystem                   1K-blocks      Used Available Use% Mounted on
/dev/mapper/vg_jj-lv_root   51606140  51589756         0 100% /
tmpfs                         16499048        72  16498976   1% /dev/shm
/dev/sda1                       495844     41321    428923   9% /boot
/dev/mapper/vg_jj-lv_home 1854530800 777109956 983216124  45% /home

仔细检查后发现/var/log下的有个mcelog文件,大小达到39.8G,用cat /dev/null > /var/log/mcelog
后,能恢复正常,但是开机几天后,这个文件有变成了39.8G,导致上面的应用总是报错

切换到root用户下,mcelog显示:

Hardware event. This is not a software error.
MCE 29
CPU 8 BANK 7
MISC 42184000 ADDR 49493c540
TIME 1511174096 Mon Nov 20 18:34:56 2017
MCG status:
MCi status:
Error overflow
Corrected error
MCi_MISC register valid
MCi_ADDR register valid
MCA: MEMORY CONTROLLER RD_CHANNEL0_ERR
Transaction: Memory read error
STATUS cc00008000010090 MCGSTATUS 0
MCGCAP 7000c16 APICID 10 SOCKETID 1
CPUID Vendor Intel Family 6 Model 63
Hardware event. This is not a software error.
MCE 30
CPU 8 BANK 7
MISC 526a2a00 ADDR 49493c800
TIME 1511174096 Mon Nov 20 18:34:56 2017
MCG status:
MCi status:
Error overflow
Corrected error
MCi_MISC register valid
MCi_ADDR register valid
MCA: MEMORY CONTROLLER RD_CHANNEL0_ERR
Transaction: Memory read error
STATUS cc00008000010090 MCGSTATUS 0
MCGCAP 7000c16 APICID 10 SOCKETID 1
CPUID Vendor Intel Family 6 Model 63
Hardware event. This is not a software error.
MCE 31
CPU 8 BANK 7
MISC 4238a200 ADDR 46e5dda80
TIME 1511174096 Mon Nov 20 18:34:56 2017
MCG status:
MCi status:
Corrected error
MCi_MISC register valid
MCi_ADDR register valid
MCA: MEMORY CONTROLLER RD_CHANNEL0_ERR
Transaction: Memory read error
STATUS 8c00004000010090 MCGSTATUS 0
MCGCAP 7000c16 APICID 10 SOCKETID 1
CPUID Vendor Intel Family 6 Model 63


求教这是什么问题,如何解决,感谢各位专家指点。。。

论坛徽章:
8
双鱼座
日期:2014-07-30 09:28:14辰龙
日期:2014-08-22 14:14:43水瓶座
日期:2014-12-02 15:36:392015年亚洲杯之朝鲜
日期:2015-02-06 09:28:592015亚冠之全北现代
日期:2015-09-10 14:40:18青铜圣斗士
日期:2015-11-18 09:22:56黄金圣斗士
日期:2015-11-26 09:17:2615-16赛季CBA联赛之新疆
日期:2016-08-15 17:00:22
发表于 2017-11-20 15:00 |显示全部楼层
基本判断为内存问题,待解决中。。。。。。。。。

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
发表于 2017-11-20 19:23 |显示全部楼层
回复 1# 20032007

有一条内存坏了。ECC纠错成功。
建议更换内存。或者可以暂关掉mcelog。

评分

参与人数 1信誉积分 +10 收起 理由
20032007 + 10 很给力!

查看全部评分

论坛徽章:
29
技术图书徽章
日期:2013-09-02 19:59:502015元宵节徽章
日期:2015-03-06 15:51:332015小元宵徽章
日期:2015-03-06 15:57:20操作系统版块每日发帖之星
日期:2015-08-16 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17操作系统版块每日发帖之星
日期:2015-09-21 06:20:002015亚冠之水原三星
日期:2015-10-30 00:06:07数据库技术版块每日发帖之星
日期:2015-12-24 06:20:0015-16赛季CBA联赛之上海
日期:2016-01-07 10:32:07操作系统版块每日发帖之星
日期:2016-01-08 06:20:00操作系统版块每日发帖之星
日期:2016-05-18 06:20:00IT运维版块每日发帖之星
日期:2016-07-23 06:20:00
发表于 2017-11-21 14:03 |显示全部楼层
硬件坏了,还不赶快去修啊
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

SACC2019中国系统架构师大会

【数字转型 架构演进】SACC2019中国系统架构师大会,8.5折限时优惠重磅来袭!
2019年10月31日~11月2日第11届中国系统架构师大会(SACC2019)将在北京隆重召开。四大主线并行的演讲模式,1个主会场、20个技术专场、超千人参与的会议规模,100+来自互联网、金融、制造业、电商等领域的嘉宾阵容,将为广大参会者提供一场最具价值的技术交流盛会。

限时8.5折扣期:2019年9月30日前


----------------------------------------

大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP