免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 10815 | 回复: 6
打印 上一主题 下一主题

[已解决]关于组装服务器出的问题. [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-01-16 20:21 |只看该作者 |倒序浏览
本帖最后由 hxi28 于 2015-01-27 03:01 编辑

上一任的技术部老大走了。给我们小辈留了一堆难题。
其中包括一个:有一台超微的X8系列的组装服务器,双路的,然后CPU1对应的内存虽然系统能检测出来全部容量,但是还是有那么1条的容量总是随机的丢失。通常只要关机,再启动就好用了,而这次,就不好用了,问了官方客服,只要我去更新IPMI和BIOS,照做。但没几天,毛病依旧。所以想请问,这种情况,通常是哪里出了问题,该怎么弄才会不再旧病复发?
另外这机器是按照台式机改造的,安装了个PCIE接口的显卡,BIOS日志中总显示PCI-E设备有错误。

更奇怪了。昨天就一直报 Correctable ECC 错误,今天不报了,结果不报下面大篇幅的警告,丢失的内存又自己回来了。

[问题已解决],毛病还是出在电源上,温度过高导致不能稳定工作,竟然是风扇坏掉了。其实主要是公司老板不想多花钱,问题必须排查清楚。

同时IPMI报
  1. 79        01/17/2015 23:43:34        OEM        Memory        Correctable ECC @ DIMM2A(CPU1) - Asserted
复制代码
可能是什么原因?内存坏了?还是插槽侦测有问题?
找来了IPMI的日志
  1. 01/01/2015 22:19:05        Fan5        Fan        Lower Non-Critical - Going Low - Deasserted
  2. 01/01/2015 22:19:05        Fan5        Fan        Lower Critical - Going Low - Deasserted
  3. 01/01/2015 22:19:05        Fan5        Fan        Lower Non-Recoverable - Going Low - Deasserted
  4. 01/01/2015 22:19:04        Fan1        Fan        Lower Non-Critical - Going Low - Deasserted
  5. 01/01/2015 22:19:04        Fan1        Fan        Lower Critical - Going Low - Deasserted
  6. 01/01/2015 22:19:04        Fan1        Fan        Lower Non-Recoverable - Going Low - Deasserted
  7. 01/01/2015 22:19:03        VBAT        Voltage        Upper Non-Critical - Going High - Deasserted
  8. 01/01/2015 22:19:03        VBAT        Voltage        Upper Critical - Going High - Deasserted
  9. 01/01/2015 22:19:03        VBAT        Voltage        Upper Non-Recoverable - Going High - Deasserted
  10. 01/01/2015 22:19:02        +3.3VSB        Voltage        Upper Non-Critical - Going High - Deasserted
  11. 01/01/2015 22:19:02        +3.3VSB        Voltage        Upper Critical - Going High - Deasserted
  12. 01/01/2015 22:19:02        +3.3VSB        Voltage        Upper Non-Recoverable - Going High - Deasserted
  13. 01/01/2015 22:19:01        +3.3V        Voltage        Upper Non-Critical - Going High - Deasserted
  14. 01/01/2015 22:19:01        +3.3V        Voltage        Upper Critical - Going High - Deasserted
  15. 01/01/2015 22:19:01        +3.3V        Voltage        Upper Non-Recoverable - Going High - Deasserted
  16. 01/01/2015 22:19:01        +1.1V        Voltage        Upper Non-Critical - Going High - Deasserted
  17. 01/01/2015 22:19:00        +1.1V        Voltage        Upper Critical - Going High - Deasserted
  18. 01/01/2015 22:19:00        +1.1V        Voltage        Upper Non-Recoverable - Going High - Deasserted
  19. 01/01/2015 22:19:00        +12V        Voltage        Upper Non-Critical - Going High - Deasserted
  20. 01/01/2015 22:18:59        +12V        Voltage        Upper Critical - Going High - Deasserted
  21. 01/01/2015 22:18:59        +12V        Voltage        Upper Non-Recoverable - Going High - Deasserted
  22. 01/01/2015 22:18:59        +5V        Voltage        Upper Non-Critical - Going High - Deasserted
  23. 01/01/2015 22:18:58        +5V        Voltage        Upper Critical - Going High - Deasserted
  24. 01/01/2015 22:18:58        +5V        Voltage        Upper Non-Recoverable - Going High - Deasserted
  25. 01/01/2015 22:18:58        +1.8V        Voltage        Upper Non-Critical - Going High - Deasserted
  26. 01/01/2015 22:18:57        +1.8V        Voltage        Upper Critical - Going High - Deasserted
  27. 01/01/2015 22:18:57        +1.8V        Voltage        Upper Non-Recoverable - Going High - Deasserted
  28. 01/01/2015 22:18:57        +1.5V        Voltage        Upper Non-Critical - Going High - Deasserted
  29. 01/01/2015 22:18:56        +1.5V        Voltage        Upper Critical - Going High - Deasserted
  30. 01/01/2015 22:18:56        +1.5V        Voltage        Upper Non-Recoverable - Going High - Deasserted
  31. 01/01/2015 22:18:56        CPU2 DIMM        Voltage        Upper Non-Critical - Going High - Deasserted
  32. 01/01/2015 22:18:56        CPU2 DIMM        Voltage        Upper Critical - Going High - Deasserted
  33. 01/01/2015 22:18:55        CPU2 DIMM        Voltage        Upper Non-Recoverable - Going High - Deasserted
  34. 01/01/2015 22:18:55        CPU1 DIMM        Voltage        Upper Non-Critical - Going High - Deasserted
  35. 01/01/2015 22:18:55        CPU1 DIMM        Voltage        Upper Critical - Going High - Deasserted
  36. 01/01/2015 22:18:54        CPU1 DIMM        Voltage        Upper Non-Recoverable - Going High - Deasserted
  37. 01/01/2015 22:18:54        CPU2 VTT        Voltage        Upper Non-Critical - Going High - Deasserted
  38. 01/01/2015 22:18:54        CPU2 VTT        Voltage        Upper Critical - Going High - Deasserted
  39. 01/01/2015 22:18:53        CPU2 VTT        Voltage        Upper Non-Recoverable - Going High - Deasserted
  40. 01/01/2015 22:18:53        CPU1 VTT        Voltage        Upper Non-Critical - Going High - Deasserted
  41. 01/01/2015 22:18:53        CPU1 VTT        Voltage        Upper Critical - Going High - Deasserted
  42. 01/01/2015 22:18:52        CPU1 VTT        Voltage        Upper Non-Recoverable - Going High - Deasserted
  43. 01/01/2015 22:18:52        CPU2 Vcore        Voltage        Upper Non-Critical - Going High - Deasserted
  44. 01/01/2015 22:18:52        CPU2 Vcore        Voltage        Upper Critical - Going High - Deasserted
  45. 01/01/2015 22:18:52        CPU2 Vcore        Voltage        Upper Non-Recoverable - Going High - Deasserted
  46. 01/01/2015 22:18:51        CPU1 Vcore        Voltage        Upper Non-Critical - Going High - Deasserted
  47. 01/01/2015 22:18:51        CPU1 Vcore        Voltage        Upper Critical - Going High - Deasserted
  48. 01/01/2015 22:18:50        CPU1 Vcore        Voltage        Upper Non-Recoverable - Going High - Deasserted
复制代码

论坛徽章:
0
2 [报告]
发表于 2015-01-16 22:03 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
3 [报告]
发表于 2015-01-16 22:47 |只看该作者
回复 2# 苏州微信


非要说的话:
1、是否可能是主板接触不良?     根据实际维护情况,感觉也就是内存条插槽金手指有问题。
2、是否可能硬件时间过长老化?     这个机器不是24小时运转的。
3、是不是很长时间没开机了?    也不是,是按照台式机改造的,前任老大们拿这个当游戏机用。

论坛徽章:
13
技术图书徽章
日期:2014-04-29 14:15:42IT运维版块每日发帖之星
日期:2015-12-12 06:20:00IT运维版块每日发帖之星
日期:2015-08-30 06:20:00IT运维版块每日发帖之星
日期:2015-08-24 06:20:00IT运维版块每日发帖之星
日期:2015-08-02 06:20:002015年亚洲杯之澳大利亚
日期:2015-04-03 15:03:12申猴
日期:2015-03-20 09:00:292015年迎新春徽章
日期:2015-03-04 09:54:452015年辞旧岁徽章
日期:2015-03-03 16:54:15季节之章:冬
日期:2015-01-20 17:08:47双子座
日期:2014-11-21 16:30:31技术图书徽章
日期:2014-07-11 16:29:08
4 [报告]
发表于 2015-01-17 10:28 |只看该作者
服务器用什么电源?

论坛徽章:
0
5 [报告]
发表于 2015-01-17 17:36 |只看该作者
回复 4# dengbao2001


    FSP500-702UC

论坛徽章:
13
技术图书徽章
日期:2014-04-29 14:15:42IT运维版块每日发帖之星
日期:2015-12-12 06:20:00IT运维版块每日发帖之星
日期:2015-08-30 06:20:00IT运维版块每日发帖之星
日期:2015-08-24 06:20:00IT运维版块每日发帖之星
日期:2015-08-02 06:20:002015年亚洲杯之澳大利亚
日期:2015-04-03 15:03:12申猴
日期:2015-03-20 09:00:292015年迎新春徽章
日期:2015-03-04 09:54:452015年辞旧岁徽章
日期:2015-03-03 16:54:15季节之章:冬
日期:2015-01-20 17:08:47双子座
日期:2014-11-21 16:30:31技术图书徽章
日期:2014-07-11 16:29:08
6 [报告]
发表于 2015-01-18 20:34 |只看该作者
hxi28 发表于 2015-01-17 17:36
回复 4# dengbao2001


尝试更换过电源吗?

论坛徽章:
0
7 [报告]
发表于 2015-01-19 20:43 |只看该作者
本帖最后由 hxi28 于 2015-01-19 20:44 编辑

回复 6# dengbao2001


    从前任老大那得知,他曾经借用朋友(做系统集成)公司的多款电源,期间也不定时随机出现问题。并且从任何时候,都是接在UPS上用的。没有单独接市电,毕竟市电波动的影响是无法预测的。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP