- 论坛徽章:
- 0
|
本帖最后由 h710877 于 2017-02-06 11:50 编辑
本人使用的一台服务器,安装的CentOS6.5 64位,运行一段时间后,总是会出现宕机情况,只能按电源键几秒强制关机再启动(按主板上的重启键无效),现象:
1. 主板电源亮,能听到主机运行的声音,应该是风扇转动
2. 打开屏幕,完全是黑的(已经在rc.local中setterm -blank 0关掉了自动黑屏,正常应该是可以看到login的界面的)
3. 开机后,查看/var/log/message等日志,在系统死机前完全没有任何相关信息,直接是到本次开机的信息
4. 用sar查看之前的系统负载,也很正常,CPU空闲比例一般都有90%以上(2分钟记录一次数据)
系统版本:
CentOS release 6.5 (Final)
内核版本:
Linux version 2.6.32-431.el6.x86_64 (mockbuild@c6b8.bsys.dev.centos.org) (gcc version 4.4.7 20120313 (Red Hat 4.4.7-4) (GCC) ) #1 SMP Fri Nov 22 03:15:09 UTC 2013
主要安装软件:
PHP 5.5.11,运行php-fpm
nginx version: nginx/1.6.2
mysql Ver 14.14 Distrib 5.6.17
感觉像Windows的蓝屏,现在没有任何有价值的信息来判断问题。由于机器是用作公司的服务器,不方便进行重新安装等,不知道有没有什么办法诊断,或者有听说过相关的系统BUG、软硬件兼容问题之类的?
补充:出现问题后,网络不通、crontab任务也没有继续定时运行、自己的应用也没有任何日志留下,打开该机显示器,完全黑屏。
使用的是普通的PC,不是专门的服务器机器。
# lspci
00:00.0 Host bridge: Intel Corporation Xeon E3-1200 v2/3rd Gen Core processor DRAM Controller (rev 09)
00:01.0 PCI bridge: Intel Corporation Xeon E3-1200 v2/3rd Gen Core processor PCI Express Root Port (rev 09)
00:02.0 VGA compatible controller: Intel Corporation Xeon E3-1200 v2/3rd Gen Core processor Graphics Controller (rev 09)
00:14.0 USB controller: Intel Corporation 7 Series/C210 Series Chipset Family USB xHCI Host Controller (rev 04)
00:16.0 Communication controller: Intel Corporation 7 Series/C210 Series Chipset Family MEI Controller #1 (rev 04)
00:1a.0 USB controller: Intel Corporation 7 Series/C210 Series Chipset Family USB Enhanced Host Controller #2 (rev 04)
00:1b.0 Audio device: Intel Corporation 7 Series/C210 Series Chipset Family High Definition Audio Controller (rev 04)
00:1c.0 PCI bridge: Intel Corporation 7 Series/C210 Series Chipset Family PCI Express Root Port 1 (rev c4)
00:1c.4 PCI bridge: Intel Corporation 7 Series/C210 Series Chipset Family PCI Express Root Port 5 (rev c4)
00:1d.0 USB controller: Intel Corporation 7 Series/C210 Series Chipset Family USB Enhanced Host Controller #1 (rev 04)
00:1e.0 PCI bridge: Intel Corporation 82801 PCI Bridge (rev a4)
00:1f.0 ISA bridge: Intel Corporation B75 Express Chipset LPC Controller (rev 04)
00:1f.2 SATA controller: Intel Corporation 7 Series/C210 Series Chipset Family 6-port SATA Controller [AHCI mode] (rev 04)
00:1f.3 SMBus: Intel Corporation 7 Series/C210 Series Chipset Family SMBus Controller (rev 04)
03:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller (rev 0c)
硬件本身应该都没有故障的,一般运行一周左右会出问题,有时候使用得频繁的话会比较快出问题。感觉可能是软硬件兼容性问题或者系统BUG之类
2017-02-06补充:
从2016年初,对机器CPU进行降频后(每核从3.3GHz降到2.8GHz),至今1年多,已经不再出现宕机了。
|
|