免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 6924 | 回复: 9
打印 上一主题 下一主题

linux服务器频繁死机 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2007-08-08 15:51 |只看该作者 |倒序浏览
最近公司的linux服务器频繁死机,几乎每天都要死一次,服务器主要运行mrtg

dmesg内容如下
Linux version 2.2.14C11 (root@adrian1.cobalt.com) (gcc version 2.95.2 19991024 (release)) #2 Wed Jun 28 00:55:51 PDT 2000
Ignoring bogus EBDA pointer 3FFF000
Detected 448220420 Hz processor.
Calibrating delay loop... 894.57 BogoMIPS
Memory: 127980k/131072k available (1076k kernel code, 416k reserved, 1540k data, 60k init)
Dentry hash table entries: 16384 (order 5, 128k)
Buffer cache hash table entries: 131072 (order 7, 512k)
Page cache hash table entries: 32768 (order 5, 128k)
VFS: Diskquotas version dquot_6.4.0 initialized
CPU: AMD AMD-K6(tm)-III Processor stepping 04
Checking 386/387 coupling... OK, FPU using exception 16 error reporting.
Checking 'hlt' instruction... OK.
POSIX conformance testing by UNIFIX
PCI: Using configuration type 1
PCI: Probing PCI hardware
Linux NET4.0 for Linux 2.2
Based upon Swansea University Computer Society NET3.039
NET4: Unix domain sockets 1.0 for Linux NET4.0.
NET4: Linux TCP/IP 1.0 for NET4.0
IP Protocols: ICMP, UDP, TCP, IGMP
TCP: Hash tables configured (ehash 131072 bhash 65536)
Initializing RT netlink socket
Starting kswapd v 1.3
Cobalt watchdog v1.3 enabled
Cobalt temperature sensor v1.2 enabled
Serial driver version 4.27 with<4>Keyboard timeout[2]
Keyboard timeout[2]
no serial options enabled
ttyS00 at 0x03f8 (irq = 4) is a 16550A
ttyS01 at 0x02f8 (irq = 3) is a 16550A
pty: 256 Unix98 ptys configured
Real Time Clock Driver v1.09
lcd: Cobalt LCD Driver v3.01 by
lcd: Andrew Bose <andrew@cobaltnet.com>, Timothy Stonis <tim@cobaltnet.com>
serialnumber: Version 1.1 initialized. Serial number=10000007682f3801. Copyright (c) 1994-2000 Axent Technologies, Inc
Uniform Multi-Platform E-IDE driver Revision: 6.30
ALI15X3: IDE controller on PCI bus 00 dev 78
ALI15X3: 100% native mode on irq 14
    ide0: BM-DMA at 0xf000-0xf007, BIOS settings: hdaMA, hdbMA
    ide1: BM-DMA at 0xf008-0xf00f, BIOS settings: hdcMA, hddMA
hda: ST320413A, ATA DISK drive
ide0 at 0x1f0-0x1f7,0x3f6 on irq 14
ALI15X3: Ultra DMA enabled
hda: ST320413A, 19092MB w/1024kB Cache, CHS=38792/16/63, (U)DMA
md driver 0.90.0 MAX_MD_DEVS=256, MAX_REAL=12
translucent personality registered
linear personality registered
raid0 personality registered
raid1 personality registered
raid5 personality registered
raid5: measuring checksumming speed
raid5: MMX detected, trying high-speed MMX checksum routines
   pII_mmx   :   844.296 MB/sec
   p5_mmx    :   818.388 MB/sec
   8regs     :   596.265 MB/sec
   32regs    :   389.382 MB/sec
using fastest function: pII_mmx (844.296 MB/sec)
scsi : 0 hosts.
scsi : detected total.

eth0: Invalid EEPROM checksum 0x7e14, check settings before activating this device!
eth0: Intel EtherExpress Pro 10/100 at 0x6040, 00:10:E0:03:34:6A, IRQ 11.
  Board assembly 000000-000, Physical connectors present:
  Primary interface chip None PHY #0.
  General self-test: passed.
  Serial sub-system self-test: passed.
  Internal registers self-test: passed.
  ROM checksum self-test: passed (0xdbd8681d).
  Receiver lock-up workaround activated.
md.c: sizeof(mdp_super_t) = 4096
Partition check:
hda: hda1 hda2 < hda5 hda6 > hda3 hda4
autodetecting RAID arrays
autorun ...
... autorun DONE.
VFS: Mounted root (ext2 filesystem) readonly.
Freeing unused kernel memory: 60k freed
Adding Swap: 131532k swap-space (priority -1)
Cobalt Networks Bandwidth Limiting Module
Copyright (c) 1999, Cobalt Networks, Inc.
All rights reserved
family 10 not registered


其中有一段eth0: Invalid EEPROM checksum 0x7e14, check settings before activating this device!
请问是不是网卡有问题?

论坛徽章:
0
2 [报告]
发表于 2007-08-08 21:31 |只看该作者
EEPROM  是遠程引導用的,我覺得沒關係

打開 sysstat 看看是不是CPU 負載過重了,你 mrtg 監控多少個點?

說實話,你的機器太老了

论坛徽章:
0
3 [报告]
发表于 2007-08-09 10:05 |只看该作者
机器是老了点.
mrtg监控10个点
mrtg运行时cpu最高100%
以前也到过100% 但是也没死机过

[ 本帖最后由 Jeffalpha 于 2007-8-9 10:06 编辑 ]

论坛徽章:
0
4 [报告]
发表于 2007-08-09 11:24 |只看该作者
老机器CPU风扇行不行啊

论坛徽章:
0
5 [报告]
发表于 2007-08-09 12:46 |只看该作者
free | /usr/bin/awk '/Swap: /{print $3*1000; print $3*1000; print ""; print ""}'

看 SWAP 的 target 命令,監控下你的 swap 使用率吧,看看是不是資源耗盡

论坛徽章:
0
6 [报告]
发表于 2007-08-09 15:54 |只看该作者
最近温度很高吧,给鸭的降降温

论坛徽章:
0
7 [报告]
发表于 2007-08-09 21:33 |只看该作者
这个可能是和服务器的运行环境有关系,   我门单位的服务器最近也是莫名奇妙的重新启动,

测试结果我发现一个奇怪的原因, 只要机房开空调服务器n小时内不会重新启动, 但是一不开空调,结果就是重新或自动关系了..  呵呵

论坛徽章:
5
IT运维版块每日发帖之星
日期:2015-08-06 06:20:00IT运维版块每日发帖之星
日期:2015-08-10 06:20:00IT运维版块每日发帖之星
日期:2015-08-23 06:20:00IT运维版块每日发帖之星
日期:2015-08-24 06:20:00IT运维版块每日发帖之星
日期:2015-11-12 06:20:00
8 [报告]
发表于 2007-08-09 22:24 |只看该作者
各个风扇还在转吗?

论坛徽章:
1
白银圣斗士
日期:2015-11-23 08:33:04
9 [报告]
发表于 2007-08-09 22:32 |只看该作者
原帖由 rhce2233 于 2007-8-9 21:33 发表
这个可能是和服务器的运行环境有关系,   我门单位的服务器最近也是莫名奇妙的重新启动,

测试结果我发现一个奇怪的原因, 只要机房开空调服务器n小时内不会重新启动, 但是一不开空调,结果就是重新或自动关系了 ...

呵呵!IT房装一个自动启动空调的装置!不贵,千把块!

设定一个温度,到这个温度会自动跳的.热的时候会自动启动.停动后,来电后也会自动启动.

论坛徽章:
0
10 [报告]
发表于 2007-08-10 09:52 |只看该作者
呵呵..小机房空调坏了..拿fans顶着呢..-.-
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP