免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2481 | 回复: 9
打印 上一主题 下一主题

请教:solaris9频繁假死 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2007-04-25 15:47 |只看该作者 |倒序浏览
大家好。我的系统最近经常假死,状态:任何应用都停,所有工作站和pc无法连接到服务器。ping和telnet均无反应。经过约20分钟,系统自动恢复。部分应用需要重起才恢复。检查当时系统的占用并不忙。系统为
solaris9,总版本118558-11。系统的内存空闲的只有200--300兆。java版本1.4.2_08。大家碰到过吗?有没有什么思路?检查思路也好

论坛徽章:
0
2 [报告]
发表于 2007-04-25 16:36 |只看该作者
好像网卡的工作状态,比如全双工还是半双工,是应该检查的项目之一。

论坛徽章:
0
3 [报告]
发表于 2007-04-25 16:44 |只看该作者
十分感谢!
怎么检查?ifconfig?参数怎么解读?

论坛徽章:
0
4 [报告]
发表于 2007-04-25 16:47 |只看该作者
man sa1
设置crontab
然后通过sar看假死时段的记录

论坛徽章:
0
5 [报告]
发表于 2007-04-25 17:01 |只看该作者
这个方法已经用过了。
没有异常和超标的数值。
是网中人大哥?

论坛徽章:
0
6 [报告]
发表于 2007-04-26 06:05 |只看该作者
检查思路:

1。找出假死状态第一次出现的时间点。

2。找出在此时间点前后,在这个系统上做了哪些改动。

3。找出在此时间点前后,在与这个系统有关的其他系统上,或网络上做了哪些改动。

4。找出假死状态出现前,是哪个应用或进程首先出问题。

5。找出假死状态出现前,在与这个系统有关的其他系统上,或网络上,做了哪些操作或启动/停止了哪些进程。


一般要查:
hardware
power management
NFS
NIS
/var/adm/messages

论坛徽章:
0
7 [报告]
发表于 2007-04-26 10:39 |只看该作者

按照五楼的思路基本就能解决这个问题了。

另外再补充一个检查一下有没有资源同抢的现象?
比如说,你有其他同网的机器与这个服务器的IP地址相同,或者有其他相同的资源。也可能造成这种现象。

论坛徽章:
0
8 [报告]
发表于 2007-04-26 15:22 |只看该作者
感谢大家。
1。/var/adm/messages 看过,没有。
2。IP地址没有可能同抢。
3。如何检查:是哪个应用或进程首先出问题和做了哪些操作或启动/停止了哪些进程?
在感谢大家支持,问题挺挠头

论坛徽章:
0
9 [报告]
发表于 2007-04-26 20:06 |只看该作者
假死时,用top看一下服务器上的信息.仔细看看系统资源占用情况,比如内存,cpu,swap区的利用率情况.在分析原因在哪里,就有方向了.再不行就找sun工程师开个case咨询一下.

论坛徽章:
0
10 [报告]
发表于 2007-04-27 09:11 |只看该作者
谢谢。
top中没有什么,只是可用内存太少
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP