免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 6588 | 回复: 8
打印 上一主题 下一主题

求助:solaris 总是隔一段时间就自动重启 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-06-19 11:00 |只看该作者 |倒序浏览
本帖最后由 czx10000 于 2009-6-22 11:28 编辑

向各位大虾求助,小机是SPARC M8000 ;OS是solaris 10.重启时业务并不忙。实在无言的……

希望各位帮帮忙?
日志:

Jun 15 09:30:10 appserver ip: [ID 995438 kern.warning] WARNING: High TCP connect timeout rate! System (port 80) may be under a SYN flood attack!
Jun 17 17:19:07 appserver unix: [ID 836849 kern.notice]
Jun 17 17:19:07 appserver ^Mpanic[cpu27]/thread=2a100d4bca0:
Jun 17 17:19:08 appserver unix: [ID 799565 kern.notice] BAD TRAP: type=34 rp=2a100d4aa10 addr=b5de0448a mmu_fsr=0
Jun 17 17:19:08 appserver unix: [ID 100000 kern.notice]
Jun 17 17:19:08 appserver unix: [ID 839527 kern.notice] sched:
Jun 17 17:19:08 appserver unix: [ID 123557 kern.notice] alignment error:
Jun 17 17:19:08 appserver unix: [ID 381800 kern.notice] addr=0xb5de0448a
Jun 17 17:19:08 appserver unix: [ID 101969 kern.notice] pid=0, pc=0x1182e44, sp=0x2a100d4a2b1, tstate=0x80001606, context=0x0
Jun 17 17:19:08 appserver unix: [ID 743441 kern.notice] g1-g7: 8aed501e377, 2f6c, 1, 0, 753, 0, 2a100d4bca0
Jun 17 17:19:08 appserver unix: [ID 100000 kern.notice]

论坛徽章:
0
2 [报告]
发表于 2009-06-19 15:34 |只看该作者
system panic,need to analyse the core dump

论坛徽章:
0
3 [报告]
发表于 2009-06-19 15:54 |只看该作者
M8000 用的是4核SPARC64 VII 或双核SPARC64 VI。
WARNING: High TCP connect timeout rate! System (port 80) may be under a SYN flood attack!
是一种常规告警,并非真正的受到攻击!

造成问题的原因我觉得有2个方向的可能:

1个是硬件本事、硬件驱动、设备配置文件出问题了!
1个是连接数太大而导致squid内存分配失败(如果你最近更新过squid,可能自己编译的版本有bug 或服务配置文件里个别参数设置有问题!

^Mpanic[cpu27]/thread=2a100d4bca0:
BAD TRAP: type=34 rp=2a100d4aa10 addr=b5de0448a
这个是第感觉是27号cpu (多核的每个核心算一个独立的cpu)上的(线程ID 2a100d4bca0) down了,

你可以通过终端登录服务器,查看内核追踪程序( kernel traceback)的输出,如果是硬件问题输出信息中会有显示是那个设备产生的trap。

论坛徽章:
0
4 [报告]
发表于 2009-06-19 15:56 |只看该作者
SUN的手册上关于BAD TRAP的说明:

Cause

A bad trap can indicate faulty hardware or a mismatch between hardware and its configuration information. Data loss is possible if the problem occurs other than at boot time.

Action

If you recently installed new hardware, verify that the software was correctly configured. Check the kernel traceback displayed on the console to see which device generated the trap. If the configuration files are correct, you probably have to replace
the device.

In some cases, the bad trap message indicates a bad or down-rev CPU.

Technical Notes

A hardware processor trap occurred, and the kernel trap handler was unable to restore the system state. This message is a fatal error that usually precedes a panic,after which the system performs a sync, dump, and reboot. The following conditions
can cause a bad trap: a system text or data access fault, a system data alignment error, or certain kinds of user software traps.

论坛徽章:
0
5 [报告]
发表于 2009-06-19 16:01 |只看该作者
如果你机器上用了squid,坚持日志是否有相关的错误警告!

如果最近自己编译安装过squid ,可以问sun 售后服务要一个预编译的版本来试试!

论坛徽章:
0
6 [报告]
发表于 2009-06-20 01:47 |只看该作者
这个错误 不是 硬件的问题 检查你的应用

论坛徽章:
0
7 [报告]
发表于 2009-06-20 15:27 |只看该作者
WARNING: High TCP connect timeout rate! System (port 80) may be under a SYN flo

论坛徽章:
0
8 [报告]
发表于 2009-06-22 11:33 |只看该作者
这个错误 不是 硬件的问题 检查你的应用
进程音 发表于 2009-6-20 01:47



我有两台一样的机器实现负载均衡的,但是只有这个总是重启!!还有一个问题就是这台机器(总是重启的)的时钟总是比另外一台 较快,10个小时能差13、4秒。

论坛徽章:
0
9 [报告]
发表于 2009-12-19 11:58 |只看该作者
从工:
    权威的分析还是要做core dump分析,
    分析结果我已发给你了,请参考。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP