免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3585 | 回复: 8
打印 上一主题 下一主题

求助T4-2自动重启原因 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-02-01 10:37 |只看该作者 |倒序浏览
最近公司一台T4-2老是自动重启,求助重启真正原因:
疑点如下:
1.上面部署的是应用是tocmat和apache,每天应用都有自动重启,但是从性能图上看,内存没有真正的释放,标注的4,3,2 应用重启,内存虽然有释放,但是
整个系统的内存使用率比上次应用重启的高 如下图

2.每次系统DOWN机的时候,内存使用率都100%,但是以SOLARIS的机制来看,当内存用完,还会使用SWAP,也就是应用变慢,不会使机器重启
3.系统日志重启日志如下


Jan 29 15:39:23 msuu067 unix: [ID 330770 kern.notice] send mondo timeout [retries: 0x49355]  cpuids:
Jan 29 15:39:23 msuu067 unix: [ID 152697 kern.notice]  0x38
Jan 29 15:39:23 msuu067 unix: [ID 152697 kern.notice]  0x39
Jan 29 15:39:23 msuu067 unix: [ID 330770 kern.notice] send mondo timeout [retries: 0x48e62]  cpuids:
Jan 29 15:39:23 msuu067 unix: [ID 152697 kern.notice]  0x3a
Jan 29 15:39:23 msuu067 unix: [ID 152697 kern.notice]  0x38
Jan 29 15:39:23 msuu067 unix: [ID 152697 kern.notice]  0x3b
Jan 29 15:39:23 msuu067 unix: [ID 152697 kern.notice]  0x39
Jan 29 15:39:23 msuu067 unix: [ID 152697 kern.notice]  0x3c
Jan 29 15:39:23 msuu067 unix: [ID 152697 kern.notice]  0x3a
Jan 29 15:39:23 msuu067 unix: [ID 152697 kern.notice]  0x3d
Jan 29 15:39:23 msuu067 unix: [ID 152697 kern.notice]  0x3b
Jan 29 15:39:23 msuu067 unix: [ID 152697 kern.notice]  0x3e
Jan 29 15:39:23 msuu067 unix: [ID 152697 kern.notice]  0x3c
Jan 29 15:39:23 msuu067 unix: [ID 152697 kern.notice]  0x3f
Jan 29 15:39:23 msuu067 unix: [ID 152697 kern.notice]  0x3d
Jan 29 15:39:23 msuu067 unix: [ID 100000 kern.notice]
Jan 29 15:39:23 msuu067 unix: [ID 152697 kern.notice]  0x3e
Jan 29 15:39:23 msuu067 unix: [ID 152697 kern.notice]  0x3f
Jan 29 15:39:23 msuu067 unix: [ID 100000 kern.notice]
Jan 29 15:39:23 msuu067 unix: [ID 350512 kern.notice] panic: failed to stop cpu56
Jan 29 15:39:23 msuu067 unix: [ID 350512 kern.notice] panic: failed to stop cpu57
Jan 29 15:39:23 msuu067 unix: [ID 350512 kern.notice] panic: failed to stop cpu58
Jan 29 15:39:23 msuu067 unix: [ID 350512 kern.notice] panic: failed to stop cpu59
Jan 29 15:39:23 msuu067 unix: [ID 350512 kern.notice] panic: failed to stop cpu60
Jan 29 15:39:23 msuu067 unix: [ID 350512 kern.notice] panic: failed to stop cpu61
Jan 29 15:39:23 msuu067 unix: [ID 350512 kern.notice] panic: failed to stop cpu62
Jan 29 15:39:23 msuu067 unix: [ID 350512 kern.notice] panic: failed to stop cpu63
Jan 29 15:39:23 msuu067 unix: [ID 836849 kern.notice]
Jan 29 15:39:23 msuu067 ^Mpanic[cpu65]/thread=3000cc67400:
Jan 29 15:39:23 msuu067 unix: [ID 152620 kern.notice] send_mondo_set: timeout
Jan 29 15:39:23 msuu067 unix: [ID 100000 kern.notice]
Jan 29 15:39:23 msuu067 genunix: [ID 723222 kern.notice] 000002a107170ec0 unix:send_mondo_set+4a4 (8, 10, 1d709fdb78d62, 77, 3000b4f
6600, 49355)
Jan 29 15:39:23 msuu067 genunix: [ID 179002 kern.notice]   %l0-3: 000000000183c730 0000000000000008 000000000000ffff 0001d709fdb78f7
4
Jan 29 15:39:23 msuu067   %l4-7: 0000000001dc7ac2 0000000000000000 00000000010b8120 0000000000000000
Jan 29 15:39:23 msuu067 genunix: [ID 723222 kern.notice] 000002a107170fa0 unixt_some+194 (2a107171210, 2a107171090, ffffffffffffff
ff, fffffffffffffff8, 2a107171058, 0)
Jan 29 15:39:23 msuu067 genunix: [ID 179002 kern.notice]   %l0-3: 00000000018919c4 000002a107171090 0000000000000002 000000000000000
1
Jan 29 15:39:23 msuu067   %l4-7: fffffffffffffffd 000002a1071710d0 000002a107171098 0000000000000008
Jan 29 15:39:23 msuu067 genunix: [ID 723222 kern.notice] 000002a107171110 unixt_sync+148 (2a107171520, ffffffffffffffff, fffffffff
ffffff8, 1043c00, 3000b4f6000, 2a10717121
Jan 29 15:39:23 msuu067 genunix: [ID 179002 kern.notice]   %l0-3: 0000000000000008 0001d709c2282f72 000000000000007f 000002a10717156
0
Jan 29 15:39:23 msuu067   %l4-7: 0000000000000001 000000000000007f 000000000000003f 0000000000000001
Jan 29 15:39:23 msuu067 genunix: [ID 723222 kern.notice] 000002a107171420 unix:hat_unload_callback+824 (ffffffffffffe000, 73010000,
0, fffffffffffffff8, 0, 3000b361280)
Jan 29 15:39:23 msuu067 genunix: [ID 179002 kern.notice]   %l0-3: 0000000000000001 000002a107171528 000002a1071717e8 000000000000000
0

论坛徽章:
2
双鱼座
日期:2014-02-23 12:10:03操作系统版块每日发帖之星
日期:2015-12-17 06:20:00
2 [报告]
发表于 2013-02-01 10:42 |只看该作者
做过POST吗?检查下CPU是否有问题~

论坛徽章:
0
3 [报告]
发表于 2013-02-01 14:04 |只看该作者
CPU是没有问题的
回复 1# laiqifei


   

论坛徽章:
0
4 [报告]
发表于 2013-02-01 15:35 |只看该作者
压力测试跑跑,看看是不是有泄漏。

论坛徽章:
20
申猴
日期:2013-09-12 19:39:05狮子座
日期:2014-07-20 21:19:51寅虎
日期:2014-08-16 18:37:47水瓶座
日期:2014-10-15 18:58:25天蝎座
日期:2015-01-22 18:19:15NBA常规赛纪念章
日期:2015-05-04 22:32:032015亚冠之胡齐斯坦钢铁
日期:2015-06-03 11:28:502015亚冠之吉达阿赫利
日期:2015-09-19 12:41:47午马
日期:2013-09-18 14:36:40戌狗
日期:2013-09-18 14:44:39处女座
日期:2013-09-24 17:46:41CU十二周年纪念徽章
日期:2013-10-24 15:41:34
5 [报告]
发表于 2013-02-01 17:19 |只看该作者
是不是也有内存利用率的参数设置来防止内存耗尽啊

论坛徽章:
0
6 [报告]
发表于 2013-02-04 12:47 |只看该作者
Pls see "SPARC T4 systems seeing "send_mondo" panics followed by a system hang [ID 1482273.1]" in handbook

论坛徽章:
2
双鱼座
日期:2014-02-23 12:10:03操作系统版块每日发帖之星
日期:2015-12-17 06:20:00
7 [报告]
发表于 2013-02-04 13:07 |只看该作者
Solution
This is NOT a hardware issue and so NO hardware of any kind should be replaced.

If you see this type of panic please open a Service Request (SR) to the VSP SPARC T4 Hardware Group in My Oracle Support (MOS) and either upload or attach the corefile, explorer, and ILOM snapshot for analysis.


论坛徽章:
0
8 [报告]
发表于 2013-02-05 12:17 |只看该作者
内存的插法是否正确?

论坛徽章:
0
9 [报告]
发表于 2013-02-07 11:05 |只看该作者
升级ilom到最新版本
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP