免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2106 | 回复: 5
打印 上一主题 下一主题

[系统管理] 求助 red hat 企业5.5出现死机现象,麻烦高手指导 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-10-26 20:54 |只看该作者 |倒序浏览
硬件:64G内存    4颗12核AMD CPU ,系统为32位 red hat 5.5 企业版(应用程序暂时在64位上不稳定,所以选择32位)使用PAE内核,支持大内存,安装oracle 11g,目前系统运行3-4天后,就出现死机的情况:服务器上层应用全部死掉,只能ping通,接显示器,操作无反应,ssh都登录不上,不知道是什么原因?如何解决?初步怀疑是oracle 11g安装在使用内存的问题上引发了OOM机制保护,message日志如下:
Oct 21 04:25:16 SV01 kernel: Free pages:    50643284kB (50635956kB HighMem)
Oct 21 04:25:16 SV01 kernel: Active:3203392 inactive:390852 dirty:0 writeback:0 unstable:0 free:12660821 slab:58228 mapped-file:350026 mapped-anon:107641 pagetables:15082
Oct 21 04:25:16 SV01 kernel: DMA free:3588kB min:68kB low:84kB high:100kB active:12kB inactive:0kB present:16384kB pages_scanned:63733 all_unreclaimable? yes
Oct 21 04:25:16 SV01 kernel: lowmem_reserve[]: 0 0 880 65520
Oct 21 04:25:16 SV01 kernel: DMA32 free:0kB min:0kB low:0kB high:0kB active:0kB inactive:0kB present:0kB pages_scanned:0 all_unreclaimable? no
Oct 21 04:25:16 SV01 kernel: lowmem_reserve[]: 0 0 880 65520
Oct 21 04:25:16 SV01 kernel: Normal free:3740kB min:3756kB low:4692kB high:5632kB active:1016kB inactive:16kB present:901120kB pages_scanned:1010314 all_unreclaimable? yes
Oct 21 04:25:16 SV01 kernel: lowmem_reserve[]: 0 0 0 517120
Oct 21 04:25:16 SV01 kernel: HighMem free:50635956kB min:512kB low:69552kB high:138592kB active:12812540kB inactive:1563392kB present:66191360kB pages_scanned:0 all_unreclaimable? no
Oct 21 04:25:16 SV01 kernel: lowmem_reserve[]: 0 0 0 0
Oct 21 04:25:16 SV01 kernel: DMA: 1*4kB 18*8kB 9*16kB 1*32kB 1*64kB 1*128kB 0*256kB 0*512kB 1*1024kB 1*2048kB 0*4096kB = 3588kB
Oct 21 04:25:16 SV01 kernel: DMA32: empty
Oct 21 04:25:16 SV01 kernel: Normal: 35*4kB 0*8kB 33*16kB 24*32kB 4*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 1*2048kB 0*4096kB = 3740kB
Oct 21 04:25:16 SV01 kernel: HighMem: 2221*4kB 1268*8kB 220*16kB 67*32kB 45*64kB 44*128kB 65*256kB 7*512kB 5*1024kB 8*2048kB 12344*4096kB = 50635956kB
Oct 21 04:25:16 SV01 kernel: 3486605 pagecache pages
Oct 21 04:25:16 SV01 kernel: Swap cache: add 0, delete 0, find 0/0, race 0+0
Oct 21 04:25:16 SV01 kernel: Free swap  = 32764556kB
Oct 21 04:25:16 SV01 kernel: Total swap = 32764556kB
Oct 21 04:25:16 SV01 kernel: Free swap:       32764556kB
Oct 21 04:25:16 SV01 kernel: 16777216 pages of RAM
Oct 21 04:25:16 SV01 kernel: 16547840 pages of HIGHMEM
Oct 21 04:25:16 SV01 kernel: 436203 reserved pages
Oct 21 04:25:16 SV01 kernel: 5265788 pages shared
Oct 21 04:25:16 SV01 kernel: 0 pages swap cached
Oct 21 04:25:16 SV01 kernel: 2 pages dirty
Oct 21 04:25:16 SV01 kernel: 0 pages writeback
Oct 21 04:25:16 SV01 kernel: 350026 pages mapped
Oct 21 04:25:16 SV01 kernel: 58228 pages slab
Oct 21 04:25:16 SV01 kernel: 15082 pages pagetables
Oct 21 04:25:16 SV01 kernel: Out of memory: Killed process 32592, UID 503, (oracle).
Oct 21 04:25:20 SV01 kernel: gawk invoked oom-killer: gfp_mask=0xd0, order=0, oomkilladj=0
Oct 21 04:25:20 SV01 kernel:  [<c0459ccb>] out_of_memory+0x72/0x1a3
Oct 21 04:25:20 SV01 kernel:  [<c045b232>] __alloc_pages+0x24e/0x2cf
Oct 21 04:25:20 SV01 kernel:  [<c0470f86>] cache_alloc_refill+0x26d/0x482
Oct 21 04:25:20 SV01 kernel:  [<c0470d0f>] kmem_cache_alloc+0x41/0x4b
Oct 21 04:25:20 SV01 kernel:  [<c041caeb>] pgd_alloc+0x29/0x77
Oct 21 04:25:20 SV01 kernel:  [<c042378a>] mm_init+0xa9/0xe1
Oct 21 04:25:20 SV01 kernel:  [<c042431a>] copy_process+0x9f5/0x123e
Oct 21 04:25:20 SV01 kernel:  [<c043436e>] alloc_pid+0x1c0/0x216
Oct 21 04:25:20 SV01 kernel:  [<c0424db1>] do_fork+0x41/0x168
Oct 21 04:25:20 SV01 kernel:  [<c040318b>] sys_clone+0x28/0x2d
Oct 21 04:25:20 SV01 kernel:  [<c0404f17>] syscall_call+0x7/0xb
Oct 21 04:25:20 SV01 kernel:  =======================
Oct 21 04:25:20 SV01 kernel: Mem-info:
Oct 21 04:25:20 SV01 kernel: DMA per-cpu:
Oct 21 04:25:20 SV01 kernel: cpu 0 hot: high 0, batch 1 used:0
Oct 21 04:25:20 SV01 kernel: cpu 0 cold: high 0, batch 1 used:0
Oct 21 04:25:20 SV01 kernel: cpu 1 hot: high 0, batch 1 used:0
Oct 21 04:25:20 SV01 kernel: cpu 1 cold: high 0, batch 1 used:0
Oct 21 04:25:20 SV01 kernel: cpu 2 hot: high 0, batch 1 used:0
Oct 21 04:25:20 SV01 kernel: cpu 2 cold: high 0, batch 1 used:0
Oct 21 04:25:20 SV01 kernel: cpu 3 hot: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 3 cold: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 4 hot: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 4 cold: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 5 hot: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 5 cold: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 6 hot: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 6 cold: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 7 hot: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 7 cold: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 8 hot: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 8 cold: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 9 hot: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 9 cold: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 10 hot: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 10 cold: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 11 hot: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 11 cold: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 12 hot: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 12 cold: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 13 hot: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 13 cold: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 14 hot: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 14 cold: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 15 hot: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 15 cold: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 16 hot: high 0, batch 1 used:0
Oct 21 04:25:26 SV01 kernel: cpu 16 cold: high 0, batch 1 used:0

论坛徽章:
0
2 [报告]
发表于 2012-10-27 09:40 |只看该作者
感觉是内存不足导致系统死机的,LZ可以查下你的应用程序在使用内存的时候是否一直占用内存而不释放的。

论坛徽章:
0
3 [报告]
发表于 2012-10-27 16:46 |只看该作者
谢谢回复,我也做了内存监控,死机时内存也足着,唉!

论坛徽章:
13
技术图书徽章
日期:2014-04-29 14:15:42IT运维版块每日发帖之星
日期:2015-12-12 06:20:00IT运维版块每日发帖之星
日期:2015-08-30 06:20:00IT运维版块每日发帖之星
日期:2015-08-24 06:20:00IT运维版块每日发帖之星
日期:2015-08-02 06:20:002015年亚洲杯之澳大利亚
日期:2015-04-03 15:03:12申猴
日期:2015-03-20 09:00:292015年迎新春徽章
日期:2015-03-04 09:54:452015年辞旧岁徽章
日期:2015-03-03 16:54:15季节之章:冬
日期:2015-01-20 17:08:47双子座
日期:2014-11-21 16:30:31技术图书徽章
日期:2014-07-11 16:29:08
4 [报告]
发表于 2012-10-27 21:29 |只看该作者
Oct 21 04:25:16 SV01 kernel: Out of memory: Killed process 32592, UID 503, (oracle).


将数据库与应用程序的服务器分开,Oracle如果想性能好,还是升级到64位的。

你都用11G了,11GR2都可以支持6版本了

论坛徽章:
0
5 [报告]
发表于 2012-10-29 09:41 |只看该作者
11GR2都可以支持6版本了---应该是64位版本吧,谢谢!感觉与Oracle 配置的SGA和PGA有关系,帮了调整,正常观察中。

论坛徽章:
0
6 [报告]
发表于 2012-10-31 16:43 |只看该作者
通过这几天的查询,感觉meminfo中LowTotal:       256032 kB  有点小,不知道是什么原因?很容易就引起LowFree:          9124 kB  过低,引起oom保护机制。有没有什么办法提高LowTotal:?望各位指教,谢谢
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP