免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1583 | 回复: 3
打印 上一主题 下一主题

[内核模块] 有偿求助!!!kdump [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-12-10 00:39 |只看该作者 |倒序浏览
   我的环境是liunx suse 11 p1 + hadoop+infiniband平台,问题是服务器运行一段时间不定期的服务器会自动重启,每次重启的服务器都不同一台,通过KDUMP转存的VMCORE由于水平有限又不懂反汇编始终找不到具体导致服务器重启的根本原因,求助各路精英协助分析问题,报酬问题可以QQ沟通2799335249,谢谢!

310205.816258] BUG: unable to handle kernel NULL pointer dereference at (null)
[310205.816274] IP: [<ffffffff811a5d55>] apparmor_file_permission+0x25/0xf0
[310205.816289] PGD 46b4b2067 PUD 0
[310205.816295] Oops: 0000 [#1] SMP
[310205.816301] last sysfs file: /sys/devices/pci0000:00/0000:00:1a.0/usb1/1-1/1-1.5/1-1.5:1.0/input/input5/capabilities/sw
[310205.816310] CPU 9
[310205.816313] Modules linked in: ipmi_si ipmi_devintf ipmi_msghandler raw bonding rdma_ucm rdma_cm iw_cm ib_addr ib_ipoib cpufreq_conservative ib_cm cpufreq_userspace cpufreq_powersave ipv6 acpi_cpufreq ib_usa(N) ib_sa ib_uverbs ib_umad kcopy(N) ib_mthca microcode fuse loop dm_mod ib_qib(N) tpm_tis joydev tpm ib_mad tpm_bios usbhid pcspkr ib_core shpchp igb hid pci_hotplug ses rtc_cmos dca rtc_core enclosure rtc_lib wmi sg container button acpi_pad ehci_hcd usbcore sd_mod crc_t10dif edd xfs exportfs fan processor ide_pci_generic ide_core aacraid(N) ata_generic libata scsi_mod thermal thermal_sys hwmon
[310205.816392] Supported: Yes
[310205.816399] Pid: 11483, comm: java Tainted: G          N  2.6.32.12-0.7-default #1 NF5270M3
[310205.816405] RIP: 0010:[<ffffffff811a5d55>]  [<ffffffff811a5d55>] apparmor_file_permission+0x25/0xf0
[310205.816415] RSP: 0018:ffff880864eebec8  EFLAGS: 00010292
[310205.816420] RAX: ffffffff818442e0 RBX: ffff8801c8acc080 RCX: 0000000000000000
[310205.816425] RDX: ffff880864eebf50 RSI: 0000000000000004 RDI: ffff8801c8acc080
[310205.816430] RBP: ffff8801c8acc080 R08: 0000000000000001 R09: ffff8801c8acc0b0
[310205.816435] R10: 0000000000057402 R11: ffffffff811a5d30 R12: 0000000000000000
[310205.816440] R13: 0000000000000004 R14: 00000000000000a9 R15: 0000000000000042
[310205.816446] FS:  00007f0f66867710(0000) GS:ffff88048e4c0000(0000) knlGS:0000000000000000
[310205.816452] CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
[310205.816457] CR2: 0000000000000000 CR3: 00000004644ca000 CR4: 00000000000406e0
[310205.816462] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
[310205.816468] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400
[310205.816474] Process java (pid: 11483, threadinfo ffff880864eea000, task ffff880864e48500)
[310205.816478] Stack:
[310205.816481]  00007f0f78949000 0000000000002000 ffff8801c8acc080 0000000000000000
[310205.816488] <0> 00007f0f668640d0 ffffffff810fc2d6 fffffffffffffff2 ffff8801c8acc080
[310205.816495] <0> ffff880864eebf50 ffffffff810fc9b4 ffff88046c3f7e40 ffff8801c8acc080
[310205.816504] Call Trace:
[310205.816528]  [<ffffffff810fc2d6>] rw_verify_area+0x56/0xc0
[310205.816538]  [<ffffffff810fc9b4>] vfs_read+0xa4/0x130
[310205.816547]  [<ffffffff810fcb43>] sys_read+0x53/0xa0
[310205.816560]  [<ffffffff81002f7b>] system_call_fastpath+0x16/0x1b
[310205.816573]  [<00007f0f836c357d>] 0x7f0f836c357d
[310205.816577] Code: 84 00 00 00 00 00 48 83 ec 28 48 89 5c 24 08 4c 89 6c 24 20 48 89 fb 48 89 6c 24 10 4c 89 64 24 18 41 89 f5 4c 8b a7 98 00 00 00 <49> 8b 2c 24 48 85 ed 74 20 48 83 7f 10 00 74 19 48 8b 47 18 48
[310205.816624] RIP  [<ffffffff811a5d55>] apparmor_file_permission+0x25/0xf0
[310205.816632]  RSP <ffff880864eebec8>
[310205.816636] CR2: 0000000000000000

论坛徽章:
2
寅虎
日期:2014-11-25 21:47:342015小元宵徽章
日期:2015-03-06 15:58:18
2 [报告]
发表于 2014-12-10 07:04 |只看该作者
        我在开发中,曾经遇到和你类似的问题,请关注apparmor这个字眼,
        【百度百科】AppArmor是一个高效和易于使用的Linux系统安全应用程序。AppArmor对操作系统和应用程序所受到的威胁进行从内到外的保护,甚至是未被发现的0day漏洞和未知的应用程序漏洞所导致的攻击。AppArmor安全策略可以完全定义个别应用程序可以访问的系统资源与各自的特权。AppArmor包含大量的默认策略,它将先进的静态分析和基于学习的工具结合起来,AppArmor甚至可以使非常复杂的应用可以使用在很短的时间内应用成功。
        这个应该是你非法访问某些系统资源,然后apparmor被激活,导致crash。这个问题不太好定位,但是基本上和你一样,是必现的,你需要做好异常时的资源访问机制。

论坛徽章:
208
巨蟹座
日期:2013-09-02 09:16:36卯兔
日期:2013-09-02 20:53:59酉鸡
日期:2013-09-05 21:21:45戌狗
日期:2013-10-15 20:51:17寅虎
日期:2013-10-18 21:13:16白羊座
日期:2013-10-23 21:15:19午马
日期:2013-10-25 21:22:48技术图书徽章
日期:2013-11-01 09:11:32双鱼座
日期:2013-11-01 20:29:44丑牛
日期:2013-11-01 20:40:00卯兔
日期:2013-11-11 09:21:32酉鸡
日期:2013-12-04 19:56:39
3 [报告]
发表于 2014-12-10 09:40 |只看该作者
把apparmor service停了先

论坛徽章:
15
射手座
日期:2014-02-26 13:45:082015年迎新春徽章
日期:2015-03-04 09:54:452015年辞旧岁徽章
日期:2015-03-03 16:54:15羊年新春福章
日期:2015-02-26 08:47:552015年亚洲杯之卡塔尔
日期:2015-02-03 08:33:45射手座
日期:2014-12-31 08:36:51水瓶座
日期:2014-06-04 08:33:52天蝎座
日期:2014-05-14 14:30:41天秤座
日期:2014-04-21 08:37:08处女座
日期:2014-04-18 16:57:05戌狗
日期:2014-04-04 12:21:33技术图书徽章
日期:2014-03-25 09:00:29
4 [报告]
发表于 2014-12-10 10:28 |只看该作者
看似指针重复释放,可能是apparmor相关内核流程的bug,需要具体分析代码逻辑。

如果要规避或解决的话,最好还是按ls说的,先停掉apparmor 。

另外,也可到git中搜搜相关的bug修复。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP