免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2730 | 回复: 17
打印 上一主题 下一主题

[内存管理] 【求助】OOM的时候kill进程失败 [复制链接]

论坛徽章:
2
2015年亚洲杯之乌兹别克斯坦
日期:2015-04-15 15:43:482015亚冠之迪拜阿赫利
日期:2015-06-30 20:36:46
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-11-12 22:48 |只看该作者 |倒序浏览
发生OOM的时候使用force_sig向进程发送SIGKILL,结果进程并没有终止,一直在task list里面,导致内存不能释放,系统卡住。

有人遇到过这样的问题?

论坛徽章:
0
2 [报告]
发表于 2015-11-30 22:18 |只看该作者
最终结果这个进程状态是不是ZOMBIE状态?

论坛徽章:
20
程序设计版块每日发帖之星
日期:2015-08-17 06:20:00程序设计版块每日发帖之星
日期:2016-07-16 06:20:00程序设计版块每日发帖之星
日期:2016-07-18 06:20:00每日论坛发贴之星
日期:2016-07-18 06:20:00黑曼巴
日期:2016-12-26 16:00:3215-16赛季CBA联赛之江苏
日期:2017-06-26 11:05:5615-16赛季CBA联赛之上海
日期:2017-07-21 18:12:5015-16赛季CBA联赛之青岛
日期:2017-09-04 17:32:0515-16赛季CBA联赛之吉林
日期:2018-03-26 10:02:16程序设计版块每日发帖之星
日期:2016-07-15 06:20:0015-16赛季CBA联赛之江苏
日期:2016-07-07 18:37:512015亚冠之萨济拖拉机
日期:2015-08-17 12:21:08
3 [报告]
发表于 2015-12-02 11:34 |只看该作者
进程是不是只有在被调度之后才能响应信号?

论坛徽章:
2
2015年亚洲杯之乌兹别克斯坦
日期:2015-04-15 15:43:482015亚冠之迪拜阿赫利
日期:2015-06-30 20:36:46
4 [报告]
发表于 2015-12-03 13:44 |只看该作者
回复 2# kerryxi

状态是D,不是Z,看起来好像进程一直没有被调度,所以一直没有退出。
   

论坛徽章:
2
2015年亚洲杯之乌兹别克斯坦
日期:2015-04-15 15:43:482015亚冠之迪拜阿赫利
日期:2015-06-30 20:36:46
5 [报告]
发表于 2015-12-03 13:47 |只看该作者
回复 3# nswcfd


    是的,只有被调度之后才能响应信号,现在看起来就是进程没有被调度。
现在我发完SIGKILL之后,强制修改进程状态为TASK_INTERRUPTIBLE,设置优先级最高,如果当前进程不是要被kill的进程就执行schedule(),有所改善,但有时候还是会卡住。

论坛徽章:
20
程序设计版块每日发帖之星
日期:2015-08-17 06:20:00程序设计版块每日发帖之星
日期:2016-07-16 06:20:00程序设计版块每日发帖之星
日期:2016-07-18 06:20:00每日论坛发贴之星
日期:2016-07-18 06:20:00黑曼巴
日期:2016-12-26 16:00:3215-16赛季CBA联赛之江苏
日期:2017-06-26 11:05:5615-16赛季CBA联赛之上海
日期:2017-07-21 18:12:5015-16赛季CBA联赛之青岛
日期:2017-09-04 17:32:0515-16赛季CBA联赛之吉林
日期:2018-03-26 10:02:16程序设计版块每日发帖之星
日期:2016-07-15 06:20:0015-16赛季CBA联赛之江苏
日期:2016-07-07 18:37:512015亚冠之萨济拖拉机
日期:2015-08-17 12:21:08
6 [报告]
发表于 2015-12-03 17:46 |只看该作者
D是在等待外部事件,只能被所等待的事件源来wakeup,调度器帮不了忙。
这个进程在等待什么?可以看看ps/top看看其wait address / wchan。

论坛徽章:
2
2015年亚洲杯之乌兹别克斯坦
日期:2015-04-15 15:43:482015亚冠之迪拜阿赫利
日期:2015-06-30 20:36:46
7 [报告]
发表于 2015-12-07 16:29 |只看该作者
回复 6# nswcfd


    请教下,wait address要怎么看?

论坛徽章:
20
程序设计版块每日发帖之星
日期:2015-08-17 06:20:00程序设计版块每日发帖之星
日期:2016-07-16 06:20:00程序设计版块每日发帖之星
日期:2016-07-18 06:20:00每日论坛发贴之星
日期:2016-07-18 06:20:00黑曼巴
日期:2016-12-26 16:00:3215-16赛季CBA联赛之江苏
日期:2017-06-26 11:05:5615-16赛季CBA联赛之上海
日期:2017-07-21 18:12:5015-16赛季CBA联赛之青岛
日期:2017-09-04 17:32:0515-16赛季CBA联赛之吉林
日期:2018-03-26 10:02:16程序设计版块每日发帖之星
日期:2016-07-15 06:20:0015-16赛季CBA联赛之江苏
日期:2016-07-07 18:37:512015亚冠之萨济拖拉机
日期:2015-08-17 12:21:08
8 [报告]
发表于 2015-12-08 16:16 |只看该作者
ps -O wchan #-O 增加输出列

top -> f(选列) -> y(选择wchan)

论坛徽章:
0
9 [报告]
发表于 2015-12-08 21:18 |只看该作者
方法1:cat /proc/[pid]/wchan
只能看到最后的address

方法2:
echo 't' > /proc/sysrq-trigger
能够在dmesg里面看到所有任务的堆栈

方法3:
cat /proc/[pid]/stack
这个在早期的linux UP kernel能够显示,在SMP下面需要修改内核stack的代码,就能够看到完整的堆栈

论坛徽章:
2
2015年亚洲杯之乌兹别克斯坦
日期:2015-04-15 15:43:482015亚冠之迪拜阿赫利
日期:2015-06-30 20:36:46
10 [报告]
发表于 2015-12-21 16:20 |只看该作者
回复 6# nswcfd


    非常感谢,知道在哪里可以看到wait address了。

前段时间事情太多,这个问题就搁置了一段时间,现在继续跟进这个问题。

我这里出现卡死的时候这个系统都不响应了,所以我改了内核,在卡死的时候直接把wait address打印出来,目前正在调试,还没抓到地址,比较怀疑是卡在磁盘IO,因为我们这个进程需要较多磁盘操作。

再请教下,如果我找到了wait address,有办法**这个进程,进而将其kill吗?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP