免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 12051 | 回复: 5

INFO: rcu_sched_state detected stall on CPU 0 [复制链接]

论坛徽章:
0
发表于 2012-01-05 16:07 |显示全部楼层
Dec 30 15:12:14 T206 kernel: [ 1196.284001] INFO: rcu_sched_state detected stall on CPU 0 (t=15000 jiffies)
Dec 30 15:12:14 T206 kernel: [ 1196.284001] sending NMI to all CPUs:

如题,求指点
提示这个错误是什么原因引起的?

论坛徽章:
0
发表于 2012-03-21 11:53 |显示全部楼层
顶起来,我也有这个提示信息。。。。在控制台,突然这样显示

论坛徽章:
16
2015亚冠之吉达阿赫利
日期:2015-08-17 11:21:462015年迎新春徽章
日期:2015-03-04 09:58:11酉鸡
日期:2014-12-07 09:06:19水瓶座
日期:2014-11-04 14:23:29天秤座
日期:2014-03-02 08:57:52双鱼座
日期:2014-02-22 13:07:56午马
日期:2014-02-14 11:08:18双鱼座
日期:2014-02-13 11:09:37卯兔
日期:2014-02-06 15:10:34子鼠
日期:2014-01-20 14:48:19戌狗
日期:2013-12-19 09:37:46射手座
日期:2013-12-19 09:33:47
发表于 2014-07-22 13:03 |显示全部楼层
遇到类似问题,顶起

论坛徽章:
0
发表于 2014-07-22 18:32 |显示全部楼层
某个核调度出了问题,跟softlockup有点像。可能是spinlock关抢占。或者fifo死循环。
如果是前者,得查死锁回溯;
我们的业务模型会在某几个cpu上fifo死循环,没办法,目前的临时解决方法是配置了CONFIG_NO_HZ_FULL 。
CONFIG_NO_HZ_FULL的好处是,如果运行的进程只有一个,RCU也会认为该cpu经过了一个grace period,不会出死锁。

论坛徽章:
0
发表于 2014-07-22 19:06 |显示全部楼层
一般是死锁了,由于提示是cpu0死了,看下“sending nmi”下一行开始的cpu0的栈,一般最后能看到某个spin lock irqsave类似的锁操作,然后看下这个锁哪里用到。另一个常用的检测方式是把内核的lockdep检测打开,这样错误基本是无所遁形的(O_O)

论坛徽章:
2
寅虎
日期:2014-11-25 21:47:342015小元宵徽章
日期:2015-03-06 15:58:18
发表于 2014-07-22 20:42 |显示全部楼层
触发NMI,一般是cpu卡死,如死锁,也有如系统异常时,巨量的prinrk(打印全开)。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP