免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2422 | 回复: 4
打印 上一主题 下一主题

[内核入门] del_timer_sync不能在中断上下文调? [复制链接]

论坛徽章:
2
寅虎
日期:2014-11-25 21:47:342015小元宵徽章
日期:2015-03-06 15:58:18
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-11-27 21:08 |只看该作者 |倒序浏览
1. 内核对中断上下文的定义是什么?
    禁止抢占就可以认为是中断上下文,而不是狭义上的softirq和irq吧。
2. del_timer_sync不能再中断上下文调用?
  1. * Note: For !irqsafe timers, you must not hold locks that are held in
  2. *   interrupt context while calling this function. Even if the lock has
  3. *   nothing to do with the timer in question.  Here's why:
  4. *
  5. *    CPU0                                    CPU1
  6. *    ----                                         ----
  7. *                                                <SOFTIRQ>
  8. *                                              call_timer_fn();
  9. *                                              base->running_timer = mytimer;
  10. *  spin_lock_irq(somelock);
  11. *                                            <IRQ>
  12. *                                              spin_lock(somelock);
  13. *  del_timer_sync(mytimer);
  14. *   while (base->running_timer == mytimer);
  15. *
  16. * Now del_timer_sync() will never return and never release somelock.
  17. * The interrupt on the other CPU is waiting to grab somelock but
  18. * it has interrupted the softirq that CPU0 is waiting to finish.
  19. *
  20. * The function returns whether it has deactivated a pending timer or not.
复制代码
删除定时器就是detach_timer,看内核对del_timer_sync的实现,它没有主动调度,如果按照上面的用法,是会死锁。
但是如果我这样用:

  1. *    CPU0                             CPU1
  2. *    ----                             ----
  3. *                                   <SOFTIRQ>
  4. *                                   call_timer_fn();
  5. *                                     base->running_timer = mytimer;
  6. *  spin_lock_irq(lock_A);
  7. *                                     <IRQ>
  8. *                                        spin_lock(lock_B);
  9. *  del_timer_sync(mytimer);
  10. *   while (base->running_timer == mytimer);
复制代码
保证该锁不会死锁,应该好像也是可以用的?

论坛徽章:
9
辰龙
日期:2014-08-18 20:38:42未羊
日期:2014-09-04 08:50:45丑牛
日期:2014-09-06 00:12:55寅虎
日期:2014-12-22 20:50:56摩羯座
日期:2015-01-14 22:28:15巳蛇
日期:2015-01-23 20:39:272015年辞旧岁徽章
日期:2015-03-03 16:54:1515-16赛季CBA联赛之青岛
日期:2016-03-13 23:37:1915-16赛季CBA联赛之深圳
日期:2016-03-29 18:52:38
2 [报告]
发表于 2014-11-27 22:49 |只看该作者
第一个问题:
关抢占不属于中断上下文。但软硬中断里头都属于中断上下文。原因请见:

#define in_irq()                (hardirq_count())
#define in_softirq()                (softirq_count())
#define in_interrupt()                (irq_count())

#define hardirq_count()        (preempt_count() & HARDIRQ_MASK)
#define softirq_count()        (preempt_count() & SOFTIRQ_MASK)
#define irq_count()        (preempt_count() & (HARDIRQ_MASK | SOFTIRQ_MASK))


我们的判断标准就是in_interrupt()


第二个问题:
还没有想明白,不过:
* Synchronization rules:
1. Callers must prevent restarting of the timer, otherwise this function is meaningless.
2. It must not be called from interrupt contexts.
3. The caller must not hold locks which would prevent  completion of the timer's handler.
4. The timer's handler must not call  add_timer_on().

这4个条件好像要同时满足,你一开始于的这个场景是只这里的第3条。而并不是不能在中段里头用的原因。
反过来证明,在你的场景里头,就算是CPU 0不是在中断里头调用del_timer_sync,死锁也一样会发生。

论坛徽章:
9
辰龙
日期:2014-08-18 20:38:42未羊
日期:2014-09-04 08:50:45丑牛
日期:2014-09-06 00:12:55寅虎
日期:2014-12-22 20:50:56摩羯座
日期:2015-01-14 22:28:15巳蛇
日期:2015-01-23 20:39:272015年辞旧岁徽章
日期:2015-03-03 16:54:1515-16赛季CBA联赛之青岛
日期:2016-03-13 23:37:1915-16赛季CBA联赛之深圳
日期:2016-03-29 18:52:38
3 [报告]
发表于 2014-11-27 23:12 |只看该作者
看到这个贴:https://lkml.org/lkml/2011/6/16/224

突然想明白了。

如果在CPU0 上执行TimerA, 正在执行时,被中断,此时调用del_timer_sync就会自死锁。因为中断不返回,这个TimerA又不可能完成,而不完成,del_timer_sync又不可能返回。要知道__run_timers是在放了锁的情况下去运行Timer的。

论坛徽章:
2
寅虎
日期:2014-11-25 21:47:342015小元宵徽章
日期:2015-03-06 15:58:18
4 [报告]
发表于 2014-11-28 06:33 |只看该作者
本帖最后由 镇水铁牛 于 2014-11-28 06:34 编辑

回复 3# Tinnal
如果在CPU0 上执行TimerA, 正在执行时,被中断,此时调用del_timer_sync就会自死锁。因为中断不返回,这个TimerA又不可能完成,而不完成,del_timer_sync又不可能返回。
【】如果在CPU0 上执行TimerA(在CPU0的软中断处理上下文), 正在执行时,被中断,只有CPU0的硬中断会打断它吧(软中断是不会打断软中断的),理论上不会在硬中断中调用del_timer_sync。其实最关键的是 The caller must not hold locks which would prevent  completion  of the timer's handler.
要知道__run_timers是在放了锁的情况下去运行Timer的。
【】是的,内核在很多中断处理都是开中断和无锁的。

   

论坛徽章:
9
辰龙
日期:2014-08-18 20:38:42未羊
日期:2014-09-04 08:50:45丑牛
日期:2014-09-06 00:12:55寅虎
日期:2014-12-22 20:50:56摩羯座
日期:2015-01-14 22:28:15巳蛇
日期:2015-01-23 20:39:272015年辞旧岁徽章
日期:2015-03-03 16:54:1515-16赛季CBA联赛之青岛
日期:2016-03-13 23:37:1915-16赛季CBA联赛之深圳
日期:2016-03-29 18:52:38
5 [报告]
发表于 2014-11-28 09:16 |只看该作者
本帖最后由 Tinnal 于 2014-11-28 09:17 编辑

回复 4# 镇水铁牛


   
只有CPU0的硬中断会打断它吧(软中断是不会打断软中断的),理论上不会在硬中断中调用del_timer_sync


首先,这不是一个理论,没有去证明。
其次,我们甚至不能假定。
就如https://lkml.org/lkml/2011/6/16/224这个BUG一下。on_each_cpu、smp_call_function等,一个不注意,就已经是硬中断环境了。
另人在函数头明确声明的约束,最好整改一下程序吧,就算现在你想近尽法说它们的这些约束你不涉及,内核的演变也不能保证你永远不涉及,还是尽量不要去违背,https://lkml.org/lkml/2011/6/16/224最终也改了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP