免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123
最近访问板块 发新帖
楼主: wwdwwd
打印 上一主题 下一主题

[C] 为什么我明明设置了递归锁,但是锁的时候还是死锁了呢? [复制链接]

论坛徽章:
0
21 [报告]
发表于 2010-05-27 18:04 |只看该作者
回复  wwdwwd


    百思不得其解。。。。
rain_fish 发表于 2010-05-27 14:15


百思不得其解too!

论坛徽章:
0
22 [报告]
发表于 2010-05-28 00:00 |只看该作者
本帖最后由 wwdwwd 于 2010-05-28 00:08 编辑

ptack 后出现这样的结果,这能说明什么问题呢?看样子应该是main函数调用pthread_mutex_lock时被信号打断,然后在信号处理函数prompt_info中执行pthread_mutex_lock ()的时候一层一层的调用时出现问题了,但是如果不是由settimer发信号,而是手动给进城发信号就没有问题,崩溃啊!
#0  0x00c76410 in __kernel_vsyscall ()
#1  0x00316a4e in __lll_mutex_lock_wait () from /lib/libpthread.so.0
#2  0x003128c4 in _L_mutex_lock_760 () from /lib/libpthread.so.0
#3  0x00312768 in pthread_mutex_lock () from /lib/libpthread.so.0
#4  0x08048646 in prompt_info ()
#5  <signal handler called>
#6  0x00312762 in pthread_mutex_lock () from /lib/libpthread.so.0
#7  0x08048756 in main ()


另外:ltrace的时候经常发生这样的错误:
Error: call nesting too deep!

论坛徽章:
0
23 [报告]
发表于 2010-05-28 01:09 |只看该作者
多线程的程序不要依赖信号,Linux对多线程和信号的同时支持不是很好。
信号是对进程的,每个线程都有机会处理信号,无法确定是哪个线程。如果一定要用信号,不处理信号的线程要设置一下信号mask,查pthread_sigmask()函数。

我的多线程程序,除了退出信号交给主线程处理外,一上来都是先屏蔽各种信号的。

论坛徽章:
0
24 [报告]
发表于 2010-05-28 08:29 |只看该作者
多线程的程序不要依赖信号,Linux对多线程和信号的同时支持不是很好。
信号是对进程的,每个线程都有机会处 ...
没本 发表于 2010-05-28 01:09

我理解你的意思,我在写多线程程序时也是这么做的,但我上面的程序不是多线程程序,是单线程的,就很奇怪了,看样子应该是pthread_mutex_lock函数不可重入导致的.

论坛徽章:
0
25 [报告]
发表于 2010-05-28 11:31 |只看该作者
回复 24# wwdwwd


    信号处理函数的忌讳还是蛮多的,可能是你的mutex犯了它的某条忌讳了吧。

  1. $ man sigaction
  2. ...
  3.        In order to prevent errors arising from interrupting  non-
  4.        reentrant  function  calls,  applications  should  protect
  5.        calls to these functions either by blocking the  appropri‐
  6.        ate  signals or through the use of some programmatic sema‐
  7.        phore (see semget(), sem_init(), sem_open(), and  so  on).
  8.        Note in particular that even the "safe" functions may mod‐
  9.        ify errno; the signal-catching function, if not  executing
  10.        as an independent thread, may want to save and restore its
  11.        value. Naturally, the same principles apply to  the  reen‐
  12.        trancy  of  application  routines  and  asynchronous  data
  13.        access. Note that longjmp() and siglongjmp()  are  not  in
  14.        the list of reentrant functions.  This is because the code
  15.        executing after longjmp() and siglongjmp()  can  call  any
  16.        unsafe  functions  with  the  same danger as calling those
  17.        unsafe functions directly from the signal handler.  Appli‐
  18.        cations  that  use  longjmp() and siglongjmp() from within
  19.        signal handlers require rigorous protection in order to be
  20.        portable.  Many  of  the other functions that are excluded
  21.        from the list are traditionally implemented  using  either
  22.        malloc()  or free() functions or the standard I/O library,
  23.        both of which traditionally use data structures in a  non-
  24.        reentrant manner. Since any combination of different func‐
  25.        tions using a common data structure can  cause  reentrancy
  26.        problems,  this  volume  of  IEEE Std 1003.1-2001 does not
  27.        define the behavior when any unsafe function is called  in
  28.        a signal handler that interrupts an unsafe function.

复制代码

论坛徽章:
0
26 [报告]
发表于 2010-05-28 14:02 |只看该作者
经过两天的折腾,总结一下:
1:pthread_mutex_lock(&_mutex); 这个函数调用因为使用了全局变量_mutex所以是不可重入的,在信号处理函数中再次调用pthread_mutex_lock(&_mutex)时就会出现问题,具体内部我猜想是这样的:如果说pthread_mutex_lock函数执行完毕了,然后收到信号并处理的话这样不会出现问题,因为锁是递归锁;现在pthread_mutex_lock函数没有执行完毕的时候收到信号并处理(见pstack的结果),此时的某些内部数据可能有一半处理好了,一半没有处理好,在信号处理函数中再次调用pthread_mutex_lock时可能就检查到死锁了,这时可能认为这个锁不是递归锁,因为内部数据不完整了,判断就有可能发生错误。如果在单独的线程中处理信号则不会出现死锁,这是因为这里的死锁是因为多次锁造成的,不同线程锁同一个锁时不会产生死锁,只会等待;
2:虽然pthread_mutex_lock使用了全局变量,但事实上他是线程安全的,因为不是所有的使用全局变量的函数都不是线程安全,pthread_mutex_lock函数本身在线程安全方面会做保证。
3:在freebsd下面不会发生死锁,说明freebsd这块儿的实现比linux要好一些;
4:在主函数中调用pthread_mutex_lock和pthread_mutex_unlock时阻塞信号也不会产生死锁,这证明了上面的猜想。另外如果在pthread_mutex_lock和pthread_mutex_unlock中间有printf函数的话还是会出现死锁,这应该是因为printf调用了puts,puts本身用到锁了。

带信号阻塞的代码如下:
  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <pthread.h>
  4. #include <sys/time.h>
  5. #include <stdio.h>
  6. #include <unistd.h>
  7. #include <signal.h>
  8. #include <string.h>
  9. #include <errno.h>

  10. pthread_mutex_t _mutex;
  11. pthread_mutexattr_t _attr;

  12. void prompt_info(int signo)
  13. {
  14.         pthread_mutex_lock(&_mutex);
  15.         printf("in signal\n");
  16.         pthread_mutex_unlock(&_mutex);
  17. }
  18. // 建立信号处理机制
  19. void init_sigaction(void)
  20. {
  21.     struct sigaction tact;
  22.    
  23.     /*信号到了要执行的任务处理函数为prompt_info*/
  24.     tact.sa_handler = prompt_info;
  25.     tact.sa_flags = SA_RESTART|SA_NODEFER;
  26.     tact.sa_flags = 0;
  27.     /*初始化信号集*/
  28.     sigemptyset(&tact.sa_mask);
  29.     /*建立信号处理机制*/
  30.     sigaction(SIGALRM, &tact, NULL);
  31. }
  32. void init_time()
  33. {
  34.     struct itimerval value;
  35.    
  36.     /*设定执行任务的时间间隔*/
  37.     value.it_value.tv_sec = 0;
  38.     value.it_value.tv_usec = 1;
  39.     /*设定初始时间计数*/
  40.     value.it_interval = value.it_value;
  41.     /*设置计时器ITIMER_REAL*/
  42.     setitimer(ITIMER_REAL, &value, NULL);
  43. }


  44. int main()
  45. {
  46.     pthread_mutexattr_init(&_attr);
  47.     pthread_mutexattr_settype(&_attr,PTHREAD_MUTEX_RECURSIVE);
  48.     pthread_mutex_init(&_mutex, &_attr);
  49.     init_sigaction();
  50.     init_time();
  51.         int ret;
  52.         sigset_t bset,oset;
  53.         sigemptyset(&bset);
  54.         sigaddset(&bset, SIGALRM);

  55.         while ( 1 ) {
  56.                 pthread_sigmask(SIG_SETMASK, &bset, &oset);
  57.                 ret = pthread_mutex_lock(&_mutex);
  58.                 pthread_sigmask(SIG_SETMASK, &oset, NULL);
  59.            if(0!= ret) {
  60.                 printf("lock  error in main is %d\n",errno);
  61.                 perror("error info is ");
  62.                 }else {   
  63.                         //printf("in main\n");
  64.                 pthread_sigmask(SIG_SETMASK, &bset, &oset);
  65.                 pthread_mutex_unlock(&_mutex);
  66.                 pthread_sigmask(SIG_SETMASK, &oset, NULL);
  67.         }
  68.     }
  69.     return 0;
  70. }
复制代码

论坛徽章:
0
27 [报告]
发表于 2010-05-28 14:06 |只看该作者
多谢楼上各位的帮助,我还是老实的开一个单独的线程来处理信号吧。之前不想这么做的原因是:我们的程序本来是在windows下的,现在要改到linux下。windows下的settimer也是在当前线程处理的,如果我单独起一个线程处理信号的话,因为我们在信号处理函数中处理了几乎所有的逻辑,我就得挨个函数的检查看有没有线程安全,死锁之类的,oh my god,^_^

论坛徽章:
0
28 [报告]
发表于 2010-05-28 14:08 |只看该作者
你可以想办法保持信号处理函数的简单,把要处理的事件放入事件队列就立即返回,由单独线程来处理事件。

论坛徽章:
0
29 [报告]
发表于 2010-05-28 14:12 |只看该作者
你可以想办法保持信号处理函数的简单,把要处理的事件放入事件队列就立即返回,由单独线程来处理事件。
没本 发表于 2010-05-28 14:08

那跟单独开一个线程处理信号一样了,对吧
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP