- 论坛徽章:
- 0
|
情况是这样的:
程序是一个服务端,接受客户端连接请求后fork一个进程,poll 的代码如下
size_t doread(char *buf, size_t bufsiz)
{
struct pollfd fdarray[1];
fd_set fds;
struct timeval tv;
time_t t;
int n = 0;
int ret, err;
time(&t);
if (t >= readtimeout) disconnected_timeout();
loop:
memset(fdarray, 0, sizeof(struct pollfd));
fdarray[0].fd = imap_server_msgsock;
fdarray[0].events = POLLIN | POLLHUP | POLLNVAL | POLLERR | POLLRDHUP;
if((ret = poll(fdarray, 1, (readtimeout-t)*1000)) <= 0)
{
if(ret == 0)
syslog(LOG_INFO, "poll timeout");
if(ret < 0)
syslog(LOG_INFO, "poll err:%s", strerror(errno));
err = errno;
disconnected_timeout();
return (0);
}
if ((fdarray[0].revents & POLLIN) && (fdarray[0].fd == imap_server_msgsock) && (n=read(imap_server_msgsock, buf, bufsiz)) > 0)
{
if ( n > 0 )
bytes_received_count += n; /* count received bytes */
return (n);
}
else{
disconnected();
return (0);
}
}
现在问题是,客户端连接大约500左右,也就是创建进程500.poll的超时时间是5分钟,现在ps发现有的进程存在了2个小时,用gdb查看发现是死在这个函数的poll中,按照理论来说5分钟poll没有事件,就会超时退出,但是poll没有退出。
请高手或者有过类似情况的仁兄帮忙分析一下原因,是不是什么信号或者事件没设置还是什么其他的,多谢了 |
|