Chinaunix

标题: linux read超时问题 [打印本页]

作者: cgp2001    时间: 2009-06-12 09:37
标题: linux read超时问题
我在用socket,connect连接了http服务器后,用read从上面取网页,发现将所有的数据read完后,好像读取不到结束符,导致read阻塞在那里。我将超时时间设为1分钟,大部分都在接近1分钟的时候才结束,有些还超时了,而实际上读取数据时间不超过10秒,这是什么原因呢?
作者: ideawu    时间: 2009-06-12 10:34
你是怎么判断结束符的? 你认为HTTP报文的结束符*是什么*?
作者: eveson    时间: 2009-06-12 10:36
当read到字符个数为0时结束就可以了。
作者: bobozhang    时间: 2009-06-12 10:48
强烈建议楼主买一本unix network programming来看,这样你才能系统的学习网络编程,要不然进步很慢

PS:
呵呵,买书的时候也不反对到我的论坛签名的网站上去通过那个当当网连接过去买,哈哈,我可得到3块钱的提成
作者: cgp2001    时间: 2009-06-12 11:18
bool bSuc = false;
        while(1)
        {
                fd_set rset;
                FD_ZERO(&rset);
                FD_SET(m_sktLink,&rset);
                struct timeval tv;
                tv.tv_sec = 60;
                tv.tv_usec = 0;
                int ret = select(m_sktLink+1,&rset,NULL,NULL,&tv);
                if(ret < 0)
                {
                        m_ofsLog<<"select error:"<<GetCurTime()<<endl;
                        break;
                }
                else if(ret == 0)
                {
                        m_ofsLog<<"timeout:"<<GetCurTime()<<endl;
                        break;
                }
                else if(FD_ISSET(m_sktLink,&rset))
                {
                        n = read(m_sktLink,ch,sizeof(ch)-1);
                        if(n == 0)
                        {
                                bSuc = true;
                                break;
                        }
                        ch[n] = 0;
                        m_ofsLog<<"reading "<<++times<<" :"<<GetCurTime()<<endl;
                        m_strPageContent += ch;
                }
        }
我的代码大概是这样子的,由于1分钟描述符没有准备好,超时了。
实际上我抓了很多网页,开始时速度很快,速度能有50K/s左右,现在只有23K/s左右了。
作者: flynetcn    时间: 2009-06-12 11:21
服务器是什莫时候断开链接的?然后客户端接到EOF结束符又过了多长时间呢?
作者: bobozhang    时间: 2009-06-12 11:25
n = read(m_sktLink,ch,sizeof(ch)-1);
                        if(n == 0)
                        {
                                bSuc = true;
                                break;
                        }
                        ch[n] = 0;
                        m_ofsLog<<"reading "<<++times<<" :"<<GetCurTime()<<endl;
                        m_strPageContent += ch;


这里有问题,万一 n== -1 呢,但这里的问题不一定是你说的问题的问题
作者: cgp2001    时间: 2009-06-12 11:31
如果n==-1,这一行: m_ofsLog<<"reading "<<++times<<" :"<<GetCurTime()<<endl;
应该有输出,而实际上可能输出
reading  12    11:26:12
time out     11:27:12
也就是读了12次之后,等一分钟,既没有接到数据,也没有接到结束符,超时了,中间也没有出现n==-1的情况。
我觉得如果服务器断开了,它不会阻塞在select那里啊。




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2