免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1895 | 回复: 3
打印 上一主题 下一主题

socket 读取http奇怪的多读了一些0和其它的数字 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2007-09-17 11:21 |只看该作者 |倒序浏览
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
#include <sys/socket.h>
#include <netdb.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <error.h>
#include <errno.h>

extern int h_errno;

int main(void)
{
        int sockfd;
        int readn;
        char http_head[1000];
        struct sockaddr_in server;
        struct hostent *h;

        if((h=gethostbyname("hi.baidu.com"))==NULL)
        {
                fprintf(stderr,"gethostbyname error ");
                exit(1);
        }

        bzero(&server,sizeof(server));
        server.sin_family=AF_INET;
        server.sin_port=htons(80);

        memcpy(&server.sin_addr,h->h_addr,h->h_length);

        if((sockfd=socket(AF_INET,SOCK_STREAM,0))<0)
        {
                fprintf(stderr,"socket error %s\n",strerror(errno));
                exit(1);
        }

        if((connect(sockfd,(struct sockaddr*)&server,sizeof(struct sockaddr_in)))<0)
        {
                fprintf(stderr,"connect error %s\n",strerror(errno));
                exit(1);

        }
        sprintf(http_head,"GET /phps/rss HTTP/1.1\r\n"
                                        "Host: hi.baidu.com\r\n"
                                        "User-Agent: Mozilla/5.0 (X11; U; Linux i686; zh-CN; rv:1.8.1.6) Gecko/20070723 Iceweasel/2.0.0.6 (Debian-2.0.0.6-0etch1)\r\n"
                                        "Accept: text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5\r\n"
                                        "Accept-Language: zh-cn,zh;q=0.5\r\n"
                                        "Accept-Charset: gb2312,utf-8;q=0.7,*;q=0.7\r\n"
                                        "Connection: Close\r\n\r\n");
        write(sockfd,http_head,strlen(http_head));
        memset(http_head,'\0',1000);
        while(readn=read(sockfd,http_head,1000))
        {
                printf("%s",http_head);
                //printf("%d\n",readn);
                memset(http_head,'\0',1000);
        }


}

论坛徽章:
0
2 [报告]
发表于 2007-09-17 11:25 |只看该作者
http 1.1支持chunked的Transfer-Encoding
具体看RFC
一个偷懒的办法就是把请求头改成HTTP/1.0

论坛徽章:
0
3 [报告]
发表于 2007-09-17 11:31 |只看该作者
呵呵 确实,谢谢了

论坛徽章:
0
4 [报告]
发表于 2007-09-17 11:47 |只看该作者
再多下嘴,现在web上大多是动态内容,使用chunked Transfer-Encoding传输,服务端就可以一边生成内容一边发送给客户端。而HTTP 1.0就不能,所以比较慢。
对于多个请求,使用HTTP 1.1还能得到持久连接和流水线的好处,所以推荐使用1.1
当然这些功能一般不是自己实现,用libcurl就可以了。
要是不嫌慢的话, perl的LWP和python的urllib2也很棒。
虽然perl/python都提供curl的封装,用起来不那么地道就是了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP