免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5202 | 回复: 8
打印 上一主题 下一主题

有没有办法读出HTTP包头? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2007-07-28 11:43 |只看该作者 |倒序浏览
使用socket模块,好像只能读定长数据,但是HTTP包头是变长的,我需要去掉HTTP包头,读他的数据。

论坛徽章:
0
2 [报告]
发表于 2007-07-29 09:40 |只看该作者
看来有点难度,顶上去

论坛徽章:
0
3 [报告]
发表于 2007-07-29 10:46 |只看该作者
有很多办法能读出HTTP的头。

比方说Py的urllib类库。比方说Firefox就有一个显示HTTP头的插件。

如果实在不行,还有一个杀鸡的牛刀,sniffer。ethereal是我用过的最好的。

论坛徽章:
0
4 [报告]
发表于 2007-07-29 15:29 |只看该作者
不是有httplib吗?如果你只是要读数据,不是有urllib和urlib2吗?

论坛徽章:
0
5 [报告]
发表于 2007-08-01 10:53 |只看该作者
第一个空行做分界阿, 上面的是包头,下面的是内容
xyxwangkai 该用户已被删除
6 [报告]
发表于 2009-02-04 17:04 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
7 [报告]
发表于 2009-02-19 17:05 |只看该作者
conn = httplib.HTTPConnection(host)
conn.request("HEAD",url)
resp = conn.getresponse()

不知道是不是你想要的

论坛徽章:
0
8 [报告]
发表于 2009-02-19 17:35 |只看该作者
用正则

论坛徽章:
0
9 [报告]
发表于 2009-03-17 11:29 |只看该作者

回复 #1 didida1975 的帖子

6楼正解,
我不知道python有没有可以直接用的函数,不过如6楼所说,“\r\n\r\n”是HTTP包头部结束的标志,后面既是HTTP数据:
/*********************************************
        说明:  获取buf与后面第一个\r\n\r\n
                  结尾处 之间字节数          
        返回值:成功  字节数
                  -1    未找到\r\n\r\n
        参数1: 数据起始地址
        参数2: 数据长度
*********************************************/
size_t str_find_rnrn(void * buf, size_t len) {
        int i, tmp_len;
        tmp_len = len - 4;
        for(i = 0; i < len; i++) {
                if(*(uint32_t *)(buf+i) == 168626701) {
                        return i+4;
                }      
        }      
        return -1;
}

返回的结果为http头部到数据部分的长度,buf+返回值 就是http数据起始位置
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP