免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: redor
打印 上一主题 下一主题

分布式定向采集系统ispider发布 [复制链接]

论坛徽章:
0
51 [报告]
发表于 2010-01-05 22:04 |只看该作者
牛人,力挺啊

论坛徽章:
0
52 [报告]
发表于 2010-01-05 23:51 |只看该作者
呵呵,来围观~~~

这是做什么用的,完全不懂的说……

论坛徽章:
0
53 [报告]
发表于 2010-01-06 10:02 |只看该作者
不错,很强大,
抓取模板确实不好配,主要是有些网站经常变动
突然某一天抓的数据特别少的时候,就是网站变了
纯用socket自己发送请求,麻烦了点吧,这个应该有库可以用的
不过自己写也是一种锻炼啊
楼主英明

论坛徽章:
0
54 [报告]
发表于 2010-01-06 11:08 |只看该作者
原帖由 aychxm 于 2010-1-6 10:02 发表
不错,很强大,
抓取模板确实不好配,主要是有些网站经常变动
突然某一天抓的数据特别少的时候,就是网站变了
纯用socket自己发送请求,麻烦了点吧,这个应该有库可以用的
不过自己写也是一种锻炼啊
楼主英明



我有线程的socket 通信的封装 很简单的

论坛徽章:
0
55 [报告]
发表于 2010-01-06 11:09 |只看该作者
原帖由 GodPig 于 2010-1-5 23:51 发表
呵呵,来围观~~~

这是做什么用的,完全不懂的说……



抓页面用的

论坛徽章:
0
56 [报告]
发表于 2010-01-06 11:23 |只看该作者
LZ是纯用socket发送请求获取页面信息的么?这些“请求”有标准么?

论坛徽章:
0
57 [报告]
发表于 2010-01-06 11:38 |只看该作者
原帖由 yyoc 于 2010-1-6 11:23 发表
LZ是纯用socket发送请求获取页面信息的么?这些“请求”有标准么?


当然有标准

HTTP/1.0 HTTP/1.1 rfc2616

论坛徽章:
0
58 [报告]
发表于 2010-01-07 16:29 |只看该作者

回复 #57 redor 的帖子

楼主 真是个牛人 学习 学习!

论坛徽章:
0
59 [报告]
发表于 2011-08-02 17:03 |只看该作者
应该会是很好的学习程序

论坛徽章:
0
60 [报告]
发表于 2011-08-04 11:00 |只看该作者
牛,这个项目用来学习不错
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP