免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3872 | 回复: 4
打印 上一主题 下一主题

写个爬虫是用php还是perl? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-03-22 13:51 |只看该作者 |倒序浏览
大家好,
我现在要写爬虫程序,功能是抓取一些电子商务网站的商品信息,并且要监控它们价格的变动。
现在犹豫的是,不知道是php还是用perl来写这个脚本合适。
有经验的朋友给点意见吧。

论坛徽章:
27
水瓶座
日期:2014-08-22 21:06:34程序设计版块每日发帖之星
日期:2015-11-25 06:20:0015-16赛季CBA联赛之新疆
日期:2015-12-19 19:05:48IT运维版块每日发帖之星
日期:2015-12-25 06:20:31IT运维版块每日发帖之星
日期:2015-12-25 06:20:31IT运维版块每日发帖之星
日期:2015-12-25 06:20:3315-16赛季CBA联赛之上海
日期:2016-04-15 19:51:31程序设计版块每日发帖之星
日期:2016-04-17 06:23:29程序设计版块每日发帖之星
日期:2016-04-23 06:20:00程序设计版块每日发帖之星
日期:2016-05-26 06:20:00每日论坛发贴之星
日期:2016-05-26 06:20:0015-16赛季CBA联赛之辽宁
日期:2017-02-16 23:59:47
2 [报告]
发表于 2011-03-22 15:22 |只看该作者
用你擅长的来写

论坛徽章:
0
3 [报告]
发表于 2011-03-22 19:38 |只看该作者
用perl

1 perl有多线程机制
2 perl的正则处理要方便一点
3 php是插件机制,只适合处理短时的请求,不是为后台长时间运行设计的
4 perl爬虫方面现成的类库比较多,解析html的模块也比较成熟

论坛徽章:
0
4 [报告]
发表于 2011-03-23 09:23 |只看该作者
回复 3# yakczh


    楼上,能提供参考资料吗。谢谢哈!!!

论坛徽章:
0
5 [报告]
发表于 2011-03-23 15:56 |只看该作者
现在做爬虫还用正则吗?out了。

建议用支持CSS3/XPath selector那样的包,因为你可以使用类似jquery那样的语法去分析页面,
很爽的。

cpan 搜索xpath, css3能够一堆。

上月我还用过Mojo. Mojo的xpath相对弱一些,但是如果够用也就行了,我是看上他的
异步IO和连接池。

你可以试试其他的。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP