antidarkness 发表于 2014-03-24 07:35

请问实现对网页信息进行抓取的方法都有些什么?分别用什么语言实现?

例如:
1.对某个特定网页每天更新的链接;
2.以及对网页的表格进行抓取;
3.另外对需要输入用户名跟密码之后进入的界面,当被用户授权后,该如何进行抓取;
4.再就是对不同网页内核是否有实现方式上的区分(如IE与webkit)

cryboy2001 发表于 2014-03-27 10:04

你要写“网络爬虫”
到网上搜一下“网络爬虫”了解一下。

stduolc 发表于 2014-04-01 09:55

python或者go写起来都很快。perl我不会,但是应该也可以。
页: [1]
查看完整版本: 请问实现对网页信息进行抓取的方法都有些什么?分别用什么语言实现?