Chinaunix's Archiver
论坛
›
网络技术
› 请问实现对网页信息进行抓取的方法都有些什么?分别用什么语言实现?
antidarkness
发表于 2014-03-24 07:35
请问实现对网页信息进行抓取的方法都有些什么?分别用什么语言实现?
例如:
1.对某个特定网页每天更新的链接;
2.以及对网页的表格进行抓取;
3.另外对需要输入用户名跟密码之后进入的界面,当被用户授权后,该如何进行抓取;
4.再就是对不同网页内核是否有实现方式上的区分(如IE与webkit)
cryboy2001
发表于 2014-03-27 10:04
你要写“网络爬虫”
到网上搜一下“网络爬虫”了解一下。
stduolc
发表于 2014-04-01 09:55
python或者go写起来都很快。perl我不会,但是应该也可以。
页:
[1]
查看完整版本:
请问实现对网页信息进行抓取的方法都有些什么?分别用什么语言实现?