免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3316 | 回复: 5
打印 上一主题 下一主题

奇想,想写个小爬虫,求助 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-12-08 15:36 |只看该作者 |倒序浏览
本人奇想通过shell写个小的爬虫,其实最简单的,
现在取到值是
http://www.tudou.com/programs/view/QsvpZCzQn2s/
http://www.tudou.com/programs/view/rjfJUx5_O1o/
是土豆网的视频把真实的地址隐藏了
但是可以通过
http://www.flvcd.com/
把真实的地址找出来
http://221.233.135.133/flv/024/5 ... ed3b2d9b8bf493ccdb0
http://61.55.161.9/flv/024/563/3 ... d687335ba1b493ccde9

我在这里卡住了

我怎么通过links 通过访问
http://www.flvcd.com/
把我需要的值
http://www.tudou.com/programs/view/QsvpZCzQn2s/
添进去并提交
然后通过
grep把
结果的值取出来呢?

谢谢各位了


不是这样哦
现在有点思路了
就是 直接 访问
links  http://www.flvcd.com/parse.php?+ ... s/view/QsvpZCzQn2s/
只要格式对就可以得出我要的结果了
不过有人能帮我看下怎么转换格式吗
http://www.tudou.com/programs/view/fQ_cjxetdY0/
的请求url是
http://www.flvcd.com/parse.php?k ... xetdY0%2F&flag=

知道怎么转换吗

[ 本帖最后由 wmtytyty 于 2008-12-8 17:28 编辑 ]

论坛徽章:
1
2015年亚洲杯之韩国
日期:2015-04-24 09:07:02
2 [报告]
发表于 2008-12-08 15:47 |只看该作者
什么是小爬虫?

论坛徽章:
0
3 [报告]
发表于 2008-12-08 15:50 |只看该作者
原帖由 biglazybug 于 2008-12-8 15:47 发表
什么是小爬虫?


用过网络蚂蚁没?

论坛徽章:
1
2015年亚洲杯之韩国
日期:2015-04-24 09:07:02
4 [报告]
发表于 2008-12-08 15:51 |只看该作者

回复 #3 smallstar001 的帖子

就用过flashget

[ 本帖最后由 biglazybug 于 2008-12-8 15:53 编辑 ]

论坛徽章:
0
5 [报告]
发表于 2008-12-08 16:02 |只看该作者
原帖由 biglazybug 于 2008-12-8 15:51 发表
就用过flashget


也行,老板本的 flashget那个下载进度像不像一个小虫子再爬

论坛徽章:
1
2015年亚洲杯之韩国
日期:2015-04-24 09:07:02
6 [报告]
发表于 2008-12-08 16:21 |只看该作者

回复 #5 smallstar001 的帖子

哦 那个呀 就是密密麻麻的小点子 走进度那个呗
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP