免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 5219 | 回复: 11
打印 上一主题 下一主题

perl 网页提取问题(cookie) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-05-05 09:46 |只看该作者 |倒序浏览
题,要提取网页内容,先从一个页面开始,获得cookie,然后访问该网页上的一些列提供的连接,
大致程序如下:
use LWP::UserAgent;
use HTTP::Cookies;
my $ua = LWP::UserAgent->new;  
my $cookie_jar = HTTP::Cookies->new( );
$ua->cookie_jar($cookie_jar);
my $request = HTTP::Request->new(GET => $url1);
my $response = $ua->request($request);
$cookie_jar->extract_cookies($response);  
$ua->cookie_jar($cookie_jar);
$request = HTTP::Request->new(GET => $url2);
$cookie_jar->add_cookie_header($request);
my $response = $ua->request($request);   
my $content = $response->content();   
print "$content";


应该是在访问url2已经上传了cookie,可是可能在url2页面在初始化的时候,有个javascript检测浏览器是否支持cookies,那些语言如下
var cookieEnabled = (navigator.cookieEnabled)
  if (typeof navigator.cookieEnabled == "undefined" && !cookieEnabled) {
    document.cookie = "testcookie"
    cookieEnabled = (document.cookie.indexOf("testcookie") != -1)
  }
  if (!cookieEnabled) {
    alert('You must enable cookie support for your browser to use this site.');
    putSessionAttribute("cookieEnabled", "no");
  } else {
    putSessionAttribute("cookieEnabled", "yes");
  }

有没有方法绕过这个javascipt啊,我也试用了$ua->agent('Mozilla/5.0'); 但也不好使,帮帮忙!

谢谢了

论坛徽章:
0
2 [报告]
发表于 2009-05-05 10:16 |只看该作者
怎么没人回答,在线等,急待解决啊~~

论坛徽章:
0
3 [报告]
发表于 2009-05-05 10:30 |只看该作者
啥网站?
您写的太复杂了

论坛徽章:
0
4 [报告]
发表于 2009-05-05 10:32 |只看该作者
LWP::UserAgent没有分析JS的引擎 想想~~

论坛徽章:
0
5 [报告]
发表于 2009-05-05 10:47 |只看该作者
可能是我笨 看不出和javascript有什么关系
你提你的网页不好么, 为什么要管javascrip

论坛徽章:
0
6 [报告]
发表于 2009-05-05 10:53 |只看该作者

论坛徽章:
0
7 [报告]
发表于 2009-05-05 10:57 |只看该作者

回复 #4 hfahe 的帖子

希望你能想出个办法来

论坛徽章:
0
8 [报告]
发表于 2009-05-05 11:02 |只看该作者

回复 #5 DQP 的帖子

可能我没描述好,自己理解也不怎么深,共同学习~~

论坛徽章:
0
9 [报告]
发表于 2009-05-05 11:05 |只看该作者
现在是cookie没有生效?

论坛徽章:
3
戌狗
日期:2014-09-10 17:07:162015年辞旧岁徽章
日期:2015-03-03 16:54:15wusuopu
日期:2016-06-17 17:43:45
10 [报告]
发表于 2009-05-05 13:06 |只看该作者
好像浏览那个网站需要支持Javascript
<div id="checkJS" class="checkJavascript">
  Javascript is not enabled on this browser. This site will not work properly without Javascript.
</div>
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP