免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2137 | 回复: 7
打印 上一主题 下一主题

网页操作求助 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-03-15 21:57 |只看该作者 |倒序浏览
我想在下面这个(http://bigg.ucsd.edu/bigg/main.pl)网站上提交数据(如“ALD6”),然后跳转到另一页面(http://bigg.ucsd.edu/bigg/post.pl),点击链接能到最后的页面,抓取我需要的数据。
我试着写了一段代码,但是POST上数据后,得到的$res是乱码,请问是什么情况?谢谢!
  1. #!/usr/bin/perl

  2. use HTTP::Request::Common qw(POST);
  3. use WWW::Mechanize;
  4. use LWP::UserAgent;

  5. # Launch the WWW::Mechanize browser
  6. my $mech=WWW::Mechanize->new(autocheck=>1);

  7. # Fetch a page
  8. my $url='http://bigg.ucsd.edu/bigg/main.pl/';
  9. $mech->get($url);

  10. # Post paramaters
  11. my $req = POST($url,
  12.                 organism=>'222668',
  13.                 is_associated=>'yes',
  14.                 is_associated=>'no',
  15.                 is_translocation=>'yes',
  16.                 is_translocation=>'no',
  17.                 exchanges=>'yes',
  18.                 exchanges=>'no',
  19.                 reversibility=>'Reversible',
  20.                 reversibility=>'Irreversible',
  21.                 confidence=>'not evaluated',
  22.                 confidence=>'modeling evidence',
  23.                 confidence=>'biological evidence',
  24.                 locus_text=>'ALD6',
  25.                 "\.submit"=>'Find Reactions',
  26.         );
  27.        
  28. my $res=$mech->request($req);

  29. sleep(10);

  30. if ($res->is_success) {
  31.         print "Bingo!\n";
  32. }else{
  33.         print $res->status_line,"\n";
  34.         print $res->message;
  35. };

  36. my $b=$res->content();       
  37. open (LOG, ">>1.txt");
  38. print LOG $b;
  39.                
复制代码

论坛徽章:
0
2 [报告]
发表于 2013-03-19 09:42 |只看该作者
是不是因为跳转之后的页面有图片?图片无法输出到txt文件中,所以乱码?我试了你说的ALD6,有两个问号是png格式的。

论坛徽章:
0
3 [报告]
发表于 2013-03-19 19:42 |只看该作者
回复 2# picbhan
嗯,那这种情况应该怎么解决呢?


   

论坛徽章:
0
4 [报告]
发表于 2013-03-19 21:29 |只看该作者
回复 3# Weiping_Zhang


    建议你好好看看这个帖子,应该能解决你的问题。
LWP

论坛徽章:
0
5 [报告]
发表于 2013-03-20 09:23 |只看该作者
回复 4# picbhan
好的,谢谢!

   

论坛徽章:
0
6 [报告]
发表于 2013-03-20 20:32 |只看该作者
$ file 1.txt
1.txt: gzip compressed data, from Unix

论坛徽章:
0
7 [报告]
发表于 2013-03-20 20:36 |只看该作者
解压后貌似还是原来的网页

1.zip

5.38 KB, 下载次数: 5

论坛徽章:
0
8 [报告]
发表于 2013-03-21 21:34 |只看该作者
post的内容还是不对!!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP