免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2773 | 回复: 4
打印 上一主题 下一主题

急 perl提取网页内容 [复制链接]

论坛徽章:
0
1 [报告]
发表于 2009-02-20 14:25 |只看该作者
my ($city) = ($data =~ /<a href=\"\/city\/57036_full\.html\" target=\"_blank\" class=\"fb14\">(.*?)<\/a>/m);
&nbsp;&nbsp;&nbsp;&nbsp;my ($weather, $temp) = ($data =~ /<td width=\"109\" align=\"center\">(.*?) \| (.*?)<\/td>/m);
&nbsp;&nbsp;&nbsp;&nbsp;print $city, "
\n", $weather, "\n", $temp, "\n

$data是html源码,不知道能不能满足你要求,还是要根据具体标签特征来抽取吧。

论坛徽章:
0
2 [报告]
发表于 2009-02-20 15:00 |只看该作者
可以的!太牛B了,刚接触perl很强大!谢谢你了

论坛徽章:
0
3 [报告]
发表于 2009-02-20 15:03 |只看该作者
#!/usr/bin/perl
while(<>){
   chomp;
   if(/<a[^<]*>([^<]*)</||/<td[^<]*>([^<]*)</){
      print "$1";
}
}
print "\n"

论坛徽章:
3
戌狗
日期:2014-09-10 17:07:162015年辞旧岁徽章
日期:2015-03-03 16:54:15wusuopu
日期:2016-06-17 17:43:45
4 [报告]
发表于 2009-02-20 15:19 |只看该作者
原帖由 justlooks 于 2009-2-20 15:03 发表
#!/usr/bin/perl
while(){
   chomp;
   if(/

这个有点抽象
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP