免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2096 | 回复: 1
打印 上一主题 下一主题

分析HTML::Parser模块 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-03-15 18:15 |只看该作者 |倒序浏览
大侠们帮忙分析一下以下代码都是什么意思?谢谢了,看完一些英文文档还是不怎么明白。
use HTML:arser ();

  sub start_handler
  {
    return if shift ne "title";
    my $self = shift;
    $self->handler(text => sub { print shift }, "dtext";
    $self->handler(end  => sub { shift->eof if shift eq "title"; },
                           "tagname,self";
  }

  my $p = HTML:arser->new(api_version => 3);
  $p->handler( start => \&start_handler, "tagname,self";
  $p->parse_file(shift || die) || die $!;
  print "\n";

论坛徽章:
7
巳蛇
日期:2014-04-10 08:54:57白羊座
日期:2014-04-22 20:06:262015年亚洲杯之沙特阿拉伯
日期:2015-02-10 14:18:532015年辞旧岁徽章
日期:2015-03-03 16:54:152015亚冠之吉达阿赫利
日期:2015-06-02 11:34:112015亚冠之武里南联
日期:2015-06-24 12:13:082015亚冠之阿尔纳斯尔
日期:2015-08-03 09:08:25
2 [报告]
发表于 2011-03-15 18:28 |只看该作者
回复 1# Dragon_yao

你只用知道 HTML:arser 的工作原理就够了,其实很简单(如果你对 Perl 本身不熟,那你还是找别人解释吧)。
简单的说,HTML:arser 分析 HTML 文件的时候,可以指定三个 handler,分别用来处理开标签,文本和闭标签。Over.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP