各位帮忙看一下这个程序。 我想从博客里提取作者的信息输出到文件weblist.txt。 博客地址分别是: http://roll.finance.sina.com.cn/blog/blogarticle/inde_1.shtml … weblist.txt要这样的结果: 芥阳 麻麻的猪猪侠 张磊 … 运行程序之后,没有输出正确的内容. 程序如下:
#!perl -w use strict; use LWP::UserAgent; open OUTPUT,'>','weblist.txt' or die 'weblist.txt error!'; my $get_page = LWP::UserAgent -> new; $get_page -> timeout(6); my $page_addr = ''; my $response = ''; my $content = ''; my $author_name = ''; my $web_list = ''; &print_list(); sub print_list{ foreach (1 .. 6 ){ $page_addr = 'http://roll.finance.sina.com.cn/blog/blogarticle/inde_'.$_.'.shtml'; $response = $get_page -> get( $page_addr ); $content = $response -> content; print $_. "done\n"; $content =~ s#<!DOCTYPE.+?html>##xs; while ( $content =~ s#class="blog.sina.com.cn/u/".+?>(.+?)<##xs){ $author_name = $1; print OUTPUT "$author_name\n"; }
} }
|