- 论坛徽章:
- 0
|
我现在遇到一个网页,这个网页很奇怪,页面内有很多超链接可以链接到其他的网页,但是网络地址始终不变。这个网页的地址为
http://apps.who.int/classifications/apps/icd/icd10online/
我用程序抓取了其中的一个超链接,地址为
http://apps.who.int/classifications/apps/icd/icd10online/ka00.htm
但得到的为乱码,不知道是什么原因,有可能是编码问题。请各位高人指点,现将程序附上
#!/usr/bin/perl -w
use LWP;
open OUT ,">123.txt";
my $browser = LWP::UserAgent->new;
@headers = (
'User-Agent' => 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)',
'Accept' => '*/*',
'Accept-Encoding' => 'gzip, deflate',
'Accept-Language' => 'zh-cn',
;
my $response = $browser->get( "http://apps.who.int/classifications/apps/icd/icd10online/ka00.htm", @headers );
if($response->is_success){
my $content = $response->content;
print OUT $content;
} |
-
1.png
(25.73 KB, 下载次数: 20)
-
2.png
(19.15 KB, 下载次数: 19)
|