- 论坛徽章:
- 0
|
最近事情不太多,加上每天打开网页去看论坛有些繁琐,尝试着写一个脚本去定时刷新perl版块帖子的更新情况,知道format可以格式化输出,但是在我做完后,发现有些地方,自己始终做不好,把源代码贴出来,请大家指教一下,- #!/usr/bin/perl
- use strict;
- use LWP::Simple qw(get);
- my $min = `date +%M`;
- chomp $min;
- my $now_min = -1;
- my $pinlv = 1;
- while(1)
- {
- $min =`date +%M`;
- chomp $min;
- if($now_min != $min && !($min%$pinlv) )
- {
- $now_min = $min;
- my $URL="http://bbs.chinaunix.net/forum-25-1.html";
- my $html =get($URL);
- my @array = split("\n",$html);
- my @arrray_for_out;
- my @aa = &check_title(@array);
- sleep(1);
- &format_print(@aa);
- }
- else
- {
- sleep(5);
- }
- }
- sub check_title
- {
- my @array = @_;
- my @array_for_out;
- my $flag = 0;
- my $flag1 = 0;
- my $tag = 0;
- my $tag1 = 0;
- my $titleurl;
- my $titlename;
- my $author;
- my $writedate;
- my $last_replay;
- my $replaytime;
- my $readnum;
- my $replaynum;
- open FH, ">","Temp.txt";
- for(@array)
- {
- # my $line = $_;
- if(/\<div width=\"0\" height="0" id=\"cuad_69/)
- {
- $flag = 1
- }
- if($flag eq 1 && /span id=.*?a href=\"(.*?)\"\>(.*?)\</)
- {
- $titleurl=$1;
- $titleurl = "http://bbs.chinaunix.net/".$titleurl;
- $titlename = $2;
- push @array_for_out,$titleurl ;
- push @array_for_out,$titlename;
- $tag=1;
- }
- if($flag eq 1 && $tag eq 1 && /a href=.*?>(.*?)\<\/a\>$/)
- {
- $author = $1;
- push @array_for_out, $author;
- $flag1= 1;
- }
- if($flag eq 1 && $tag eq 1 && $flag1 eq 1 && /\<cite\>(\d+\-\d+\-\d+)\</)
- {
- $writedate=$1;
- push @array_for_out, $writedate;
- }
- if($flag eq 1 && $tag eq 1 && $flag1 eq 1 && /^\<\w+\s+\w+=.\w+.\>\<strong\>(\d+)\<\/strong\>\<\/td\>$/)
- {
- $replaynum = $1;
- push @array_for_out,$replaynum;
- }
- if($flag eq 1 && $tag eq 1 && $flag1 eq 1 && /bgcolor=.*?strong\>(\d+)\<\/strong\>\<\/td\>$/)
- {
- $readnum = $1;
- push @array_for_out, $readnum;
- }
- if($flag eq 1 && $tag eq 1 && $flag1 eq 1 && /cite.*?a href\=.*?\>(.*?)\</)
- {
- $last_replay = $1;
- chomp $last_replay;
- push @array_for_out, $last_replay;
- $tag1 = 1;
- }
- if($flag eq 1 && $tag eq 1 && $flag1 eq 1 && $tag1 eq 1 && /em.*?a href=.*?\>(.*?)\</ && !(/清除 Cookies\<\/a\>/))
- {
- $replaytime = $1;
- push @array_for_out,$replaytime;
- print FH "$titlename\△$author\△$writedate\△$replaynum\△$readnum\△$last_replay\△$replaytime\△$titleurl\n";
- }
- }
- close FH;
- return @array_for_out;
- }
- sub format_print
- {
- my $tt=`date +%T`;
- chomp $tt;
- print "$tt\t";
- my ($tname,$author,$wdate,$replaynum,$readnum,$last_replay,$updatetime,$url);
- open FD ,"<Temp.txt";
- while(<FD>)
- {
- ($tname,$author,$wdate,$replaynum,$readnum,$last_replay,$updatetime,$url) = split("\△",$_);
- $^ = 'STDOUT_TOP';
- $~ = 'STDOUT';
- $= = 31;
- $| = 1;
- write;
- }
- format STDOUT_TOP =
- @>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
- "Page $%"
- Net Title
- Name Author Date R/RTimes last_replay updatetime URL
- ---------------------------------------------------------------------------------------------
- .
-
- format STDOUT =
- @<<<<<<<<<<<<<<<<<<< @||||||| @<<<<<<<<<@>>>>@<<<< @|||||||| @<<<<<<<<<< @||||||||||||||||||||| @<<<<<<<<<<<<<<<<<<<<<<<<<<<<
- $tname, $author, $wdate, $replaynum."/"$readnum, $last_replay , $updatetime , $url
- .
- }
复制代码 执行后,输出的结果是这样的
14:52:47 Page 1
Net Title
Name Author Date R/RTimes last_replay updatetime URL
---------------------------------------------------------------------------------------------
perl如何得到一个字符 better03 2010-12-16 0/8 better033 2010-12-16 http://bbs.chinaunix.n
这个算不算bug paktc 2010-12-16 7/126 toniz 2010-12-16 http://bbs.chinaunix.n
在这里发个招聘贴找人 weiweijh 2010-12-15 6/160 liyangole 2010-12-16 http://bbs.chinaunix.n
Mail::IMAPClient读ou yaoliwei 2010-12-16 1/26 yaoliwei 2010-12-16 http://bbs.chinaunix.n
茴字的多种写法 -- 论 兰花仙子 2009-12-01 59/15357 2gua 2010-12-16 http://bbs.chinaunix.n
不明白这个Magic Perl cinanine 2010-12-16 5/161 toniz 2010-12-16 http://bbs.chinaunix.n
[求助]修改文件内容 haijunze 2010-12-16 4/75 haijunzen 2010-12-16 http://bbs.chinaunix.n
字符怎么相加? solu 2010-12-16 6/111 昭襄王 2010-12-16 http://bbs.chinaunix.n
Magic Perl Code! deathcul 2003-06-03 7/1791 liyangole 2010-12-16 http://bbs.chinaunix.n
Perl变量作用域[PDF下 兰花仙子 2006-02-03 30/7565 2gua 2010-12-16 http://bbs.chinaunix.n
获取文件所在目录 liuyifan 2010-12-15 5/146 99超人 2010-12-16 http://bbs.chinaunix.n
学习引用竟然可以引用 tsie_che 2010-12-16 3/176 guap514 2010-12-16 http://bbs.chinaunix.n
求助:windows下安装C liuyifan 2010-12-13 2/163 liuyifang 2010-12-15 http://bbs.chinaunix.n
tcl命名空间有个问题?kingkick 2010-12-15 1/86 zhlong8 2010-12-15 http://bbs.chinaunix.n
在linux 下安装mod_pe jackson6 2010-12-12 15/335 兰花仙子 2010-12-15 http://bbs.chinaunix.n
美国上市当当网信招聘 dangdang 2010-12-14 5/305 kingwmj 2010-12-15 http://bbs.chinaunix.n
如何通过perl修改类似 wangyl19 2010-12-14 4/190 ulmer 2010-12-15 http://bbs.chinaunix.n
win32::api 启动windo lgq_101 2010-12-15 5/116 黑色阳光_ 2010-12-15 http://bbs.chinaunix.n
请问这个正则表达式该 regonly1 2010-12-10 18/545 langren86 2010-12-15 http://bbs.chinaunix.n
Perl UDP Server 如何 r_zack 2010-12-15 5/115 r_zack 2010-12-15 http://bbs.chinaunix.n
perl 网络编程 jiannma 2010-12-15 2/185 兰花仙子 2010-12-15 http://bbs.chinaunix.n
请各位大侠帮忙解决一 忧郁蓝黑 2010-12-15 1/85 兰花仙子 2010-12-15 http://bbs.chinaunix.n
急急急,perl脚本使用 cnmtchbg 2010-12-15 4/147 langren86 2010-12-15 http://bbs.chinaunix.n
在perl 中调用oracle jackson6 2010-12-14 5/171 兰花仙子 2010-12-15 http://bbs.chinaunix.n
读取文件创建散列的问 sai9924 2010-12-14 6/184 wfnh 2010-12-15 http://bbs.chinaunix.n
mason 里怎么实现url?jackson6 2010-12-14 2/153 yiten 2010-12-15 http://bbs.chinaunix.n
从一个Perl程序看网络 兰花仙子 2010-12-08 29/3335 scrit 2010-12-15 http://bbs.chinaunix.n
这里url没有显示全,请教各位指正一下,因为学习perl不久,所以想听听别人的想法。 |
|