免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2490 | 回复: 4
打印 上一主题 下一主题

请问如何获取最后一次匹配的结果及每次匹配的结果 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-04-07 22:58 |只看该作者 |倒序浏览
221.229.172.231 - - [02/Apr/2008:10:05:04 +0800] "GET /bderror.txt?userip=192.168.1.102&url=[http://see.fofan.com/see/moreerror.html?q=http://see.fofan.com/see/404.html?q=http://see.fofan.com
/see/dnserror.html?q=http://www.eebbk.com/downlist.asp?csid=1804&classid=1805&txt=&txt=#4%5%3%2%&txt=&ecode=400]
&dns=[61.147.37.1%2061.177.7.1%20192.168.1.1]

日志的一行如上格式(格式有限,只能手工断行,以上日志为一行)
特征由彩色标出
现有两个匹配需求
1.获取最后一个html?q=后面的url

2.匹配所有的
&txt=  并获取其后边的字符或空


其中 这一行日志中有几个
html?q= 及几个&txt= 是不确定的

还请各位帮着解答或给些提示

我怎么一点思路都没有呢,不知道该用那种语法
谢谢了



[ 本帖最后由 King_Leo 于 2008-4-7 22:59 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2008-04-07 23:10 |只看该作者
正则不好用?

论坛徽章:
0
3 [报告]
发表于 2008-04-08 00:16 |只看该作者
匹配url最好用Regexp::Common,可读性好些
第二个如果是我的话可能会改用python来做:)

论坛徽章:
0
4 [报告]
发表于 2008-04-08 02:26 |只看该作者
简单试试吧:

  1. use warnings;
  2. use strict;

  3. my $string='221.229.172.231 - - [02/Apr/2008:10:05:04 +0800] "GET /bderror.txt?userip=192.168.1.102&url=[[url]http://see.fofan.com/see/moreerror.html?q=http://see.fofan.com/see/404.html?q=http://see.fofan.com[/url] /see/dnserror.html?q=http://www.eebbk.com/downlist.asp?csid=1804&classid=1805&txt=&txt=#4%5%3%2%&txt=&ecode=400]';

  4. if ($string =~ m/.*html\?q=(http:\/\/[^&]*)/ ) {
  5.         print "Found URL : $1\n";
  6. }

  7. while ( $string =~ m/&txt=([^&]*)/g ) {
  8.         print "*[$1]*\n";
  9. }
复制代码

论坛徽章:
0
5 [报告]
发表于 2008-04-08 09:45 |只看该作者
原帖由 __lxmxn__ 于 2008-4-8 02:26 发表
简单试试吧:

use warnings;
use strict;

my $string='221.229.172.231 - - [02/Apr/2008:10:05:04 +0800] "GET /bderror.txt?userip=192.168.1.102&url=[http://see.fofan.com/see/moreerror.html?q=ht ...


很感谢楼上的解答~

呵呵,我再去看看概念

原来默认最后得到的匹配就是最后一次的匹配,而加了/g后自然捕获每一次匹配。。。。

哎~~~~~
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP