免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3373 | 回复: 10
打印 上一主题 下一主题

求教“或(|)"在正则中的使用[应该是括号的用法,已解决] [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-04-07 17:53 |只看该作者 |倒序浏览
本帖最后由 addbe 于 2010-04-08 12:25 编辑

我想用一条正则匹配下面两个列子,但是一直都无法实现
[Thu Oct 29 09:47:35 2009] [error] [client 127.0.0.1] File does not exist: /opt/httpd/htdocs/favicon.ico
这个列子,我希望将内容分成4部分,分别是:
$1 "Thu Oct 29 09:47:35 2009"
$2 "error"
$3 "client 127.0.0.1"
$4 "File does not exist: /opt/httpd/htdocs/favicon.ico"
我使用的正则为:

  1. /\[(.*)\] \[(.*)\] (?:\[(.*)\]) (.*)/
复制代码
效果和我设想的一样

[Thu Oct 29 09:39:51 2009] [notice] Apache/2.2.14 (Unix) PHP/5.3.0 configured -- resuming normal operations
这个列子,我依然希望把内容分为4部分,分别是:
$1 "Thu Oct 29 09:39:51 2009"
$2 "notice"
$3 " Apache/2.2.14 (Unix) PHP/5.3.0 configured"
$4 "resuming normal operations"
使用的正则为:

  1. /\[(.*)\] \[(.*)\] (?:(.*)--) (.*)/
复制代码
效果和我设想的一样

我简单的以为,只需要把正则写成
  1. /\[(.*)\] \[(.*)\] (?:\[(.*)\]|(.*)--) (.*)/
复制代码
就可以实现两个列子都能成功匹配。
但是事实证明我错了。感觉问题出在“或(|)”运算上。
特此求解。谢谢

论坛徽章:
0
2 [报告]
发表于 2010-04-07 17:55 |只看该作者

  1. /\[(.*)\] \[(.*)\] (?:\[(.*)\])|(?:(.*)--) (.*)/
复制代码
这个写法也不可以

论坛徽章:
0
3 [报告]
发表于 2010-04-07 18:09 |只看该作者
  1. [Thu Oct 29 09:47:35 2009] [error] [client 127.0.0.1] File does not exist: /opt/httpd/htdocs/favicon.ico
  2. 这个列子,我希望将内容分成4部分,分别是:
  3. $1 "Thu Oct 29 09:47:35 2009"
  4. $2 "error"
  5. $3 "client 127.0.0.1"
  6. $4 "File does not exist: /opt/httpd/htdocs/favicon.ico"
复制代码
  1. /\[(.*?)\]\s+\[(.*?)\]\s+\[(.*?)\]\s+(.*)/
复制代码

论坛徽章:
0
4 [报告]
发表于 2010-04-07 22:42 |只看该作者
感谢回帖
但是不知道shigw001想表达的是什么意思?
是告诉我
  1. /\[(.*?)\]\s+\[(.*?)\]\s+\[(.*?)\]\s+(.*)/
复制代码
可以对第一个列子匹配出我所希望的效果么?

论坛徽章:
0
5 [报告]
发表于 2010-04-08 10:25 |只看该作者
  1. /\[(.*)\]\s+\[(.*)\]\s+\[?(.*)(?:\]|\s+--)\s+(.*)/
复制代码

论坛徽章:
0
6 [报告]
发表于 2010-04-08 10:56 |只看该作者
感谢LS的
我想请教下为什么
  1. \[?(.*)(?:\]|\s+--)
复制代码
能够生效
我的写法是将获取的直接“或"起来,你的写法是把边界(或者说是用于分割的)”或“了下
是不是”或“的用法,不适合于$1这样的取值?
谢谢

论坛徽章:
0
7 [报告]
发表于 2010-04-08 11:14 |只看该作者
/\[(.*)\] \[(.*)\] (?:\[(.*)\]|(.*)--) (.*)/
你这样是5个字段 $3 $4只能有一个 你把5个字段全打印出来你就明白了

论坛徽章:
0
8 [报告]
发表于 2010-04-08 11:18 |只看该作者
你要喜欢用那个/\[(.*)\] \[(.*)\] (?:\[(.*)\]|(.*)--) (.*)/

下面打印就需要做处理
  1. if(defined $3)
  2.                 {
  3.                         print "$1\t$2\t$3\t$5\n";
  4.                 }
  5.                 elsif(defined $4)
  6.                 {
  7.                         print "$1\t$2\t$4\t$5\n";
  8.                 }
  9.                 else
  10.                 {
  11.                         print "error\n";
  12.                 }
复制代码

论坛徽章:
0
9 [报告]
发表于 2010-04-08 12:08 |只看该作者
/\[(.*)\] \[(.*)\] (?:\[(.*)\]|(.*)--) (.*)/
你这样是5个字段 $3 $4只能有一个 你把5个字段全打印出来你 ...
xuanyuzheng 发表于 2010-04-08 11:14

是不是应该这么理解
perl只看()的数量,哪怕被
  1. (?:)
复制代码
所包含。
依然会被看成$3,$4
如果是这样,我对利用()分组的方式可能需要再理解了
谢谢指教

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
10 [报告]
发表于 2010-04-08 12:10 |只看该作者
Perl 的这种做法明显要比你想象的那种做法便于理解啊。
只要数左括号就可以了,不管匹配上没匹配上。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP