免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 6553 | 回复: 4
打印 上一主题 下一主题

正则替换问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-10-05 20:40 |只看该作者 |倒序浏览
  1. >>> line='source_host=1.1.1.1'
  2. >>>a=re.compile(r'(source_host=).*?')
  3. >>> a.sub(r'\1',line)
  4. 'source_host=1.1.1.1'
复制代码
为什么结果不是'source_host='呢?

论坛徽章:
0
2 [报告]
发表于 2010-10-05 23:52 |只看该作者
搞错了吧。。
re.findall('.+(?:=)',line)  这样就可以

论坛徽章:
0
3 [报告]
发表于 2010-10-06 08:40 |只看该作者
本帖最后由 zhasm 于 2010-10-06 08:49 编辑
  1. a=re.compile(r'(source_host=).*?')
复制代码
该正则仅能够匹配文本source_host=,原因是后面的部分.*?不匹配任何文本也可以(懒惰模式),因此它就偷懒不再匹配。

整个替换语句是将source_host=1.1.1.1中的source_host=替换为source_host=而已。因此出现上面的结果。

如果想按照你的本意来替换,可以将正则式改为:
  1. a=re.compile(r'(source_host=).*')
复制代码
即,去掉末尾的问号,改为贪婪模式,正则式就能匹配整行文本,并替换为\1了。

论坛徽章:
0
4 [报告]
发表于 2010-10-06 14:36 |只看该作者
回复 3# zhasm


    谢谢,但是如果用包含数字的字符串去替换还是会出错:
  1. >>> line='source_host=1.1.1.1'
  2. >>> a=re.compile(r'(source_host=).*')
  3. >>> b='abcd'
  4. >>> a.sub(r'\1%s' %b ,line)
  5. 'source_host=abcd'
  6. >>> b='1.2.3.4'
  7. >>> a.sub(r'\1%s' %b ,line)
  8. Traceback (most recent call last):
  9.   File "<stdin>", line 1, in <module>
  10.   File "/usr/local/python/lib/python2.6/re.py", line 278, in filter
  11.     return sre_parse.expand_template(template, match)
  12.   File "/usr/local/python/lib/python2.6/sre_parse.py", line 795, in expand_template
  13.     raise error, "invalid group reference"
  14. sre_constants.error: invalid group reference
  15. >>>
  16. >>> b='202.101.10.1'
  17. >>> a.sub(r'\1%s' %b ,line)
  18. 'P2.101.10.1'
  19. >>>  
复制代码

论坛徽章:
0
5 [报告]
发表于 2010-10-06 16:36 |只看该作者
本帖最后由 zhasm 于 2010-10-06 16:37 编辑
  1. >>> b='1.2.3.4'
  2. >>> a.sub(r'\1%s' %b ,line)
复制代码
这句有问题。将b代入之后,替换部分就成了r'\11.2.3.4'了。原正则中没有第11组。因此失败。

复杂的正则替换,在python中可以暂时使用callback函数来搞定。或者写个inline版,例如
  1. >>> a.sub(lambda x:x.group(1)+b ,line)
  2. 'source_host=1.2.3.4'
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP