Chinaunix

标题: 正则表达式的匹配问题 [打印本页]

作者: yudun1989    时间: 2011-04-03 01:10
标题: 正则表达式的匹配问题
想匹配一个网页中的标签
初始标签:
<dd>\r\n<ul class="remark">
结束节点:
</p>\r\n</dd>
中间为任意字符
我的正则表达式为
<dd>\\r\\n<ul\sclass=\"remark\">.*?</p>\\r\\n</dd>

这里哪错了?我自己看的好像是.*?有错误,但是不知到怎么改,</dd>有没有错误呢?
作者: anonymous0502    时间: 2012-07-16 16:18
本帖最后由 anonymous0502 于 2012-07-16 16:19 编辑

不知道你的代码怎么写的,可能是\r\n那里吧
  1. #!/usr/bin/python
  2. # -*- coding: utf-8 -*-

  3. import sys,re

  4. def main():
  5.     v1='''
  6. 想匹配一个网页中的标签
  7. 初始标签:
  8. <dd>\r\n<ul class="remark">
  9. 结束节点:
  10. </p>\r\n</dd>
  11. 中间为任意字符
  12. 我的正则表达式为
  13. '''
  14.     restr=r'<dd>\r\n<ul\sclass="remark">.*?</p>\r\n</dd>'
  15.     r=re.findall(restr,v1,re.DOTALL)
  16.     if r:
  17.         for it in r:
  18.             print(it)

  19. if __name__ == '__main__':
  20.     main()
复制代码





欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2