- 论坛徽章:
- 0
|
本帖最后由 八月飞霜 于 2013-04-24 09:16 编辑
我想匹配<table>标签之间的代码,但是我这个程序每次都执行单行匹配,如何进行多行匹配 也就是说 将<table>和</table>
写在一行就可以匹配中间的内容 多行就不行
txt文件里面的html代码- <table class="protomers" summary="Properties of various protomer conformations of 80466">
- <tbody>
- <tr>
- <th class="type">
- <small>Type</small>
- <big>pH range</big>
- </th>
- <td class="download">
- ↓
- <ul>
- <li><a href="http://zinc11.docking.org/fget.pl?l=0&z=8987822&f=m" title="Download MOL2 File">
- MOL2</a></li>
- <li><a href="http://zinc11.docking.org/fget.pl?l=0&z=8987822&f=d" title="Download SDF File">
- SDF</a></li>
- <li><a href="http://zinc11.docking.org/fget.pl?l=0&z=8987822&f=s" title="Download SMILES File">
- SMILES</a></li>
- <li><a href="http://zinc11.docking.org/fget.pl?l=0&z=8987822&f=h" title="Download Flexibase File">
- Flexibase</a></li>
- </ul>
- </td>
- </tr>
- </tbody>
- </table>
复制代码 python程序- #!/usr/bin/python
- import re
- myfile=open('te.txt','r')
- m_file=myfile.read()
- #print m_file
- pattern=re.compile(r'<table .*?>(.*?)</table>')
- if re.search(pattern,m_file):
- print 'found it'
- else:
- print 'not fount'
- text=pattern.findall(m_file)
- print text
复制代码 麻烦大家看看,在线等! |
|