免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1874 | 回复: 5

[求助正则表达式] 匹配网页源码里面的字符串 [复制链接]

论坛徽章:
0
发表于 2012-09-05 10:58 |显示全部楼层
本帖最后由 zhshb8511 于 2012-09-06 00:36 编辑

正则匹配 正文内容,该怎么写呢

假如所有数据都已经 去除换行符后存储在$_了
  1. @search_result = /\w*\s*\.*\w*/g;
  2. ;好像上面的写法是不对的
复制代码
就是下面html代码里面的 Table 1. Keyboard commands
  1.   <tr style='mso-yfti-irow:0;mso-yfti-firstrow:yes;page-break-inside:avoid'>
  2.    <td width=835 colspan=2 valign=top style='width:466.0pt;border:none;
  3.    border-bottom:solid windowtext 1.0pt;mso-border-bottom-alt:solid windowtext .5pt;
  4.    padding:0cm 5.4pt 0cm 5.4pt'>
  5.    <p class=T1TableTitleStandard><a name="KeyboardCommands_table"><span
  6.    lang=EN-US>Table </span></a><!--[if supportFields]><span style='mso-bookmark:
  7.    KeyboardCommands_table'></span><span style='mso-element:field-begin'></span><span
  8.    style='mso-bookmark:KeyboardCommands_table'><span lang=EN-US><span
  9.    style='mso-spacerun:yes'>&nbsp;</span>SEQ Table \r 1 \* MERGEFORMAT <span
  10.    style='mso-element:field-separator'></span></span></span><![endif]--><span
  11.    style='mso-bookmark:KeyboardCommands_table'><span lang=EN-US><span
  12.    style='mso-no-proof:yes'>1</span></span></span><!--[if supportFields]><span
  13.    style='mso-bookmark:KeyboardCommands_table'></span><span style='mso-element:
  14.    field-end'></span><![endif]--><span style='mso-bookmark:KeyboardCommands_table'></span><span
  15.    lang=EN-US>. Keyboard commands</span></p>
  16.    </td>
  17.   </tr>
复制代码

论坛徽章:
0
发表于 2012-09-06 00:37 |显示全部楼层
谁给看看呢,真是三天不读书,直接人变猪啊

论坛徽章:
0
发表于 2012-09-06 09:02 |显示全部楼层
把 <[^>]+> 替换成空格,剩下的不就是我们在网页上看到的“正文”么?
不太明白楼主的意思。

论坛徽章:
0
发表于 2012-09-06 10:23 |显示全部楼层
回复 3# justqb
谢谢你的回复
其实我想要的数据是 “Table 1. Keyboard commands”

   

论坛徽章:
0
发表于 2012-09-06 10:26 |显示全部楼层
本帖最后由 justqb 于 2012-09-06 10:26 编辑

SEQ Table \r 1 \* MERGEFORMAT
这些为什么不要了呢?

论坛徽章:
3
CU十二周年纪念徽章
日期:2013-10-24 15:41:34子鼠
日期:2013-12-14 14:57:19射手座
日期:2014-04-25 21:23:23
发表于 2012-09-06 10:43 |显示全部楼层
  1. <tr[\s\S]+?<p[^>]+><a\s*name=["']?(.*?)["]>
复制代码
取$1 ,,不过话说。我还是没怎么看懂你的需求
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

SACC2019中国系统架构师大会

【数字转型 架构演进】SACC2019中国系统架构师大会
2019年10月31日~11月2日第11届中国系统架构师大会(SACC2019)将在北京隆重召开。四大主线并行的演讲模式,1个主会场、20个技术专场、超千人参与的会议规模,100+来自互联网、金融、制造业、电商等领域的嘉宾阵容,将为广大参会者提供一场最具价值的技术交流盛会。




----------------------------------------

大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP