免费注册 查看新帖 |

ChinaUnix.net

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1806 | 回复: 5

[求助正则表达式] 匹配网页源码里面的字符串 [复制链接]

论坛徽章:
0
发表于 2012-09-05 10:58 |显示全部楼层
本帖最后由 zhshb8511 于 2012-09-06 00:36 编辑

正则匹配 正文内容,该怎么写呢

假如所有数据都已经 去除换行符后存储在$_了
  1. @search_result = /\w*\s*\.*\w*/g;
  2. ;好像上面的写法是不对的
复制代码
就是下面html代码里面的 Table 1. Keyboard commands
  1.   <tr style='mso-yfti-irow:0;mso-yfti-firstrow:yes;page-break-inside:avoid'>
  2.    <td width=835 colspan=2 valign=top style='width:466.0pt;border:none;
  3.    border-bottom:solid windowtext 1.0pt;mso-border-bottom-alt:solid windowtext .5pt;
  4.    padding:0cm 5.4pt 0cm 5.4pt'>
  5.    <p class=T1TableTitleStandard><a name="KeyboardCommands_table"><span
  6.    lang=EN-US>Table </span></a><!--[if supportFields]><span style='mso-bookmark:
  7.    KeyboardCommands_table'></span><span style='mso-element:field-begin'></span><span
  8.    style='mso-bookmark:KeyboardCommands_table'><span lang=EN-US><span
  9.    style='mso-spacerun:yes'>&nbsp;</span>SEQ Table \r 1 \* MERGEFORMAT <span
  10.    style='mso-element:field-separator'></span></span></span><![endif]--><span
  11.    style='mso-bookmark:KeyboardCommands_table'><span lang=EN-US><span
  12.    style='mso-no-proof:yes'>1</span></span></span><!--[if supportFields]><span
  13.    style='mso-bookmark:KeyboardCommands_table'></span><span style='mso-element:
  14.    field-end'></span><![endif]--><span style='mso-bookmark:KeyboardCommands_table'></span><span
  15.    lang=EN-US>. Keyboard commands</span></p>
  16.    </td>
  17.   </tr>
复制代码

论坛徽章:
0
发表于 2012-09-06 00:37 |显示全部楼层
谁给看看呢,真是三天不读书,直接人变猪啊

论坛徽章:
0
发表于 2012-09-06 09:02 |显示全部楼层
把 <[^>]+> 替换成空格,剩下的不就是我们在网页上看到的“正文”么?
不太明白楼主的意思。

论坛徽章:
0
发表于 2012-09-06 10:23 |显示全部楼层
回复 3# justqb
谢谢你的回复
其实我想要的数据是 “Table 1. Keyboard commands”

   

论坛徽章:
0
发表于 2012-09-06 10:26 |显示全部楼层
本帖最后由 justqb 于 2012-09-06 10:26 编辑

SEQ Table \r 1 \* MERGEFORMAT
这些为什么不要了呢?

论坛徽章:
3
CU十二周年纪念徽章
日期:2013-10-24 15:41:34子鼠
日期:2013-12-14 14:57:19射手座
日期:2014-04-25 21:23:23
发表于 2012-09-06 10:43 |显示全部楼层
  1. <tr[\s\S]+?<p[^>]+><a\s*name=["']?(.*?)["]>
复制代码
取$1 ,,不过话说。我还是没怎么看懂你的需求
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

数据风云,十年变迁
DTCC 第十届中国数据库技术大会已启航!

2019年5月8日~5月10日,由IT168旗下ITPUB企业社区平台主办的第十届中国数据库技术大会(DTCC2019),将在北京隆重召开。大会将邀请百余位行业专家,就热点技术话题进行分享,是广大数据领域从业人士的又一次年度盛会和交流平台。与SACC2018类似,本届大会将采用“3+2”模式:3天传统技术演讲+2天深度主题培训。大会不仅提供超100场的主题演讲,还会提供连续2天的深度课程培训,深化数据领域的项目落地实践方案。
DTCC2019,一场值得期待的数据技术盛会,殷切地希望您报名参与!

活动入口>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP