免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2723 | 回复: 9
打印 上一主题 下一主题

perl 匹配替换的问题。急 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-09-16 05:18 |只看该作者 |倒序浏览
10可用积分
比如现在有好几个html文件。 每个文件中都有类似于 <p> <b>1. Acceptance </b> </p> 的标签。
这里面的1. Acceptance表示标题。 我要找到所有包含标题的 <p> 标签。 然后将p标签变为 <h4> 标签. 但是 <p>标签和标题之间可能还有其他的标签 比如 <b>. 我只需要改变相应 <p>为 <h4>, 其他的内容保持不变。

我现在写的表达式 是 。 $_ =~ s/ <p>(.*?\d+\..*?) <\/p>/ <h4>$1 <\/h4>/g  但是这样根本替换不了。


请高手帮指点一下吧。 多谢了

论坛徽章:
0
2 [报告]
发表于 2009-09-16 09:22 |只看该作者

回复 #1 bird528 的帖子

<p>(.*?)<\/p> 这样不就行了?
或者用

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
3 [报告]
发表于 2009-09-16 10:48 |只看该作者

回复 #1 bird528 的帖子

<p>前多了个空格吧。

论坛徽章:
1
狮子座
日期:2013-12-16 16:09:24
4 [报告]
发表于 2009-09-28 21:08 |只看该作者

回复 #1 bird528 的帖子

用正则表达式的时候除了用斜杠,也可以用其他任意符号,让正则表达式清晰容易写出正确的代码

  1 #!/usr/bin/perl
  2 my $html=<<'HTMLEND';
  3 <p> <b>1. Acceptance </b> </p>
  4 HTMLEND
  5 print $html;
  6 $html=~s!<p>(.*?\d+\..*?)</p>!<h4>$1</h4>!g;
  7 print $html;

论坛徽章:
0
5 [报告]
发表于 2009-09-28 22:35 |只看该作者

回复 #4 ttcn 的帖子

! 会与negative assertions冲突。(这东西翻译成否定断言么。。。。 怎么听上去这么别扭呢)
我一般用s{}{}

论坛徽章:
0
6 [报告]
发表于 2009-09-29 00:05 |只看该作者
原帖由 bird528 于 2009-9-16 05:18 发表
比如现在有好几个html文件。 每个文件中都有类似于  1. Acceptance   的标签。
这里面的1. Acceptance表示标题。 我要找到所有包含标题的  标签。 然后将p标签变为  标签. 但是 标签和标题之间可能还有其他的 ...


perl -pe 's#<(/){0,1}b>#<$1h4>#g' example.html

论坛徽章:
1
狮子座
日期:2013-12-16 16:09:24
7 [报告]
发表于 2009-09-29 21:01 |只看该作者

回复 #5 DQP 的帖子

有理!多谢指出!

论坛徽章:
0
8 [报告]
发表于 2009-10-05 12:58 |只看该作者
那会不会有什么多行的问题呢?

论坛徽章:
0
9 [报告]
发表于 2009-10-13 19:56 |只看该作者

回复 #2 toniz 的帖子

楼主还要确定找到的是包含标题的 <p> 标签吧~

论坛徽章:
0
10 [报告]
发表于 2009-10-13 20:12 |只看该作者

回复 #3 blackold 的帖子

同意黑哥的说法,去掉空格之后,楼主的表达式就能正常工作了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP