免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1564 | 回复: 1

sed 在html文件中匹配字符逻辑关系有点迷糊~ 求助~~ [复制链接]

论坛徽章:
0
发表于 2012-04-14 23:13 |显示全部楼层
5可用积分
本帖最后由 zktq 于 2012-04-14 23:14 编辑

很头疼的问题,找了半天的例子都没有找到解决方法。

替换文件夹/www/web/0/123/ 下文件夹内 所有的HTML文件内容,把文字 "自学" 字段 替换成 "<a href="/0_1/980.html" target="_blank">自学</a>“。(不带双引号)

这样处理很简单,但是只能执行一次,因为还是在不断生成新的html文件的,新的html文件中还是自学字段仍然需要替换成<a href="/0_1/980.html" target="_blank">自学</a> 如果继续执行sed命令 已经替换过的文件就会被替换成<a href="/0_1/980.html" target="_blank"><a href="/0_1/980.html" target="_blank">自学</a></a>。。。。。。。那就乱了。

有什么方法能避免重复替换的么? 因为有特征,就是替换过后的文件左右两边都有分隔符, 左边是> 右边是< 也就是说,

匹配字段
自学 但是如果字段自学两边带有>< 符号的就不替换。

头疼。。

论坛徽章:
0
发表于 2012-04-14 23:27 |显示全部楼层
本帖最后由 hbmhalley 于 2012-04-14 23:34 编辑
  1. sed -r 's,(^|[^>])自学,\1<a href="/0_1/980.html" target="_blank">自学</a>,g'
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP