免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1648 | 回复: 6
打印 上一主题 下一主题

请教一个正则表达式问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-04-22 15:23 |只看该作者 |倒序浏览
我有一批文本文件,需要将其中所有的<cut value="${param}"/>替换为${param},其中${param}是变量,能否用shell脚本来完成这个工作?

论坛徽章:
84
每日论坛发贴之星
日期:2015-12-29 06:20:00每日论坛发贴之星
日期:2016-01-16 06:20:00每周论坛发贴之星
日期:2016-01-17 22:22:00程序设计版块每日发帖之星
日期:2016-01-20 06:20:00每日论坛发贴之星
日期:2016-01-20 06:20:00程序设计版块每日发帖之星
日期:2016-01-21 06:20:00每日论坛发贴之星
日期:2016-01-21 06:20:00程序设计版块每日发帖之星
日期:2016-01-23 06:20:00程序设计版块每日发帖之星
日期:2016-01-31 06:20:00数据库技术版块每日发帖之星
日期:2016-01-16 06:20:00程序设计版块每日发帖之星
日期:2016-01-16 06:20:00程序设计版块每日发帖之星
日期:2016-01-14 06:20:00
2 [报告]
发表于 2006-04-22 17:11 |只看该作者
大概是这样吧:
s/<cut value="\(${param}\)"\/>/\1/g  #(只适用于sed)

论坛徽章:
0
3 [报告]
发表于 2006-04-22 17:20 |只看该作者

你看看是不是这个意思

============
文件:-
$ cat 2.txt
<cut value=test1/>
<cut value=test2/>

解决方法:
$ sed "s/<cut value=//g" 2.txt |sed "s/\/>//g"
test1
test2

论坛徽章:
0
4 [报告]
发表于 2006-04-22 18:55 |只看该作者
多谢两位,我试试

论坛徽章:
0
5 [报告]
发表于 2006-04-22 20:40 |只看该作者
原帖由 yjh777 于 2006-4-22 17:11 发表
大概是这样吧:
s/<cut value="\(${param}\)"\/>/\1/g  #(只适用于sed)


我测试过,此方法正解

不过我有点不明白:
1  如果把匹配的字符串直接替换为明确指定的字符串时,到很简单,但这个题目
中替换的字符串是待提取的,如上$(param),怎么实现的呢,我才命令中没有看出来
2 后面那个\1是什么意思?
3 为什么匹配模式中要用圆括号?

我是SHELL初学者,很菜,但很想搞明白AWK在这点上的用法

谢谢指点

论坛徽章:
0
6 [报告]
发表于 2006-04-22 21:08 |只看该作者
刚才看了一篇SHELL版的精华帖子,我明白了这三个问题

可是,如果被匹配的字符串中如果本身就有()怎么办?比如,qq.txt中有下面两行:
this is example:<cut value="(${param})"/>what can I do?
this is example:<cut value="(${param})"/>what can I do?


如果要把:<cut value="(${param})"/>替换成${param}),怎么写呢?

[ 本帖最后由 xxjoyjn 于 2006-4-22 21:10 编辑 ]

论坛徽章:
0
7 [报告]
发表于 2006-04-23 01:20 |只看该作者

谢谢各位,这个问题已经解决一半了

问题已经解决了,过程如下

测试文件的内容是这样的


  1. <c:out value="${test1}"/><c:out value="${test4}"/><c:out value="${test3}"/>
  2. <c:out value="${test2}"/>

复制代码


使用下面命令

  1. sed 's/<c:out value="\${\(.*\)}"\/>/\${\1}/g' test
复制代码


输出并不是我期望的

  1. ${test1}${test4}${test3}
  2. ${test2}
复制代码


而是

  1. ${test1}"/><c:out value="${test4}"/><c:out value="${test3}
  2. ${test2}
复制代码


在一行有多个匹配的时候,直接首尾匹配了,这样得到的不是原来我想要得到的结果.

暂时通过

sed 's/<cut value="\${\(.\{3,40\}\)}"\/>/\${\1}/g' test.jsp

指定了匹配的内容的长度这个方法,测试了有限的几个文件通过,不知道还有没有更好的办法

最后用下面的方法搞定

匹配数据中不能含有{

  1. sed 's/<c:out value="\${\([^{]*\)}"\/>/\${\1}/g' test
复制代码


突然发现可以有很多方法,比如不能含有<或>都可以.

[ 本帖最后由 sxybit 于 2006-4-23 20:52 编辑 ]
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP