免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 6763 | 回复: 15
打印 上一主题 下一主题

[文本处理] 在sed中转义 + 的疑惑 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-09-16 07:30 |只看该作者 |倒序浏览
转义符 '\' 不是将特殊字符转成普通字符么,为什么在  sed 中单单这个 '+' 用上转义字符才具有正则表达式中的特殊含义,去了反而只是普通字符。

#cat data
#akalkjissmbmasia
#+++++++++
#cat data | sed 's/+\+/*/g'
#akalkjissmbmasia
#*

所以很疑惑

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
2 [报告]
发表于 2013-09-16 07:50 |只看该作者
sed认为+是普通字符,\+是特殊字符。

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
3 [报告]
发表于 2013-09-16 08:52 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
4 [报告]
发表于 2013-09-16 11:23 |只看该作者
回复 1# henryele

Master/zooyo said:
楼主理解有误, \ 为转义符, 意思就是改变其本来的意思, ... 不要认死理的觉得\+就一定是转义为加减号.

# cat data | sed 's/+\+/*/g'
#akalkjissmbmasia
#*

# cat data | sed -r 's/+\+/*/g'
sed: -e expression #1, char 9: Invalid preceding regular expression

# cat data | sed -r 's/\+\+/*/g'
#akalkjissmbmasia
#****+

# cat data | sed -r 's/\++/*/g'
#akalkjissmbmasia
#*

   

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
5 [报告]
发表于 2013-09-16 13:30 |只看该作者
如果不用 -r,则 + 就是普通字符,用了 -r 则 + 是正则符号。同时,转义后就正好是反过来的意思了。
这完全是属于你是否指定某个规则来解释你的符号。

如果说 lz 对于 + 有疑问,那为什么对 ( ) 没疑问呢。

论坛徽章:
4
CU大牛徽章
日期:2013-03-13 15:29:07CU大牛徽章
日期:2013-03-13 15:29:49CU大牛徽章
日期:2013-03-13 15:30:19CU十二周年纪念徽章
日期:2013-10-24 15:41:34
6 [报告]
发表于 2013-09-16 21:42 |只看该作者
本帖最后由 shencz2000 于 2013-09-17 13:26 编辑

楼主说的问题在我的计算机上不存在。
在我的计算机上,使用如下命令,会得到如下的结果:
echo "#++++++++" |  sed 's/\++/*/g'
#*

如果修改这一个命令,会得到错误:
echo "#++++++++" |  sed 's/+\+/*/g'
sed:-e 表达式 #1,字符 9:无效的前导常规表达式

看了4楼的帖子,我明白了原因,因为我使用了alias命令,alias sed='sed -r'。

论坛徽章:
0
7 [报告]
发表于 2013-09-17 07:24 |只看该作者
回复 6# shencz2000


    我的是rhel 5     sed  是4.1.5

论坛徽章:
0
8 [报告]
发表于 2013-09-17 07:28 |只看该作者
回复 5# seesea2517


    因为我理解的  \( \) 就是sed内用来定义子串的固定用法

论坛徽章:
0
9 [报告]
发表于 2013-09-17 07:33 |只看该作者
回复 5# seesea2517


    而+应该在则正表达式的范围

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
10 [报告]
发表于 2013-09-17 08:36 |只看该作者
回复 8# henryele


    那+的用法也可以理解理解嘛。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP