免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2382 | 回复: 8
打印 上一主题 下一主题

[文本处理] sed 's/pattern/replacement/g' FILE [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-08-13 14:03 |只看该作者 |倒序浏览
  1. #cat 1.txt
  2. 1: hello Linux
  3. 2: hello linux
  4. 3: hello (Linux)
  5. 4: hello (linux)
  6. #sed -n 's/([Ll]inux)/--/gp' 1.txt
  7. 3: hello --
  8. 4: hello --
  9. #sed -n 's/\([Ll]inux\)/--/gp' 1.txt
  10. 1: hello --
  11. 2: hello --
  12. 3: hello (--)
  13. 4: hello (--)
复制代码
请问第9行的命令中 \(...\) 起的是什么作用?

论坛徽章:
4
IT运维版块每日发帖之星
日期:2015-08-04 06:20:00IT运维版块每日发帖之星
日期:2015-10-10 06:20:002015亚冠之阿尔艾因
日期:2015-11-08 10:27:01CU十四周年纪念徽章
日期:2020-11-05 14:10:23
2 [报告]
发表于 2015-08-13 14:08 |只看该作者
\是转义符,正则中有特殊含义的符号,在正则匹配的时候,如果要去除其特殊含义,仅表示字面含义(字符串),就要在前面加转义符 \ 转义。写为 \\, \$, \*, \+, \(, \)。

论坛徽章:
0
3 [报告]
发表于 2015-08-13 14:53 |只看该作者
nail78 发表于 2015-08-13 14:08
\是转义符,正则中有特殊含义的符号,在正则匹配的时候,如果要去除其特殊含义,仅表示字面含义(字符串), ...


感谢回复!
如果说 \(  \) 是去除 (  ) 的特殊含义,那么在最后的那条命令中应该是匹配 (linux) 和 (Linux) 这两行的,那么第1行和第2行应该不会出来才对啊?
况且我觉得通过倒数第二条命令可以看出 (   ) 是不需要转意,就能匹配到的。
  1. #sed -n 's/([Ll]inux)/--/gp' 1.txt
  2. 3: hello --
  3. 4: hello --
  4. #sed -n 's/\([Ll]inux\)/--/gp' 1.txt
  5. 1: hello --
  6. 2: hello --
  7. 3: hello (--)
  8. 4: hello (--)
复制代码

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
4 [报告]
发表于 2015-08-13 15:02 |只看该作者
xiang1162090014 发表于 2015-08-13 14:53
如果说 \(  \) 是去除 (  ) 的特殊含义,


(GNU) sed 在不使用 -r 的时候, \( 是给 ( 添加特殊含义; 在使用 -r 的时候, \( 是去除 ( 的特殊含义.

论坛徽章:
0
5 [报告]
发表于 2015-08-13 15:28 |只看该作者
MMMIX 发表于 2015-08-13 15:02
(GNU) sed 在不使用 -r 的时候, \( 是给 ( 添加特殊含义; 在使用 -r 的时候, \( 是去除 ( 的特殊含义.



谢谢回复!
你这段话的后半段我能理解,请问前半段中 不使用 -r 时, \(  \)  的特殊含义是什么呢?

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
6 [报告]
发表于 2015-08-13 15:40 |只看该作者
xiang1162090014 发表于 2015-08-13 15:28
谢谢回复!
你这段话的后半段我能理解,请问前半段中 不使用 -r 时, \(  \)  的特殊含义是什么呢?


引入 capture group 呀. 介绍正则的文档中大部分都有这个的介绍, 虽然未必都叫这个名字.

论坛徽章:
0
7 [报告]
发表于 2015-08-13 16:42 |只看该作者
MMMIX 发表于 2015-08-13 15:40
引入 capture group 呀. 介绍正则的文档中大部分都有这个的介绍, 虽然未必都叫这个名字.


哦,原来是这样,我看的书中没有解释这个内容。我先找找资料看看。

论坛徽章:
1
数据库技术版块每日发帖之星
日期:2015-08-06 06:20:00
8 [报告]
发表于 2015-08-13 22:20 |只看该作者
扩展正则里的,如果不想用\,可以前面加个r选项,表示支持扩展正则。

论坛徽章:
0
9 [报告]
发表于 2015-08-14 09:50 |只看该作者
恩,了解了!  非常感谢!

练习中的题目是这样的:
  1. sed 's/\([Ll]inux\)/\1(TM)/g' 1.txt
复制代码
\(pattern\)  捕获组后 提供给 replacement 中引用。

如果sed -r 的话,就是
  1. sed -r 's/([Ll]inux)/\1(TM)/g' 1.txt
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP