免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: yzkarchive
打印 上一主题 下一主题

[文本处理] 请教正则表达式问题 [复制链接]

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
11 [报告]
发表于 2013-10-15 15:02 |只看该作者
yzkarchive 发表于 2013-10-15 14:48
回复 9# WilliBhamlll

那书本上说的第一部分”“\([^)]*\)”表示的是第一个括号之前的内容,比如上面的 ...


你那本书上所谓的第一个括号应该是指第1个)
  1. echo 'This is (the) (second) line'|sed 's/\([^)]*\).*/\1/'
  2. This is (the
复制代码
还有那条将括号中的内容替换成***的命令,执行报错,改了改。
  1. echo 'This is (the) (second) line'|sed ':b;s/\([^)]*\)\(([^)]*)\)\(.*\)/\1\***\3/;tb'
  2. This is *** *** line
复制代码

论坛徽章:
15
CU大牛徽章
日期:2013-03-13 15:32:35白羊座
日期:2013-10-30 13:11:16未羊
日期:2013-11-29 10:47:02白羊座
日期:2014-01-22 11:34:25白羊座
日期:2014-03-04 11:05:50申猴
日期:2014-07-29 16:31:36天秤座
日期:2013-10-23 15:33:47未羊
日期:2013-10-09 09:18:53CU大牛徽章
日期:2013-03-13 15:38:15CU大牛徽章
日期:2013-03-13 15:38:52CU大牛徽章
日期:2013-03-14 14:08:55未羊
日期:2013-09-23 09:29:22
12 [报告]
发表于 2013-10-15 15:13 |只看该作者
回复 11# WilliBhamlll

多谢了,我再研究下!
   

论坛徽章:
15
CU大牛徽章
日期:2013-03-13 15:32:35白羊座
日期:2013-10-30 13:11:16未羊
日期:2013-11-29 10:47:02白羊座
日期:2014-01-22 11:34:25白羊座
日期:2014-03-04 11:05:50申猴
日期:2014-07-29 16:31:36天秤座
日期:2013-10-23 15:33:47未羊
日期:2013-10-09 09:18:53CU大牛徽章
日期:2013-03-13 15:38:15CU大牛徽章
日期:2013-03-13 15:38:52CU大牛徽章
日期:2013-03-14 14:08:55未羊
日期:2013-09-23 09:29:22
13 [报告]
发表于 2013-10-15 15:46 |只看该作者
回复 9# WilliBhamlll


我按照您的语句修改了下,怎么就不行?

你的语句可以执行成功
echo 'This is the (first) line'|sed 's/\([^)]*\).*/\1/'

我用下面的语句,以c为分界符怎么不行?
echo 'ab cdef ghigklmnopq'|sed 's/\c[^f]*\f.*/\1/'   

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
14 [报告]
发表于 2013-10-15 15:51 |只看该作者
回复 13# yzkarchive


    建议你先看一下sed基础还有正则的知识。
  1. echo 'ab cdef ghigklmnopq'|sed 's/\([^c]\)c.*/\1/'
复制代码

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
15 [报告]
发表于 2013-10-15 15:52 |只看该作者
回复 13# yzkarchive


echo 'This is the (first) line'|sed 's/\([^)]*\).*/\1/'
红色部分是后向引用的固定写法,跟echo命令里面的圆括号没有任何关系。

论坛徽章:
15
CU大牛徽章
日期:2013-03-13 15:32:35白羊座
日期:2013-10-30 13:11:16未羊
日期:2013-11-29 10:47:02白羊座
日期:2014-01-22 11:34:25白羊座
日期:2014-03-04 11:05:50申猴
日期:2014-07-29 16:31:36天秤座
日期:2013-10-23 15:33:47未羊
日期:2013-10-09 09:18:53CU大牛徽章
日期:2013-03-13 15:38:15CU大牛徽章
日期:2013-03-13 15:38:52CU大牛徽章
日期:2013-03-14 14:08:55未羊
日期:2013-09-23 09:29:22
16 [报告]
发表于 2013-10-15 15:55 |只看该作者
回复 14# WilliBhamlll

正在看sed,看到b label的时候实在看不明白,所以来询问,从你的回答中\(和\)来表明分割后的字符串,多谢!
   

论坛徽章:
15
CU大牛徽章
日期:2013-03-13 15:32:35白羊座
日期:2013-10-30 13:11:16未羊
日期:2013-11-29 10:47:02白羊座
日期:2014-01-22 11:34:25白羊座
日期:2014-03-04 11:05:50申猴
日期:2014-07-29 16:31:36天秤座
日期:2013-10-23 15:33:47未羊
日期:2013-10-09 09:18:53CU大牛徽章
日期:2013-03-13 15:38:15CU大牛徽章
日期:2013-03-13 15:38:52CU大牛徽章
日期:2013-03-14 14:08:55未羊
日期:2013-09-23 09:29:22
17 [报告]
发表于 2013-10-15 15:55 |只看该作者
回复 15# Shell_HAT

谢谢大神!
   

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
18 [报告]
发表于 2013-10-15 15:59 |只看该作者
yzkarchive 发表于 2013-10-15 15:55
回复 14# WilliBhamlll

正在看sed,看到b label的时候实在看不明白,所以来询问,从你的回答中\(和\)来 ...


可以看看tim大师的贴子,比较好理解。
http://bbs.chinaunix.net/thread-1762006-1-1.html

论坛徽章:
15
CU大牛徽章
日期:2013-03-13 15:32:35白羊座
日期:2013-10-30 13:11:16未羊
日期:2013-11-29 10:47:02白羊座
日期:2014-01-22 11:34:25白羊座
日期:2014-03-04 11:05:50申猴
日期:2014-07-29 16:31:36天秤座
日期:2013-10-23 15:33:47未羊
日期:2013-10-09 09:18:53CU大牛徽章
日期:2013-03-13 15:38:15CU大牛徽章
日期:2013-03-13 15:38:52CU大牛徽章
日期:2013-03-14 14:08:55未羊
日期:2013-09-23 09:29:22
19 [报告]
发表于 2013-10-15 16:15 |只看该作者
回复 18# WilliBhamlll

多谢,看到b label和t label的时候有点头大,看了两天了,实在看不懂。
   

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
20 [报告]
发表于 2013-10-15 16:44 |只看该作者
本帖最后由 WilliBhamlll 于 2013-10-15 16:46 编辑
yzkarchive 发表于 2013-10-15 14:33
书本上内容摘录:

textfile内容为



之前没仔细看。刚刚一个朋友问我问题,再看看这里你贴的内容,书上说的是对的。顶楼贴的内容很容易让人误解。

\([^)]*\)\(([^)]*)\)\(.*\)这是那条命令里的正则部分,以第一部分([^)]*\)来看,的确是匹配第一个括号之前内容:
  1. echo 'This is (the) (second) line'|sed 's/\([^)]*\)\(([^)]*)\)\(.*\)/\1/'
  2. This is
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP