免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4173 | 回复: 12
打印 上一主题 下一主题

这个sed代码为什么无法正确匹配第一个字符 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-03-28 11:37 |只看该作者 |倒序浏览
1.txt中的内容是
abc

代码写成
  1. gsed -r 's/^(.)+/\1/' 1.txt
复制代码
执行的结果是 c 而不是 a
为什么\1匹配的不是第一个字符,而是最后一个字符呢?

论坛徽章:
71
15-16赛季CBA联赛之同曦
日期:2018-08-23 15:41:42辰龙
日期:2014-08-15 09:07:43狮子座
日期:2014-06-03 13:55:33亥猪
日期:2014-06-02 11:17:08巨蟹座
日期:2014-05-06 10:02:03午马
日期:2014-05-04 08:18:27亥猪
日期:2014-04-29 11:11:32技术图书徽章
日期:2014-04-24 15:51:26技术图书徽章
日期:2014-04-17 11:01:53辰龙
日期:2014-04-15 12:45:46亥猪
日期:2014-04-11 09:06:23射手座
日期:2014-04-01 15:28:10
2 [报告]
发表于 2012-03-28 12:01 |只看该作者
sed  's/^\(.\).*/\1/'

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
3 [报告]
发表于 2012-03-28 12:03 |只看该作者
回复 1# namejm


    因为最后匹配的是c。

论坛徽章:
1
摩羯座
日期:2014-12-29 15:59:36
4 [报告]
发表于 2012-03-28 12:10 |只看该作者
\1或者说$1在正则引擎内部变化了三次
a b c
  1. echo abc | perl -ple 's/^(?:(.)(?{print $1}))+/\1/'
复制代码

论坛徽章:
0
5 [报告]
发表于 2012-03-28 14:37 |只看该作者
blackold 发表于 2012-03-28 12:03
回复 1# namejm
因为最后匹配的是c。

  为什么会匹配最后的c,正是我困惑的地方。

  1. gsed -r 's/^(.)+/\1/' 1.txt
复制代码
^不是匹配行首么?
按照sed的贪婪特性,“^(.)+”应该是匹配整行内容啊,把行首之后的第一个任意字符用括号包起来,然后用\1引用,应该匹配第一个字符a的啊,怎么就匹配到最后1个字符c去了呢?
难道 ^ 字符失效了吗?

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
6 [报告]
发表于 2012-03-28 15:03 |只看该作者
回复 5# namejm


    如果是这样理解,^(.)+就只匹配一个字符了。

论坛徽章:
0
7 [报告]
发表于 2012-03-28 17:54 |只看该作者
blackold 发表于 2012-03-28 15:03
回复 5# namejm

想了一下,按照我那个理解,是应当只匹配行首第一个字符,而不是整行字符了
但是 /^(.)+/ 匹配的是最后一个字符,具体该怎么理解呢?能详细讲解一下吗?主要是^在这里没有匹配到行首,让我困惑不已。

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
8 [报告]
发表于 2012-03-28 17:59 |只看该作者
回复 7# namejm


    好好想想!

论坛徽章:
0
9 [报告]
发表于 2012-03-28 18:36 |只看该作者
回复 7# namejm


    /^(.)+/等价于/^((.)+)/而非/(^.)+/,所以在行首的不是(.)而是((.)+)

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
10 [报告]
发表于 2012-03-28 18:56 |只看该作者
楼主,俺和你讨论一个哲学问题吧,如果没有匹配第一个,何来最后一个?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP