免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4197 | 回复: 7
打印 上一主题 下一主题

[文本处理] 关于tr -s命令的具体处理逻辑 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-09-23 15:45 |只看该作者 |倒序浏览
昨天对于tr这个转换字符的命令看了一下,在进行试验的时候,发现tr -s这个通常用于去除多余重复字符的命令在逻辑上与描述的有点不一样,比较难于理解~~

以下是试验的过程:
[Azrael@Redhat6 chapter2]$ cat test
aaa
bbb
ccc
[Azrael@Redhat6 chapter2]$ tr -s 'a' 'a' < test
a
bbb
ccc
[Azrael@Redhat6 chapter2]$ tr -s 'a' 'c' < test
c
bbb
c

难道tr -s不是将第一种字符的重复改成第二种字符的不重复形式吗?,为啥tr -s 'a' 'c'这条命令的效果这么奇怪?

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
2 [报告]
发表于 2013-09-23 15:56 |只看该作者
回复 1# Azrael0507


    先转换,后挤压。

论坛徽章:
5
金牛座
日期:2013-10-14 14:40:422015年亚洲杯之伊朗
日期:2015-03-26 10:37:012015亚冠之浦和红钻
日期:2015-10-12 17:47:4115-16赛季CBA联赛之山东
日期:2016-01-20 16:43:1215-16赛季CBA联赛之辽宁
日期:2016-03-29 16:43:59
3 [报告]
发表于 2013-09-23 16:00 |只看该作者
tr -s  'a' 'c'
首先把多个a、多个c都去除重复,然后把a替换成c
或者是先把a替换成c,然后再去除重复

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
4 [报告]
发表于 2013-09-23 16:03 |只看该作者
回复 3# itfly3


    没有或者啊。
你的两种解释是自相矛盾的。

论坛徽章:
5
金牛座
日期:2013-10-14 14:40:422015年亚洲杯之伊朗
日期:2015-03-26 10:37:012015亚冠之浦和红钻
日期:2015-10-12 17:47:4115-16赛季CBA联赛之山东
日期:2016-01-20 16:43:1215-16赛季CBA联赛之辽宁
日期:2016-03-29 16:43:59
5 [报告]
发表于 2013-09-23 16:16 |只看该作者
我就是不确定是先替换还是先压缩

论坛徽章:
0
6 [报告]
发表于 2013-09-23 19:24 |只看该作者
回复 2# blackold


    也就是说,tr -s ‘set1’ ‘set2’这个命令,不仅会对set1的字符进行挤压,也会对set2的进行挤压?
    嗯,如果是这样,就清楚了,因为昨天看的那个文章,讲的是对set1进行挤压~~set2只负责转换的~~

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
7 [报告]
发表于 2013-09-24 09:20 |只看该作者
回复 6# Azrael0507


    不是。

使用 set1 set2 进行转换,最后使用 set2 进行挤压(压缩)。

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
8 [报告]
发表于 2013-09-24 09:48 |只看该作者
有man可以查嘛:
       Translation occurs if -d is not given and both SET1 and SET2 appear.  -t may be  used  only  when  translating.
       SET2 is extended to length of SET1 by repeating its last character as necessary.  Excess characters of SET2 are
       ignored.  Only [:lower:] and [:upper:] are guaranteed to expand in ascending order; used in SET2  while  trans-
       lating,  they may only be used in pairs to specify case conversion.  -s uses SET1 if not translating nor delet-
       ing; else squeezing uses SET2 and occurs after translation or deletion.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP