免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: wy200747055
打印 上一主题 下一主题

[文本处理] 怎么用comm命令输出./test文件中重复的字符串 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2012-10-07 10:17 |只看该作者
回复 8# L_kernel


    大神,你太厉害了~
    我觉得那个出题官可能就是想要我这样写的。。。
    PS:comm中使用到的-表示stdin,是不是所有命令都可以这样用-呢?

论坛徽章:
0
12 [报告]
发表于 2012-10-07 10:27 |只看该作者
回复 8# L_kernel


    大神,我现在发现我的shell编程这一块学的很生硬肤浅,一点都不够灵活,我觉得我需要多练练。你有没有什么好的书或者资料可以给我推荐的。。。。

论坛徽章:
1
辰龙
日期:2014-05-22 11:38:58
13 [报告]
发表于 2012-10-07 10:53 |只看该作者
本帖最后由 winway1988 于 2012-10-07 11:00 编辑
  1. [winway@s212 test]$ cat urfile
  2. 4
  3. 3
  4. 2
  5. 2
  6. 1
  7. [winway@s212 test]$ sort urfile | uniq | comm -3 urfile - | uniq
  8.         1
  9.         2
  10.         3
  11. 3
  12. 2
  13. 1
复制代码
comm要排序的吧

论坛徽章:
1
辰龙
日期:2014-05-22 11:38:58
14 [报告]
发表于 2012-10-07 11:07 |只看该作者
  1. [winway@s212 test]$ cat > urfile
  2. aaa
  3. bbb
  4. aaa
  5. bbb
  6. bbb
  7. ccc
  8. ddd
  9. eee
  10. eee
  11. fff
  12. [winway@s212 test]$ sort urfile | uniq | comm -2 -3 <(sort urfile) - | uniq
  13. aaa
  14. bbb
  15. eee
  16. [winway@s212 test]$ cat > urfile
  17. 4
  18. 3
  19. 2
  20. 2
  21. 1
  22. [winway@s212 test]$ sort urfile | uniq | comm -2 -3 <(sort urfile) - | uniq
  23. 2
复制代码

论坛徽章:
0
15 [报告]
发表于 2012-10-07 13:40 |只看该作者
回复 14# winway1988


     comm -2 -3 <(sort urfile) - 重定向也能这么用!哎,我要学的东西太多了。
     你说的很对,确实要排序的。

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
16 [报告]
发表于 2012-10-07 22:00 |只看该作者
wy200747055 发表于 2012-10-07 10:17
回复 8# L_kernel
不能保证所有。大部分都是可以的。

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
17 [报告]
发表于 2012-10-07 22:02 |只看该作者
wy200747055 发表于 2012-10-07 10:27
回复 8# L_kernel
要练习的话,实际练习,这里是一个好地方。
另外Advanced bash script这本书不错。简称是abs

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
18 [报告]
发表于 2012-10-08 10:00 |只看该作者

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
19 [报告]
发表于 2012-10-08 10:01 |只看该作者
回复 11# wy200747055


有机会的话可以问问出题者8楼那种方法处理百万数据效率究竟如何

论坛徽章:
2
技术图书徽章
日期:2013-10-08 08:52:55水瓶座
日期:2013-11-22 12:16:09
20 [报告]
发表于 2012-10-08 10:14 |只看该作者
  1. sort test |uniq -d
复制代码
不知道效率怎么样,有谁说一下
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP