免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2328 | 回复: 6

[文本处理] shell处理相同的行? [复制链接]

论坛徽章:
3
2015亚冠之布里斯班狮吼
日期:2015-06-25 18:46:20程序设计版块每日发帖之星
日期:2015-09-17 06:20:0015-16赛季CBA联赛之江苏
日期:2017-01-09 21:37:58
发表于 2017-11-27 21:39 |显示全部楼层
我有一个文件,里面有几千行,但是里面有重复的行:比如:

T23    TJ      23.12   56.678
WUQ   YU     13.02   57.689
T23    TJ      23.12   56.678
YIN     SQ     25.369   23.943
。。。。。。

现在第一行与第三行的四列值相同,所以要删掉第三行或者第一行,保证不重复,用shell怎么实现啊?谢谢!


论坛徽章:
0
发表于 2017-11-28 09:16 |显示全部楼层
如果只是删除重复的行,就很简单了。
[root@localhost ~]# cat a.log
T23    TJ      23.12   56.678
WUQ   YU     13.02   57.689
T23    TJ      23.12   56.678
YIN     SQ     25.369   23.943
[root@localhost ~]# cat a.log |sort -u
T23    TJ      23.12   56.678
WUQ   YU     13.02   57.689
YIN     SQ     25.369   23.943

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
发表于 2017-11-28 13:19 |显示全部楼层
回复 1# tengfei0311

$ awk '!a[$0]++' FILE

http://bbs.chinaunix.net/thread-2309494-1-1.html

论坛徽章:
3
15-16赛季CBA联赛之八一
日期:2017-12-29 13:06:2315-16赛季CBA联赛之天津
日期:2018-08-08 17:39:4619周年集字徽章-年
日期:2019-12-25 22:50:31
发表于 2017-11-28 14:47 |显示全部楼层
回复 1# tengfei0311

awk '!a[$3]++'  log

论坛徽章:
3
15-16赛季CBA联赛之八一
日期:2017-12-29 13:06:2315-16赛季CBA联赛之天津
日期:2018-08-08 17:39:4619周年集字徽章-年
日期:2019-12-25 22:50:31
发表于 2017-11-28 14:48 |显示全部楼层
回复 1# tengfei0311

awk '!a[$3]++'  log

论坛徽章:
3
15-16赛季CBA联赛之八一
日期:2017-12-29 13:06:2315-16赛季CBA联赛之天津
日期:2018-08-08 17:39:4619周年集字徽章-年
日期:2019-12-25 22:50:31
发表于 2017-11-28 14:54 |显示全部楼层
[$4]        

论坛徽章:
25
程序设计版块每日发帖之星
日期:2016-05-03 06:20:0015-16赛季CBA联赛之八一
日期:2018-07-05 10:34:09黑曼巴
日期:2018-07-06 15:19:5015-16赛季CBA联赛之佛山
日期:2018-08-03 13:19:3315-16赛季CBA联赛之山西
日期:2018-08-07 19:46:2315-16赛季CBA联赛之广夏
日期:2018-08-08 19:31:5015-16赛季CBA联赛之青岛
日期:2018-11-26 15:21:5015-16赛季CBA联赛之上海
日期:2018-12-11 09:45:3219周年集字徽章-年
日期:2020-04-18 23:54:5215-16赛季CBA联赛之深圳
日期:2020-04-19 21:40:19黑曼巴
日期:2022-04-03 17:55:1315-16赛季CBA联赛之八一
日期:2018-07-03 16:56:46
发表于 2017-11-28 21:10 |显示全部楼层
回复 1# tengfei0311


  1. sort -u file
  2. awk '!a[$0]++' file
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP