免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1676 | 回复: 7
打印 上一主题 下一主题

[文本处理] 我想过滤重复域,该怎么做? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-09-14 19:03 |只看该作者 |倒序浏览
我想过滤重复域,该怎么做?
例如,id:261068 和 code:102 有四行相同,我想通过命令过滤掉,只保留其中一行,

id:261068 AID: 1247390583 Error code:102
id:261068 AID: 1247390200 Error code:102
id:261068 AID: 1247390105 Error code:102
id:261068 AID: 1247390783 Error code:102
id:42132 AID: 1235615282 Error code:404
id:42132 AID: 1246819659 Error code:404
id:7387 AID: 1363426088 Error code:102
id:7387 AID: 1363426381 Error code:102
id:42132 AID: 1117287712 Error code:404
id:42132 AID: 1174863788 Error code:404
id:42132 AID: 1199131510 Error code:404

各位帮帮忙,谢谢了!!

论坛徽章:
10
2015亚冠之全北现代
日期:2015-06-16 09:16:24CU十四周年纪念徽章
日期:2016-08-08 11:20:3915-16赛季CBA联赛之青岛
日期:2016-02-17 09:14:2015-16赛季CBA联赛之北京
日期:2016-02-12 22:23:3215-16赛季CBA联赛之同曦
日期:2016-01-15 11:11:0815-16赛季CBA联赛之广东
日期:2016-01-15 10:46:4215-16赛季CBA联赛之北控
日期:2015-12-19 18:20:002015亚冠之山东鲁能
日期:2015-07-02 14:03:482015亚冠之吉达阿赫利
日期:2015-06-28 14:08:4015-16赛季CBA联赛之天津
日期:2017-04-21 10:37:41
2 [报告]
发表于 2012-09-14 19:25 |只看该作者
头和尾相同,中间不相同,你要保留那一行。   你的问题太有深度了吧?

论坛徽章:
0
3 [报告]
发表于 2012-09-14 19:47 |只看该作者
保留重复域的第一行
awk '!a[$1$NF]++'

论坛徽章:
0
4 [报告]
发表于 2012-09-15 16:58 |只看该作者
大神解释下,没看太懂~~~回复 3# kk5234


   

论坛徽章:
0
5 [报告]
发表于 2012-09-15 18:42 |只看该作者
回复 4# xu_liuzhen

哪里没懂啊,看看下面这个贴子。
http://bbs.chinaunix.net/forum.p ... 1672726#pid11904888
   

论坛徽章:
0
6 [报告]
发表于 2012-09-16 10:39 |只看该作者
现在懂了,谢谢了
这个文本由第一个域id就可以区分出来是否重复所以用$1,如果需要区分的域不止一个,假如要同时比对$1和$3,能否写成awk '!a[$1$3]++'   ?
或者有其他写法?

回复 5# kk5234


   

论坛徽章:
0
7 [报告]
发表于 2012-09-16 16:03 |只看该作者
回复 6# xu_liuzhen

可以的。
   

论坛徽章:
0
8 [报告]
发表于 2012-09-17 11:44 |只看该作者
好的,谢谢了回复 7# kk5234


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP