免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: solu
打印 上一主题 下一主题

[文本处理] shell 如何根据某一列去重,获取某一列的最大值? [复制链接]

论坛徽章:
2
2015年迎新春徽章
日期:2015-03-04 10:01:44程序设计版块每日发帖之星
日期:2015-06-28 22:20:00
11 [报告]
发表于 2015-07-09 20:50 |只看该作者
{
        a[$1]=a[$1]>$2?a[$1]2
}
END{
        for(i in a)
        {
                print i,a[i]
        }
}

论坛徽章:
24
申猴
日期:2014-10-10 15:56:39射手座
日期:2014-10-10 15:57:18黑曼巴
日期:2018-05-14 11:05:122016科比退役纪念章
日期:2018-05-14 11:05:0715-16赛季CBA联赛之北控
日期:2018-05-14 11:05:0015-16赛季CBA联赛之江苏
日期:2017-02-27 18:11:0715-16赛季CBA联赛之上海
日期:2018-08-15 09:48:5415-16赛季CBA联赛之佛山
日期:2018-07-20 17:14:2315-16赛季CBA联赛之佛山
日期:2019-09-10 18:08:4615-16赛季CBA联赛之山西
日期:2020-03-26 09:40:5115-16赛季CBA联赛之佛山
日期:2020-05-08 09:03:54
12 [报告]
发表于 2015-07-10 11:49 |只看该作者
awk '$2>a[$1]{a[$1]=$2}END{for(i in a){print i,a[i]}}' aa.txt

论坛徽章:
11
程序设计版块每日发帖之星
日期:2015-09-09 06:20:00CU十四周年纪念徽章
日期:2016-05-16 11:11:112016科比退役纪念章
日期:2016-05-04 17:16:57程序设计版块每日发帖之星
日期:2016-02-20 06:20:00程序设计版块每周发帖之星
日期:2015-11-06 19:30:58程序设计版块每日发帖之星
日期:2015-09-12 06:20:00程序设计版块每日发帖之星
日期:2015-09-11 06:20:00每日论坛发贴之星
日期:2015-09-10 06:20:00程序设计版块每日发帖之星
日期:2015-09-10 06:20:00每日论坛发贴之星
日期:2015-09-09 06:20:0015-16赛季CBA联赛之四川
日期:2016-12-15 15:52:10
13 [报告]
发表于 2015-09-06 16:54 |只看该作者
awk '{if(a[$1]<$2)a[$1]=$2} END{for(i in a)print i,a[i]}' test.txt

论坛徽章:
1
15-16赛季CBA联赛之江苏
日期:2016-10-26 16:19:04
14 [报告]
发表于 2016-09-02 11:19 |只看该作者
awk '{a[$1]=$2;if(a[$1]<$2)a[$1]=$2}END{for(i in a)print i,a[i]}' file

论坛徽章:
28
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
15 [报告]
发表于 2016-09-02 11:44 |只看该作者
本帖最后由 moperyblue 于 2016-09-02 11:54 编辑
  1. sort -k2,2nr|awk '!a[$1]++'
  2. sort -k1,1 -k2,2n|sed -r 'N;/(\S+).*\n\1/!P;D'
  3. awk '$2>a[$1]{a[$1]=$2}END{for(i in a)print i,a[i]}'
  4. awk '$2>a[$1]{a[$1]=$2}!b[$1]++{c[++d]=$1}END{for(;i++<d;)print c[i],a[c[i]]}' #按第一列顺序
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP