免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2822 | 回复: 9
打印 上一主题 下一主题

[文本处理] 第一列相同的几行,取第二列数字最大的那一行 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-07-10 16:13 |只看该作者 |倒序浏览
文件内容:“
哈哈 10 的哇放大放大放大沙发倒萨倒萨
哈哈         5 的哇放大放
哈哈         3 放大放
啦啦 10 的哇放大放大放大沙发倒萨倒萨
啦啦         5 的哇放大放
啦啦         3 放大放


分三列,第一列相同的几行输出第二列数值最大的一行。输出为:

哈哈 10 的哇放大放大放大沙发倒萨倒萨
啦啦 10 的哇放大放大放大沙发倒萨倒萨



google半天了,没找到方法~~~~

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
2 [报告]
发表于 2014-07-10 16:26 |只看该作者
本帖最后由 关阴月飞 于 2014-07-10 16:30 编辑

看错了.....
  1. awk 'FNR==NR{if($2>max)max=$2;next}$2==max'  file file
复制代码

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
3 [报告]
发表于 2014-07-10 16:28 |只看该作者
回复 1# GoGo闯
  目前发现, 我的办法都是最笨的.

如果 第二列一定是数字, 在第一个sort 中要加上-n 参数.
  1. sort -k2,2 file | sort -k1,1 -u
复制代码

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
4 [报告]
发表于 2014-07-10 16:31 |只看该作者
  1. awk '$2>b[$1]{b[$1]=$2;a[$1]=$0}END{for(i in a)print a[i]}' file
复制代码

论坛徽章:
0
5 [报告]
发表于 2014-07-10 16:36 |只看该作者
本帖最后由 GoGo闯 于 2014-07-10 16:36 编辑

谢各位帮忙,刚才稀里糊涂整出个办法。
  1. cat file|sort -k1n -k2nr|awk '!a[$1]++'
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
6 [报告]
发表于 2014-07-10 16:37 |只看该作者
  1. awk '{if($2>m[$1])s[$1]=$0;m[$1]=$2}END{for(i in s)print s[i]}'
复制代码

论坛徽章:
1
处女座
日期:2014-09-18 16:18:00
7 [报告]
发表于 2014-07-10 16:41 |只看该作者
  1. wk 'NR==1{v=$1;max=$2;text[n]=$0}{if($1!=v){n++;max=0}if(max<$2){max=$2;text[n]=$0};v=$1}END{for(i in text)print text[i]}' testfile1
复制代码
比较搓。。。来练习一下

论坛徽章:
1
处女座
日期:2014-09-18 16:18:00
8 [报告]
发表于 2014-07-10 16:42 |只看该作者
回复 6# yestreenstars

我去你们的太简便了。。。赶紧瞄一瞄
   

论坛徽章:
1
处女座
日期:2014-09-18 16:18:00
9 [报告]
发表于 2014-07-10 16:49 |只看该作者
本帖最后由 Kasiotao 于 2014-07-10 16:49 编辑

回复 6# yestreenstars
关联数组的妙用啊。。。理解了。。。,感觉自己思路还没打开

   

论坛徽章:
0
10 [报告]
发表于 2014-07-10 20:55 |只看该作者
回复 3# q1208c 厉害


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP