免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2762 | 回复: 3
打印 上一主题 下一主题

[文本处理] 重复列求平均值 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-11-26 18:58 |只看该作者 |倒序浏览
  1. cc1     1
  2. cc1     2
  3. cc1     2
  4. cc2     1
  5. cc2     9
  6. cc3     2
  7. cc3     4
复制代码
想得到的结果是:
  1. cc1        1        1.67
  2. cc1        2        1.67
  3. cc1        2        1.67
  4. cc2        1        5
  5. cc2        9        5
  6. cc3        2        3
  7. cc3        4        3
复制代码
以第一列为源,重复的就求平均值并在第三列显示

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
2 [报告]
发表于 2013-11-26 19:04 |只看该作者
回复 1# c2-linux
  1. awk 'FNR==NR{a[$1]+=$2;b[$1]++;next}{print $0,a[$1]/b[$1]}' file file
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
3 [报告]
发表于 2013-11-27 09:37 |只看该作者
  1. [root@localhost ~]# cat i
  2. cc1     1
  3. cc1     2
  4. cc1     2
  5. cc2     1
  6. cc2     9
  7. cc3     2
  8. cc3     4
  9. [root@localhost ~]# awk 'NR==FNR{a[$1]+=$2;b[$1]++;next}{print $0"\t"a[$1]/b[$1]}' i i
  10. cc1     1       1.66667
  11. cc1     2       1.66667
  12. cc1     2       1.66667
  13. cc2     1       5
  14. cc2     9       5
  15. cc3     2       3
  16. cc3     4       3
  17. [root@localhost ~]#
复制代码

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
4 [报告]
发表于 2013-11-27 10:53 |只看该作者
回复 1# c2-linux

How about this
  1. $ cat FILE
  2. cc1     1
  3. cc1    2
  4. cc1    20
  5. cc2    1
  6. cc2      9
  7. cc3    12
  8. cc3     14

  9. $ awk '{cnt[$1]++;sum[$1]+=$2;a1[NR]=$1;a2[NR]=$2}END{for(n=0;n++<NR;)printf("%-8s %6d %6.2f\n",a1[n],a2[n],sum[a1[n]]/cnt[a1[n]])}' FILE
  10. cc1           1   7.67
  11. cc1           2   7.67
  12. cc1          20   7.67
  13. cc2           1   5.00
  14. cc2           9   5.00
  15. cc3          12  13.00
  16. cc3          14  13.00
复制代码

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP