免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1552 | 回复: 9

[文本处理] 另类平均值求法 [复制链接]

论坛徽章:
0
发表于 2014-04-27 14:36 |显示全部楼层
本帖最后由 秋天的絮儿 于 2014-04-27 14:37 编辑

Dear:
第7行连续相同的话,求该连续行第三列的平均值并写在列的最后。



------------------------------------------------------------------
源文件:
  1. a       b       3       q       e       w       aaa
  2. a       b       4       q       e       w       bbb
  3. a       b       5       q       e       w       bbb
  4. a       b       5       q       e       w       ccc
  5. a       b       5       q       e       w       ccc
  6. a       b       4       q       e       w       aaa
  7. a       b       8       q       e       w       aaa
  8. a       b       2       q       e       w       ccc
  9. a       b       5       q       e       w       ccc
复制代码
目标文件:
  1. a        b        3        q        e        w        aaa        3
  2. a        b        4        q        e        w        bbb        4.5
  3. a        b        5        q        e        w        bbb        4.5
  4. a        b        5        q        e        w        ccc        5
  5. a        b        5        q        e        w        ccc        5
  6. a        b        4        q        e        w        aaa        6
  7. a        b        8        q        e        w        aaa        6
  8. a        b        2        q        e        w        ccc        3.5
  9. a        b        5        q        e        w        ccc        3.5
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
发表于 2014-04-27 17:25 |显示全部楼层
  1. #!/usr/bin/awk -f
  2. {
  3.         a[NR]=$0
  4.         b[NR]=$3
  5.         c[NR]=$7
  6. }
  7. END{
  8.         for(i=0;i++<NR;){
  9.                 if(c[i+1]==c[i]){
  10.                         j=i
  11.                         sum=b[j]
  12.                         while(c[j+1]==c[j]){
  13.                                 sum+=b[j+1]
  14.                                 j++
  15.                         }
  16.                         avg=sum/(j-i+1)
  17.                         while(i<=j){
  18.                                 print a[i]"\t"avg
  19.                                 i++
  20.                         }
  21.                         i=j
  22.                 }else{
  23.                         print a[i]"\t"b[i]
  24.                 }
  25.         }
  26. }
复制代码

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
发表于 2014-04-27 23:33 |显示全部楼层
  1. $ awk 'NR==FNR{if($7!=p){if(NR!=1)a[np]=s/c;np=NR;s=$3;c=1}else {s+=$3;c++};p=$7;next}FNR==1{a[np]=s/c}{if(a[FNR]) p=a[FNR];print $0,p}' urfile urfile
复制代码

论坛徽章:
0
发表于 2014-04-28 08:51 |显示全部楼层
回复 3# blackold


    膜拜黑哥。

论坛徽章:
0
发表于 2014-04-28 08:51 |显示全部楼层
回复 2# yestreenstars


    谢谢,可以使用

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
发表于 2014-04-28 09:54 |显示全部楼层
  1. awk '$NF!=v{i++}FNR==1{i=1}{k=$NF""i}NR==FNR{c[k]++;s[k]+=$3}NR>FNR{print $0,s[k]/c[k]}{v=$NF}' file file
复制代码

论坛徽章:
0
发表于 2014-04-28 10:34 |显示全部楼层
都很牛,答案都出来了,我承认题目都没有看懂

论坛徽章:
6
处女座
日期:2014-04-02 16:07:17酉鸡
日期:2014-04-14 10:09:22子鼠
日期:2014-04-17 11:57:30辰龙
日期:2014-09-01 17:14:08戌狗
日期:2014-10-28 12:25:54未羊
日期:2014-11-14 11:31:58
发表于 2014-04-28 10:36 |显示全部楼层
  1. awk 'NR>1&&$7!=c{for(i=1;i<=x;i++)print d[i]"\t"a/b;a=0;b=0;x=0}{a=a+$3;b++;c=$7;x++;d[x]=$0}END{for(i=1;i<=x;i++)print d[i]"\t"a/b}' a.txt
复制代码

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
发表于 2014-04-28 12:21 |显示全部楼层
  1. $ echo | awk 'NR>1&&$7!=c||NR!=FNR{for(i=1;i<=x;i++)print d[i]"\t"a/b;a=0;b=0;x=0}{a=a+$3;b++;c=$7;x++;d[x]=$0}'  a.txt  -
复制代码

论坛徽章:
130
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
发表于 2014-04-28 15:26 |显示全部楼层
回复 1# 秋天的絮儿

How about this way with read FILE one times only

$ awk 'function out(){for(n=1;n<=c;n++)print a[n]"\t"s/c;s=c=0}{if(S7!=$7)out();s+=$3;a[++c]=$0;S7=$7}END{out()}' FILE
a       b       3       q       e       w       aaa        3
a       b       4       q       e       w       bbb        4.5
a       b       5       q       e       w       bbb        4.5
a       b       5       q       e       w       ccc        5
a       b       5       q       e       w       ccc        5
a       b       4       q       e       w       aaa        6
a       b       8       q       e       w       aaa        6
a       b       2       q       e       w       ccc        3.5
a       b       5       q       e       w       ccc        3.5

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

DTCC2020中国数据库技术大会

【架构革新 高效可控】2020年12月21日-23日第十一届中国数据库技术大会将在北京隆重召开。

大会设置2大主会场,20+技术专场,将邀请超百位行业专家,重点围绕数据架构、AI与大数据、传统企业数据库实践和国产开源数据库等内容展开分享和探讨,为广大数据领域从业人士提供一场年度盛会和交流平台。

http://dtcc.it168.com


大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP