免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 6563 | 回复: 14
打印 上一主题 下一主题

请教用awk对同一文件分类统计最大值及平均值 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-07-03 11:40 |只看该作者 |倒序浏览
有一文件内容如下:
2009-4-2 15:00        291        239
2009-4-2 15:15        163        177
2009-4-2 15:30        240        269
2009-4-2 15:45        234        252
2009-4-3 15:15        159        157
2009-4-3 15:30        203        201
2009-4-3 15:45        329        357
2009-4-3 16:00        296        224
2009-4-3 16:15        229        219
对此文本想根据$1相同的行,分别求$3和$4的平均值,和最大值,按以下结果输出,请问用awk怎么做?
结果:
2009-4-2   $3平均值   $4平均值  $3最大值  $4最大值
2009-4-3   $3平均值   $4平均值  $3最大值  $4最大值

论坛徽章:
15
2015年辞旧岁徽章
日期:2015-03-03 16:54:15双鱼座
日期:2015-01-15 17:29:44午马
日期:2015-01-06 17:06:51子鼠
日期:2014-11-24 10:11:13寅虎
日期:2014-08-18 07:10:55酉鸡
日期:2014-04-02 12:24:51双子座
日期:2014-04-02 12:19:44天秤座
日期:2014-03-17 11:43:36亥猪
日期:2014-03-13 08:13:51未羊
日期:2014-03-11 12:42:03白羊座
日期:2013-11-20 10:15:18CU大牛徽章
日期:2013-04-17 11:48:45
2 [报告]
发表于 2009-07-03 11:43 |只看该作者
作业?

论坛徽章:
0
3 [报告]
发表于 2009-07-03 11:52 |只看该作者
原帖由 rdcwayx 于 2009-7-3 11:43 发表
作业?


不是作业呢,是工作需要,但我对这些一点都不懂,要处理很多数据。所以上来请教一下。

论坛徽章:
0
4 [报告]
发表于 2009-07-03 11:58 |只看该作者
  1. awk '{a[$1]++;s3[$1]+=$3;s4[$1]+=$4;max3[$1]=($3>max3[$1]?$3:max3[$1]);max4[$1]=($4>max4[$1]?$4:max4[$1])}END{for (i in a) print i,s3[i]/a[i],s4[i]/a[i],max3[i],max4[i]}' file
复制代码

论坛徽章:
0
5 [报告]
发表于 2009-07-03 13:07 |只看该作者
原帖由 ywlscpl 于 2009-7-3 11:58 发表
awk '{a[$1]++;s3[$1]+=$3;s4[$1]+=$4;max3[$1]=($3>max3[$1]?$3:max3[$1]);max4[$1]=($4>max4[$1]?$4:max4[$1])}END{for (i in a) print i,s3/a,s4/a,max3,max4}' file


多谢大侠指点,但我文件里的数据都是按日期顺序来排,但不知道为何执行这个操作后输出的结果没有按原来的时间顺序来排列:
下面是简化命令后的输出结果
# awk '{a[$1]++;s3[$1]+=$3} END {for (i in a) print i,s3/a}' test.txt
2009-6-25 1009.88
2009-6-16 690.441
2009-6-5 2424.56
2009-5-26 2053.69
2009-5-17 1287.49
2009-5-6 393.426
2009-4-27 341.574

论坛徽章:
0
6 [报告]
发表于 2009-07-03 13:13 |只看该作者

回复 #5 hapig 的帖子

那你就排排阿 再 (sort)
--awk 数组是无序的

论坛徽章:
0
7 [报告]
发表于 2009-07-03 13:43 |只看该作者
多谢各位指点了,现在就剩下最大值的问题了,执行出错,把ywlscpl 的命令全部输进去也是报错。

# awk '{a[$1]++;max3[$1]=($3>max3[$1]?$3:max3[$1])} END {for (i in a) print i,max3}'  test.txt
awk: syntax error near line 1
awk: illegal statement near line 1

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
8 [报告]
发表于 2009-07-03 14:00 |只看该作者
try:
  1. $ awk '$1!=p{if(p) print p"\t"s3/a[p]"\t"s4/a[p]"\t"m3"\t"m4;s3=0;s4=0;p=$1}{s3+=$3;s4+=$4;a[p]++;if($3>m3)m3=$3;if($4>m4)m4=$4}END{print p"\t"s3/a[p]"\t"s4/a[p]"\t"m3"\t"m4}' urfile
复制代码

论坛徽章:
0
9 [报告]
发表于 2009-07-03 14:01 |只看该作者
  1. 你输错了  max3[i]
  2. awk '{a[$1]++;max3[$1]=($3>max3[$1]?$3:max3[$1])} END {for (i in a) print i,max3[i]}'  test.txt
复制代码

论坛徽章:
0
10 [报告]
发表于 2009-07-03 14:24 |只看该作者

回复 #7 hapig 的帖子

awk '{a[$1]++;max3[$1]=($3>max3[$1]?$3:max3[$1])} END {for (j in a) print j,max3[j]}' test.txt
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP