忘记密码   免费注册 查看新帖 | 论坛精华区
ChinaUnix.net
  平台论坛 博客 微博 读书 人才 精华 文库 自测 | 频道操作系统 开发 数据库 存储 服务器 网络 IT新闻 Linux 下载 Power用户组
最近访问板块 发新帖
查看: 1875 | 回复: 14

请教用awk对同一文件分类统计最大值及平均值 [复制链接]
更多

帖子
50
主题
3
精华
0
可用积分
82
专家积分
0
在线时间
181 小时
注册时间
2007-11-18
最后登录
2012-02-08
论坛徽章:
0
发表于 2009-07-03 11:40:35 |显示全部楼层
有一文件内容如下:
2009-4-2 15:00        291        239
2009-4-2 15:15        163        177
2009-4-2 15:30        240        269
2009-4-2 15:45        234        252
2009-4-3 15:15        159        157
2009-4-3 15:30        203        201
2009-4-3 15:45        329        357
2009-4-3 16:00        296        224
2009-4-3 16:15        229        219
对此文本想根据$1相同的行,分别求$3和$4的平均值,和最大值,按以下结果输出,请问用awk怎么做?
结果:
2009-4-2   $3平均值   $4平均值  $3最大值  $4最大值
2009-4-3   $3平均值   $4平均值  $3最大值  $4最大值
Go well, go shell

Rank: 8Rank: 8

帖子
1829
主题
104
精华
0
可用积分
6357
专家积分
10
在线时间
1079 小时
注册时间
2006-08-25
最后登录
2012-02-09
论坛徽章:
0
发表于 2009-07-03 11:43:50 |显示全部楼层
作业?

帖子
50
主题
3
精华
0
可用积分
82
专家积分
0
在线时间
181 小时
注册时间
2007-11-18
最后登录
2012-02-08
论坛徽章:
0
发表于 2009-07-03 11:52:31 |显示全部楼层
原帖由 rdcwayx 于 2009-7-3 11:43 发表
作业?


不是作业呢,是工作需要,但我对这些一点都不懂,要处理很多数据。所以上来请教一下。

Rank: 9Rank: 9Rank: 9

帖子
5034
主题
69
精华
0
可用积分
41814
专家积分
170
在线时间
3293 小时
注册时间
2005-12-11
最后登录
2012-02-09
论坛徽章:
0
发表于 2009-07-03 11:58:35 |显示全部楼层
  1. awk '{a[$1]++;s3[$1]+=$3;s4[$1]+=$4;max3[$1]=($3>max3[$1]?$3:max3[$1]);max4[$1]=($4>max4[$1]?$4:max4[$1])}END{for (i in a) print i,s3[i]/a[i],s4[i]/a[i],max3[i],max4[i]}' file
复制代码
[楼主]:说说你们在打野球的时候对手什么庆祝动作最令你无语?

我刚刚一口气进了两个三分哦。
嗯~嗯

帖子
50
主题
3
精华
0
可用积分
82
专家积分
0
在线时间
181 小时
注册时间
2007-11-18
最后登录
2012-02-08
论坛徽章:
0
发表于 2009-07-03 13:07:49 |显示全部楼层
原帖由 ywlscpl 于 2009-7-3 11:58 发表
awk '{a[$1]++;s3[$1]+=$3;s4[$1]+=$4;max3[$1]=($3>max3[$1]?$3:max3[$1]);max4[$1]=($4>max4[$1]?$4:max4[$1])}END{for (i in a) print i,s3/a,s4/a,max3,max4}' file


多谢大侠指点,但我文件里的数据都是按日期顺序来排,但不知道为何执行这个操作后输出的结果没有按原来的时间顺序来排列:
下面是简化命令后的输出结果
# awk '{a[$1]++;s3[$1]+=$3} END {for (i in a) print i,s3/a}' test.txt
2009-6-25 1009.88
2009-6-16 690.441
2009-6-5 2424.56
2009-5-26 2053.69
2009-5-17 1287.49
2009-5-6 393.426
2009-4-27 341.574

Rank: 2

帖子
509
主题
31
精华
0
可用积分
1205
专家积分
1
在线时间
4345 小时
注册时间
2007-11-01
最后登录
2012-02-05
论坛徽章:
0
发表于 2009-07-03 13:13:38 |显示全部楼层

回复 #5 hapig 的帖子

那你就排排阿 再 (sort)
--awk 数组是无序的
-----------------------------------------------------------------
GNU bash, version 3.1.17(6)-release (i686-pc-cygwin)

帖子
50
主题
3
精华
0
可用积分
82
专家积分
0
在线时间
181 小时
注册时间
2007-11-18
最后登录
2012-02-08
论坛徽章:
0
发表于 2009-07-03 13:43:49 |显示全部楼层
多谢各位指点了,现在就剩下最大值的问题了,执行出错,把ywlscpl 的命令全部输进去也是报错。

# awk '{a[$1]++;max3[$1]=($3>max3[$1]?$3:max3[$1])} END {for (i in a) print i,max3}'  test.txt
awk: syntax error near line 1
awk: illegal statement near line 1

Rank: 7Rank: 7Rank: 7

帖子
11378
主题
90
精华
0
可用积分
16388
专家积分
369
在线时间
4706 小时
注册时间
2007-10-22
最后登录
2012-02-09
论坛徽章:
0
发表于 2009-07-03 14:00:00 |显示全部楼层
try:
  1. $ awk '$1!=p{if(p) print p"\t"s3/a[p]"\t"s4/a[p]"\t"m3"\t"m4;s3=0;s4=0;p=$1}{s3+=$3;s4+=$4;a[p]++;if($3>m3)m3=$3;if($4>m4)m4=$4}END{print p"\t"s3/a[p]"\t"s4/a[p]"\t"m3"\t"m4}' urfile
复制代码

LIVE FREE OR DIE!     K.I.S.S.  DRY




远离                                                                                                                                                                       shell

Rank: 9Rank: 9Rank: 9

帖子
5034
主题
69
精华
0
可用积分
41814
专家积分
170
在线时间
3293 小时
注册时间
2005-12-11
最后登录
2012-02-09
论坛徽章:
0
发表于 2009-07-03 14:01:34 |显示全部楼层
  1. 你输错了  max3[i]
  2. awk '{a[$1]++;max3[$1]=($3>max3[$1]?$3:max3[$1])} END {for (i in a) print i,max3[i]}'  test.txt
复制代码
[楼主]:说说你们在打野球的时候对手什么庆祝动作最令你无语?

我刚刚一口气进了两个三分哦。
嗯~嗯

帖子
84
主题
50
精华
0
可用积分
103
专家积分
0
在线时间
693 小时
注册时间
2004-03-13
最后登录
2011-11-01
论坛徽章:
0
发表于 2009-07-03 14:24:54 |显示全部楼层

回复 #7 hapig 的帖子

awk '{a[$1]++;max3[$1]=($3>max3[$1]?$3:max3[$1])} END {for (j in a) print j,max3[j]}' test.txt
您需要登录后才可以回帖 登录 | 注册

北京皓辰网域网络信息技术有限公司. 版权所有 京ICP证:060528号 北京市公安局海淀分局网监中心备案编号:1101082001
广播电视节目制作经营许可证(京) 字第1234号 中国互联网协会会员  联系我们:
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP