免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1938 | 回复: 9
打印 上一主题 下一主题

[文本处理] 指定范围求平均值 [复制链接]

论坛徽章:
3
金牛座
日期:2015-05-27 16:03:00午马
日期:2015-05-27 16:03:212015亚冠之德黑兰石油
日期:2015-06-09 11:13:42
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-03-31 15:03 |只看该作者 |倒序浏览
列1      列2        列3
a,        c,        0
a,        c,        1
a,        c,        1
a,        c,        1
a,        c,        0
a,        c,        0
a,        c,        0
a,        c,        2
b,        c,        0
b,        c,        1
b,        c,        0
b,        c,        1
b,        c,        2
b,        c,        2
b,        c,        2
b,        c,        4
b,        c,        1
================
按照上面的文件假如我以列1为参照,求出所有a对应的列3的平均值,b对应的列3的平均值;再以列2为参照求出c对应的列3的平均值,请问如何做??

求大神解答!!
                     

求职 : 机器学习
论坛徽章:
79
2015年亚洲杯纪念徽章
日期:2015-05-06 19:18:572015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之阿尔纳斯尔
日期:2015-09-07 09:30:232015亚冠之萨济拖拉机
日期:2015-10-21 08:26:3915-16赛季CBA联赛之浙江
日期:2015-12-30 09:59:1815-16赛季CBA联赛之浙江
日期:2016-01-10 12:35:21技术图书徽章
日期:2016-01-15 11:07:2015-16赛季CBA联赛之新疆
日期:2016-02-24 13:46:0215-16赛季CBA联赛之吉林
日期:2016-06-26 01:07:172015-2016NBA季后赛纪念章
日期:2016-06-28 17:44:45黑曼巴
日期:2016-06-28 17:44:4515-16赛季CBA联赛之浙江
日期:2017-07-18 13:41:54
2 [报告]
发表于 2015-03-31 15:25 |只看该作者
本帖最后由 zsszss0000 于 2015-03-31 15:28 编辑
  1. awk -vFS="," '{if($1=="a"){sum_a+=$3;a++}if($1=="b"){sum_b+=$3;b++}if($2~"c"){sum_c+=$3;c++}}END{print sum_a/c,sum_b/b,sum_c/c}' file
复制代码
  1. sed 's/ //g' file | awk -vFS="," '{if($1=="a"){sum_a+=$3;a++}if($1=="b"){sum_b+=$3;b++}if($2=="c"){sum_c+=$3;c++}}END{print sum_a/c,sum_b/b,sum_c/c}'
复制代码
  1. 0.3125 1.44444 1.125
复制代码

论坛徽章:
28
2015年迎新春徽章
日期:2015-03-04 10:16:53午马
日期:2015-03-20 17:11:07亥猪
日期:2015-03-20 17:11:23戌狗
日期:2015-03-20 17:11:33酉鸡
日期:2015-03-20 17:11:47申猴
日期:2015-03-20 17:11:58未羊
日期:2015-03-20 17:12:10子鼠
日期:2015-03-20 17:12:23丑牛
日期:2015-03-20 17:12:40卯兔
日期:2015-03-20 17:12:51辰龙
日期:2015-03-20 17:13:00巳蛇
日期:2015-03-20 17:13:12
3 [报告]
发表于 2015-03-31 15:46 |只看该作者
  1. awk '{a[$1]++;s[$1]+=$3;b[$2]++;m[$2]+=$3}END{for(i in a)print i,s[i]/a[i];for(j in b)print j,m[j]/b[j]}' inputfile
复制代码

求职 : 机器学习
论坛徽章:
79
2015年亚洲杯纪念徽章
日期:2015-05-06 19:18:572015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之阿尔纳斯尔
日期:2015-09-07 09:30:232015亚冠之萨济拖拉机
日期:2015-10-21 08:26:3915-16赛季CBA联赛之浙江
日期:2015-12-30 09:59:1815-16赛季CBA联赛之浙江
日期:2016-01-10 12:35:21技术图书徽章
日期:2016-01-15 11:07:2015-16赛季CBA联赛之新疆
日期:2016-02-24 13:46:0215-16赛季CBA联赛之吉林
日期:2016-06-26 01:07:172015-2016NBA季后赛纪念章
日期:2016-06-28 17:44:45黑曼巴
日期:2016-06-28 17:44:4515-16赛季CBA联赛之浙江
日期:2017-07-18 13:41:54
4 [报告]
发表于 2015-03-31 15:51 |只看该作者
这个为啥不需要指出FS=“,”回复 3# 我是一隻羊


   

论坛徽章:
28
2015年迎新春徽章
日期:2015-03-04 10:16:53午马
日期:2015-03-20 17:11:07亥猪
日期:2015-03-20 17:11:23戌狗
日期:2015-03-20 17:11:33酉鸡
日期:2015-03-20 17:11:47申猴
日期:2015-03-20 17:11:58未羊
日期:2015-03-20 17:12:10子鼠
日期:2015-03-20 17:12:23丑牛
日期:2015-03-20 17:12:40卯兔
日期:2015-03-20 17:12:51辰龙
日期:2015-03-20 17:13:00巳蛇
日期:2015-03-20 17:13:12
5 [报告]
发表于 2015-03-31 16:00 |只看该作者
回复 4# zsszss0000


    有好多空格在啊,我就没用' , '.....

论坛徽章:
3
金牛座
日期:2015-05-27 16:03:00午马
日期:2015-05-27 16:03:212015亚冠之德黑兰石油
日期:2015-06-09 11:13:42
6 [报告]
发表于 2015-03-31 16:21 |只看该作者
回复 2# zsszss0000
非常感谢回答,按你的方法完全可以,就是有一点不明白
awk -vFS="," '{if($1=="a"){sum_a+=$3;a++}if($1=="b"){sum_b+=$3;b++}if($2~"c"){sum_c+=$3;c++}}END{print sum_a/a,sum_b/b,sum_c/c}'
在这个命令中   $2~"c"为什么不能写成$2=="c"呢,我试了下换成==符号的话,结果是错误的,,但是$1~"a"没问题,$1~"b"也是没问题的

   

求职 : 机器学习
论坛徽章:
79
2015年亚洲杯纪念徽章
日期:2015-05-06 19:18:572015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之阿尔纳斯尔
日期:2015-09-07 09:30:232015亚冠之萨济拖拉机
日期:2015-10-21 08:26:3915-16赛季CBA联赛之浙江
日期:2015-12-30 09:59:1815-16赛季CBA联赛之浙江
日期:2016-01-10 12:35:21技术图书徽章
日期:2016-01-15 11:07:2015-16赛季CBA联赛之新疆
日期:2016-02-24 13:46:0215-16赛季CBA联赛之吉林
日期:2016-06-26 01:07:172015-2016NBA季后赛纪念章
日期:2016-06-28 17:44:45黑曼巴
日期:2016-06-28 17:44:4515-16赛季CBA联赛之浙江
日期:2017-07-18 13:41:54
7 [报告]
发表于 2015-03-31 16:23 |只看该作者
$2不是c,而是      (一串空格)c,所以使用~而不是==
  1. sed 's/ //g' file | awk -vFS="," '{if($1=="a"){sum_a+=$3;a++}if($1=="b"){sum_b+=$3;b++}if($2=="c"){sum_c+=$3;c++}}END{print sum_a/c,sum_b/b,sum_c/c}'
复制代码
这个我先用sed处理了一下就可以直接==了回复 6# lxh9090


   

论坛徽章:
3
金牛座
日期:2015-05-27 16:03:00午马
日期:2015-05-27 16:03:212015亚冠之德黑兰石油
日期:2015-06-09 11:13:42
8 [报告]
发表于 2015-03-31 16:31 |只看该作者
回复 2# zsszss0000

回复 3# 我是一隻羊

非常感谢两位大神的回答,哈哈,学习了!!

[root@localhost ceshishell]# sed 's/ //g' avg1.txt | awk -vFS="," '{if($1=="a"){sum_a+=$3;a++}if($1=="b"){sum_b+=$3;b++}if($2~"c"){sum_c+=$3;c++}}END{print sum_a/a,sum_b/b,sum_c/c}'
0.625 1.44444 1.05882

[root@localhost ceshishell]# awk '{a[$1]++;s[$1]+=$3;b[$2]++;m[$2]+=$3}END{for(i in a)print i,s/a;for(j in b)print j,m[j]/b[j]}' avg1.txt
a, 0.625
b, 1.44444
c, 1.05882
[root@localhost ceshishell]#


   

论坛徽章:
3
金牛座
日期:2015-05-27 16:03:00午马
日期:2015-05-27 16:03:212015亚冠之德黑兰石油
日期:2015-06-09 11:13:42
9 [报告]
发表于 2015-03-31 16:32 |只看该作者
回复 7# zsszss0000
非常感谢,明白了!

   

论坛徽章:
10
2015年亚洲杯之科威特
日期:2015-04-13 13:51:5315-16赛季CBA联赛之山东
日期:2016-01-16 18:35:0815-16赛季CBA联赛之广东
日期:2016-01-04 15:26:23程序设计版块每日发帖之星
日期:2015-11-13 06:20:002015亚冠之阿尔艾因
日期:2015-11-10 12:32:242015亚冠之阿尔沙巴布
日期:2015-05-15 18:26:49羊年新春福章
日期:2015-04-28 16:45:112015年亚洲杯之伊拉克
日期:2015-04-25 20:06:30羊年新春福章
日期:2015-04-13 13:53:2015-16赛季CBA联赛之八一
日期:2016-01-20 18:23:49
10 [报告]
发表于 2015-04-01 11:18 |只看该作者
  1. awk '{if($1~/a/)d[$1]++;e+=$3;if($1~/b/)f[$1]++;g+=$3;if($2~/c/)h[$2]++;k+=$3}END{for(i in d)print i FS d[i] FS e/d[i];for(j in f)print j FS f[j] FS g/f[j];for(m in h)print m FS h[m] FS k/h[m]}'  urfile
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP