忘记密码   免费注册 查看新帖 | 论坛精华区

ChinaUnix.net

  平台 论坛 博客 认证专区 大话IT HPC论坛 徽章 文库 沙龙 自测 下载 频道自动化运维 虚拟化 储存备份 C/C++ PHP MySQL 嵌入式 Linux系统
最近访问板块 发新帖
查看: 421 | 回复: 2

[文本处理] 计算每列数值平均 [复制链接]

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:49:03
发表于 2017-07-14 19:57 |显示全部楼层
本帖最后由 shihyu 于 2017-07-14 20:00 编辑
  1. #!/usr/bin/python
  2. # -*- coding: utf-8 -*-
  3. import re
  4. import sys

  5. def get_nodes(inputline):
  6.     p = re.compile("g\=\(([-+]?\d+\.\d+)\,\s([-+]?\d+\.\d+),\s([-+]?\d+\.\d+).*a\=\(([-+]?\d+\.\d+),\s([-+]?\d+\.\d+),\s([-+]?\d+\.\d+)")
  7.     lines = inputline.read()
  8.     lines = lines.strip().split('\n')
  9.     lens = len(lines)

  10.     print(lens)

  11.     s0 = 0
  12.     s1 = 0
  13.     s2 = 0
  14.     s3 = 0
  15.     s4 = 0
  16.     s5 = 0

  17.     for i in range(0, lens, 1):
  18.         n1 = p.findall(lines[i])[0]
  19.         s0 = s0 + float(n1[0])
  20.         s1 = s1 + float(n1[1])
  21.         s2 = s2 + float(n1[2])
  22.         s3 = s3 + float(n1[3])
  23.         s4 = s4 + float(n1[4])
  24.         s5 = s5 + float(n1[5])

  25.     print(s0 / lens)
  26.     print(s1 / lens)
  27.     print(s2 / lens)
  28.     print(s3 / lens)
  29.     print(s4 / lens)
  30.     print(s5 / lens)

  31. if __name__ == "__main__":
  32.     fin = open(sys.argv[1])
  33.     get_nodes(fin)
复制代码

g=(0.00000, -0.00195, 0.00000), a=(9.13281, -0.03906, 0.56836)
g=(0.00000, -0.00195, 0.00000), a=(9.12305, -0.05859, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.06445, -0.04883, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.04492, -0.02930, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.07422, -0.05859, 0.59766)
g=(0.00000, -0.00195, 0.00000), a=(9.02539, -0.04883, 0.58789)
g=(0.00000, -0.00195, 0.00000), a=(9.05469, -0.06836, 0.52930)
g=(0.00000, -0.00195, 0.00000), a=(9.11328, -0.03906, 0.63672)
g=(0.00000, -0.00195, 0.00000), a=(9.08398, -0.06836, 0.55859)
g=(0.00000, -0.00195, 0.00000), a=(9.06445, -0.06836, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.12305, -0.06836, 0.62695)
g=(0.00000, -0.00195, 0.00000), a=(9.10352, -0.05859, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.08398, -0.07813, 0.57813)



我目前是用 python regular expression 计算出每列数值总和的平均~ 不知道用 sed or awk 一行代码有办法作到同样事情嘛?

谢谢


论坛徽章:
115
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07巳蛇
日期:2014-05-09 16:43:18巨蟹座
日期:2014-10-23 17:48:38子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59
发表于 2017-07-14 21:07 |显示全部楼层
回复 1# shihyu

How about this ...

$ awk -F, '{gsub(".=\\(","");for(n=1;n<=NF;++n)a[n]+=$n}END{for(n=1;n<=NF;++n)s=s a[n]/NR " ";print s}' FILE
0 -0.00195 0 9.08398 -0.05634 0.582635

$ cat FILE
g=(0.00000, -0.00195, 0.00000), a=(9.13281, -0.03906, 0.56836)
g=(0.00000, -0.00195, 0.00000), a=(9.12305, -0.05859, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.06445, -0.04883, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.04492, -0.02930, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.07422, -0.05859, 0.59766)
g=(0.00000, -0.00195, 0.00000), a=(9.02539, -0.04883, 0.58789)
g=(0.00000, -0.00195, 0.00000), a=(9.05469, -0.06836, 0.52930)
g=(0.00000, -0.00195, 0.00000), a=(9.11328, -0.03906, 0.63672)
g=(0.00000, -0.00195, 0.00000), a=(9.08398, -0.06836, 0.55859)
g=(0.00000, -0.00195, 0.00000), a=(9.06445, -0.06836, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.12305, -0.06836, 0.62695)
g=(0.00000, -0.00195, 0.00000), a=(9.10352, -0.05859, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.08398, -0.07813, 0.57813)

论坛徽章:
0
发表于 2017-07-17 13:06 |显示全部楼层
数据处理,格式化成csv的部分=略

数据:
zd1,zd2,zd3
11,42,33
21,26,35
61,57,13
70,72,94

win,linux通用,测试通过的,powershell代码:
  1. $a = import-csv a:\pscode\temp227\aaa.csv
  2. $b = $a | Measure-Object -Property zd1 -Average
  3. $b
复制代码


返回:
Count    : 4
Average  : 40.75
Sum      :
Maximum  :
Minimum  :
Property : zd1

$b.Average
返回 40.75

powershell 强 简 死你。
win,linux通用的,脚本【速成大师】的路上,并不拥挤。知道powershell简单强大,并能坚持学的人,并不多。

您需要登录后才可以回帖 登录 | 注册

本版积分规则

10张SACC2017门票等你来拿~

在数字化转型时代,云已成为万物智能的数字化大脑。而随着大数据应用、人工智能、移动互联网等技术的飞速发展,“智慧 +” 的概念正在深入到各行各业,提升企业效率,释放商业潜能,创造全新机遇。作为国内顶级技术盛会之一,2017 中国系统架构师大会(SACC2017)将于 10 月 19-21 日在北京新云南皇冠假日酒店震撼来袭。今年,大会以 “云智未来” 为主题,云集国内外顶级专家,围绕云计算、人工智能、大数据、移动互联网、产业应用等热点领域展开技术探讨与交流。本届大会共设置 2 大主会场,18 个技术专场;邀请来自互联网、金融、制造业、电商等多个领域,100 余位技术专家及行业领袖来分享他们的经验;并将吸引 4000 + 人次的系统运维、架构师及 IT 决策人士参会,为他们提供最具价值的交流平台。
----------------------------------------
优惠时间:2017年10月19日前

活动链接>>
  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号 北京市公安局海淀分局网监中心备案编号:11010802020122
广播电视节目制作经营许可证(京) 字第1234号 中国互联网协会会员  联系我们:
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP