免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1304 | 回复: 2
打印 上一主题 下一主题

[文本处理] 计算每列数值平均 [复制链接]

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:49:03
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2017-07-14 19:57 |只看该作者 |倒序浏览
本帖最后由 shihyu 于 2017-07-14 20:00 编辑
  1. #!/usr/bin/python
  2. # -*- coding: utf-8 -*-
  3. import re
  4. import sys

  5. def get_nodes(inputline):
  6.     p = re.compile("g\=\(([-+]?\d+\.\d+)\,\s([-+]?\d+\.\d+),\s([-+]?\d+\.\d+).*a\=\(([-+]?\d+\.\d+),\s([-+]?\d+\.\d+),\s([-+]?\d+\.\d+)")
  7.     lines = inputline.read()
  8.     lines = lines.strip().split('\n')
  9.     lens = len(lines)

  10.     print(lens)

  11.     s0 = 0
  12.     s1 = 0
  13.     s2 = 0
  14.     s3 = 0
  15.     s4 = 0
  16.     s5 = 0

  17.     for i in range(0, lens, 1):
  18.         n1 = p.findall(lines[i])[0]
  19.         s0 = s0 + float(n1[0])
  20.         s1 = s1 + float(n1[1])
  21.         s2 = s2 + float(n1[2])
  22.         s3 = s3 + float(n1[3])
  23.         s4 = s4 + float(n1[4])
  24.         s5 = s5 + float(n1[5])

  25.     print(s0 / lens)
  26.     print(s1 / lens)
  27.     print(s2 / lens)
  28.     print(s3 / lens)
  29.     print(s4 / lens)
  30.     print(s5 / lens)

  31. if __name__ == "__main__":
  32.     fin = open(sys.argv[1])
  33.     get_nodes(fin)
复制代码

g=(0.00000, -0.00195, 0.00000), a=(9.13281, -0.03906, 0.56836)
g=(0.00000, -0.00195, 0.00000), a=(9.12305, -0.05859, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.06445, -0.04883, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.04492, -0.02930, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.07422, -0.05859, 0.59766)
g=(0.00000, -0.00195, 0.00000), a=(9.02539, -0.04883, 0.58789)
g=(0.00000, -0.00195, 0.00000), a=(9.05469, -0.06836, 0.52930)
g=(0.00000, -0.00195, 0.00000), a=(9.11328, -0.03906, 0.63672)
g=(0.00000, -0.00195, 0.00000), a=(9.08398, -0.06836, 0.55859)
g=(0.00000, -0.00195, 0.00000), a=(9.06445, -0.06836, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.12305, -0.06836, 0.62695)
g=(0.00000, -0.00195, 0.00000), a=(9.10352, -0.05859, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.08398, -0.07813, 0.57813)



我目前是用 python regular expression 计算出每列数值总和的平均~ 不知道用 sed or awk 一行代码有办法作到同样事情嘛?

谢谢


论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
2 [报告]
发表于 2017-07-14 21:07 |只看该作者
回复 1# shihyu

How about this ...

$ awk -F, '{gsub(".=\\(","");for(n=1;n<=NF;++n)a[n]+=$n}END{for(n=1;n<=NF;++n)s=s a[n]/NR " ";print s}' FILE
0 -0.00195 0 9.08398 -0.05634 0.582635

$ cat FILE
g=(0.00000, -0.00195, 0.00000), a=(9.13281, -0.03906, 0.56836)
g=(0.00000, -0.00195, 0.00000), a=(9.12305, -0.05859, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.06445, -0.04883, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.04492, -0.02930, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.07422, -0.05859, 0.59766)
g=(0.00000, -0.00195, 0.00000), a=(9.02539, -0.04883, 0.58789)
g=(0.00000, -0.00195, 0.00000), a=(9.05469, -0.06836, 0.52930)
g=(0.00000, -0.00195, 0.00000), a=(9.11328, -0.03906, 0.63672)
g=(0.00000, -0.00195, 0.00000), a=(9.08398, -0.06836, 0.55859)
g=(0.00000, -0.00195, 0.00000), a=(9.06445, -0.06836, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.12305, -0.06836, 0.62695)
g=(0.00000, -0.00195, 0.00000), a=(9.10352, -0.05859, 0.57813)
g=(0.00000, -0.00195, 0.00000), a=(9.08398, -0.07813, 0.57813)

论坛徽章:
0
3 [报告]
发表于 2017-07-17 13:06 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP