免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 24634975 | 回复: 24634975
打印 上一主题 下一主题

python对文本文档的求和平均 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-01-12 12:23 |只看该作者 |倒序浏览
如下列这个数据文档
   ci    pi       er          cc     22         ii
    2      3        5          1        2        4
    2       4      5           5       1         4
    5       6       6          5       6         7
    7       7       5          4       3         1
怎么让  cc列的数据  求和平均

论坛徽章:
0
2 [报告]
发表于 2012-01-12 13:05 |只看该作者
你的问题说得不是很清楚,如果是要让CC列为其他各列的平均值的话可以这样
  1. dfile = open(r'd:\test.txt', 'r')
  2. result = []
  3. titles = dfile.readline().split()
  4. result.append(titles)
  5. index = titles.index('cc')
  6. for line in dfile:
  7.     data = line.split()
  8.     avg = (sum([float(i) for i in data]) - float(data[index])) / (len(data) - 1)
  9.     data[index] = avg
  10.     result.append(data)

  11. for index, data in enumerate(result):
  12.     result[index] = ''.join(['%8s' % s for s in data])
  13.    
  14. dfile.close()
  15. dfile = open(r'd:\test.txt', 'w')
  16. dfile.write('\n'.join(result))
  17. dfile.close()
复制代码

论坛徽章:
0
3 [报告]
发表于 2012-01-12 13:14 |只看该作者
我明白你的意思了
       不过我要的是 单纯  cc这一列的所有值求和  至于求不求平均倒也无所谓
        在这个数据文档里面  即是要[1,5,5,4]4个值迭加

论坛徽章:
0
4 [报告]
发表于 2012-01-12 13:17 |只看该作者
  整个过程是这样  通过在数据库中抓取数据(通过快照,每隔一段时间抓去然后记录)  建立如上面类似的数据文档   挑选想要的一些数据计算平均值。 比如cc的平均值,ci的平均值

论坛徽章:
0
5 [报告]
发表于 2012-01-12 13:49 |只看该作者
本帖最后由 inpool 于 2012-01-12 13:53 编辑

那就更简单了
  1. def get_avg(path, colname):
  2.     dfile = open(path)
  3.     index = dfile.readline().split().index(colname)
  4.     data = [float(line.split()[index]) for line in dfile]
  5.     dfile.close()
  6.     return sum(data)/len(data)

  7. if __name__ == '__main__':
  8.     avg = get_avg(r'd:\test.txt', 'cc')
  9.     print avg
复制代码

论坛徽章:
0
6 [报告]
发表于 2012-01-12 14:55 |只看该作者
楼上厉害啊

论坛徽章:
0
7 [报告]
发表于 2012-01-12 15:18 |只看该作者
f = file('file.txt')
s = []
sum = 0
for lines in f:
    s.append(lines.split())
index = s[0].index('cc')
for i in s[1:]:
    sum = sum + int(i[index])
print "The sum of the colum 'cc' is %d"%sum
print "The average of the colum 'cc' is %d"%(sum/(len(s)-1))



论坛徽章:
0
8 [报告]
发表于 2012-01-12 17:07 |只看该作者
本帖最后由 houwenhui1990 于 2012-01-12 17:22 编辑
  1. #!/usr/bin/env python
  2. f=open('a.txt','r')
  3. title=f.readline().split()
  4. index=title.index('cc')
  5. sum=0
  6. num=0
  7. while True:
  8.     line=f.readline().split()
  9.     if bool(line)!=0:
  10.         sum+=int(line[index])
  11.         num+=1
  12.     else:
  13.         f.close()
  14.         print 'sum is %d, avg is %.2f'%(sum,float(sum)/num)
  15.         break
复制代码

论坛徽章:
0
9 [报告]
发表于 2012-07-21 16:47 |只看该作者
inpool 发表于 2012-01-12 13:49
那就更简单了

第4行不会把第一行读到吗?

论坛徽章:
0
10 [报告]
发表于 2012-07-21 17:58 |只看该作者
本帖最后由 nmweizi 于 2012-07-21 18:26 编辑

from __future__ import division
from pandas import *
df= read_csv(r'F:\python\pandas\test1.txt',sep ='[ ]*',index_col=None)
f = df['cc']
f.sum()/f.count()

或者
print  df.sum()/df.count()


Out[10]:
ci    4.00
pi    5.00
er    5.25
cc    3.75
22    3.00
ii    4.00
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP