免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 7249 | 回复: 15
打印 上一主题 下一主题

python读取1500万行数据,快速取余. [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-01-29 18:34 |只看该作者 |倒序浏览
hi
    请教一个python问题: 我有一个1500万行的数据:

18527308
18527309
18527310
18527311
18527312
18527313
18527314
18527315
18527316
18527317

都是一些数字,现在想通过python来读取这个文件内容然后对所有行数字取余,并且输出成类似:

18527308   08
18527309   09
18527310   10
18527311   11
18527312   12
18527313   13
18527314   14
18527315   15
18527316   16
18527317   17

然后重定向到一个新的日志文件.之前用shell for循环跑太慢.我想知道如果python能同时对多行操作的话会不会快一些.
有具体实现方法吗? 多谢大家..

论坛徽章:
4
金牛座
日期:2013-10-11 16:12:50卯兔
日期:2014-07-31 09:17:19辰龙
日期:2014-08-08 09:28:02狮子座
日期:2014-09-14 20:32:05
2 [报告]
发表于 2013-01-29 19:15 |只看该作者
本帖最后由 ssfjhh 于 2013-01-29 19:32 编辑
  1. fa = open('a.txt')
  2. fb = open('b.txt','w')
  3. for l in fa.readlines():
  4.     fb.write(l[:-1] + ' ' + l[-3:])

  5. fa.close()
  6. fb.close()
复制代码

论坛徽章:
0
3 [报告]
发表于 2013-01-30 09:10 |只看该作者
谢谢, 如果是读取每行数字然后 %100呢?   比如:18527308 % 100 回复 2# ssfjhh


   

论坛徽章:
4
金牛座
日期:2013-10-11 16:12:50卯兔
日期:2014-07-31 09:17:19辰龙
日期:2014-08-08 09:28:02狮子座
日期:2014-09-14 20:32:05
4 [报告]
发表于 2013-01-30 10:27 |只看该作者
回复 3# zhangheng311

  1. fa = open('a.txt')
  2. fb = open('b.txt','w')
  3. for l in fa.readlines():
  4.     fb.write(l[:-1] + ' ' + str(int(l[:-1])%100) + '\n')

  5. fa.close()
  6. fb.close()
复制代码
如果只是简单的求一个数字的10**n的余数,用切片不是更方便吗,为什么非要先转成数字再求余?
   

论坛徽章:
0
5 [报告]
发表于 2013-01-30 11:15 |只看该作者
谢谢回答哈, 我已经用 awk 搞定了, 10秒钟左右完成. 回复 4# ssfjhh


   

论坛徽章:
4
金牛座
日期:2013-10-11 16:12:50卯兔
日期:2014-07-31 09:17:19辰龙
日期:2014-08-08 09:28:02狮子座
日期:2014-09-14 20:32:05
6 [报告]
发表于 2013-01-30 11:18 |只看该作者
回复 5# zhangheng311


    我这里没有数据,也不给个结果,python要多久呀。

论坛徽章:
0
7 [报告]
发表于 2013-01-31 09:58 |只看该作者
lz,发下awk  处理过程啊,,,

论坛徽章:
0
8 [报告]
发表于 2013-01-31 11:32 |只看该作者
awk '{print $1,$1 % 100}' test.txt

论坛徽章:
0
9 [报告]
发表于 2013-01-31 14:04 |只看该作者
python另一个同事测试的, 2分钟左右.回复 6# ssfjhh


   

论坛徽章:
0
10 [报告]
发表于 2013-01-31 14:06 |只看该作者
awk '{print $0,$0 % 100}'  test.log回复 7# jk409


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP