免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 6565 | 回复: 9
打印 上一主题 下一主题

python读文件问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-11-05 02:27 |只看该作者 |倒序浏览
有非常大的一批数据,需要从python输出刀一个txt文件,然后用c++运算,结束后输回python,但是输入输出的时间很长,有什么办法把优化以下么?现在用的是readlines,太慢了因为数据非常大

论坛徽章:
0
2 [报告]
发表于 2008-11-05 09:27 |只看该作者
弄个管道,流一下?
没试过,瞎说的。

论坛徽章:
0
3 [报告]
发表于 2008-11-05 09:53 |只看该作者
readlines是一下子把文件内容全部读入内存,只适合比较小的文件,如果文件比较大,超过了物理内存的大小,那么就要启用虚拟内存,速度自然会非常慢了。应该用readline一行一行读入,或者用read,制定每次读入的字节数。

论坛徽章:
0
4 [报告]
发表于 2008-11-05 10:23 |只看该作者
原帖由 gucuiwen 于 2008-11-5 09:53 发表
readlines是一下子把文件内容全部读入内存,只适合比较小的文件,如果文件比较大,超过了物理内存的大小,那么就要启用虚拟内存,速度自然会非常慢了。应该用readline一行一行读入,或者用read,制定每次读入的字 ...


楼上说的好,用while循环按行来读取或者按照字节数。这样会快很多。

论坛徽章:
0
5 [报告]
发表于 2008-11-05 10:31 |只看该作者
为啥用c++运算?python不能算?说来听听

论坛徽章:
0
6 [报告]
发表于 2008-11-05 17:01 |只看该作者
import linecache
     for x in range(s):
         data= linecache.getline('data.txt',x+1)
         print data
这样不知可行否?
s 可自定义,比如先打印前500行for x in range(500):,然后再for x in range(500,1000)?

[ 本帖最后由 badboy_x 于 2008-11-5 17:04 编辑 ]
pyll 该用户已被删除
7 [报告]
发表于 2008-11-06 09:43 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
8 [报告]
发表于 2008-11-06 09:54 |只看该作者
try fileinput

论坛徽章:
0
9 [报告]
发表于 2008-11-06 14:50 |只看该作者
原帖由 gucuiwen 于 2008-11-5 09:53 发表
readlines是一下子把文件内容全部读入内存,只适合比较小的文件,如果文件比较大,超过了物理内存的大小,那么就要启用虚拟内存,速度自然会非常慢了。应该用readline一行一行读入,或者用read,制定每次读入的字 ...


这才是正解!事实上在《Python核心编程》中有对这种情况的说明。

论坛徽章:
0
10 [报告]
发表于 2008-11-07 02:11 |只看该作者
c++的字符串处理比python快很多么?python的字符串处理也不是用c做的么?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP