免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4951 | 回复: 5

perl大文本处理内存占用问题 [复制链接]

论坛徽章:
0
发表于 2018-09-10 17:57 |显示全部楼层
本帖最后由 Mount_Dew 于 2018-09-10 17:57 编辑

新人请问大家,我有一个6.8G大小的文本文件,每行的内容都是3个数字,一共3亿多行,如下图。现在想把这个文件存入哈希(嵌套哈希),进行后续处理。使用文件句柄<HANDLE>输入,这个大约会占用多少内存呢?
我在公共的服务器上跑了一会儿,占用了20多G,还是没有出结果…… QQ截图20180910175225.png

论坛徽章:
42
19周年集字徽章-周
日期:2019-10-14 14:35:31平安夜徽章
日期:2015-12-26 00:06:30数据库技术版块每日发帖之星
日期:2015-12-01 06:20:002015亚冠之首尔
日期:2015-11-04 22:25:43IT运维版块每日发帖之星
日期:2015-08-17 06:20:00寅虎
日期:2014-06-04 16:25:27狮子座
日期:2014-05-12 11:00:00辰龙
日期:2013-12-20 17:07:19射手座
日期:2013-10-24 21:01:23CU十二周年纪念徽章
日期:2013-10-24 15:41:34IT运维版块每日发帖之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之新疆
日期:2016-06-07 14:10:01
发表于 2018-09-11 14:54 |显示全部楼层
为什么要全部导入再处理?
不能按行处理?
6.8G的文件,全读入,估计会用到30多G内存

论坛徽章:
12
子鼠
日期:2014-10-11 16:46:482016科比退役纪念章
日期:2018-03-16 10:24:0515-16赛季CBA联赛之山东
日期:2017-11-10 14:32:142016科比退役纪念章
日期:2017-09-02 15:42:4715-16赛季CBA联赛之佛山
日期:2017-08-28 17:11:5515-16赛季CBA联赛之浙江
日期:2017-08-24 16:55:1715-16赛季CBA联赛之青岛
日期:2017-08-17 19:55:2415-16赛季CBA联赛之天津
日期:2017-06-29 10:34:4315-16赛季CBA联赛之四川
日期:2017-05-16 16:38:55黑曼巴
日期:2016-07-19 15:03:112015亚冠之萨济拖拉机
日期:2015-05-22 11:38:5315-16赛季CBA联赛之北京
日期:2019-08-13 17:30:53
发表于 2018-09-11 15:27 |显示全部楼层
本帖最后由 523066680 于 2018-09-11 16:09 编辑

不要一次读入内存。
用 DB_File 模块,访问和读写操作都在磁盘进行,只占用少量内存,key/value 对是没问题的,多层镶嵌的哈希表没试过。

查了一下:
https://metacpan.org/pod/DB_File ... tures-with-DB_File?

How do I store complex data structures with DB_File?Although DB_File cannot do this directly, there is a module which can layer transparently over DB_File to accomplish this feat.
Check out the MLDBM module, available on CPAN in the directory modules/by-module/MLDBM.


论坛徽章:
0
发表于 2018-09-11 15:59 |显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
发表于 2018-09-17 14:57 |显示全部楼层
回复 3# 523066680
感谢大佬,我试试。


论坛徽章:
0
发表于 2018-09-17 14:59 |显示全部楼层
回复 2# laputa73
好的。因为后面会需要根据key来查询value……


您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP