免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 9811 | 回复: 15
打印 上一主题 下一主题

ruby如何去处理 20G的大文件? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-04-16 01:02 |只看该作者 |倒序浏览
现在要分析一个日志文件,大小约20G.机器内存只有8G,无法全部读到内存中。
现在一行一行读取,但是速度很慢。

试过多线程等方式,反而更慢。

求解。。。

论坛徽章:
0
2 [报告]
发表于 2011-04-17 08:34 |只看该作者
时间是必须的,你不能指望20g很快就完成,你得想想为啥要等到20g?欠考虑就是要付出代价的。
想办法把文件分割成若干个小文件吧,然后处理。

论坛徽章:
0
3 [报告]
发表于 2011-04-21 23:22 |只看该作者
是什么分析需求,需要把全部日志放到内存里?

简单的需求一般可以line by line。

论坛徽章:
0
4 [报告]
发表于 2011-04-25 11:24 |只看该作者
日志按照天分割,一天差不多20G.

论坛徽章:
0
5 [报告]
发表于 2011-04-26 15:17 |只看该作者
分割小一点吧。

论坛徽章:
0
6 [报告]
发表于 2011-06-01 17:00 |只看该作者
按照小时分割日志吧,或者按照分钟。。。

论坛徽章:
3
寅虎
日期:2013-11-27 07:53:29申猴
日期:2014-09-12 09:24:152015年迎新春徽章
日期:2015-03-04 09:48:31
7 [报告]
发表于 2011-09-08 09:21 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
8 [报告]
发表于 2011-09-08 11:36 |只看该作者
欢迎新人加入。

论坛徽章:
0
9 [报告]
发表于 2011-11-21 17:13 |只看该作者
谢分享

论坛徽章:
0
10 [报告]
发表于 2011-11-22 18:07 |只看该作者
用hadoop
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP