免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3829 | 回复: 13
打印 上一主题 下一主题

How to process billions of small files with limited memory? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-05-27 08:48 |只看该作者 |倒序浏览
本帖最后由 Osirix 于 2010-05-28 15:21 编辑

在当前目录下,一共有几百万个小文件,需要删除内容中所有含特定关键词的文件,而可用内存只有64MB
试了下:
find . -type f -exec grep -i -l -H "keyword" {} + |xargs -i rm -rf {}

出现"Out of Memory"错误


这样类似的任务在大型网站的日志维护中应该经常出现,大家能否分享下解决的好方法呢?

论坛徽章:
9
2015亚冠之阿尔纳斯尔
日期:2015-09-10 16:21:162015亚冠之塔什干火车头
日期:2015-07-01 16:23:022015年亚洲杯之巴勒斯坦
日期:2015-04-20 17:19:46子鼠
日期:2014-11-13 09:51:26未羊
日期:2014-08-28 18:13:36技术图书徽章
日期:2014-02-21 09:30:15酉鸡
日期:2014-01-14 11:12:49天蝎座
日期:2013-12-09 17:56:53平安夜徽章
日期:2015-12-26 00:06:30
2 [报告]
发表于 2010-05-27 09:07 |只看该作者
try:
  1. find . -type f  | xargs grep -i -l -H "keyword" | xargs rm -fr
复制代码

论坛徽章:
0
3 [报告]
发表于 2010-05-27 09:08 |只看该作者
find -type f -name "keyword" -exec rm {} \;
这样应该也行吧?

论坛徽章:
0
4 [报告]
发表于 2010-05-27 09:18 |只看该作者
try:
HH106 发表于 2010-05-27 09:07



   

    Failed!

论坛徽章:
0
5 [报告]
发表于 2010-05-27 10:34 |只看该作者
文件太多,可能要更改核心参数,什么操作系统呀?

论坛徽章:
0
6 [报告]
发表于 2010-05-27 11:24 |只看该作者
文件太多,可能要更改核心参数,什么操作系统呀?
lzolder 发表于 2010-05-27 10:34



    Fedora 12

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
7 [报告]
发表于 2010-05-27 11:39 |只看该作者
本帖最后由 blackold 于 2010-05-27 11:43 编辑
  1. grep -Eril "keyword" .|xargs rm -rf
复制代码

论坛徽章:
0
8 [报告]
发表于 2010-05-27 11:50 |只看该作者
不知

我只了解AIX下如何改

论坛徽章:
0
9 [报告]
发表于 2010-05-27 17:02 |只看该作者
循环可以不:
for F in *
do
    grep "keyword"  $F && rm -f $F
done

有可能非常慢

论坛徽章:
0
10 [报告]
发表于 2010-05-27 19:56 |只看该作者
64M 足够
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP