免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1044 | 回复: 3
打印 上一主题 下一主题

求助——对大文件的操作问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2005-06-23 09:58 |只看该作者 |倒序浏览
现有一30万行左右的文本文件a.txt,需要对其中的某些记录(大约10万条)进行删除,同时需要对这些记录进行备份。
这些记录的规则描述是:"^..........ABCDEFGH"。其中ABCDEFGH的可能性有3千多种,全部保存在一个临时文件temp中。
我的方法是使用grep或awk进行备份,
while read head;do
awk '/^..........'$head'/{print NR,$0}' a.txt >> a.bak
done < temp
但是效率很低,求助一个效率高的方法进行相关操作。


另外,如果已经得到需要删除的行的行号(不规则),如何进行删除操作,效率好?

论坛徽章:
0
2 [报告]
发表于 2005-06-23 10:12 |只看该作者

求助——对大文件的操作问题

shell对30万行的记录,无论用什么速度都慢!还是用vi吧

论坛徽章:
0
3 [报告]
发表于 2005-06-23 14:36 |只看该作者

求助——对大文件的操作问题

试试

  1. while read head; do
  2.     echo "^.........$head"
  3. done > pattern_list
  4. egrep -f pattern_list a.txt > a.bak
复制代码

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
4 [报告]
发表于 2005-06-23 15:14 |只看该作者

求助——对大文件的操作问题

  1. 备份
  2. grep -f temp a.txt >a.bak
  3. 删除
  4. grep -v -f temp a.txt >a.org
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP