免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1977 | 回复: 7
打印 上一主题 下一主题

如何删除文件A中所有出现在文件B中的行 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-12-25 15:14 |只看该作者 |倒序浏览
10可用积分
B是一个样本匹配库,约1万行
A是一个随机文本

要求:

如果A中的某一行在B中能找到匹配行,就在A中将这行删除,怎么才能高效一点啊

我现在的做法是将B中的每一行分别取出,然后去A中 sed /patter/d,感觉这样效率太低了

最佳答案

查看完整内容

grep -v -w -f B A > tempfile

论坛徽章:
0
2 [报告]
发表于 2009-12-25 15:14 |只看该作者
grep -v -w -f B A > tempfile

论坛徽章:
0
3 [报告]
发表于 2009-12-25 15:19 |只看该作者
awk 'NR=FNR{a[$0]++,next}{if(a[$0]<2) print $0}' B A

论坛徽章:
0
4 [报告]
发表于 2009-12-25 15:42 |只看该作者
快抢分啊!

想起李律师一句话

人少,分多,速来


[ 本帖最后由 merlin852 于 2009-12-25 15:58 编辑 ]

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
5 [报告]
发表于 2009-12-25 15:57 |只看该作者
感觉grep比awk快,借用2楼的写法
fgrep -v -w -f B A > tempfile

论坛徽章:
0
6 [报告]
发表于 2009-12-25 16:11 |只看该作者

回复 #1 Tanacore 的帖子

#!/bin/bash
rm -rf c
while read a
do
grep "$a" B >/dev/null 2>&1
if [ $? -ne 0 ];then
echo "$a" >>c
fi
done<A

论坛徽章:
0
7 [报告]
发表于 2009-12-25 16:35 |只看该作者
sort A B | uniq -u > c

论坛徽章:
0
8 [报告]
发表于 2009-12-25 16:50 |只看该作者
awk 'NR==FNR{a[$1]=1} NR>FNR&&!a[$1]{print}' A B
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP