免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4818 | 回复: 12
打印 上一主题 下一主题

文件比较 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-09-18 16:09 |只看该作者 |倒序浏览
5可用积分
两个文件A,B,都很大,其中它们的大部分内容都是一样的,其中B是由A改动而来,但我不记得改了哪些地方,如何比较这两个文件,输出B中不同于A或B具有,A不具有的行。
也输出A且有,B不具有的行,比较我做的是删除操作。。用awk能做到不?

论坛徽章:
0
2 [报告]
发表于 2009-09-18 16:11 |只看该作者
development:~# comm --help
Usage: comm [OPTION]... FILE1 FILE2
Compare sorted files FILE1 and FILE2 line by line.

With no options, produce three-column output.  Column one contains
lines unique to FILE1, column two contains lines unique to FILE2,
and column three contains lines common to both files.

  -1              suppress lines unique to FILE1
  -2              suppress lines unique to FILE2
  -3              suppress lines that appear in both files
      --help     display this help and exit
      --version  output version information and exit

Report bugs to <bug-coreutils@gnu.org>.

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
3 [报告]
发表于 2009-09-18 16:12 |只看该作者
B有A没有: grep -Fvf A B
A有B没有: grep -Fvf B A

论坛徽章:
0
4 [报告]
发表于 2009-09-18 16:13 |只看该作者
diff
comm

论坛徽章:
0
5 [报告]
发表于 2009-09-19 17:47 |只看该作者
vimdiff

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
6 [报告]
发表于 2009-09-20 10:58 |只看该作者
系统不同,awk的版本不同,对某些特殊用法的支持也不同,下面是我收集的几个,挨个试试吧:

  1. awk '{if(FILENAME=="urfile1")a[$0]=1;else{if(a[$0]!=1)print >"urfile2"}}' urfile1 urfile2
复制代码

  1. awk 'ARGIND==1{a[$0]}ARGIND>1&&!($0 in a){print $0}' a b
复制代码

  1. nawk 'NR==FNR{a[$1]=$1}NR>FNR{if(!($1 in a)){print $1}}' b.txt a.txt
复制代码

  1. awk 'NR==FNR{a[$1]++}NR>FNR&&!a[$1]++' b.txt a.txt
复制代码

论坛徽章:
0
7 [报告]
发表于 2009-09-20 12:26 |只看该作者
diff

论坛徽章:
0
8 [报告]
发表于 2009-09-20 14:15 |只看该作者
diff file1 file2

论坛徽章:
0
9 [报告]
发表于 2009-09-22 16:04 |只看该作者

回复 #3 blackold 的帖子

只比较有内容的行,空白行不比较。。
还有就是比较时忽略行首和行尾空白字符,也就是说行"    xxx   xx xxx  "和"xxx   xx xxx"在比较时得到的结果应该是相同,不能输出这两行。

论坛徽章:
0
10 [报告]
发表于 2009-09-22 16:13 |只看该作者
原帖由 共舞秋雨 于 2009-9-22 16:04 发表
只比较有内容的行,空白行不比较。。
还有就是比较时忽略行首和行尾空白字符,也就是说行"    xxx   xx xxx  "和"xxx   xx xxx"在比较时得到的结果应该是相同,不能输出这两行。



man diff
-b     Ignore changes in amount of white space.

-B     Ignore changes that just insert or delete blank lines.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP