免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3577 | 回复: 8

求助;把a.txt与b.txt两个文档中完全匹配的行都删除 [复制链接]

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
发表于 2015-12-24 16:10 |显示全部楼层
本帖最后由 hkldd 于 2015-12-26 11:49 编辑

把a.txt与b.txt两个文档中完全匹配的行都删除,也就是把a.txt与b.txt中相同的行都除掉,分别留下不相同的行在原文档。谢谢!

需要处理的样本文件:
a.txt
1a 25 65 13 26 75
1a 55 36 17 1f 07
2b 14 11 5b 6a 3c
5c 26 87 25 47 9c
3d 14 58 1f 39 2a
3d 44 52 3a 2b dd
3d 44 35 5c 6b 9c

b.txt
1a 55 36 17 1f 07
2b 14 11 5b 6a 3c
5c 26 87 25 47 9c
3d 14 58 1f 39 2a
3d 44 52 3a 2b dd
5d 24 32 3a 2b cc

需要得到的样式文件:
a.txt
1a 25 65 13 26 75
3d 44 35 5c 6b 9c

b.txt
5d 24 32 3a 2b cc

附;如果输出结果与源文件名有冲突或难度,可改写成以下的样式文件:
aw.txt
1a 25 65 13 26 75
3d 44 35 5c 6b 9c

dw.txt
5d 24 32 3a 2b cc

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
发表于 2015-12-24 17:57 |显示全部楼层
本帖最后由 sunzhiguolu 于 2015-12-24 17:58 编辑

回复 1# hkldd
试下:
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;

  4. sub get_hash_by_file{
  5.         my ($rsFile, %hFile) = pop;
  6.         open (my $fhFile, '<', $rsFile) or die "Warnings: $rsFile not exists!\n";
  7.         while (<$fhFile>){
  8.                 chomp;
  9.                 $hFile{$_} = '';
  10.         }
  11.         close ($fhFile);
  12.         \%hFile;
  13. }

  14. if (@ARGV < 2){
  15.         die "Usage : Perl $0 a.txt b.txt!\n";
  16. }

  17. my @aFiles;
  18. foreach (@ARGV){
  19.         push (@aFiles, get_hash_by_file(\$_));
  20. }

  21. foreach my $sIdx (0 .. $#aFiles){
  22.         my %hNext = %{$aFiles[abs ($sIdx - 1)]};
  23.         foreach (keys %{$aFiles[$sIdx]}){
  24.                 print "$_\n" unless exists $hNext{$_};
  25.         }
  26.         print "\n";
  27. }
复制代码

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
发表于 2015-12-25 01:17 |显示全部楼层
sunzhiguolu 你好!
   测试运行错误,不知是哪里出了问题,麻烦你再检查一下,谢谢!

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
发表于 2015-12-25 09:37 |显示全部楼层
回复 3# hkldd
把错误信息贴出来, 大家可以帮你看下...

   

论坛徽章:
0
发表于 2015-12-25 16:06 |显示全部楼层
这个用SHELL方便很多
awk 'BEGIN{count=0}NR==FNR{w[count]=$0;count++}NR>FNR{for (i in w) if(w[i]==$0){flag=1;break}if(flag!=1){print $0}flag=0}' 1.txt 2.txt
awk 'BEGIN{count=0}NR==FNR{w[count]=$0;count++}NR>FNR{for (i in w) if(w[i]==$0){flag=1;break}if(flag!=1){print $0}flag=0}' 2.txt 1.txt

输出
5d 24 32 3a 2b cc

1a 25 65 13 26 75
3d 44 35 5c 6b 9c

论坛徽章:
0
发表于 2015-12-25 18:29 |显示全部楼层
perl

open(IN, "1.txt") or die "open error: $!";
my @x = <IN>;
close (IN);
open(IN, "2.txt") or die "open error: $!";
my @y = <IN>;
close (IN);   
chomp(@y);
my $p = join('|', map{quotemeta} @y);
print (grep ! /$p/, @x);
chomp(@x);
my $n = join('|', map{quotemeta} @x);
print (grep ! /$n/, @y);
print "\n";

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
发表于 2015-12-25 21:04 |显示全部楼层
谢谢大家的回复!我需要的是把a.txt与b.txt对比,把两个文档中相同的行都除掉,这样两个文档中就只剩下不相同的行了,不相同的行能回写到原文档最理想,或者分别写到另外的文件也可以,谢谢大家!

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
发表于 2015-12-26 11:32 |显示全部楼层
我在论坛里找到rubyish大侠写的;在两个文件提不同的代码,能够把a.txt与b.txt中不同行提出来,代码如下;
  1. #!/usr/bin/perl

  2. my ( $i, $j ) = map { open my ($f), $_; $f } 'A.txt', 'B.txt';
  3. my %a = map { $_, 1 } <$i>;
  4. my %b = map { $_, 1 } <$j>;
  5. print "A:\n", grep { !$b{$_} } keys %a;
  6. print "B:\n", grep { !$a{$_} } keys %b;
复制代码
想麻烦大家把这段代码修改一下,把两个文件中的不同部分的输出结果,分别保存在c.txt与d.txt的两个文档中,最好能加上注释,让我学习学习,谢谢!



论坛徽章:
6
丑牛
日期:2014-03-21 15:42:04子鼠
日期:2014-04-12 11:50:17处女座
日期:2014-09-01 09:25:1115-16赛季CBA联赛之吉林
日期:2015-12-22 14:01:5215-16赛季CBA联赛之广东
日期:2016-03-08 18:49:422016科比退役纪念章
日期:2016-07-06 12:19:55
发表于 2015-12-28 17:11 |显示全部楼层
  1. egrep -v -f a.txt b.txt
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP