免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 1855 | 回复: 11
打印 上一主题 下一主题

求高手,如何使用perl提取出两个文件中不同的部分。附上我的代码,只是效率低。处理太慢 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-02-28 13:02 |只看该作者 |倒序浏览
本帖最后由 yanglc2013 于 2013-02-28 13:07 编辑

求租,如何使用perl提取出两个文件中不同的部分

以下是我的代码,只是效率太低,处理起来很慢。

  1. #!/usr/bin/perl
  2. open(IN,$ARGV[0]);
  3. open(SE,$ARGV[1]);
  4. open(OUT,">$ARGV[2]");
  5. @AT2=<SE>;
  6. foreach my  $t(<IN>){
  7. print $t unless grep /^$t/,@AT2;
  8. }
  9. close IN;
  10. close SE;
  11. close OUT;
复制代码

论坛徽章:
0
2 [报告]
发表于 2013-02-28 13:07 |只看该作者
没有高手指点吗?

论坛徽章:
46
15-16赛季CBA联赛之四川
日期:2018-03-27 11:59:132015年亚洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49双鱼座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亚冠之布里斯班狮吼
日期:2015-07-13 10:44:56
3 [报告]
发表于 2013-02-28 13:17 |只看该作者
你的数据有多少行?对于小文件来说还不错啊

论坛徽章:
0
4 [报告]
发表于 2013-02-28 13:19 |只看该作者
回复 3# zhlong8
有45062行  但是处理了好几分钟。虽然结果对了。但是您帮我写个其他的程序吗?


   

论坛徽章:
46
15-16赛季CBA联赛之四川
日期:2018-03-27 11:59:132015年亚洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49双鱼座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亚冠之布里斯班狮吼
日期:2015-07-13 10:44:56
5 [报告]
发表于 2013-02-28 13:47 |只看该作者
回复 4# yanglc2013


    你这直接把 @AT2 变成个 hash 用 exists 就可以了吧。
  1. %AT2 = map {$_ => 1 } @AT2; print OUT $t if exists $AT2{$t};
复制代码
如果只需要 $t 匹配@AT2 某一行的开头部分,你需要把换行符给 chomp 掉。可以把第二个文件读成一个字符串,用 /^\Q$t\E/m 来匹配。study 现在好像不管用了,否则这里很合适

论坛徽章:
0
6 [报告]
发表于 2013-02-28 14:12 |只看该作者
回复 1# yanglc2013


     你的程序也貌似只在第一个文件中查找与第二文件不同的部分吧?那第二个文件与第一个文件中不同的部分呢?

论坛徽章:
0
7 [报告]
发表于 2013-02-28 14:18 |只看该作者
回复 5# zhlong8
实乃初学者,不太明白啊。大师怎么改?


   

论坛徽章:
0
8 [报告]
发表于 2013-02-28 14:19 |只看该作者
回复 6# kk861123
第一个文件是个库,包含了所有的数据。


   

论坛徽章:
0
9
发表于 2013-02-28 14:22
回复 5# zhlong8
而且 我要输出的是不同的部分。


   

论坛徽章:
0
10 [报告]
发表于 2013-02-28 14:36 |只看该作者
本帖最后由 kk861123 于 2013-02-28 14:36 编辑

回复 8# yanglc2013


    oh,我给你改一下,不是很明白对比的是什么东西,你先试试吧:
  1. #!/usr/bin/perl
  2. open(IN,$ARGV[0]);
  3. open(SE,$ARGV[1]);
  4. open(OUT,">$ARGV[2]");

  5. my %m;
  6. $m{$_}++ while <SE>;
  7. while ( <IN> ){
  8.     print OUT $_ unless exists $m{$_};
  9. }

  10. close IN;
  11. close SE;
  12. close OUT;
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP