免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1510 | 回复: 9
打印 上一主题 下一主题

[文本处理] 两个文件进行跨文件匹配 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2016-10-19 22:10 |只看该作者 |倒序浏览
A文件有2000多行,B文件有10W+,现要求从B文件的每一行匹配A文件的每一行,匹配到了就将B文件的这一行输出,用Perl怎么做

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
2 [报告]
发表于 2016-10-19 22:12 |只看该作者
A, B 文件可有示例数据, 希望得到的结果请举个例子.

论坛徽章:
0
3 [报告]
发表于 2016-10-19 22:19 |只看该作者
回复 2# sunzhiguolu

A文件
abcdefg
gfedcba

B文件
.......
set qwerty {abcdefg}
set yterwq {gfedcba}
........

就是这样,A的每一行隐藏于B中,找出来B包含A的某一行的那行,

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
4 [报告]
发表于 2016-10-19 22:21 |只看该作者
回复 3# junweitao
A文件
abcdefg
gfedcba
A 文件中每记录的值可有重复?


论坛徽章:
0
5 [报告]
发表于 2016-10-19 22:24 |只看该作者
回复 4# sunzhiguolu


AB两个文件都没有重复的



论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
6 [报告]
发表于 2016-10-19 22:30 |只看该作者
  1. perl -nle 'if(@ARGV){$h{$_}++;next}($k)=/\{(\w+)/;print if($h{$k})' a b
复制代码

论坛徽章:
28
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
7 [报告]
发表于 2016-10-19 22:37 |只看该作者

  1. grep -Ff A B
复制代码

论坛徽章:
0
8 [报告]
发表于 2016-10-20 09:35 |只看该作者
回复 6# sunzhiguolu

执行出来是空的,不知道是不是因为字符串太长或者特殊符号太多A:
ia_subsys/bia/punit_par/grp_punit/punit_mem/punit_context_ebb/genblk1Xnon_stack_slices[2]Xrf_dfx_wrapper_context_rf/context_rf_ipXcontext_rf_8Xcontext_rf_1273_generic_imc_8Xpunit_1r1w_32x64_imc_wrp/punitth32x64x1w_dft_wrp_inst/DOB_mem[35]

B
set_rtl_to_gate_name -rtl {ia_subsys/bia/punit_par/grp_punit/punit_mem/punit_context_ebb/genblk1.non_stack_slices[2].rf_dfx_wrapper_context_rf/context_rf_ip.context_rf_8.context_rf_1273_generic_imc_8.punit_1r1w_32x64_imc_wrp/punitth32x64x1w_dft_wrp_inst/DOB_mem[35]} -gate [get_net {ia_subsys/bia/punit_par/grp_punit/punit_mem/punit_context_ebb/genblk1Xnon_stack_slices[2]Xrf_dfx_wrapper_context_rf/context_rf_ipXcontext_rf_8Xcontext_rf_1273_generic_imc_8Xpunit_1r1w_32x64_imc_wrp/punitth32x64x1w_dft_wrp_inst/DOB_mem[35]}]

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
9 [报告]
发表于 2016-10-20 09:58 |只看该作者
回复 8# junweitao
  1. perl -nle 'if(@ARGV){$h{$_}++;next}(undef,$k)=/\{([^}]+)/g;print if($h{$k})' a b
复制代码



论坛徽章:
1
15-16赛季CBA联赛之江苏
日期:2016-10-26 16:19:04
10 [报告]
发表于 2016-10-20 10:39 |只看该作者
grep -f A B
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP