免费注册	查看新帖 \|


平台论坛博客文库

› 论坛 › 程序设计 › Shell › 麻烦大神给写个匹配代码，谢谢！

123 / 3 页下一页

最近访问板块

发新帖

楼主: bmne

上一主题

下一主题

[文本处理] 麻烦大神给写个匹配代码，谢谢！ [复制链接]

论坛徽章:: 31

程序设计版块每日发帖之星
日期:2016-02-06 06:20:00

程序设计版块每日发帖之星
日期:2016-07-20 06:20:00

程序设计版块每日发帖之星
日期:2016-07-26 06:20:00

每日论坛发贴之星
日期:2016-07-26 06:20:00

程序设计版块每日发帖之星
日期:2016-07-27 06:20:00

每日论坛发贴之星
日期:2016-07-27 06:20:00

程序设计版块每日发帖之星
日期:2016-07-28 06:20:00

程序设计版块每日发帖之星
日期:2016-07-29 06:20:00

程序设计版块每日发帖之星
日期:2016-08-02 06:20:00

程序设计版块每日发帖之星
日期:2016-08-06 06:20:00

程序设计版块每日发帖之星
日期:2016-08-08 06:20:00

程序设计版块每日发帖之星
日期:2016-08-09 06:20:00

11楼 [报告]

发表于 2016-08-06 08:49 |只看该作者

回复 10# Windows19

大神，辛苦了

1、这是个经典比较对比的代码啊grep -Ff 你厉害威武，加上个F，马上就神速运行了。但它是比较对比a中任意位置的字符串的，对我来说不适合。我要的是a中行首字符串必须和b相同，我学习了一段时间，但没找到grep怎样匹配a中行首字符串必须和b相同。请指导

2、你二楼的代码，好用。提点过分的要求，能否给精简一下写连在一起？这个代码是我必须收藏的

3、另外增加个要求。把下面给改一下，取个反向的。我不会加 !
awk 'BEGIN{count=0}NR==FNR{w[count]=$0;count++}NR>FNR{for (i in w) if(w==$0){flag=1;break}if(flag!=1){print $0}flag=0}' b.txt a.txt
要求：提取a中同b中相同的行

大神若忙，没时间就算了，若有点功夫就帮帮我。感谢

另，你是实战大神，写出的代码很实用。实话

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 10

15-16赛季CBA联赛之同曦
日期:2016-06-11 19:22:41

15-16赛季CBA联赛之深圳
日期:2020-05-31 16:13:56

15-16赛季CBA联赛之同曦
日期:2020-01-28 12:42:47

每日论坛发贴之星
日期:2016-08-09 06:20:00

程序设计版块每日发帖之星
日期:2016-08-09 06:20:00

每日论坛发贴之星
日期:2016-07-12 06:20:00

程序设计版块每日发帖之星
日期:2016-07-12 06:20:00

程序设计版块每日发帖之星
日期:2016-07-06 06:20:00

程序设计版块每日发帖之星
日期:2016-07-04 06:20:00

15-16赛季CBA联赛之佛山
日期:2021-02-26 09:33:41

12楼 [报告]

发表于 2016-08-06 21:59 |只看该作者

Try this:
awk 'BEGIN{FS=""}NR==FNR{a[$0]=1}NR!=FNR{if(a[$1$2$3$4$5$6$7])print $0}' b.txt a.txt

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

13楼 [报告]

发表于 2016-08-06 22:11 |只看该作者

本帖最后由华小飞_Perl 于 2016-08-07 21:27 编辑

写了个Perl代码发到shell的版块，不会被说吧

#!/usr/bin/perl
use warnings;
use strict;
open INPUT_1, '<', 'b.txt' or die "Don't open the file: $!";
open INPUT_2, '<', 'a.txt' or die "Don't open the file: $!";
my (@b_array, %b_hash);
while (<INPUT_1>) {
chomp;
push @b_array, $_;
}
%b_hash = map { $_ => 1 } @b_array;
my $ref_b = \%b_hash;
while (my $a_item = <INPUT_2>) {
chomp $a_item;
my $copy_of_a = $a_item;
$a_item =~ s/(\w{7})\w+/$1/;
print $copy_of_a, "\n" if ( $ref_b->{$a_item} );
}
close INPUT_1;
close INPUT_2;

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 31

程序设计版块每日发帖之星
日期:2016-02-06 06:20:00

程序设计版块每日发帖之星
日期:2016-07-20 06:20:00

程序设计版块每日发帖之星
日期:2016-07-26 06:20:00

每日论坛发贴之星
日期:2016-07-26 06:20:00

程序设计版块每日发帖之星
日期:2016-07-27 06:20:00

每日论坛发贴之星
日期:2016-07-27 06:20:00

程序设计版块每日发帖之星
日期:2016-07-28 06:20:00

程序设计版块每日发帖之星
日期:2016-07-29 06:20:00

程序设计版块每日发帖之星
日期:2016-08-02 06:20:00

程序设计版块每日发帖之星
日期:2016-08-06 06:20:00

程序设计版块每日发帖之星
日期:2016-08-08 06:20:00

程序设计版块每日发帖之星
日期:2016-08-09 06:20:00

14楼 [报告]

发表于 2016-08-07 08:06 |只看该作者

回复 12# ll104567

大神厉害，精细准确，好用

必收藏之

另，如果大神有点时间，给把11楼第三条的代码取反。（只提取a中同b的行）

谢谢大神

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 31

程序设计版块每日发帖之星
日期:2016-02-06 06:20:00

程序设计版块每日发帖之星
日期:2016-07-20 06:20:00

程序设计版块每日发帖之星
日期:2016-07-26 06:20:00

每日论坛发贴之星
日期:2016-07-26 06:20:00

程序设计版块每日发帖之星
日期:2016-07-27 06:20:00

每日论坛发贴之星
日期:2016-07-27 06:20:00

程序设计版块每日发帖之星
日期:2016-07-28 06:20:00

程序设计版块每日发帖之星
日期:2016-07-29 06:20:00

程序设计版块每日发帖之星
日期:2016-08-02 06:20:00

程序设计版块每日发帖之星
日期:2016-08-06 06:20:00

程序设计版块每日发帖之星
日期:2016-08-08 06:20:00

程序设计版块每日发帖之星
日期:2016-08-09 06:20:00

15楼 [报告]

发表于 2016-08-07 08:09 |只看该作者

回复 13# 华小飞_Perl

大神，你这个代码能运行？你再看看

我的问题？不上截图了，我没运行起来

辛苦

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

16楼 [报告]

发表于 2016-08-07 08:39 |只看该作者

按照你给的文本示例是没问题的，运行起来无误后才发出来的，你原来的文件是都是数字的吗，不是的话就不行了，要改一下正则，发的源码是匹配数字的。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 3

2015年迎新春徽章
日期:2015-03-04 09:56:11

数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00

数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00

17楼 [报告]

发表于 2016-08-08 12:50 |只看该作者

给你一个思路
把b的所有行放到hash里,然后a再来查

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 10

天蝎座
日期:2013-09-22 22:32:23

程序设计版块每日发帖之星
日期:2016-08-07 06:20:00

lufei
日期:2016-06-17 17:38:40

程序设计版块每日发帖之星
日期:2016-06-12 06:20:00

2016科比退役纪念章
日期:2016-05-31 15:47:20

CU十四周年纪念徽章
日期:2016-05-27 12:24:56

2015年亚洲杯之阿曼
日期:2015-05-03 21:01:35

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

天蝎座
日期:2013-10-20 21:05:24

程序设计版块每日发帖之星
日期:2016-08-11 06:20:00

18楼 [报告]

发表于 2016-08-08 13:43 |只看该作者

本帖最后由 liion631818 于 2016-08-08 13:44 编辑

ubuntu:~/shell$ awk 'FNR==NR{a[$0]++;next}{e=substr($0, 1, 7); for(i in a)if(e ~ i){print $0;break}}' b.txt a.txt
123456789
234567890
345678901
456789012

复制代码

回复 1# bmne

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 31

程序设计版块每日发帖之星
日期:2016-02-06 06:20:00

程序设计版块每日发帖之星
日期:2016-07-20 06:20:00

程序设计版块每日发帖之星
日期:2016-07-26 06:20:00

每日论坛发贴之星
日期:2016-07-26 06:20:00

程序设计版块每日发帖之星
日期:2016-07-27 06:20:00

每日论坛发贴之星
日期:2016-07-27 06:20:00

程序设计版块每日发帖之星
日期:2016-07-28 06:20:00

程序设计版块每日发帖之星
日期:2016-07-29 06:20:00

程序设计版块每日发帖之星
日期:2016-08-02 06:20:00

程序设计版块每日发帖之星
日期:2016-08-06 06:20:00

程序设计版块每日发帖之星
日期:2016-08-08 06:20:00

程序设计版块每日发帖之星
日期:2016-08-09 06:20:00

19楼 [报告]

发表于 2016-08-08 14:06 |只看该作者

回复 18# liion631818

谢谢大神

抽空还是来帮助，感谢

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

20楼 [报告]

发表于 2016-08-08 17:05 |只看该作者

回复 17# cjaizss

大神见解给力，这样很方便!

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

123 / 3 页下一页

发新帖

Chinaunix › 论坛 › 程序设计 › Shell › 麻烦大神给写个匹配代码，谢谢！

北京盛拓优讯信息技术有限公司. 版权所有京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号：11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员联系我们：huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP