免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3908 | 回复: 16
打印 上一主题 下一主题

文本匹配问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-12-27 17:40 |只看该作者 |倒序浏览
我有二个文件,1.txt、2.txt
1.txt
--------------------------------------
abc : 123 : 456 : ...
bcd : 234 : 432 : ...
efd : 324 : 322 : ....
egd : 234 : 233 : ...
dfe : 234 : 345 : ..
des : 233 :326 : ...
...
...
----------------------------------------

2.txt
----------------------------------------
bcd
efd
des
...
...
___________________________

就是1.txt 是全部的数据,2.txt是我需要的数据,就是我想从1.txt中筛选出 2.txt列出的这些(就是要1.txt中后面的值)。

该如何用awk或者sed去筛选呢?

谢谢

[ 本帖最后由 zanefei 于 2008-12-27 17:42 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2008-12-27 17:55 |只看该作者
我就是搞不清楚怎么嵌套的问题

论坛徽章:
0
3 [报告]
发表于 2008-12-27 17:55 |只看该作者
awk -F '[ :]+' 'FNR==NR{a[$0]=1}FNR!=NR && ($1 in a){sub(/[^:]*:/,"");print $0}' 2.txt 1.txt

awk -F '[ :]+' 'FNR==NR{a[$0]=1}FNR!=NR && ($1 in a){print $0}' 2.txt 1.txt

[ 本帖最后由 爱知 于 2008-12-27 17:57 编辑 ]

论坛徽章:
0
4 [报告]
发表于 2008-12-27 18:22 |只看该作者
谢谢

我刚刚偶然看到可以用fgrep去完成。不过还是谢谢了

论坛徽章:
0
5 [报告]
发表于 2008-12-27 18:25 |只看该作者
这个?
grep -f 2.txt 1.txt

论坛徽章:
3
戌狗
日期:2014-09-10 17:07:162015年辞旧岁徽章
日期:2015-03-03 16:54:15wusuopu
日期:2016-06-17 17:43:45
6 [报告]
发表于 2008-12-27 18:29 |只看该作者
楼上的可以,用sed不太好做。

或者可以用grep

论坛徽章:
0
7 [报告]
发表于 2008-12-27 18:36 |只看该作者
原帖由 爱知 于 2008-12-27 18:25 发表
这个?
grep -f 2.txt 1.txt

恩就是这个,虽然不知道运行效率怎么样。


不过你能将awk的那个讲解一下么?

论坛徽章:
0
8 [报告]
发表于 2008-12-27 21:01 |只看该作者
原帖由 爱知 于 2008-12-27 18:25 发表
这个?
grep -f 2.txt 1.txt

学到了新知识,谢谢爱知。哈

论坛徽章:
0
9 [报告]
发表于 2008-12-27 21:18 |只看该作者
原帖由 爱知 于 2008-12-27 17:55 发表
awk -F '[ :]+' 'FNR==NR{a[$0]=1}FNR!=NR && ($1 in a){sub(/[^:]*:/,"");print $0}' 2.txt 1.txt

awk -F '[ :]+' 'FNR==NR{a[$0]=1}FNR!=NR && ($1 in a){print $0}' 2.txt 1.txt


先解释一下FNR与NR的区别吧
FNR表示当前文件的记录数 NR表示到此为止的记录数
对于单个文件NR 和FNR 的输出结果一样的
# awk '{print NR,$0}' file1
1 a b c d
2 a b d c
3 a c b d
4 a c d b
5 a d c b
6 a d b c
awk '{print FNR,$0}' file1
1 a b c d
2 a b d c
3 a c b d
4 a c d b
5 a d c b
6 a d b c
但是对于多个文件 :
# awk '{print NR,$0}' file1 file2
1 a b c d
2 a b d c
3 a c b d
4 a c d b
5 a d c b
6 a d b c
7 aa bb cc dd
8 aa bb dd cc
9 aa cc bb dd
10 aa cc dd bb
11 aa dd bb cc
12 aa dd cc bb
# awk '{print FNR,$0}' file1 file2
1 a b c d
2 a b d c
3 a c b d
4 a c d b
5 a d c b
6 a d b c
1 aa bb cc dd
2 aa bb dd cc
3 aa cc bb dd
4 aa cc dd bb
5 aa dd bb cc
6 aa dd cc bb

[test@erpdataserver ~]$ awk -F '[ :]+' '{print}' 2.txt 1.txt
bcd
efd
des
abc : 123 : 456 : ...
bcd : 234 : 432 : ...
efd : 324 : 322 : ....
egd : 234 : 233 : ...
dfe : 234 : 345 : ..
des : 233 :326 : ...

然后解释一下这一句吧
awk -F '[ :]+' 'FNR==NR{a[$0]=1}FNR!=NR && ($1 in a){print $0}' 2.txt 1.txt
以一个或者多个空格或者:为记录分隔符
因为2.txt在前面,所以当FNR=NR 就是说当前文件的记录数以记录数一样的时候,下面这三行满足条件,也就是2.txt文件内容
bcd
efd
des
把$0也就是bcd efd des赋值给数组a
如果FNR!=NR 成立的话 下面这些满足条件,也就是1.txt文件
abc : 123 : 456 : ...
bcd : 234 : 432 : ...
efd : 324 : 322 : ....
egd : 234 : 233 : ...
dfe : 234 : 345 : ..
des : 233 :326 : ...

根据数组a来打印满足条件的行记录。


不知道有没有人看懂了。。。。。。。
如有不当,请指正,谢谢。

[ 本帖最后由 我是DBA 于 2008-12-27 21:20 编辑 ]

论坛徽章:
0
10 [报告]
发表于 2008-12-27 21:27 |只看该作者

回复 #9 我是DBA 的帖子

赞一个
描写的挺清楚的

to 楼主:
man 和 info 这些内容都有
以前这类的老帖超多,搜搜
多看看,就知道了

[ 本帖最后由 爱知 于 2008-12-27 21:28 编辑 ]
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP