免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2997 | 回复: 7
打印 上一主题 下一主题

[文本处理] 求助,awk处理两个文本 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2019-04-05 17:37 |只看该作者 |倒序浏览
本帖最后由 云蓝的梦 于 2019-04-05 20:36 编辑

如果A文件和B文件第一列相同,且A文件的第2列大于等于B文件的第二列,第三列小于等于B文件的第三列,则输出A文件+B文件,如果没有,则照常输出A文件

A文件

01 44 47

01 48 55

01 101 103

02 55 60

B文件

01 40 100 m1

02 50 90 m2

02 100 140 m3

输出

01 44 47 01 40 100 m1

01 48 55 01 40 100 m1

01 101 103

02 55 60 02 50 90 m2

第一次发帖求助,谢谢大家了。

论坛徽章:
0
2 [报告]
发表于 2019-04-05 21:51 |只看该作者
有人吗。我想出来的是这个 :awk 'NR==FNR{++i;a[i]=$1;b[i]=$2;c[i]=$3;next}{for(j=1;j<=i;j++){if(a[j]==$1 && b[j]>=$2 && c[j]<=$3) print a[j],b[j],c[j],$0}}' a.txt  b.txt   
但是结果少了A没有匹配到的其他部分。有人能帮帮我吗               

论坛徽章:
0
3 [报告]
发表于 2019-04-05 21:58 |只看该作者
awk 'NR==FNR{++i;a[i]=$1;b[i]=$2;c[i]=$3;next}{for(j=1;j<=i;j++){if(a[j]==$1 && b[j]>=$2 && c[j]<=$3) print a[j],b[j],c[j],$0; else print a[j],b[j],c[j]}}' a.txt&nbsp;&nbsp;b.txt
这样修改了结果也不对

论坛徽章:
0
4 [报告]
发表于 2019-04-06 00:03 |只看该作者
本帖最后由 jzsjm1002 于 2019-04-06 01:30 编辑

回复 1# 云蓝的梦
  1. [root@vh100 awk]# cat test.awk
  2. #!/usr/bin/awk -f
  3. #

  4. NR==FNR && $0!~/^$/{
  5.   i++;bfile[i]=$0;a[i]=$1;b[i]=$2;c[i]=$3;next
  6. }

  7. NR!=FNR{
  8.   d=0
  9.   for(j=1;j<=i;j++)
  10.     if($1==a[j] && $2>=a[j] && $3<=c[j]){
  11.       print $0,bfile[j]
  12.       d=1
  13.       break
  14.     }
  15.   if(!(d)) print $0
  16. }

  17. [root@vh100 awk]# ./test.awk b a
  18. 01 44 47 01 40 100 m1

  19. 01 48 55 01 40 100 m1

  20. 01 101 103

  21. 02 55 60 02 50 90 m2
复制代码



论坛徽章:
0
5 [报告]
发表于 2019-04-06 14:37 |只看该作者
回复 4# jzsjm1002
谢谢,不过请问一下这段代码里的d=0  d=1  和 (!(d))是什么意思啊



论坛徽章:
0
6 [报告]
发表于 2019-04-06 21:10 |只看该作者
本帖最后由 jzsjm1002 于 2019-04-06 21:12 编辑

回复 5# 云蓝的梦

a文件每读入一行 d=0     满足if条件 d=1 (给打印过的行做一个标记)
if(!(d)) d=0 为真 满足条件 打印$0 (当d=1时 为假 不满足条件 不做打印)
通俗的讲: 就是当前行打印过了,这行就不做打印,没有打印过,打印$0






论坛徽章:
0
7 [报告]
发表于 2019-04-08 08:34 |只看该作者
讲解的好明白。谢谢谢谢了回复 6# jzsjm1002


论坛徽章:
0
8 [报告]
发表于 2019-04-19 19:30 |只看该作者
厉害了,学习学习
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP