Chinaunix

标题: awk多文本 不同FS的疑问 [打印本页]

作者: jzsjm1002    时间: 2019-03-23 23:46
标题: awk多文本 不同FS的疑问
本帖最后由 jzsjm1002 于 2019-03-24 12:09 编辑

文件a00.xml
100020:160908:0
300006:2141624:254
300009:37273:0
300024:7879674:3307
300025:746151:596
300026:341735:0
300027:2151826:0
300028:429171:0
300029:516083:0
300030:11755071:0

文件b00.xml
100020 160908 0
300006 2141624 0
300009 37273 0
300024 7879674 0
300025 746151 0
300026 341735 0
300027 2151826 0
300028 429171 0
300029 516083 0
300030 11755071 0

b00.xml文件对a00.xml进行校验
a00.xml $3不为0 取$3的值 代替b00x.xml $3的值
想要得结果

100020:160908:0
300006:2141624:254
300009:37273:0
300024:7879674:3307
300025:746151:596
300026:341735:0
300027:2151826:0
300028:429171:0
300029:516083:0
300030:11755071:0

脚本如下:
  1. [root@vh100 awk]# cat test.awk
  2. #!/usr/bin/awk -f
  3. #

  4. BEGIN{
  5.   OFS=SUBSEP=":"
  6. }

  7. FILENAME=="a00.xml"{
  8.   FS=":"
  9.   a[$1,$2]=$3
  10. }

  11. FILENAME=="b00.xml"{
  12.   FS=" "
  13.   c[++j]=$1":"$2
  14. }

  15. END{
  16.   for(i=0;++i<=j;)
  17.     print c[i],a[c[i]]
  18. }

  19. [root@vh100 awk]# ./test.awk a00.xml b00.xml
  20. 100020 160908 0::                        # <-- 为什么首行输出 间隔:会在后面
  21. 300006:2141624:254
  22. 300009:37273:0
  23. 300024:7879674:3307
  24. 300025:746151:596
  25. 300026:341735:0
  26. 300027:2151826:0
  27. 300028:429171:0
  28. 300029:516083:0
  29. 300030:11755071:0
复制代码

awk版本: GNU Awk 4.0.2
有没有大神帮忙解答一下 感谢!
作者: cfwyy    时间: 2019-03-25 09:25
你在指令里面更改FS 对第一行来说已经来不及了,此时第一行已经读入了,是按系统默认的FS,这里改只会影响到后面的行。所以第一行结果就不是你想要的了。
具体来说,
读到第二个文件时,前面改了FS=“:",$1=100020 160908 0    ,$2空
c[1]=100020 160908 0:
a[100020 160908 0:] 空
所以第一行打印100020 160908 0::   (加一个OFS)

作者: jzsjm1002    时间: 2019-03-25 10:06
回复 2# cfwyy

非常感谢!~
作者: 本友会机友会摄友会    时间: 2019-03-25 16:44
提示: 作者被禁止或删除 内容自动屏蔽
作者: jzsjm1002    时间: 2019-03-25 17:05
回复 4# 本友会机友会摄友会

感谢




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2