免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1907 | 回复: 2

[文本处理] 一件诡异的事情,无法理解,请大神指点 [复制链接]

论坛徽章:
17
辰龙
日期:2014-05-21 21:01:4115-16赛季CBA联赛之北控
日期:2016-11-28 18:26:3815-16赛季CBA联赛之佛山
日期:2016-11-03 11:18:5815-16赛季CBA联赛之辽宁
日期:2016-07-10 16:09:4115-16赛季CBA联赛之江苏
日期:2016-02-20 23:09:202015亚冠之塔什干棉农
日期:2015-08-17 19:49:492015年亚洲杯之日本
日期:2015-04-30 01:24:342015年亚洲杯之约旦
日期:2015-04-01 00:37:182015年亚洲杯之沙特阿拉伯
日期:2015-03-02 15:55:40处女座
日期:2014-05-25 10:34:0015-16赛季CBA联赛之深圳
日期:2016-12-23 13:51:38
发表于 2020-03-09 05:11 |显示全部楼层
本帖最后由 bikkuri 于 2020-03-09 05:28 编辑

大家好!
我有一个问题向大家请教。
有a和b两个文本文件,两者的区别仅仅在于第二行中的最后一个字母,一个是小写字母o,一个是大写字母A。
[root@betactvdh:/tmp]# cat a
1
2% o
3
4
5
6
[root@betactvdh:/tmp]# cat b
1
2% A
3
4
5
6
[root@betactvdh:/tmp]# diff a b
2c2
< 2% o
---
> 2% A[root@betactvdh:/tmp]# hexdump -C a
00000000  31 0a 32 25 20 6f 0a 33  0a 34 0a 35 0a 36 0a     |1.2% o.3.4.5.6.|
0000000f
[root@betactvdh:/tmp]# hexdump -C b
00000000  31 0a 32 25 20 41 0a 33  0a 34 0a 35 0a 36 0a     |1.2% A.3.4.5.6.|
0000000f
[root@betactvdh:/tmp]#

hexdump.PNG

然后我用同一条awk命令将6行的文本折叠成两行,其中对b文件可以得到期望的结果,但是对a文件的操作却失败了!
[root@betactvdh:/tmp]# cat a|awk '{for(i>0;i<=NR;i++)a=$0}END{for(j=0;3*j+1<i;j++){printf"|";for(k=1;k<=3;k++)printf a[3*j+k]"|";printf"\n"}}'
|1|awk: cmd. line:1: (FILENAME=- FNR=6) fatal: not enough arguments to satisfy format string
        `2% o|'
           ^ ran out for this one
[root@betactvdh:/tmp]# cat b|awk '{for(i>0;i<=NR;i++)a=$0}END{for(j=0;3*j+1<i;j++){printf"|";for(k=1;k<=3;k++)printf a[3*j+k]"|";printf"\n"}}'
|1|2% A|3|
|4|5|6|

  1. awk '{for(i>0;i<=NR;i++)a[i]=$0}END{for(j=0;3*j+1<i;j++){printf"|";for(k=1;k<=3;k++)printf a[3*j+k]"|";printf"\n"}}'
复制代码



awk的版本是gawk 4.0.2,算是比较高的版本。
[root@betactvdh:/tmp]# awk --version
GNU Awk 4.0.2
Copyright (C) 1989, 1991-2012 Free Software Foundation.

This program is free software; you can redistribute it and/or modify
it under the terms of the GNU General Public License as published by
the Free Software Foundation; either version 3 of the License, or
(at your option) any later version.

This program is distributed in the hope that it will be useful,
but WITHOUT ANY WARRANTY; without even the implied warranty of
MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
GNU General Public License for more details.

You should have received a copy of the GNU General Public License
along with this program. If not, see http://www.gnu.org/licenses/.
[root@betactvdh:/tmp]#

请问为什么会出现这种情况呢?



谢谢大家!


awk_issue.png

论坛徽章:
8
2016科比退役纪念章
日期:2018-10-24 08:24:0115-16赛季CBA联赛之北控
日期:2019-03-12 14:34:562016科比退役纪念章
日期:2019-04-01 10:33:0915-16赛季CBA联赛之山东
日期:2019-04-17 12:46:3215-16赛季CBA联赛之广夏
日期:2019-05-09 16:40:4015-16赛季CBA联赛之广夏
日期:2019-10-10 15:33:4015-16赛季CBA联赛之辽宁
日期:2019-10-15 08:37:0615-16赛季CBA联赛之北控
日期:2021-03-30 15:53:34
发表于 2020-03-09 10:15 |显示全部楼层
1.  一点也不诡义,问题出在在printf函数,你再去翻翻该函数的用法,其实错误提示已经给你信息了... format string...就是在格式化字符的时候出错了。printf函数格式化符 百分号后面的一些字符是有格式化意义的,碰巧让你碰到一个有意义,一个无意义。
你写的printf部分改成
  1. printf("%s|",a[3*j+k])
复制代码
即可。
2.  如果只是对你的两个文件达要你要的结果,我会这么写:
  1. awk '{a[NR]=$0}END{for(i=1;i<=NR;i++){printf("|%s",a[i]);if(i%3==0)printf("|\n")}}' file
复制代码

评分

参与人数 1信誉积分 +10 收起 理由
飘絮絮絮丶 + 10 赞一个!

查看全部评分

论坛徽章:
17
辰龙
日期:2014-05-21 21:01:4115-16赛季CBA联赛之北控
日期:2016-11-28 18:26:3815-16赛季CBA联赛之佛山
日期:2016-11-03 11:18:5815-16赛季CBA联赛之辽宁
日期:2016-07-10 16:09:4115-16赛季CBA联赛之江苏
日期:2016-02-20 23:09:202015亚冠之塔什干棉农
日期:2015-08-17 19:49:492015年亚洲杯之日本
日期:2015-04-30 01:24:342015年亚洲杯之约旦
日期:2015-04-01 00:37:182015年亚洲杯之沙特阿拉伯
日期:2015-03-02 15:55:40处女座
日期:2014-05-25 10:34:0015-16赛季CBA联赛之深圳
日期:2016-12-23 13:51:38
发表于 2020-03-09 12:56 |显示全部楼层
回复 2# cfwyy

谢谢您的指点!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

SACC2021中国系统架构师大会

【数字转型 架构重塑】2021年5月20日-22日第十三届中国系统架构师大会将在云端进行网络直播。

大会为期3天的议程,涉及20+专场,近120个主题,完整迁移到线上进行网络直播对会议组织来说绝非易事;但考虑到云端会议的直播形式可以实现全国各地技术爱好者的参与,也使ITPUB作为技术共享交流平台得到更好的普及,我们决定迎难而上。
http://sacc.it168.com/


大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP