免费注册	查看新帖 \|


平台论坛博客文库

› 论坛 › 程序设计 › Shell › awk中如何去除每个域的首尾空格，并且在条件中使用？

最近访问板块

发新帖

查看: 7019 | 回复: 3

上一主题

下一主题

[文本处理] awk中如何去除每个域的首尾空格，并且在条件中使用？ [复制链接]

论坛徽章:: 0

电梯直达

跳转到指定楼层

1楼 [收藏(0)] [报告]

发表于 2015-07-06 17:27 |只看该作者 |倒序浏览

本帖最后由 xylcxyfc 于 2015-07-06 17:36 编辑

数据库中有张表，f1与f2分别是这张表前后两天的数据导出文件，这张表的主键在第一、二个字段。

awk 'BEGIN{FS = ","} NR==FNR{a[$1$2]++} NR>FNR&&!a[$1$2]{if(NF>0) print $0",5"}' f1.txt f2.txt

复制代码

这是一个根据其主键判断有无新增数据并输出的语句，现在的问题是，突然某天，数据库中的数据没有变化，然而数据文件中不知为何主键字段的首尾多了一些空格，体现在主键所在域的首尾多了这些空格，比如说前一天是"5678"，后一天的该域就变成了" 5678 "。
这样在上面的awk中，添加主键值到a数组时，数组就不是同一列了，判断的结果就会出错。

那么，在不改变这两个文件内容的前提下，有没方法事先把域中的所有或指定字段trim一下呢（去除首尾空格），并且在去除后，“NR>FNR&&!a[$1$2]”这里a数组中的值是trim后的值呢？

测试结果：sub一次只能指定一个域或者整条记录。如果依次指定域的话，使用sub或者gsub替换空格后，在动作前的条件判断中引用该域的值还是没有trim过的。

f1.txt

123456,"00","asdas"

复制代码

f2.txt

123456 ,"00","asdas"

复制代码

现在因为空格的问题导致输出一条新增数据，正确的结果应该是无输出，也即认为数据没变化。

-------------------------------------------------

去除引号后好像还没效果

文库|博客

论坛徽章:: 0

2楼 [报告]

发表于 2015-07-06 17:33 |只看该作者

本帖最后由 xylcxyfc 于 2015-07-06 17:33 编辑

好吧，我可能找到gsub没有效果的原因了，双引号把空格括住了

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 60

20周年集字徽章-20
日期:2020-10-28 14:04:30

15-16赛季CBA联赛之北京
日期:2016-07-06 15:42:07

15-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:09

15-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56

黄金圣斗士
日期:2015-12-02 11:44:35

白银圣斗士
日期:2015-11-25 14:32:43

白银圣斗士
日期:2015-11-23 12:53:35

2015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:48

2015亚冠之首尔
日期:2015-09-01 16:46:05

2015亚冠之德黑兰石油
日期:2015-08-31 11:39:19

2015亚冠之萨济拖拉机
日期:2015-08-28 21:06:53

15-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53

3楼 [报告]

发表于 2015-07-06 17:35 |只看该作者

awk 'BEGIN{FS = ","}{gsub(/ +/,"",$1)}NR==FNR{a[$1$2]++} NR>FNR&&!a[$1$2]{if(NF>0) print $0",5"}' f1.txt f2.txt

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

4楼 [报告]

发表于 2015-07-06 17:51 |只看该作者

回复 3# reyleon

厉害，实验了下有效果，原来要在前面用大括号括住，我之前没括号怎么都不对，但这样一次只能指定一个域，有没给定多个字段位置只用一次gsub的写法？谢谢！

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

发新帖

Chinaunix › 论坛 › 程序设计 › Shell › awk中如何去除每个域的首尾空格，并且在条件中使用？

北京盛拓优讯信息技术有限公司. 版权所有京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号：11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员联系我们：huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP