免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3993 | 回复: 11
打印 上一主题 下一主题

awk处理文本某域空格的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-08-21 22:13 |只看该作者 |倒序浏览
有这样一个文本

1 pass due|某省  某市      某区     某小区  X号|
2 new djkw|AA BB      CCC   DDD  WWW      |

现在现将文本处理为 第一域中的空格不能动,第二域中的空格全部替换没有.
这个awk脚本应该如何写? 我用sub和gsub试过,但都不行.请教一下高手?

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
2 [报告]
发表于 2008-08-21 22:21 |只看该作者
awk 'BEGIN{FS=OFS="|"}{gsub(/ /,"",$2);print}'

论坛徽章:
0
3 [报告]
发表于 2008-08-21 22:23 |只看该作者
不行啊!
用二楼的方法试过啦,不行,输出的第二个域和原文本一样,没有变化.

论坛徽章:
0
4 [报告]
发表于 2008-08-21 22:27 |只看该作者
二楼的朋友,你哪个OFS在我程序中没写,有没有关系?

论坛徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00
5 [报告]
发表于 2008-08-21 22:34 |只看该作者
sed版本的(效率比awk低的多)
sed -r ':a /\|.*[ \t]/ { s/\|(.*)[ \t]/\|\1/;ba;}'

论坛徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00
6 [报告]
发表于 2008-08-21 22:38 |只看该作者
再改一下:
sed -r ':a /\|.*[ \t]/ { s/\|(.*)[ \t]+(.*)\|/\|\1\2\|/;ta;}'

论坛徽章:
0
7 [报告]
发表于 2008-08-21 22:46 |只看该作者
谢谢版主回贴,但这个程序还有一些东西,所以必须要用awk来写.
我只是不太明白,如果用gsub(" ","",$0)可以将所有空格去除,但用gsub(" ","",$2)却无法去除某个域上的空格,这有些让人费解.
像对于行尾的空格,用gsub(/  *$/,"",$2)又可以去除.真是不明白.

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
8 [报告]
发表于 2008-08-21 22:57 |只看该作者
这样??

论坛徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00
9 [报告]
发表于 2008-08-21 22:59 |只看该作者
awk 'BEGIN{FS="|";OFS="|"}{gsub(/[ \t]/,"",$2);print}'

论坛徽章:
0
10 [报告]
发表于 2008-08-21 23:06 |只看该作者
八楼的朋友,你的系统是什么的? 我用的是AIX 5L,不知道用你的方法行不行,明天到单位去试一下.
另外,再问一下,[[:blank"]]两个方括号是什么意思? blank可以换成space吗?
+号的意思是不是和*号同一个意思,表示多个或0个的意思?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP