免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3143 | 回复: 12
打印 上一主题 下一主题

[文本处理] 请教如何将含多个单词空格隔开的名词看做一个域来操作 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-06-26 03:08 |只看该作者 |倒序浏览
$head dat.txt
ALGERIA        36.4   14.6
CONGO          37.3    8.0               
EGYPT          42.1   15.3               
GHANA          55.8   25.6               
IVORY COAST    56.1   33.1               
MALAGASY       41.8   15.8               
MOROCCO        46.1   18.7               
TUNISIA        41.7   10.1               
CAMBODIA       41.4   19.7               
CEYLON         35.8    8.5

像上面的数据中,实质上只有三列,每行的域分隔符为不等的空格,但有一点是第一个域可能为多个空格隔开的名词,比如:
IVORY COAST    56.1   33.1   

现在要做到将三列以‘\t’制表符隔开,而不再是不等的空格隔开。现在我只能对后面数字列做到这样,请问各位如何整个做到这一点。
$ cat dat.txt|tr -s ' ' |awk  'BEGIN{OFS="\t"}{print $(NF-2), $(NF-1), $NF}'|head
ALGERIA 36.4    14.6
CONGO   37.3    8.0
EGYPT   42.1    15.3
GHANA   55.8    25.6
COAST   56.1    33.1       ## 实际应为: IVORY COAST   56.1   33.1  
MALAGASY        41.8    15.8
MOROCCO 46.1    18.7
TUNISIA 41.7    10.1
CAMBODIA        41.4    19.7
CEYLON  35.8    8.5



dat.txt.tar.gz

912 Bytes, 下载次数: 12

data

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
2 [报告]
发表于 2015-06-26 04:24 |只看该作者
回复 1# bmechuangye

$ awk '{OFS="\t";$1=$1;if(NF>3){$1=$1" "$2;$2=$3;$3=$4;NF=3}}1' FILE
ALGERIA        36.4        14.6
CONGO        37.3        8.0
EGYPT        42.1        15.3
GHANA        55.8        25.6
IVORY COAST        56.1        33.1
MALAGASY        41.8        15.8
MOROCCO        46.1        18.7
TUNISIA        41.7        10.1
CAMBODIA        41.4        19.7
CEYLON        35.8        8.5

   

论坛徽章:
0
3 [报告]
发表于 2015-06-26 05:11 |只看该作者
本帖最后由 bmechuangye 于 2015-06-26 05:12 编辑

回复 2# jason680

非常感谢jason680!

有个问题想问一下,就是这一行命令最后那个“1”是什么意思?我试了试,1改成其它数字结果都不变,为什么?

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
4 [报告]
发表于 2015-06-26 05:24 |只看该作者
回复 3# bmechuangye

awk初学之常见问题
http://bbs.chinaunix.net/thread-2309494-1-1.html

1. awk ‘{code}1’ 中的“1”是干什么的?
   

论坛徽章:
0
5 [报告]
发表于 2015-06-26 05:33 |只看该作者
回复 4# jason680

     谢谢您!

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
6 [报告]
发表于 2015-06-26 09:56 |只看该作者
@jason680@bmechuangye

你们大半夜不睡觉的么?  

论坛徽章:
11
射手座
日期:2015-08-11 16:10:26辰龙
日期:2015-08-11 16:11:11黑曼巴
日期:2016-04-26 16:58:40
7 [报告]
发表于 2015-06-26 10:24 |只看该作者
  1. awk -vFS="  +" -vOFS="\t" '$1=$1' file
复制代码
不是很严谨,其实楼主半夜不睡觉很正常,但是680大神大半夜不睡觉就不合理了

论坛徽章:
0
8 [报告]
发表于 2015-06-27 05:30 |只看该作者
回复 7# hjfeng1988

  谢谢,很精练。您好,-vFS="  +" 这个是一个以上空格不包括一个空格的意思吗?
   

论坛徽章:
11
射手座
日期:2015-08-11 16:10:26辰龙
日期:2015-08-11 16:11:11黑曼巴
日期:2016-04-26 16:58:40
9 [报告]
发表于 2015-06-27 09:49 |只看该作者
回复 8# bmechuangye


    +是一个或一个以上,"  +"就是两个或者两个以上的空格

论坛徽章:
0
10 [报告]
发表于 2015-06-27 09:56 |只看该作者
回复 9# hjfeng1988


谢谢hjfeng1988!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP