免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
1234下一页
最近访问板块 发新帖
查看: 11831 | 回复: 30
打印 上一主题 下一主题

[文本处理] 【已解决】awk处理:交换两列,同时每行其他字符不变 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-09-03 00:02 |只看该作者 |倒序浏览
本帖最后由 louis0o0 于 2014-09-03 22:36 编辑

最近学习awk处理,在做例题时碰到如下问题:
交换first name与second name,原始为:
Tommy Savage:408-724-0140:1222 Oxbow Court, Sunnyvale, CA 94087:5/19/66:34200
Yukio Takeshida:387-827-1095:13 Uno Lane, Ashville, NC 23556:7/1/29:57000
Vinh Tranh:438-910-7449:8235 Maple Street, Wilmington, VM 29085:9/23/63:68900
要求改变之后为:
Savage Tommy:408-724-0140:1222 Oxbow Court, Sunnyvale, CA 94087:5/19/66:34200
Takeshida Yukio:387-827-1095:13 Uno Lane, Ashville, NC 23556:7/1/29:57000
Tranh Vinh:438-910-7449:8235 Maple Street, Wilmington, VM 29085:9/23/63:68900

我不知道如何处理的地方在于如何只变换两列名字,同时保持后面的所有字符不变。还求大神帮助!~~先谢了~

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
2 [报告]
发表于 2014-09-03 00:53 |只看该作者
  1. sed -r 's/(\S+)(\s+)([^:]+)(.*)/\3\2\1\4/'
复制代码
  1. awk '{t=gensub(/([^:]+).*/,"\\1",1,$2);sub(/[^:]+/,$1,$2);$1=t}1'
复制代码

论坛徽章:
14
15-16赛季CBA联赛之辽宁
日期:2019-06-16 15:47:3515-16赛季CBA联赛之广夏
日期:2016-08-13 21:24:352015亚冠之武里南联
日期:2015-07-07 17:37:372015亚冠之萨济拖拉机
日期:2015-07-06 17:07:482015亚冠之全北现代
日期:2015-06-04 13:54:272015亚冠之城南
日期:2015-05-21 15:43:212015年亚洲杯之伊朗
日期:2015-04-25 18:20:362015年亚洲杯之伊朗
日期:2015-04-20 16:06:052015年亚洲杯之科威特
日期:2015-03-07 12:51:26丑牛
日期:2014-12-30 10:26:38申猴
日期:2014-09-28 22:40:18金牛座
日期:2014-09-13 21:12:22
3 [报告]
发表于 2014-09-03 01:00 |只看该作者
本帖最后由 reb00t 于 2014-09-03 01:02 编辑
  1. awk -F: '{printf gensub(/(.*) (.*)/,"\\2 \\1",1,$1);for(i=2;i<=NF;i++) printf ":"$i;print " "}' a


  2. sed  -r 's/([^\s]+) ([^:]+):([0-9]{3}-.*)/\2 \1:\3/g' a
复制代码
Savage Tommy:408-724-0140:1222 Oxbow Court, Sunnyvale, CA 94087:5/19/66:34200
Takeshida Yukio:387-827-1095:13 Uno Lane, Ashville, NC 23556:7/1/29:57000
Tranh Vinh:438-910-7449:8235 Maple Street, Wilmington, VM 29085:9/23/63:68900



膜拜楼上的大神,这就是差距。。。

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
4 [报告]
发表于 2014-09-03 08:36 |只看该作者
本帖最后由 ly5066113 于 2014-09-03 08:37 编辑

回复 3# reb00t


只处理你需要处理的:
  1. awk -F: -v OFS=: '$1=gensub(/(.*) (.*)/,"\\2 \\1",1,$1)'
  2. sed -r 's/(\S+)\s+([^:]+)/\2 \1/'
复制代码

论坛徽章:
7
亥猪
日期:2013-10-10 17:00:29辰龙
日期:2013-10-12 16:23:19卯兔
日期:2013-11-18 17:01:27金牛座
日期:2014-09-09 10:17:052015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之柏太阳神
日期:2015-09-25 13:56:42数据库技术版块每日发帖之星
日期:2016-08-06 06:20:00
5 [报告]
发表于 2014-09-03 09:53 |只看该作者
  1. awk '{split($2,a,":");sub(/[^:]+/,$1,$2);$1=a[1]}1' file
复制代码

论坛徽章:
1
双鱼座
日期:2014-08-25 19:13:11
6 [报告]
发表于 2014-09-03 10:19 |只看该作者
\\1 是表示引用前面正则第一个括号里内容么?

回复 2# yestreenstars


   

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
7 [报告]
发表于 2014-09-03 10:25 |只看该作者
回复 6# fxpbupt

YES
   

论坛徽章:
0
8 [报告]
发表于 2014-09-03 10:29 |只看该作者
非常感谢楼上4位大神的帮助!!:wink: (PS:星辰大神的回复真是又快又准啊!)
有一个地方我不明白,awk '{split($2,a,":";sub(/[^:]+/,$1,$2);$1=a[1]}1' file,引号里面最后的1表示什么。我去掉之后没有结果,加上就是ok的。是对什么的引用吗?还望讲解一下~~

回复 5# li0924


   

论坛徽章:
1
处女座
日期:2014-09-18 16:18:00
9 [报告]
发表于 2014-09-03 10:47 |只看该作者
练习一下:
  1. awk 'BEGIN{OFS=FS=":"}{split($1,A,/ /);$1=A[2]" "A[1];print $0}' testfile
复制代码

论坛徽章:
1
处女座
日期:2014-09-18 16:18:00
10 [报告]
发表于 2014-09-03 10:50 |只看该作者
回复 2# yestreenstars
星辰大大我想问问为什么我在split的正则匹配参数里不能用/\s/啊,只能强制用/ /(中间空个空格)

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP