免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 3661 | 回复: 20
打印 上一主题 下一主题

[文本处理] 求教个awk的问题,烦高手幫忙解答 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-11-21 17:17 |只看该作者 |倒序浏览
原始排版:

New (名次){
班級 (3年2班)
姓名 () {
X (周)
Y (小杰)
LINKS (56) { 32 52 53 54 55 56 57 58 64 89 90 91 92 93 94 95 86 87 101 103 109 114 115 11
9 123 125 131 145 146 149 150 153 161 175 185 191 193 195 201 204 211 213 219 221 223 22
7 }

條件!!
0-100     前面加R
101-200 前面加T
201-300 前面加C

轉成:
姓名 周 小杰
R32
R52
R53
R54
T115
T119 因為斷行,不能判斷成11
T123
.
C223
C227

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
2 [报告]
发表于 2014-11-21 17:36 |只看该作者
  1. sed '/^LINKS\b/{:1;N;s/\n//;/}/!b1}' i | awk '/^X|Y/{gsub(/[()]/,"");if(/^X/)printf "姓名 %s ",$2;else print $2}/^LINKS\>/{for(i=3;++i<NF;){if($i<=100)print "R"$i;else if($i<=200)print "T"$i;else print "C"$i}}'
复制代码
将管道符前面的i替换成你的文件名~

论坛徽章:
46
2015小元宵徽章
日期:2015-03-06 15:58:18羊年新春福章
日期:2015-04-14 10:37:422015年亚洲杯之阿曼
日期:2015-04-14 10:41:50NBA常规赛纪念章
日期:2015-05-04 22:32:03NBA季后赛大富翁
日期:2015-05-04 22:34:11菠菜明灯
日期:2015-05-04 22:35:49新奥尔良黄蜂
日期:2015-05-04 22:49:2315-16赛季CBA联赛之广夏
日期:2015-12-11 15:02:342015年亚洲杯之巴勒斯坦
日期:2015-03-04 19:56:562015年亚洲杯之阿联酋
日期:2015-03-04 11:19:04休斯顿火箭
日期:2015-03-02 16:32:11纽约尼克斯
日期:2015-03-02 16:09:04
3 [报告]
发表于 2014-11-21 17:54 |只看该作者
回复 2# yestreenstars
  sed '/^LINKS\b/{:1;N;s/\n//;/}/!b1}    您好 我说一下我的理解,你看看对不对

匹配这个模式/^LINKS\b/ 时执行大括号里边的动作 {:1;N;s/\n//;/}/!b1}

这里的:1是什么意思?
/}/!b1 这句话是什么意思?
谢谢


   

论坛徽章:
768
金牛座
日期:2014-02-26 17:49:58水瓶座
日期:2014-02-26 18:10:15白羊座
日期:2014-04-15 19:29:52寅虎
日期:2014-04-17 19:43:21酉鸡
日期:2014-04-19 21:24:10子鼠
日期:2014-04-22 13:55:24卯兔
日期:2014-04-22 14:20:58亥猪
日期:2014-04-22 16:13:09狮子座
日期:2014-05-05 22:31:17摩羯座
日期:2014-05-06 10:32:53处女座
日期:2014-05-12 09:23:11子鼠
日期:2014-05-21 18:21:27
4 [报告]
发表于 2014-11-21 17:57 |只看该作者
回复 3# super皮波

:1相当于一个标签,可以是其它字符,b1就是跳转到标签1处,
sed就是以这种方式来实现循环的.
   

论坛徽章:
46
2015小元宵徽章
日期:2015-03-06 15:58:18羊年新春福章
日期:2015-04-14 10:37:422015年亚洲杯之阿曼
日期:2015-04-14 10:41:50NBA常规赛纪念章
日期:2015-05-04 22:32:03NBA季后赛大富翁
日期:2015-05-04 22:34:11菠菜明灯
日期:2015-05-04 22:35:49新奥尔良黄蜂
日期:2015-05-04 22:49:2315-16赛季CBA联赛之广夏
日期:2015-12-11 15:02:342015年亚洲杯之巴勒斯坦
日期:2015-03-04 19:56:562015年亚洲杯之阿联酋
日期:2015-03-04 11:19:04休斯顿火箭
日期:2015-03-02 16:32:11纽约尼克斯
日期:2015-03-02 16:09:04
5 [报告]
发表于 2014-11-21 18:00 |只看该作者
回复 4# Herowinter
恩,谢谢。想起来这个命令了,b是绝对跳转,还有个根据前面的替换是否成功来决定跳转的命令t

   

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
6 [报告]
发表于 2014-11-21 18:01 |只看该作者
回复 3# super皮波

楼上的英雄无敌已经解释得很清楚了,我就不在多说了~
   

论坛徽章:
0
7 [报告]
发表于 2014-11-21 18:10 |只看该作者
請問 我無法執行!!
會有error message , 還請賜教,感謝!!

论坛徽章:
0
8 [报告]
发表于 2014-11-21 18:15 |只看该作者
Update error message
請問 我無法執行!!
會有error message , 還請賜教,感謝!!

error.png (9.51 KB, 下载次数: 31)

error.png

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
9 [报告]
发表于 2014-11-22 00:22 |只看该作者
回复 1# 初學者

$ awk 'BEGIN{split("RTC",a,"")}/\(\) {/{printf $1" "}/^[XY] /{gsub(/[()]/,"");printf $2" "}/^LINKS /||P==1{P=1;S=S$0;$0=S;if(sub(/ }/,"")){print"";for(n=4;n<=NF;n++)print a[int(($n-1)/100)+1]$n}}' FILE
姓名 周 小杰
R32
R52
...
T114
T115
T119
T123
...
C221
C223
C227

   

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
10 [报告]
发表于 2014-11-22 18:19 |只看该作者
  1. awk 'BEGIN{split("RTC",v,"")}/姓名/{while(getline line){$0=$0""line;if(line~/\}$/)break}gsub(/[{(A-Z)}\n]/,"");c=$0;NF=3;print;l=split(c,a,FS);for(i=5;i<=l;i++)print v[int(a[i]/100)+1]""a[i]}' file
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP