免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2773 | 回复: 19
打印 上一主题 下一主题

[文本处理] 关于sed和awk如何处理这样一段文本? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-02-15 18:19 |只看该作者 |倒序浏览
本帖最后由 for_eric 于 2014-02-15 20:27 编辑

大家好,我有类似这样的一个文本;

var a=startABC{
       { name: "a", code: "1" },
       { name: "b", code: "2" },
       { name: "c", code: "3" },
};

var a=startAGH{
       { name: "a", code: "4" },
       { name: "b", code: "5" },
       { name: "c", code: "6" },
};

var a=startACH{
       { name: "a", code: "7" },
       { name: "b", code: "8" },
       { name: "c", code: "9" },
};


可能连续都是这样的结构,我要从每个结构中得到start后面的三个字母和每个code组合成类似这样:
ABC-1,2,3
AGH-4,5,6
ACH-7,8,9
,怎么处理比较好?谢谢大家了

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
2 [报告]
发表于 2014-02-15 18:37 |只看该作者
你是让人猜你想要什么结果吗?

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
3 [报告]
发表于 2014-02-15 19:21 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
4 [报告]
发表于 2014-02-15 20:28 |只看该作者
回复 2# yestreenstars


    不好意思,没写清楚,重新编辑了一次,麻烦在看一下。

论坛徽章:
0
5 [报告]
发表于 2014-02-15 20:28 |只看该作者
回复 3# zooyo

重新编辑了一次。


   

论坛徽章:
6
处女座
日期:2014-04-02 16:07:17酉鸡
日期:2014-04-14 10:09:22子鼠
日期:2014-04-17 11:57:30辰龙
日期:2014-09-01 17:14:08戌狗
日期:2014-10-28 12:25:54未羊
日期:2014-11-14 11:31:58
6 [报告]
发表于 2014-02-15 22:05 |只看该作者
  1. awk -F"[ ={\"]+" '/var/{s="";p="";gsub(/start/,"",$3);s=$3} /code:/{p=p?p","$6:$6} /;/{print s"-"p}' o
复制代码
  1. sed -rn '/var/{:1;N;/;/!b1; s/.*start([A-Z]+)[^0-9]+([0-9]+)[^0-9]+([0-9]+)[^0-9]+([0-9]+).*/\1-\2,\3,\4/gp}' o
复制代码

论坛徽章:
0
7 [报告]
发表于 2014-02-15 22:20 |只看该作者
本帖最后由 runintostar 于 2014-02-16 23:01 编辑

回复 5# for_eric
  1. $awk -F'[ :\"={}]+' '$1=="var"{sub(/start/,"",$3);if(j++){printf "\n"}printf $3;i=0}$2=="name"{s=!i++?"-":",";printf s$6}END{printf "\n"}'
复制代码
  1. sed -n '/var/{s/.*start//;h};/name/{s/^.*code:.*"\(.*\)".*$/\1/;H};/^}/{g;s/{[^\n]*\n/-/;s/\n/,/gp}'
复制代码

论坛徽章:
0
8 [报告]
发表于 2014-02-15 23:25 |只看该作者
回复 7# runintostar

谢谢啊,就是有点不明白 s=!i++  这句话什么意思?


   

论坛徽章:
0
9 [报告]
发表于 2014-02-15 23:44 |只看该作者
回复 8# for_eric
嗯,这个,用s来保存
ABC之后的分隔符,因为第一个数字前面是'-',而后面数字间是','
第一次赋值时i是0,!i++为真,s就等于'-',之后i不为0,s就是','
这样如果ABC之后没有数字就不会输出-了

论坛徽章:
29
程序设计版块每日发帖之星
日期:2016-02-29 06:20:0015-16赛季CBA联赛之天津
日期:2016-08-10 10:33:1115-16赛季CBA联赛之深圳
日期:2016-08-17 15:07:2015-16赛季CBA联赛之佛山
日期:2016-11-07 11:33:5015-16赛季CBA联赛之广夏
日期:2016-11-15 09:13:31CU十四周年纪念徽章
日期:2016-11-24 14:12:25极客徽章
日期:2016-12-07 14:03:4015-16赛季CBA联赛之深圳
日期:2016-12-07 17:15:2715-16赛季CBA联赛之北京
日期:2016-12-22 09:30:0115-16赛季CBA联赛之深圳
日期:2016-12-22 10:49:2115-16赛季CBA联赛之山西
日期:2017-02-10 09:05:3215-16赛季CBA联赛之同曦
日期:2017-02-27 14:19:08
10 [报告]
发表于 2014-02-16 11:10 |只看该作者
awk -F \" '/start/{if(s)print s"-"p;s=gensub(/.*start(.*){/,"\\1",1);p=""}$3~/code/{p=p?p","$44}END{print s"-"p}'
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP