免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 10629 | 回复: 8
打印 上一主题 下一主题

[文本处理] awk或者sed如何处理这样的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2020-03-06 14:03 |只看该作者 |倒序浏览
cat file
gidNumber: 820
cn: icac
memberUid: aaa
memberUid: bbb
memberUid: ccc
gidNumber: 821
cn: datax
memberUid: ddd
memberUid: aaa
gidNumber: 822
cn: exchange
这里是3条记录
一个文件里gidNumber和cn 是肯定有的,memberUid可能有多个也可能没有,如何做到
gidNumber: 820,cn: icac,memberUid: aaa|bbb|ccc
gidNumber: 821,cn: datax,memberUid: ddd|aaa
gidNumber: 822,cn: exchange,




论坛徽章:
0
2 [报告]
发表于 2020-03-06 17:01 |只看该作者
有高手吗有高手吗有高手吗

论坛徽章:
0
3 [报告]
发表于 2020-03-06 19:36 |只看该作者
sed -nr '1h;1!H;${g;:a;s/(memberUid: )([^\n]+)\n\1/\1\2|/;ta;s/\n(cn|mem)|$/,\1/g;p}' file
gidNumber: 820,cn: icac,memberUid: aaa|bbb|ccc
gidNumber: 821,cn: datax,memberUid: ddd|aaa
gidNumber: 822,cn: exchange,

论坛徽章:
0
4 [报告]
发表于 2020-03-06 20:01 |只看该作者
本帖最后由 Looiml 于 2020-03-06 20:02 编辑
  1. awk -F'[: ]+' '/^mem/{printf a?"|"$2:$0;a=1;next}{a=0;if(/^gid/)print "";printf $0","}' file
复制代码


gidNumber: 820,cn: icac,memberUid: aaa|bbb|ccc
gidNumber: 821,cn: datax,memberUid: ddd|aaa
gidNumber: 822,cn: exchange,

评分

参与人数 1可用积分 +10 收起 理由
飘絮絮絮丶 + 10 赞一个!

查看全部评分

论坛徽章:
0
5 [报告]
发表于 2020-03-10 18:04 |只看该作者
本帖最后由 wjw870907 于 2020-03-12 10:13 编辑
Looiml 发表于 2020-03-06 20:01
gidNumber: 820,cn: icac,memberUid: aaa|bbb|cccgidNumber: 821,cn: datax,memberUid: ddd|aaagidNumber:  ...

谢谢大神

论坛徽章:
25
程序设计版块每日发帖之星
日期:2016-05-03 06:20:0015-16赛季CBA联赛之八一
日期:2018-07-05 10:34:09黑曼巴
日期:2018-07-06 15:19:5015-16赛季CBA联赛之佛山
日期:2018-08-03 13:19:3315-16赛季CBA联赛之山西
日期:2018-08-07 19:46:2315-16赛季CBA联赛之广夏
日期:2018-08-08 19:31:5015-16赛季CBA联赛之青岛
日期:2018-11-26 15:21:5015-16赛季CBA联赛之上海
日期:2018-12-11 09:45:3219周年集字徽章-年
日期:2020-04-18 23:54:5215-16赛季CBA联赛之深圳
日期:2020-04-19 21:40:19黑曼巴
日期:2022-04-03 17:55:1315-16赛季CBA联赛之八一
日期:2018-07-03 16:56:46
6 [报告]
发表于 2020-03-18 23:53 |只看该作者
本帖最后由 wh7211 于 2020-03-19 00:07 编辑

回复 1# wjw870907


  1. cat 1
  2. gidNumber: 820
  3. cn: icac
  4. memberUid: aaa
  5. memberUid: bbb
  6. memberUid: ccc
  7. gidNumber: 821
  8. cn: datax
  9. memberUid: ddd
  10. memberUid: aaa
  11. gidNumber: 822
  12. cn: exchange

  13. awk '/^gidNumber/{if(a){print a;a=b=""};a=$0}/^cn/{a=a","$0","}/^memberUid/{a=b?a"|"$2:a""$0;b++}END{if(a){print a}}' 1
  14. awk '/^gidNumber/{a[++b]=$0;c=""}/^cn/{a[b]=a[b]","$0","}/^memberUid/{a[b]=c?a[b]"|"$2:a[b]""$0;c++}END{for(i=1;i<=length(a);i++){print a[i]}}' 1

  15. # 输出。
  16. gidNumber: 820,cn: icac,memberUid: aaa|bbb|ccc
  17. gidNumber: 821,cn: datax,memberUid: ddd|aaa
  18. gidNumber: 822,cn: exchange,
复制代码

论坛徽章:
0
7 [报告]
发表于 2022-11-14 11:12 |只看该作者
  1. sed -r '/^gidNumber/{:a;N;/\ngidNumber/bc;/\ncn/{s/$/,/;s/\n//};s/memberUid: (.*)\n/\1|/;s/\n//;ta;:c;s/([a-z|\|]+)(memberUid: )/\2\1/;P;D}' 1
复制代码

论坛徽章:
5
白羊座
日期:2014-10-28 11:23:27水瓶座
日期:2015-01-20 10:19:022015亚冠之柏斯波利斯
日期:2015-07-11 18:17:2015-16赛季CBA联赛之同曦
日期:2015-12-23 12:38:582016猴年福章徽章
日期:2016-02-18 15:30:34
8 [报告]
发表于 2022-11-24 17:21 |只看该作者
本帖最后由 klainogn 于 2022-11-24 17:51 编辑
  1. sed -r '1{h;d};${H;g;b1};/gidNumber/!{H;d};:1;x;s/\n/,/g;:2;s/(memberUid: )([^,]+),\1/\1\2|/;t2' test.txt
  2. gidNumber: 820,cn: icac,memberUid: aaa|bbb|ccc
  3. gidNumber: 821,cn: datax,memberUid: ddd|aaa
  4. gidNumber: 822,cn: exchange
复制代码

论坛徽章:
5
白羊座
日期:2014-10-28 11:23:27水瓶座
日期:2015-01-20 10:19:022015亚冠之柏斯波利斯
日期:2015-07-11 18:17:2015-16赛季CBA联赛之同曦
日期:2015-12-23 12:38:582016猴年福章徽章
日期:2016-02-18 15:30:34
9 [报告]
发表于 2022-11-24 17:55 |只看该作者
  1. awk '/gidNumber/{if(length(s)!=0)print s;s=$0;next}s~/member/{s=s"|"$2;next}{s=s","$0}END{print s}' test.txt
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP