免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 3298 | 回复: 29
打印 上一主题 下一主题

[文本处理] shell文本替换问题,欢迎应战 [复制链接]

论坛徽章:
1
程序设计版块每日发帖之星
日期:2015-09-03 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-08-31 15:37 |只看该作者 |倒序浏览
本帖最后由 bt21cnzy21st 于 2015-08-31 19:24 编辑

有一个文本,具体替换原则是:

1.遇到cco1{},将cco1{} 替换为cco1(),并将{}内的逗号,全替换为|  (cco1内的字段数量是不固定的)
2.遇到cbax[],将[]内的{}全替换为(), 并将[]内的逗号,全替换为|    (cbax内的字段数量是不固定的)

具体如下:
             cco1{-1, 0, -1, 1438081612000, 70, 0, 0}
替换为:  cco1(-1| 0| -1|1438081612000| 70| 0| 0)


            cbax[{"OnPeakAccountID", 1800, 997699, 1970-01-01 07:00:00, 0}, {"FreeUnits", 1800, 997699, 1970-01-01 07:00:00, 0}]
替换为:cbax[("OnPeakAccountID"| 1800| 997699| 1970-01-01 07:00:00| 0)| ("FreeUnits"| 1800| 997699| 1970-01-01 07:00:00| 0)]

最终效果是如下,其中只替换有cco1和cbax后的部分,其他不管

原文:
(1,1,{1,1,cco1{-1,0, -1,1438081612000,70, 0, 0},cbax[{"OnPeakAccountID", 1800, 997699, 1970-01-01 07:00:00, 0}, {"FreeUnits", 1800, 997699, 1970-01-01 07:00:00, 0}]})

替换后:
(1,1,{1,1,cco1(-1|0| -1|1438081612000|70| 0| 0),cbax[("OnPeakAccountID"| 1800| 997699| 1970-01-01 07:00:00| 0)| ("FreeUnits"| 1800| 997699| 1970-01-01 07:00:00| 0)]})


论坛徽章:
1
程序设计版块每日发帖之星
日期:2015-09-03 06:20:00
2 [报告]
发表于 2015-08-31 15:44 |只看该作者
自己顶一下,up

论坛徽章:
11
射手座
日期:2015-08-11 16:10:26辰龙
日期:2015-08-11 16:11:11黑曼巴
日期:2016-04-26 16:58:40
3 [报告]
发表于 2015-08-31 15:48 |只看该作者
  1. [root@66a awk]# cat what.sh
  2. #!/bin/awk
  3. /cco1{/{
  4.         sub(/{/,"(");
  5.         sub(/}/,")");
  6.         gsub(/,/,"|");
  7.         print
  8. }
  9. /cbax\[/{
  10.         gsub(/{/,"(");
  11.         gsub(/}/,")");
  12.         gsub(/,/,"|");
  13.         print
  14. }
  15. [root@66a awk]# awk -f what.sh file
  16. cco1(-1| 0| -1| 1438081612000| 70| 0| 0)
  17. cbax[("OnPeakAccountID"| 1800| 997699| 1970-01-01 07:00:00| 0)| ("FreeUnits"| 1800| 997699| 1970-01-01 07:00:00| 0)]
复制代码
严谨的写不来

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
4 [报告]
发表于 2015-08-31 16:41 |只看该作者

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
5 [报告]
发表于 2015-08-31 17:06 |只看该作者
战胜之后有何奖励?

评分

参与人数 1信誉积分 +8 收起 理由
Herowinter + 8 战个痛快!

查看全部评分

论坛徽章:
6
处女座
日期:2014-04-02 16:07:17酉鸡
日期:2014-04-14 10:09:22子鼠
日期:2014-04-17 11:57:30辰龙
日期:2014-09-01 17:14:08戌狗
日期:2014-10-28 12:25:54未羊
日期:2014-11-14 11:31:58
6 [报告]
发表于 2015-08-31 17:36 |只看该作者
  1. sed -r 's/,/\|/g ;s/\{/\(/ ;s/\}/\)/'
复制代码

论坛徽章:
768
金牛座
日期:2014-02-26 17:49:58水瓶座
日期:2014-02-26 18:10:15白羊座
日期:2014-04-15 19:29:52寅虎
日期:2014-04-17 19:43:21酉鸡
日期:2014-04-19 21:24:10子鼠
日期:2014-04-22 13:55:24卯兔
日期:2014-04-22 14:20:58亥猪
日期:2014-04-22 16:13:09狮子座
日期:2014-05-05 22:31:17摩羯座
日期:2014-05-06 10:32:53处女座
日期:2014-05-12 09:23:11子鼠
日期:2014-05-21 18:21:27
7 [报告]
发表于 2015-08-31 17:41 |只看该作者
回复 1# bt21cnzy21st

  1. while read line;do if [[ "$line" =~ "cco1\{[^}]*\}" ]];then echo "$line"|tr "{}," "()|";elif [[ "$line" =~ "cbax\[[^]]*\]" ]];then echo "$line"|tr "{}," "()|";else echo "$line";fi;done<i
  2. cco1(-1| 0| -1| 1438081612000| 70| 0| 0)
  3. cbax[("OnPeakAccountID"| 1800| 997699| 1970-01-01 07:00:00| 0)| ("FreeUnits"| 1800| 997699| 1970-01-01 07:00:00| 0)]
复制代码

论坛徽章:
1
程序设计版块每日发帖之星
日期:2015-09-03 06:20:00
8 [报告]
发表于 2015-08-31 19:12 |只看该作者
本帖最后由 bt21cnzy21st 于 2015-08-31 19:13 编辑

回复 3# hjfeng1988

你好,你得代码我验证后不对呀,我想要最终效果是,其中只替换有cco1和cbax后的部分,其他不管
原文:
(1,1,{1,1,cco1{-1,0, -1,1438081612000,70, 0, 0},cbax[{"OnPeakAccountID", 1800, 997699, 1970-01-01 07:00:00, 0}, {"FreeUnits", 1800, 997699, 1970-01-01 07:00:00, 0}]})

替换后:
(1,1,{1,1,cco1(-1|0| -1|1438081612000|70| 0| 0),cbax[("OnPeakAccountID"| 1800| 997699| 1970-01-01 07:00:00| 0)| ("FreeUnits"| 1800| 997699| 1970-01-01 07:00:00| 0)]})



   

论坛徽章:
1
程序设计版块每日发帖之星
日期:2015-09-03 06:20:00
9 [报告]
发表于 2015-08-31 19:17 |只看该作者
回复 4# jason680

不好意思前辈,之前是提过相关问题, 但现在需求有变,并且之前是采用的循环一个一个字节读取并替换,性能不佳,现在的要求我已经更新到主贴中了, 耽误你宝贵时间再次review一下吧




   

论坛徽章:
1
程序设计版块每日发帖之星
日期:2015-09-03 06:20:00
10 [报告]
发表于 2015-08-31 19:20 |只看该作者
回复 5# Shell_HAT
战个痛快,不吝指教,

具体如下:
             cco1{-1, 0, -1, 1438081612000, 70, 0, 0}
替换为:  cco1(-1| 0| -1|1438081612000| 70| 0| 0)


             cbax[{"OnPeakAccountID", 1800, 997699, 1970-01-01 07:00:00, 0}, {"FreeUnits", 1800, 997699, 1970-01-01 07:00:00, 0}]
替换为:cbax[("OnPeakAccountID"| 1800| 997699| 1970-01-01 07:00:00| 0)| ("FreeUnits"| 1800| 997699| 1970-01-01 07:00:00| 0)]

最终效果是如下,其中只替换有cco1和cbax后的部分,其他不管

原文:
(1,1,{1,1,cco1{-1,0, -1,1438081612000,70, 0, 0},cbax[{"OnPeakAccountID", 1800, 997699, 1970-01-01 07:00:00, 0}, {"FreeUnits", 1800, 997699, 1970-01-01 07:00:00, 0}]})

替换后:
(1,1,{1,1,cco1(-1|0| -1|1438081612000|70| 0| 0),cbax[("OnPeakAccountID"| 1800| 997699| 1970-01-01 07:00:00| 0)| ("FreeUnits"| 1800| 997699| 1970-01-01 07:00:00| 0)]})



   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP