免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5117 | 回复: 4
打印 上一主题 下一主题

[文本处理] awk匹配段落,分别处理 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2018-12-14 16:03 |只看该作者 |倒序浏览
本帖最后由 Carol 于 2018-12-14 16:24 编辑

需要处理的文件内容:

   
    <Connector port="8443" protocol="org.apache.coyote.http11.Http11NioProtocol" server="server_name"
               maxThreads="150" SSLEnabled="true">
    <Certificate certificateKeystoreFile="conf/localhost-rsa.jks"
                         type="RSA" />
    </Connector>
    <Connector port="8443" protocol="org.apache.coyote.http11.Http11AprProtocol"
               maxThreads="150" SSLEnabled="true" >
    <UpgradeProtocol className="org.apache.coyote.http2.Http2Protocol" />
    </SSLHostConfig>


我截取了其中一段,想要做的事情是匹配<Connector...>之间的内容,然后对<Connector...>进行修改。

举例:
对于scheme="https"这个变量,如果<Connector...>中存在port="8443",判断是否有scheme="https",如果没有则添加,如果有判断属性值是否是"https",不是的话修改;
如果<Connector...>中不存在port="8443",判断是否有scheme="http",如果没有则添加,如果有判断属性值是否是"http",不是的话修改。

我的方法:
if [ -n "`awk '/<Connector/,/>/' file | grep "scheme"`" ] ;then
        sed -i '/scheme/s/"https"/"http"/' file
else
        sed -i 's/protocol[[:graph:]]*/& scheme="http" /' file
fi
if [ -z "`awk '/<Connector.*port="8443"/,/>/' file | grep "scheme"`" ] ;then
        sed -i 's/[[:space:]]*port="8443"[[:space:]]*/& scheme="https" /' file
else
        sed -i '/[[:space:]]*port="8443"[[:space:]]*/s/scheme="http"/scheme="https"/' file
fi


这里有两处错误,一个是awk匹配的是几段<Connector...>,只要其中一段包含"scheme"就会返回为真,其实我是想检查每个<Connector...>;
第二个就是sed -i的部分,限制条件不足,可能会重复添加"scheme"变量。

搜了好多文章也不知道怎么能够逐段检查<Connector...>,还望大神指点!!

论坛徽章:
0
2 [报告]
发表于 2018-12-17 14:47 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
25
程序设计版块每日发帖之星
日期:2016-05-03 06:20:0015-16赛季CBA联赛之八一
日期:2018-07-05 10:34:09黑曼巴
日期:2018-07-06 15:19:5015-16赛季CBA联赛之佛山
日期:2018-08-03 13:19:3315-16赛季CBA联赛之山西
日期:2018-08-07 19:46:2315-16赛季CBA联赛之广夏
日期:2018-08-08 19:31:5015-16赛季CBA联赛之青岛
日期:2018-11-26 15:21:5015-16赛季CBA联赛之上海
日期:2018-12-11 09:45:3219周年集字徽章-年
日期:2020-04-18 23:54:5215-16赛季CBA联赛之深圳
日期:2020-04-19 21:40:19黑曼巴
日期:2022-04-03 17:55:1315-16赛季CBA联赛之八一
日期:2018-07-03 16:56:46
3 [报告]
发表于 2018-12-17 17:40 |只看该作者
本帖最后由 wh7211 于 2018-12-17 17:43 编辑

回复 1# Carol


  1. cat 1
  2. <Connector port="8443" aaa="111"
  3. bbb="222" ccc="333"
  4. ddd="444"
  5. </Connector>
  6. <Connector port="8443" aaa="111"
  7. bbb="222" ccc="333"
  8. ddd="444" scheme="555"
  9. </Connector>
  10. <Connector port="8444" aaa="111"
  11. bbb="222" ccc="333"
  12. ddd="444"
  13. </Connector>
  14. <Connector port="8444" aaa="111"
  15. bbb="222" ccc="333"
  16. ddd="444" scheme="555"
  17. </Connector>

  18. awk '{a[NR]=$0}/port="8443"/{b=1}match($0,"(scheme=[^ ]+)",c){d=c[1];e=NR}/\/Connector/{if(b&&d){sub(d,"scheme=\042https\042",a[e])}else if(b&&!d){sub("$"," scheme=\042https\042",a[NR-1])}else if(!b&&d){sub(d,"scheme=\042http\042",a[e])}else if(!b&&!d){sub("$"," scheme=\042http\042",a[NR-1])};for(i in a){print a[i]};b=d="";delete a}' 1
  19. <Connector port="8443" aaa="111"
  20. bbb="222" ccc="333"
  21. ddd="444" scheme="https"
  22. </Connector>
  23. <Connector port="8443" aaa="111"
  24. bbb="222" ccc="333"
  25. ddd="444" scheme="https"
  26. </Connector>
  27. <Connector port="8444" aaa="111"
  28. bbb="222" ccc="333"
  29. ddd="444" scheme="http"
  30. </Connector>
  31. <Connector port="8444" aaa="111"
  32. bbb="222" ccc="333"
  33. ddd="444" scheme="http"
  34. </Connector>
复制代码

论坛徽章:
0
4 [报告]
发表于 2018-12-17 19:50 |只看该作者
回复 3# wh7211

太感动了,谢谢大神

论坛徽章:
0
5 [报告]
发表于 2018-12-17 19:54 |只看该作者
回复 2# 本友会机友会摄友会

好的,我研究研究py的方法,谢谢!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP