Chinaunix

标题: awk匹配段落,分别处理 [打印本页]

作者: Carol    时间: 2018-12-14 16:03
标题: awk匹配段落,分别处理
本帖最后由 Carol 于 2018-12-14 16:24 编辑

需要处理的文件内容:

   
    <Connector port="8443" protocol="org.apache.coyote.http11.Http11NioProtocol" server="server_name"
               maxThreads="150" SSLEnabled="true">
    <Certificate certificateKeystoreFile="conf/localhost-rsa.jks"
                         type="RSA" />
    </Connector>
    <Connector port="8443" protocol="org.apache.coyote.http11.Http11AprProtocol"
               maxThreads="150" SSLEnabled="true" >
    <UpgradeProtocol className="org.apache.coyote.http2.Http2Protocol" />
    </SSLHostConfig>


我截取了其中一段,想要做的事情是匹配<Connector...>之间的内容,然后对<Connector...>进行修改。

举例:
对于scheme="https"这个变量,如果<Connector...>中存在port="8443",判断是否有scheme="https",如果没有则添加,如果有判断属性值是否是"https",不是的话修改;
如果<Connector...>中不存在port="8443",判断是否有scheme="http",如果没有则添加,如果有判断属性值是否是"http",不是的话修改。

我的方法:
if [ -n "`awk '/<Connector/,/>/' file | grep "scheme"`" ] ;then
        sed -i '/scheme/s/"https"/"http"/' file
else
        sed -i 's/protocol[[:graph:]]*/& scheme="http" /' file
fi
if [ -z "`awk '/<Connector.*port="8443"/,/>/' file | grep "scheme"`" ] ;then
        sed -i 's/[[:space:]]*port="8443"[[:space:]]*/& scheme="https" /' file
else
        sed -i '/[[:space:]]*port="8443"[[:space:]]*/s/scheme="http"/scheme="https"/' file
fi


这里有两处错误,一个是awk匹配的是几段<Connector...>,只要其中一段包含"scheme"就会返回为真,其实我是想检查每个<Connector...>;
第二个就是sed -i的部分,限制条件不足,可能会重复添加"scheme"变量。

搜了好多文章也不知道怎么能够逐段检查<Connector...>,还望大神指点!!

作者: 本友会机友会摄友会    时间: 2018-12-17 14:47
提示: 作者被禁止或删除 内容自动屏蔽
作者: wh7211    时间: 2018-12-17 17:40
本帖最后由 wh7211 于 2018-12-17 17:43 编辑

回复 1# Carol


  1. cat 1
  2. <Connector port="8443" aaa="111"
  3. bbb="222" ccc="333"
  4. ddd="444"
  5. </Connector>
  6. <Connector port="8443" aaa="111"
  7. bbb="222" ccc="333"
  8. ddd="444" scheme="555"
  9. </Connector>
  10. <Connector port="8444" aaa="111"
  11. bbb="222" ccc="333"
  12. ddd="444"
  13. </Connector>
  14. <Connector port="8444" aaa="111"
  15. bbb="222" ccc="333"
  16. ddd="444" scheme="555"
  17. </Connector>

  18. awk '{a[NR]=$0}/port="8443"/{b=1}match($0,"(scheme=[^ ]+)",c){d=c[1];e=NR}/\/Connector/{if(b&&d){sub(d,"scheme=\042https\042",a[e])}else if(b&&!d){sub("$"," scheme=\042https\042",a[NR-1])}else if(!b&&d){sub(d,"scheme=\042http\042",a[e])}else if(!b&&!d){sub("$"," scheme=\042http\042",a[NR-1])};for(i in a){print a[i]};b=d="";delete a}' 1
  19. <Connector port="8443" aaa="111"
  20. bbb="222" ccc="333"
  21. ddd="444" scheme="https"
  22. </Connector>
  23. <Connector port="8443" aaa="111"
  24. bbb="222" ccc="333"
  25. ddd="444" scheme="https"
  26. </Connector>
  27. <Connector port="8444" aaa="111"
  28. bbb="222" ccc="333"
  29. ddd="444" scheme="http"
  30. </Connector>
  31. <Connector port="8444" aaa="111"
  32. bbb="222" ccc="333"
  33. ddd="444" scheme="http"
  34. </Connector>
复制代码

作者: Carol    时间: 2018-12-17 19:50
回复 3# wh7211

太感动了,谢谢大神
作者: Carol    时间: 2018-12-17 19:54
回复 2# 本友会机友会摄友会

好的,我研究研究py的方法,谢谢!




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2