免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 8148 | 回复: 18
打印 上一主题 下一主题

求助! 格式化xml文件 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-01-09 15:32 |只看该作者 |倒序浏览
有如下一个XML文件,我需要把每个Error标签页中的所有标签到一行中显示
A.XML:
<?xml version="1.0" encoding="UTF-8"?>
<Verify>
<Error>
<ErrorCode>A006</ErrorCode>
<SEQ>001</SEQ>
<ErrorMessage>Sum field in file header dosen't equal actual the total nuber of record..</ErrorMessage>
</Error>
<Error>
<ErrorCode>A07</ErrorCode>
<SEQ>002</SEQ>
<ErrorMessage>Sum field in file header dosen't equal actual the total nuber of record..</ErrorMessage>
</Error>
</Verify>

需要的效果
=========================
<Error> <ErrorCode>A006</ErrorCode> |<SEQ>001</SEQ>|<ErrorMessage>Sum field in file header dosen't equal actual the total nuber of record..|</Error>
<Error> <ErrorCode>A007</ErrorCode> |<SEQ>002</SEQ>|<ErrorMessage>Sum field in file header dosen't equal actual the total nuber of record..|</Error>


用SED的话应该可以,不过试了几种方法都不行,请高手指教

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
2 [报告]
发表于 2012-01-09 15:51 |只看该作者
回复 1# abci

$ awk '/<Error>/{getline v;printf $0" "v" "}/<SEQ>/,/<\/ErrorMessage>/{if(/<\/ErrorMessage>/){getline;$0=$0"\n"} printf "|"$0}' file
<Error> <ErrorCode>A006</ErrorCode> |<SEQ>001</SEQ>|<ErrorMessage>Sum field in file header dosen't equal actual the total nuber of record..|</Error>
<Error> <ErrorCode>A07</ErrorCode> |<SEQ>002</SEQ>|<ErrorMessage>Sum field in file header dosen't equal actual the total nuber of record..|</Error>

论坛徽章:
0
3 [报告]
发表于 2012-01-09 15:55 |只看该作者
/^<Error>$/{
        h;b
}
/^<\/Error>$/{
        H;z;x;s/\n/ /g;p;b
}
x
/./{
        G;x;b
}
x;p
这样可以么?

论坛徽章:
0
4 [报告]
发表于 2012-01-09 16:04 |只看该作者
回复 3# hbmhalley

不成啊
    sed:0602-428         H;z;x;s/\n/ /g;p;b 不是可识别的函数。

论坛徽章:
0
5 [报告]
发表于 2012-01-09 16:08 |只看该作者
回复 2# jason680
error内的标签内容是可变的,估计awk是不行

论坛徽章:
0
6 [报告]
发表于 2012-01-09 16:08 |只看该作者
回复 4# abci

  1. explorer@explorer-laptop:~/work$ cat temp.sed
  2. /^<Error>$/{
  3.         h;b
  4. }
  5. /^<\/Error>$/{
  6.         H;z;x;s/\n/ /g;p;b
  7. }
  8. x
  9. /./{
  10.         G;x;b
  11. }
  12. x;p
  13. explorer@explorer-laptop:~/work$ sed -n -f temp.sed temp.txt
  14. <?xml version="1.0" encoding="UTF-8"?>
  15. <Verify>
  16. <Error> <ErrorCode>A006</ErrorCode> <SEQ>001</SEQ> <ErrorMessage>Sum field in file header dosen't equal actual the total nuber of record..</ErrorMessage> </Error>
  17. <Error> <ErrorCode>A07</ErrorCode> <SEQ>002</SEQ> <ErrorMessage>Sum field in file header dosen't equal actual the total nuber of record..</ErrorMessage> </Error>
  18. </Verify>
复制代码
环境不一样?

论坛徽章:
0
7 [报告]
发表于 2012-01-09 16:13 |只看该作者
回复 4# abci

  1. #n
  2. /^<Error>$/{
  3. h
  4. b
  5. }
  6. /^<\/Error>$/{
  7. H
  8. z
  9. x
  10. s/\n/ /g
  11. p
  12. b
  13. }
  14. x
  15. /./{
  16. G
  17. x
  18. b
  19. }
  20. x
  21. p
复制代码
... 再试试

论坛徽章:
0
8 [报告]
发表于 2012-01-09 16:15 |只看该作者
回复 6# hbmhalley


    没有z,  z是干啥用的

论坛徽章:
0
9 [报告]
发表于 2012-01-09 16:17 |只看该作者
回复 8# abci


    把z改成s/.*//吧
    z是GNU扩展

论坛徽章:
0
10 [报告]
发表于 2012-01-09 16:19 |只看该作者
sed -n '/<Error>/{:a N;/<\/Error>/!ba;s/\n/|/g;p}' file
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP