免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4847 | 回复: 17
打印 上一主题 下一主题

XML文件解析 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-12-29 16:27 |只看该作者 |倒序浏览
cat file

<!-- entryright_r 0x05 -->               
    <item key="cmd:0x05,0x01" value=" auth_type=0x7f" />
    <item key="cmd:0x05,0x02" value=" auth_type=0x7f" />                       
    <item key="cmd:0x05,0x04" value=" auth_type=0x7f" />                       
    <item key="cmd:0x05,0x06" value=" auth_type=0x7f | auth_pass_through=1" />       
    <item key="cmd:0x05,0x07" value=" auth_type=0x7f" />                       
<!-- entryright_w 0x05 -->               
    <item key="cmd:0x05,0x03" value=" auth_type=0x7f" />
    <item key="cmd:0x05,0x05" value=" auth_type=0x7f" />                       
    <item key="cmd:0x05,0x08" value=" auth_type=0x7f" />
<!-- black_r 0x0a -->               
    <item key="cmd:0x0a,0x00" value=" auth_type=0x7f | qzone_protocol=1" />               
    <item key="cmd:0x0a,0x05" value=" auth_type=0x7f | qzone_protocol=1" />               
<!-- black_w 0x0a -->               
    <item key="cmd:0x0a,0x01" value=" auth_type=0x7f | qzone_protocol=1" />               
    <item key="cmd:0x0a,0x02" value=" auth_type=0x7f | qzone_protocol=1" />               
    <item key="cmd:0x0a,0x03" value=" auth_type=0x7f | qzone_protocol=1" />               
    <item key="cmd:0x0a,0x04" value=" auth_type=0x7f | qzone_protocol=1" />



我要根据<!-- xxxxxx -->里面的xxxx关键字找出里面的特定关键字,比如说根据black_w 0x0a我要找到:
0x0a,0x01
0x0a,0x02
0x0a,0x03
0x0a,0x04

怎么实现啊

论坛徽章:
0
2 [报告]
发表于 2011-12-29 16:36 |只看该作者
本帖最后由 mpstat 于 2011-12-29 16:36 编辑

谨慎预测lz会在第一个答案后补充他没说明的需求

所以我先不解答了

论坛徽章:
0
3 [报告]
发表于 2011-12-29 16:53 |只看该作者
mpstat 发表于 2011-12-29 16:36
谨慎预测lz会在第一个答案后补充他没说明的需求

所以我先不解答了



我的需求很明确啊,就是只要把那两个字段抓取出来

论坛徽章:
0
4 [报告]
发表于 2011-12-29 16:58 |只看该作者
本帖最后由 mpstat 于 2011-12-29 16:58 编辑
dashorc 发表于 2011-12-29 16:53
我的需求很明确啊,就是只要把那两个字段抓取出来

  1. grep -oP '(?<=key="cmd:)[^"]+' file
复制代码

论坛徽章:
0
5 [报告]
发表于 2011-12-29 17:08 |只看该作者
mpstat 发表于 2011-12-29 16:58



你这个只是单纯的把我要的关键字提取出来,提取之前还要判断表头的信息
<!-- black_w 0x0a -->,这里是"black_w 0x0a"

论坛徽章:
0
6 [报告]
发表于 2011-12-29 17:29 |只看该作者
dashorc 发表于 2011-12-29 17:08
你这个只是单纯的把我要的关键字提取出来,提取之前还要判断表头的信息
,这里是"black_w 0x0a"



你看,我没说错吧

我知道是个坑我还朝里面跳

论坛徽章:
0
7 [报告]
发表于 2011-12-29 17:34 |只看该作者
mpstat 发表于 2011-12-29 17:29
你看,我没说错吧

我知道是个坑我还朝里面跳



我求助的时候就说了这个了啊:
我要根据<!-- xxxxxx -->里面的xxxx关键字找出里面的特定关键字

这个用awk 的RS一次处理一段会不会比较好?

论坛徽章:
0
8 [报告]
发表于 2011-12-29 17:51 |只看该作者
dashorc 发表于 2011-12-29 17:34
我求助的时候就说了这个了啊:
我要根据里面的xxxx关键字找出里面的特定关键字


  1. awk -vFS="[\":]" '/-->/{split($0, a, " ");var=a[3];next};$3~var{print $3}' file
复制代码

论坛徽章:
0
9 [报告]
发表于 2011-12-29 18:02 |只看该作者
可能我表达方式有问题,
现在我就想要找出来“black_r 0x0a”这个表单下面两行关键字
0x0a,0x00
0x0a,0x05
不是一次列出所有的关键字

论坛徽章:
0
10 [报告]
发表于 2011-12-29 18:09 |只看该作者
dashorc 发表于 2011-12-29 18:02
可能我表达方式有问题,
现在我就想要找出来“black_r 0x0a”这个表单下面两行关键字
0x0a,0x00


等一下,让我问清楚
你是只要black_r 0x0a下的两行
还是每个这种节点下的两行
不够两行怎么办
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP