免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1861 | 回复: 9
打印 上一主题 下一主题

[文本处理] 通过脚本从xml文本取值的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-07-05 08:51 |只看该作者 |倒序浏览
本帖最后由 maxwellsma 于 2013-07-05 10:49 编辑

如下,我又个xml文件,内容如下:
[beijing]
        [neme]张三[neme]

        [age]24[age]

[/beijing]
[shanghai]
        [neme]李四[neme]

        [age]28[age]

[/shanghai]
......
还有很多
我想判断一下,如果城市为beijing而且name为张三,则要求年龄在20~28之间,这就是正确的,如果有beijing而且name为张三,年龄不再20~28之间,就是有问题的
请教各位,这个应该怎么写呢?

我这是做个合规检查,在这个xml文件中如果有beijing而且名字是张三,我就判断一下年龄是不是在20到28之间,如果是,说明合规,反之亦然
shanghai不做任何处理

论坛徽章:
0
2 [报告]
发表于 2013-07-05 09:43 |只看该作者
shanghai的呢?name拼错了,说的具体点

论坛徽章:
0
3 [报告]
发表于 2013-07-05 09:49 |只看该作者
回复 2# 心若寒江雪

谢谢回复,不好意思,name拼错了,太着急了
我这是做个合规检查,在这个xml文件中如果有beijing而且名字是张三,我就判断一下年龄是不是在20到28之间,如果是,说明合规,反之亦然
shanghai不做任何处理,我不知道我这么说,说清楚了没有
   

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
4 [报告]
发表于 2013-07-05 11:15 |只看该作者
本帖最后由 WilliBhamlll 于 2013-07-05 11:20 编辑
  1. awk -vRS='\\[/[a-z]+]' '{if($1~"beijing")s=$0;gsub(/\[age]/,"",$3);if($1~beijing && $2~"张三" && $3<=28 && $3>=20)print s,RT}' file      
  2. [beijing]
  3.         [neme]张三[neme]

  4.         [age]24[age]

  5. [/beijing]
复制代码
再根据实际情况作修改吧~

论坛徽章:
0
5 [报告]
发表于 2013-07-05 14:20 |只看该作者
本帖最后由 maxwellsma 于 2013-07-05 14:44 编辑
WilliBhamlll 发表于 2013-07-05 11:15
再根据实际情况作修改吧~



我执行结果没有任何反应的,


[root@BPPM9 tmp]# cat buhegui.xml
<?xml version="1.0" encoding="utf-8"?>
<beijing>
        <name>zhangsan</name>
        <age>29</SaveTime>
</beijing>
<shanghai>
        <name>lisi</name>
        <age>24</SaveTime>
[root@BPPM9 tmp]# cat buhegui.xml | awk -vRS='\\[/[a-z]+]' '{if($1~"beijing")s=$0;gsub(/\[age]/,"",$3);if($1~beijing && $2~"zhangsan" && $3<=28 && $3>=20)print s,RT}'
[root@BPPM9 tmp]# cat hegui.xml
<?xml version="1.0" encoding="utf-8"?>
<beijing>
        <name>zhangsan</name>
        <age>27</SaveTime>
</beijing>
<shanghai>
        <name>lisi</name>
        <age>24</SaveTime>
</shanghai>[root@BPPM9 tmp]# cat hegui.xml  | awk -vRS='\\[/[a-z]+]' '{if($1~"beijing")s=$0;gsub(/\[age]/,"",$3);if($1~beijing && $2~"zhangsan" && $3<=28 && $3>=20)print s,RT}'
[root@BPPM9 tmp]#
请指教,下面截图是我在solaris上的执行结果

无标题.jpg (103.21 KB, 下载次数: 11)

无标题.jpg

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
6 [报告]
发表于 2013-07-05 16:08 |只看该作者
唉。。。xml文本都是<>这样的,你非要给大家一个例子是[]这样的。。。。。。

把4楼坑的惨惨的

建议LZ你就直接把文件附件形式发上来吧,又不是给中情局打工,有那么机密吗?

论坛徽章:
0
7 [报告]
发表于 2013-07-05 16:42 |只看该作者
回复 6# dn833
不好意思,是我疏忽了~~

下面是我要做的检查的文件 jiancha.rar (371 Bytes, 下载次数: 2)


  

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
8 [报告]
发表于 2013-07-05 18:51 |只看该作者
  1. awk '/<beijing>/{getline a;getline b;if(a~/zhangsan/&&b!~/2[0-8]/)print "some one age is out of range\n"a,b}' you.xml
复制代码

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-10-02 06:20:00IT运维版块每月发帖之星
日期:2015-09-11 19:30:52IT运维版块每周发帖之星
日期:2015-09-11 19:20:31IT运维版块每日发帖之星
日期:2015-08-26 06:20:00每日论坛发贴之星
日期:2015-08-20 06:20:00IT运维版块每日发帖之星
日期:2015-08-20 06:20:002015年辞旧岁徽章
日期:2015-03-03 16:54:15金牛座
日期:2014-05-04 16:58:09双子座
日期:2013-12-17 16:44:37辰龙
日期:2013-11-22 15:20:59狮子座
日期:2013-11-18 22:55:08射手座
日期:2013-11-12 10:54:26
9 [报告]
发表于 2013-07-05 21:29 |只看该作者
回复 5# maxwellsma


    solaris用nawk

论坛徽章:
0
10 [报告]
发表于 2013-07-08 09:36 |只看该作者
回复 8# dn833


    经过测试,完全可用,谢谢各位
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP