忘记密码   免费注册 查看新帖 | 论坛精华区

ChinaUnix.net

  平台 论坛 博客 认证专区 大话IT HPC论坛 徽章 文库 沙龙 自测 下载 频道自动化运维 虚拟化 储存备份 C/C++ PHP MySQL 嵌入式 Linux系统
最近访问板块 发新帖
查看: 1432 | 回复: 4

XPath路径中不能使用中文? [复制链接]

论坛徽章:
0
发表于 2017-07-25 21:50 |显示全部楼层
下面代码和xml来自网上,我加入了汉字后,就不能正确执行了。
请教如何解决!

  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;

  4. use XML::XPath;
  5. use utf8;
  6. #binmode(STDOUT, ":utf8");
  7. my $xp=XML::XPath->new(filename=>"employees.xml");


  8. #测试节点
  9. print $xp->exists('/employees/employee[@age="10"]/name'),"\n";

  10. #获取节点值
  11. print $xp->findvalue('/employees/employee[@age="10"]/name'),"\n";

  12. #获取节点值
  13. print $xp->findvalue('/employees/employee[@age="30"]/工作'),"\n";

  14. #获取节点属性值
  15. print $xp->findvalue('/employees/employee[1]/@age'),"\n";

  16. #遍历节点
  17. my $nodeset=$xp->find('/employees/employee');
  18. foreach my $node ($nodeset->get_nodelist){
  19.         print $node->findvalue("country"),"\n";
  20. }
复制代码


employees.xml

  1. <?xml version="1.0" encoding="utf-8" ?>
  2. <employees>
  3.         <employee age="30">
  4.                 <name>linux</name>
  5.                 <country>US</country>
  6.                 <工作>教师</工作>
  7.         </employee>
  8.         <employee age="10">
  9.                 <name>mac</name>
  10.                 <country>US</country>
  11.         </employee>
  12.         <employee age="20">
  13.                 <name>windows</name>
  14.                 <country>US</country>
  15.         </employee>
  16. </employees>
复制代码

论坛徽章:
0
发表于 2017-07-26 10:26 |显示全部楼层
我在stackoverflow发了个贴,很快就解决了。要感谢老外的热情,也要承认他们的水平就是比我们高。
一个比较好的方案就是,直接用use XML::LibXML,而不用XML::XPath。
https://stackoverflow.com/questi ... glish-element-names
How to use Perl's XML::XPath with non-English element names?

  1. #!/usr/bin/perl

  2. use strict;
  3. use warnings;

  4. use utf8;
  5. use open ':std', ':encoding(UTF-8)';

  6. use feature qw( say );

  7. use XML::LibXML qw( );

  8. {
  9.    my $parser = XML::LibXML->new();
  10.    my $doc = $parser->parse_file('employees.xml');
  11.    say $doc->findvalue('/employees/employee[@age="10"]/name');
  12.    say $doc->findvalue('/employees/employee[@age="30"]/工作');
  13. }
复制代码

论坛徽章:
0
发表于 2017-07-26 10:34 |显示全部楼层
If you want to keep using the (buggy, slower, and far-less-widely used) XML::XPath, you can use the following:
如果你要坚持用哪个(有问题的、比较慢的、使用范围更小的)XML::XPath,你可以这样:
  1. #!/usr/bin/perl

  2. use strict;
  3. use warnings;

  4. use utf8;
  5. use open ':std', ':encoding(UTF-8)';

  6. use feature qw( say );

  7. use XML::XPath qw( );

  8. { # Monkeypatch XML::XPath.
  9.    package XML::XPath::Parser;

  10.    # Colon removed from these definitions.
  11.    my $NameStartCharClassBody = "a-zA-Z_\\xC0-\\xD6\\xD8-\\xF6\\xF8-\\x{2FF}\\x{370}-\\x{37D}\\x{37F}-\\x{1FFF}\\x{200C}-\\x{200D}\\x{2070}-\\x{218F}\\x{2C00}-\\x{2FEF}\\x{3001}-\\x{D7FF}\\x{F900}-\\x{FDCF}\\x{FDF0}-\\x{FFFD}\\x{10000}-\\x{EFFFF}";
  12.    my $NameCharClassBody = "${NameStartCharClassBody}\\-.0-9\\xB7\\x{300}-\\x{36F}\\x{203F}-\\x{2040}";
  13.    my $Name = "(?:[$NameStartCharClassBody][$NameCharClassBody]*)";

  14.    $NCName = $Name;
  15.    $QName = "$NCName(?::$NCName)?";
  16.    $NCWild = "${NCName}:\\*";
  17. }

  18. {
  19.    my $doc = XML::XPath->new(filename => "employees.xml");
  20.    say $doc->findvalue('/employees/employee[@age="10"]/name');
  21.    say $doc->findvalue('/employees/employee[@age="30"]/工作');
  22. }
复制代码

论坛徽章:
0
发表于 2017-07-26 11:21 |显示全部楼层
原始的XML::XPath:arser里的tokenize方法正则匹配有问题,元素的第一个字符不允许中文,只能以英文字母为开头。

论坛徽章:
0
发表于 2017-08-09 15:09 |显示全部楼层
powershell的xpath可以用中文,没问题。
例子:
  1. $输入文件名 = "a:\pscode\0\xml\a.xml"
  2. $a = (select-xml -Path $输入文件名 -XPath "/doc/哈哈").node
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则

10张SACC2017门票等你来拿~

在数字化转型时代,云已成为万物智能的数字化大脑。而随着大数据应用、人工智能、移动互联网等技术的飞速发展,“智慧 +” 的概念正在深入到各行各业,提升企业效率,释放商业潜能,创造全新机遇。作为国内顶级技术盛会之一,2017 中国系统架构师大会(SACC2017)将于 10 月 19-21 日在北京新云南皇冠假日酒店震撼来袭。今年,大会以 “云智未来” 为主题,云集国内外顶级专家,围绕云计算、人工智能、大数据、移动互联网、产业应用等热点领域展开技术探讨与交流。本届大会共设置 2 大主会场,18 个技术专场;邀请来自互联网、金融、制造业、电商等多个领域,100 余位技术专家及行业领袖来分享他们的经验;并将吸引 4000 + 人次的系统运维、架构师及 IT 决策人士参会,为他们提供最具价值的交流平台。
----------------------------------------
优惠时间:2017年10月19日前

活动链接>>
  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号 北京市公安局海淀分局网监中心备案编号:11010802020122
广播电视节目制作经营许可证(京) 字第1234号 中国互联网协会会员  联系我们:
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP