免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: vallygirl
打印 上一主题 下一主题

Perl 或者shell 读取xml 文件 [复制链接]

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
11 [报告]
发表于 2012-05-09 22:35 |只看该作者
XML::Simple可以用于小规模的实验,生成或解析大的XML文件或数量多的XML数据根本不可用,效率极低。几个月之前我用XML::Simple分析XML日志,它分析的速度还赶不上我系统产生日志的速度。而且在读取过程中要注意参数的设置,默认的读取方式在一些情况下会出问题

论坛徽章:
78
双子座
日期:2013-10-15 08:50:09天秤座
日期:2013-10-16 18:02:08白羊座
日期:2013-10-18 13:35:33天蝎座
日期:2013-10-18 13:37:06狮子座
日期:2013-10-18 13:40:31双子座
日期:2013-10-22 13:58:42戌狗
日期:2013-10-22 18:50:04CU十二周年纪念徽章
日期:2013-10-24 15:41:34巨蟹座
日期:2013-10-24 17:14:56处女座
日期:2013-10-24 17:15:30双子座
日期:2013-10-25 13:49:39午马
日期:2013-10-28 15:02:15
12 [报告]
发表于 2012-05-10 10:21 |只看该作者
复杂用这个XML:arser,几千万行的都没问题

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
13 [报告]
发表于 2012-05-10 11:22 |只看该作者
yybmsrs 发表于 2012-05-10 10:21
复杂用这个XML:arser,几千万行的都没问题

我们这的系统每7秒产生100多兆的XML日志,这还只是一部分日志。当时XML::Simple没能满足需要。XML:arser我也看过。XML:arser可以用XML:arser::Expat,但默认用的就是XML::Simple,expat是C的,所以效率还不错,但现在读xml最快的方式是通过C的libxml2库,XML::LibXML就是封装的这个libxml2,所以在效率上是最好的。

这里是perlmonks上的人做的benchmarks
http://www.perlmonks.org/?node_id=760629

我觉得如果是想看整体的xml文件的结构,首选XML::Simple,如果是大批量的操作XML,首选XML::LibXML

论坛徽章:
0
14 [报告]
发表于 2012-05-10 11:36 |只看该作者
学习学习
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP