免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3872 | 回复: 5
打印 上一主题 下一主题

$dom->load($url)出错 编码 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-10-24 17:09 |只看该作者 |倒序浏览
$dom = new DomDocument();        
$dom->load($url);
程序编码是UTF-8格式的  当$url内的XML文件是UTF-8格式时无问题
当$url的文件格式是非UTF-8格式时出错

在网上搜了很久  没有找到理想答案 望大家指点指点

论坛徽章:
0
2 [报告]
发表于 2006-10-25 09:51 |只看该作者

回复 1楼 qinjian1981 的帖子

回家后仔细看了下报错信息
发现XML文件流里有特殊编码的文字 我去掉后就正常了
但是如果有特殊编码的时候 LOAD不进来  
那该如何解决呢

论坛徽章:
1
技术图书徽章
日期:2013-12-05 23:25:45
3 [报告]
发表于 2006-10-26 11:17 |只看该作者
先file_get_contents读取,然后判断类型,转码,再装给xml

论坛徽章:
0
4 [报告]
发表于 2006-11-11 16:53 |只看该作者
原帖由 HonestQiao 于 2006-10-26 11:17 发表
先file_get_contents读取,然后判断类型,转码,再装给xml

$content = file_get_contents($url);
$content = iconv("gb2312","utf-8",$content);
$dom = new DomDocument();
$dom->loadXML($content);



现在的问题是file_get_contents出来的字符串里有特殊的字符编码
是不是逐字的判断编码 如果不符合再转换
但是我不知道该如何判断类型
盼复  指点一二

论坛徽章:
0
5 [报告]
发表于 2006-11-11 17:44 |只看该作者
什么是特殊字符?
贴个例子出来

论坛徽章:
0
6 [报告]
发表于 2006-11-12 08:47 |只看该作者
原帖由 qinjian1981 于 2006-11-11 16:53 发表

$content = file_get_contents($url);
$content = iconv("gb2312","utf-8",$content);
$dom = new DomDocument();
$dom->loadXML($content);



现在的问题是file_get_contents出 ...



用正则把特殊字符过滤掉。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP