免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2808 | 回复: 4
打印 上一主题 下一主题

libxml2处理中文的问题,无法显示,怎么解决谢谢 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2003-10-09 15:30 |只看该作者 |倒序浏览
libxml2处理中文的问题,无法显示,怎么解决谢谢


libxml2处理的文件中有中文encoding使用UTF-8时
a.xml:6: error: Input is not proper UTF-8, indicate encoding !
     <gjob:Application>;GBackup中国</gjob:Application>;
                              ^
a.xml:6: error: Bytes: 0xD6 0xD0 0xB9 0xFA
     <gjob:Application>;GBackup中国</gjob:Application>;
                              ^
Error parsing file 'a.xml'


使用gb2312,utf-16都是乱码,请问如何解决!

论坛徽章:
0
2 [报告]
发表于 2003-10-14 17:07 |只看该作者

libxml2处理中文的问题,无法显示,怎么解决谢谢

xml文件中加上
<?xml version="1.0" encoding = "ISO-8859-2"?>;
即可




           字符集                    涵盖语言
                                     拉丁一字符集, 包含绝大多数的欧洲语言,
                                     例如French(fr), Spanish (es), Catalan
                                     (ca), Basque (eu), Portuguese (pt),
                                     Italian (it), Albanian (sq),
                                     Rhaeto-Romanic (rm), Dutch (nl),
           ISO 8859-1(Latin1)        German (de), Danish (da), Swedish
                                     (sv), Norwegian (no), Finnish (fi),
                                     Faroese (fo), Icelandic (is), Irish
                                     (ga), Scottish (gd), English (en),
                                     Afrikaans (af) 和 Swahili (sw). 影响了
                                     美洲, 澳洲和非洲.
                                     拉丁二字符集, 包含了中欧和东欧的语
           ISO 8859-2(Latin2)        言:Czech (cs), Hungarian (hu), Polish
                                     (pl), Romanian (ro), Croatian (hr),
                                     Slovak (sk), Slovenian (sl), Sorbian.
           ISO 8859-3(Latin3)        拉丁三字符集, 包括: Esperanto (eo) and
                                     Maltese (mt)
                                     拉丁四字符集, 包括: Estonian (et), 巴
           ISO 8859-4(Latin4)        尔地克 Latvian (lv) 和 Lithuanian
                                     (lt), Greenlandic (kl) , Lappish.
                                     Bulgarian (bg), Byelorussian (be),
           ISO 8859-5(西里尔语)      Macedonian (mk), Russian (ru), Serbian
                                     (sr)
           ISO 8859-6(阿拉伯语)      阿拉伯语(ar)
           ISO 8859-7(希腊语)        希腊语(el)
           ISO 8859-8(希伯来语)      Hebrew (iw) 和Yiddish (ji)

论坛徽章:
0
3 [报告]
发表于 2003-10-15 08:34 |只看该作者

libxml2处理中文的问题,无法显示,怎么解决谢谢

用ISO-8859-1/2 只能处理中文的content, 如果标记用中文就不行了

论坛徽章:
0
4 [报告]
发表于 2004-01-13 10:09 |只看该作者

libxml2处理中文的问题,无法显示,怎么解决谢谢

你可以通过iconv命令将xml文档转成utf-8编码,然后直接解析

论坛徽章:
0
5 [报告]
发表于 2004-04-20 08:50 |只看该作者

libxml2处理中文的问题,无法显示,怎么解决谢谢

如何往XML文件中写入中文,并将中文读取出来呢?这个问题困扰我好久料,就是没有搞定,那位有经验的前辈,请不吝赐教!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP