Chinaunix

标题: libxml2处理中文的问题,无法显示,怎么解决谢谢 [打印本页]

作者: hjleochen    时间: 2003-10-09 15:30
标题: libxml2处理中文的问题,无法显示,怎么解决谢谢
libxml2处理中文的问题,无法显示,怎么解决谢谢


libxml2处理的文件中有中文encoding使用UTF-8时
a.xml:6: error: Input is not proper UTF-8, indicate encoding !
     <gjob:Application>;GBackup中国</gjob:Application>;
                              ^
a.xml:6: error: Bytes: 0xD6 0xD0 0xB9 0xFA
     <gjob:Application>;GBackup中国</gjob:Application>;
                              ^
Error parsing file 'a.xml'


使用gb2312,utf-16都是乱码,请问如何解决!
作者: iamsean    时间: 2003-10-14 17:07
标题: libxml2处理中文的问题,无法显示,怎么解决谢谢
xml文件中加上
<?xml version="1.0" encoding = "ISO-8859-2"?>;
即可




           字符集                    涵盖语言
                                     拉丁一字符集, 包含绝大多数的欧洲语言,
                                     例如French(fr), Spanish (es), Catalan
                                     (ca), Basque (eu), Portuguese (pt),
                                     Italian (it), Albanian (sq),
                                     Rhaeto-Romanic (rm), Dutch (nl),
           ISO 8859-1(Latin1)        German (de), Danish (da), Swedish
                                     (sv), Norwegian (no), Finnish (fi),
                                     Faroese (fo), Icelandic (is), Irish
                                     (ga), Scottish (gd), English (en),
                                     Afrikaans (af) 和 Swahili (sw). 影响了
                                     美洲, 澳洲和非洲.
                                     拉丁二字符集, 包含了中欧和东欧的语
           ISO 8859-2(Latin2)        言:Czech (cs), Hungarian (hu), Polish
                                     (pl), Romanian (ro), Croatian (hr),
                                     Slovak (sk), Slovenian (sl), Sorbian.
           ISO 8859-3(Latin3)        拉丁三字符集, 包括: Esperanto (eo) and
                                     Maltese (mt)
                                     拉丁四字符集, 包括: Estonian (et), 巴
           ISO 8859-4(Latin4)        尔地克 Latvian (lv) 和 Lithuanian
                                     (lt), Greenlandic (kl) , Lappish.
                                     Bulgarian (bg), Byelorussian (be),
           ISO 8859-5(西里尔语)      Macedonian (mk), Russian (ru), Serbian
                                     (sr)
           ISO 8859-6(阿拉伯语)      阿拉伯语(ar)
           ISO 8859-7(希腊语)        希腊语(el)
           ISO 8859-8(希伯来语)      Hebrew (iw) 和Yiddish (ji)
作者: heehaw    时间: 2003-10-15 08:34
标题: libxml2处理中文的问题,无法显示,怎么解决谢谢
用ISO-8859-1/2 只能处理中文的content, 如果标记用中文就不行了
作者: lucky_han    时间: 2004-01-13 10:09
标题: libxml2处理中文的问题,无法显示,怎么解决谢谢
你可以通过iconv命令将xml文档转成utf-8编码,然后直接解析
作者: blueidea    时间: 2004-04-20 08:50
标题: libxml2处理中文的问题,无法显示,怎么解决谢谢
如何往XML文件中写入中文,并将中文读取出来呢?这个问题困扰我好久料,就是没有搞定,那位有经验的前辈,请不吝赐教!




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2