- 论坛徽章:
- 0
|
本文转自:
http://yehoo.blogdriver.com/yehoo/501763.html
原文如下:
读xml文件时:
不要以为你的xml文件写明encoding="utf-8",它就会聪明的帮你用utf-8读哦,必须这样写。
document = reader.read(new FileInputStream(filename), "utf-8");
写xml文件的时候,不要自己创建Writer,让XmlWriter去根据你的form的encoding创建吧。
OutputFormat form = OutputFormat.createPrettyPrint();
form.setEncoding("utf-8");
OutputStream fos = new FileOutputStream(filename);
XMLWriter output = new XMLWriter(fos, form);
可以看到,其实Dom4j对utf-8的支持是很好的,这个也是得益于java新版本对utf-8的支持。在它IO的Reader和Writer类中,都提供了方便指定encoding的方法。
所以,如果以后自己对文件操作,需要涉及到文本的encoding操作,尽量使用Reader和Writer类,而不是File或者自己去操作Stream,除非是需要处理二机制的文件。
本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/8780/showart_424351.html |
|