Chinaunix

标题: Java的中文编程与配置 [打印本页]

作者: bingkafei 时间: 2009-12-05 09:40
标题: Java的中文编程与配置

JAVA内部是UNICODE编码，在I/O时如果使用Reader/Writer就要发生编码转换，使用系统属性file.encoding作为编码方式。如果使用Stream就没有转换的事情了，那是Binary的数据。
　　有用的方法有：
　　1.在Reader/Writer上加encoding的选项，注意编码的方向，在Reader中的encoding表示把数据从encoding转换成Unicode，writer就是把Unicode的字符转换成encoding格式的。2.用String.getByte（）把字符串转换成指定编码。
　　常用的编码格式：ISO8859_1，这个是英文系统缺省的8bit编码，因为是8bit的，所以不会把汉字的高位删去，所以用它也是可以处理汉字的（我自己这么理解，总觉得有些不妥，但又不知道不妥在何处，还望高人指出）。GB2312和GBK，汉字编码，推荐使用GBK，它兼容GB2312并且支持更多汉字。UNICODE，一个大的字符集，不知是不是国际标准反正大家都支持，使用16位对每个字符编码，汉字虽然正合适，但英文却吃亏了，要用多一倍的空间来存储，所以很多人还是老大不乐意，写的程序不支持UNICODE.
　　JSP/Servlet的中文问题有两种解决办法：1.不在程序中进行编码转换，把这个工作交给浏览器，方法就是用javac –encoding GBK *.java来编译所有的bean，然后在JSP页面上加
　　或者是在HTML中直接加：
　　到底加那个，试试就知道了，我也搞不清楚了。
　　2.在程序中指定编码，用javac –encoding ISO8859_1 *.java来编译所有的bean，在涉及到中文显示的程序上加
　　str=new String（str.getBytes（\"ISO8859_1\"））；
　　上面两种方法不能混用，意思就是要么就是GBK，要么就是ISO8859_1，从里到外都一样就好了。
　　数据库JDBC的中文问题，一般只要按照数据库指定的编码进行转换，比如按照ISO8859_1读，ISO8859_1写，一般就没什么问题了。
　　javaw会使用与java不同的Local配置进行工作，导致了我一直看不到中文，而java就是好好的。JBuilder也是好好的，没有问题，调用javaw也不是它的错，难道你想每次运行或者调试的时候蹦出个DOS黑框么？呵呵。这是JDK的一个Bug，我在java的网站上查到这个bug，描述的情况跟我的一样，然后Sun说这个Bug已经修复了，嘿嘿，简直就是扯淡！修复个茄子！Bug编号是：4629351.不信可以去看看。
　　但是难道我就不能在JBuilder里面看我可爱的中文了吗？好像JBuilder5的时候还能选择是用java还是javaw，现在好像没法儿选了。配置过UNIX下的TOMCAT，好像加了些启动参数，就能让tomcat支持中文了，JAVA虚拟机加上一些属性：
　　-Dfile.encoding=GBK -Ddefault.client.encoding=GBK -Duser.language=zh -Duser.region=CN
　　把它跟在javaw的命令行后面当参数，哈哈，搞定！
　　在JBuilder中选择Project->Project Properties->run->edit->VM Parameters，填上就行了！
　　配置心得：
　　在JDK低版本和UNIX下，需要改动font.properties，让JAVA VM能够找到合适的字体来显示汉字。目前为止，javaw有Bug，只使用英文的Local，需要给VM加上属性才行正常显示中文。

本文来自ChinaUnix博客，如果查看原文请点：http://blog.chinaunix.net/u/13830/showart_2111686.html

欢迎光临 Chinaunix (http://bbs.chinaunix.net/)