Chinaunix
标题:
Java的中文编程与配置
[打印本页]
作者:
bingkafei
时间:
2009-12-05 09:40
标题:
Java的中文编程与配置
JAVA内部是UNICODE编码,在I/O时如果使用Reader/Writer就要发生编码转换,使用系统属性file.encoding作为编码方式。如果使用Stream就没有转换的事情了,那是Binary的数据。
有用的方法有:
1.在Reader/Writer上加encoding的选项,注意编码的方向,在Reader中的encoding表示把数据从encoding转换成Unicode,writer就是把Unicode的字符转换成encoding格式的。2.用String.getByte()把字符串转换成指定编码。
常用的编码格式:ISO8859_1,这个是英文系统缺省的8bit编码,因为是8bit的,所以不会把汉字的高位删去,所以用它也是可以处理汉字的(我自己这么理解,总觉得有些不妥,但又不知道不妥在何处,还望高人指出)。GB2312和GBK,汉字编码,推荐使用GBK,它兼容GB2312并且支持更多汉字。UNICODE,一个大的字符集,不知是不是国际标准反正大家都支持,使用16位对每个字符编码,汉字虽然正合适,但英文却吃亏了,要用多一倍的空间来存储,所以很多人还是老大不乐意,写的程序不支持UNICODE.
JSP/Servlet的中文问题有两种解决办法:1.不在程序中进行编码转换,把这个工作交给浏览器,方法就是用javac –encoding GBK *.java来编译所有的bean,然后在JSP页面上加
或者是在HTML中直接加:
到底加那个,试试就知道了,我也搞不清楚了。
2.在程序中指定编码,用javac –encoding ISO8859_1 *.java来编译所有的bean,在涉及到中文显示的程序上加
str=new String(str.getBytes(\"ISO8859_1\"));
上面两种方法不能混用,意思就是要么就是GBK,要么就是ISO8859_1,从里到外都一样就好了。
数据库JDBC的中文问题,一般只要按照数据库指定的编码进行转换,比如按照ISO8859_1读,ISO8859_1写,一般就没什么问题了。
javaw会使用与java不同的Local配置进行工作,导致了我一直看不到中文,而java就是好好的。JBuilder也是好好的,没有问题,调用javaw也不是它的错,难道你想每次运行或者调试的时候蹦出个DOS黑框么?呵呵。这是JDK的一个Bug,我在java的网站上查到这个bug,描述的情况跟我的一样,然后Sun说这个Bug已经修复了,嘿嘿,简直就是扯淡!修复个茄子!Bug编号是:4629351.不信可以去看看。
但是难道我就不能在JBuilder里面看我可爱的中文了吗?好像JBuilder5的时候还能选择是用java还是javaw,现在好像没法儿选了。配置过UNIX下的TOMCAT,好像加了些启动参数,就能让tomcat支持中文了,JAVA虚拟机加上一些属性:
-Dfile.encoding=GBK -Ddefault.client.encoding=GBK -Duser.language=zh -Duser.region=CN
把它跟在javaw的命令行后面当参数,哈哈,搞定!
在JBuilder中选择Project->Project Properties->run->edit->VM Parameters,填上就行了!
配置心得:
在JDK低版本和UNIX下,需要改动font.properties,让JAVA VM能够找到合适的字体来显示汉字。目前为止,javaw有Bug,只使用英文的Local,需要给VM加上属性才行正常显示中文。
本文来自ChinaUnix博客,如果查看原文请点:
http://blog.chinaunix.net/u/13830/showart_2111686.html
欢迎光临 Chinaunix (http://bbs.chinaunix.net/)
Powered by Discuz! X3.2