Chinaunix

标题: Java的中文编程与配置 [打印本页]

作者: bingkafei    时间: 2009-12-05 09:40
标题: Java的中文编程与配置

     JAVA内部是UNICODE编码,在I/O时如果使用Reader/Writer就要发生编码转换,使用系统属性file.encoding作为编码方式。如果使用Stream就没有转换的事情了,那是Binary的数据。
  有用的方法有:
  1.在Reader/Writer上加encoding的选项,注意编码的方向,在Reader中的encoding表示把数据从encoding转换成Unicode,writer就是把Unicode的字符转换成encoding格式的。2.用String.getByte()把字符串转换成指定编码。
  常用的编码格式:ISO8859_1,这个是英文系统缺省的8bit编码,因为是8bit的,所以不会把汉字的高位删去,所以用它也是可以处理汉字的(我自己这么理解,总觉得有些不妥,但又不知道不妥在何处,还望高人指出)。GB2312和GBK,汉字编码,推荐使用GBK,它兼容GB2312并且支持更多汉字。UNICODE,一个大的字符集,不知是不是国际标准反正大家都支持,使用16位对每个字符编码,汉字虽然正合适,但英文却吃亏了,要用多一倍的空间来存储,所以很多人还是老大不乐意,写的程序不支持UNICODE.
  JSP/Servlet的中文问题有两种解决办法:1.不在程序中进行编码转换,把这个工作交给浏览器,方法就是用javac –encoding GBK *.java来编译所有的bean,然后在JSP页面上加
  或者是在HTML中直接加:
  到底加那个,试试就知道了,我也搞不清楚了。
  2.在程序中指定编码,用javac –encoding ISO8859_1 *.java来编译所有的bean,在涉及到中文显示的程序上加
  str=new String(str.getBytes(\"ISO8859_1\"));
  上面两种方法不能混用,意思就是要么就是GBK,要么就是ISO8859_1,从里到外都一样就好了。
  数据库JDBC的中文问题,一般只要按照数据库指定的编码进行转换,比如按照ISO8859_1读,ISO8859_1写,一般就没什么问题了。
  javaw会使用与java不同的Local配置进行工作,导致了我一直看不到中文,而java就是好好的。JBuilder也是好好的,没有问题,调用javaw也不是它的错,难道你想每次运行或者调试的时候蹦出个DOS黑框么?呵呵。这是JDK的一个Bug,我在java的网站上查到这个bug,描述的情况跟我的一样,然后Sun说这个Bug已经修复了,嘿嘿,简直就是扯淡!修复个茄子!Bug编号是:4629351.不信可以去看看。
  但是难道我就不能在JBuilder里面看我可爱的中文了吗?好像JBuilder5的时候还能选择是用java还是javaw,现在好像没法儿选了。配置过UNIX下的TOMCAT,好像加了些启动参数,就能让tomcat支持中文了,JAVA虚拟机加上一些属性:
  -Dfile.encoding=GBK -Ddefault.client.encoding=GBK -Duser.language=zh -Duser.region=CN
  把它跟在javaw的命令行后面当参数,哈哈,搞定!
  在JBuilder中选择Project->Project Properties->run->edit->VM Parameters,填上就行了!
  配置心得:
  在JDK低版本和UNIX下,需要改动font.properties,让JAVA VM能够找到合适的字体来显示汉字。目前为止,javaw有Bug,只使用英文的Local,需要给VM加上属性才行正常显示中文。


本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/13830/showart_2111686.html




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2