免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 13248 | 回复: 22
打印 上一主题 下一主题

[Web] 解决web服务器各种应用的乱码问题,欢迎补充和讨论 [复制链接]

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2004-08-05 22:51 |只看该作者 |倒序浏览
乱码问题:

(1)服务器端:
修改httpd.conf (在Redhat中放置的位置为/etc/httpd/conf/)
查找:
AddDefaultCharset ISO-8859-1
改成:
  1. #AddDefaultCharset ISO-8859-1

  2. AddDefaultCharset off
复制代码
]

这种方式关掉了服务器的默认语言的发送,这样仅凭html文件头中设置的语言来决定网页语言。

很多文章都说通过修改为 AddDefaultCharset GB2312 把缺省语言改成GB2312来解决中文乱码,确实GB2312内码的网页可以正常显示了,但这并非万全之策。因为当你的网页内码不是GB2312,就算你在网页用下面的meta指定了正确的语言,如ISO8859-1,也不会解码为ISO8859-1,因为Apache已经先你一步将GB2312指定为网页的语言了,


(2)养成良好的习惯,在每个网页的<head>;</head>;的最前面加入这行:

    
  1. <meta http-equiv="Content-Type" content="text/html; charset=gb2312">;
复制代码


  一般的中文版网页编辑工具(例如FrontPage、Dreamweaver等)都会自动加上这行。

3、如何解决中文文件名无法访问

 
  1.  在ie中选择 工具 ->; internet选项 ->; 高级 ->; 取消“总是以UTF-8发送URL”。
复制代码




UTF-8网页空白,在网页中加上metadata标识后,还需要手动调整编码為 utf-8 才能正常显示

如果使用的是Mozilla、Mozilla Firefox、Sarafi等其他目前流行的浏览器,通常就不会有这样的问题。

在网页的meta中指定用UTF-8:
  1. <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />;
复制代码


在<head>;</head>;之前,把"Content-Type"放在最前面,便可以解決这样的问题了。

原因:

IE 解析网页编码时是 HTML 內的标识优先的,然后是 HTTP header ;而mozilla 系列的浏览器刚刚好相反。

一般情况在,很多人是把<title>;</title>;排在最前面,并且在title中就出现了UTF-8中文,这样,IE在解析时,就先遇到UTF-8,不往下解析了,因此必须把如果把meta放在UTF-8出现之前,这样IE才能判断这个网页是以UTF-8编码的。


总之:
无论是 PHP、JSP、ASP 或其他动态网页的脚本语言,如果需要作编码设定,最好放在最前面。

使用php,也可以定义php的默认语言.

php.ini中:

  1. default_charset = "gb2312"
复制代码


释掉此行,做了以上修改,一样是为了让浏览器根据网页头中的charset来自动选择语言,这样就可以在同台服务器上提供多种语言的网页服务。


java中文乱码的解决




在基于JAVA的编程中,经常会碰到汉字的处里及显示的问题,比如一大堆乱码或问号。
这是因为JAVA中默认的编码方式是UNICODE,而中国人通常使用的文件和DB都是基于GB2312或者BIG5等编码,故会出现此问题。

1、在网页中输出中文。

JAVA在网络传输中使用的编码是"ISO-8859-1",故在输出时需要进行转化,如:
String  str="中文";
str=new  String(str.getBytes("GB2312","8859_1";
但如果在编译程序时,使用的编码是“GB2312”,且在中文平台上运行此程序,不会出现此问题,一定要注意。

2、从参数中读取中文

这正好与在网页中输出相反如:
str=new  String(str.getBytes("8859_1","GB2312";

3、操作DB中的中文问题

一个较简单的方法是:在“控制面扳”中,把“区域”设置为“英语(美国)”。如果还会出现乱码,还可进行如下设置:
取中文时:str=new  String(str.getBytes("GB2312");
向DB中输入中文:str=new  String(str.getBytes("ISO-8859-1");

4、在JSP中的中文解决:

在“控制面扳”中,把“区域”设置为“英语(美国)”.
在JSP页面中加入:
如果还不行正常显示,则还要进行下面的转换:
如:name=new  String(name.getBytes("ISO-8859-1","GBK";
就不会出现中文问题了。

CGI的?不知道对不?

找到CGI.pm,打开它,找到$self->;charset('ISO-8859-1');将它改为$self->;charset('GB2312');

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
2 [报告]
发表于 2004-10-10 11:03 |只看该作者

解决web服务器各种应用的乱码问题,欢迎补充和讨论

UP

论坛徽章:
0
3 [报告]
发表于 2004-10-11 11:59 |只看该作者

解决web服务器各种应用的乱码问题,欢迎补充和讨论

MM施主,俺崇拜你了

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
4 [报告]
发表于 2004-10-12 11:50 |只看该作者

解决web服务器各种应用的乱码问题,欢迎补充和讨论

补充:
如果使用php,也可以定义php的默认语言.

php.ini中:

;default_charset = "gb2312"

注意这里是注释掉此行,做了以上修改,目的是为让浏览器根据网页头中的charset来自动选择语言,这样就可以在同台服务器上提供多种语言的网页服务。

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
5 [报告]
发表于 2004-10-12 12:31 |只看该作者

解决web服务器各种应用的乱码问题,欢迎补充和讨论

java中文乱码的解决




在基于JAVA的编程中,经常会碰到汉字的处里及显示的问题,比如一大堆乱码或问号。
这是因为JAVA中默认的编码方式是UNICODE,而中国人通常使用的文件和DB都是基于GB2312或者BIG5等编码,故会出现此问题。

1、在网页中输出中文。

JAVA在网络传输中使用的编码是"ISO-8859-1",故在输出时需要进行转化,如:
String  str="中文";
str=new  String(str.getBytes("GB2312","8859_1";
但如果在编译程序时,使用的编码是“GB2312”,且在中文平台上运行此程序,不会出现此问题,一定要注意。

2、从参数中读取中文

这正好与在网页中输出相反如:
str=new  String(str.getBytes("8859_1","GB2312";

3、操作DB中的中文问题

一个较简单的方法是:在“控制面扳”中,把“区域”设置为“英语(美国)”。如果还会出现乱码,还可进行如下设置:
取中文时:str=new  String(str.getBytes("GB2312");
向DB中输入中文:str=new  String(str.getBytes("ISO-8859-1");

4、在JSP中的中文解决:

在“控制面扳”中,把“区域”设置为“英语(美国)”.
在JSP页面中加入:
如果还不行正常显示,则还要进行下面的转换:
如:name=new  String(name.getBytes("ISO-8859-1","GBK";
就不会出现中文问题了。

论坛徽章:
0
6 [报告]
发表于 2004-10-12 12:39 |只看该作者

解决web服务器各种应用的乱码问题,欢迎补充和讨论

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
7 [报告]
发表于 2004-10-12 12:49 |只看该作者

解决web服务器各种应用的乱码问题,欢迎补充和讨论

CGI的应该是这个:

找到CGI.pm,找到$self->;charset('ISO-8859-1');将它改为$self->;charset('GB2312');

或按以上同样处理,应该可以

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
8 [报告]
发表于 2004-10-31 14:59 |只看该作者

解决web服务器各种应用的乱码问题,欢迎补充和讨论

彻底解决Tomcat 5.0.19中文乱码

  一、Include的页面乱码

  现象:include进来的页面出现乱码,其它页面正常。

  原因:Tomcat在缺省情况下使用ISO-8859-1编码,但是在include时有时Tomcat不能正确根据外层.jsp文件的编码解析include进来的文件,造成include进来的文件中的中文乱码。

  解决:这儿可以有很多解决办法,但是对于我们的中文环境,从根本上的解决办法是将Tomcat 5.0.19的核心缺省编码从ISO-8859-1修改为GBK 。

  
  二、提交的数据乱码

  现象:通过表单提交的数据出现乱码。

  原因:原因未明。可能是Tomcat在接收到请求后,并没有能够根据request中的信息提前正确的编码方式。

  解决:可以添加一个设置字符集的Filter。

  1. package filters;

  2. import java.io.IOException;
  3. import javax.servlet.Filter;
  4. import javax.servlet.FilterChain;
  5. import javax.servlet.FilterConfig;
  6. import javax.servlet.ServletException;
  7. import javax.servlet.ServletRequest;
  8. import javax.servlet.ServletResponse;
  9. import javax.servlet.UnavailableException;

  10. public class SetCharacterEncodingFilter implements Filter {
  11.  protected String encoding = null;
  12.  protected FilterConfig filterConfig = null;
  13.  protected boolean ignore = true;

  14.  public void destroy() {
  15.   this.encoding = null;
  16.   this.filterConfig = null;
  17.  }

  18. public void doFilter(ServletRequest request, ServletResponse response,
  19. FilterChain chain)
  20. throws IOException, ServletException {

  21.  // Conditionally select and set the character encoding to be used
  22.  if (ignore || (request.getCharacterEncoding() == null)) {
  23.   String encoding = selectEncoding(request);
  24.   if (encoding != null)
  25.    request.setCharacterEncoding(encoding);
  26.  }

  27.  // Pass control on to the next filter
  28.  chain.doFilter(request, response);

  29. }

  30. public void init(FilterConfig filterConfig) throws ServletException {

  31.  this.filterConfig = filterConfig;
  32.  this.encoding = filterConfig.getInitParameter("encoding");
  33.  String value = filterConfig.getInitParameter("ignore");
  34.  if (value == null)
  35.   this.ignore = true;
  36.  else if (value.equalsIgnoreCase("true"))
  37.   this.ignore = true;
  38.  else if (value.equalsIgnoreCase("yes"))
  39.   this.ignore = true;
  40.  else
  41.   this.ignore = false;

  42. }

  43. protected String selectEncoding(ServletRequest request) {
  44.  return (this.encoding);
  45. }

  46. }
复制代码
  

配置web.xml

  1. <filter>
  2.  <filter-name>Set Character Encoding</filter-name>
  3.  <filter-class>filters.SetCharacterEncodingFilter</filter-class>
  4.  <init-param>
  5.   <param-name>encoding</param-name>
  6.   <param-value>GBK</param-value>
  7.  </init-param>
  8. </filter>

  9. <filter-mapping>
  10.  <filter-name>Set Character Encoding</filter-name>
  11.  <url-pattern>/*</url-pattern>
  12. </filter-mapping>

复制代码

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
9 [报告]
发表于 2004-10-31 15:05 |只看该作者

解决web服务器各种应用的乱码问题,欢迎补充和讨论

没试过不知道行不行

java Servlet 中文乱码问题

  1. import java.io.*;
  2. import java.util.*;
  3. import javax.servlet.*;
  4. import javax.servlet.http.*;

  5. public class GetFormData extends HttpServlet
  6. {
  7.     public void doGet(HttpServletRequest request,HttpServletResponse response) throws ServletException,IOException
  8.     {
  9.         String paramValues;
  10.         paramValues=request.getParameter("UserName";
  11.         response.setContentType("text/html;charset=gb2312";
  12.         PrintWriter out=response.getWriter();
  13.         out.println("<html>;<title>;test</title>;<body>;";
  14.         out.println("以下是收到的数据<br>;";
  15.         out.println("UserName="+paramValues);
  16.         out.println("<br>;接收结束";
  17.         out.println("</body>;";
  18.     }
  19.     public void doPost(HttpServletRequest request,HttpServletResponse response) throws ServletException,IOException
  20.     {
  21.         doGet(request,response);
  22.     }

  23. }
复制代码


只需要把

  1. paramValues=request.getParameterValues("UserName"改成下面的就可以了
  2. paramValues=request.getParameter("UserName";
复制代码

  1. 当然这句是必須的 response.setContentType("text/html;charset=gb2312"
复制代码


在jsdk2.1 tomcat及Domino5.8上的Servlet引擎运行通过了

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
10 [报告]
发表于 2004-10-31 15:09 |只看该作者

解决web服务器各种应用的乱码问题,欢迎补充和讨论

Weblogic Server中如何解决中文显示乱码问题
《世界计算机》IT.ICXO.COM ( 日期:2004-09-29 16:07)


--------------------------------------------------------------------------------


由于操作系统、浏览器、数据库、JVM采用的字符集都不一样,基于Weblogic Server开发的应用经常出现中文显示乱码问题,其实在Weblogic Server上运行的WEB应用有很多与字符集有关的设置,下面做一个总结,为了正确处理中文,最好把这些设置都设上。


1. 在JSP文件头加入
  1. <%@ page contentType=text/html; charset=GBK %>;
复制代码
指定该JSP采用的字符集。



2.在Weblogic.xml文件的中加入:

encoding
GBK


指定JSP文件中采用的字符集,在JSP文件中的<%@ page contentType=text/html; charset=GBK %>;会覆盖该设置



3.在Weblogic.xml文件的中加入

  1. compilerSupportsEncoding
  2. true
复制代码


如果为TRUE,指定在编译JSP文件时,采用在JSP文件中定义的
<%@ page contentType=text/html; charset=GBK %>;或中定义的encoding参数中定义的字符集进行编码,如果为FALSE,则采用JVM中默认指定的字符集进行编码。



4. Weblogic Server需要把HTTP request(GET 和POST)中的数据从它的原始编码转化为Unicode,以便Java servlet API进行处理,为了做这种转换,Weblogic Server需要知道HPPT request中的数据的编码方式。这可以通过在Weblogic.xml的中设置.
  1. 〈INPUT-charset>;
  2. /
  3. GBK
复制代码




5.从ORACLE数据库中检索出来的中文显示不正确时,在这种情况下,如果数据库使用的是中文字符集,并使用的是Type 2 JDBC Driver时,可加入Weblogic.codeset=GBK的属性来解决这个问题。代码如下:

  1. java.util.Properties props = new java.util.Properties();
  2. props.put(Weblogic.codeset, GBK);
  3. props.put(user, scott);
  4. props.put(password, tiger);
  5. String connectUrl = jdbc:Weblogic:oracle;
  6. Driver myDriver = (Driver)
  7. Class.forName(Weblogic.jdbc.oci.Driver).newInstance();
  8. Connection conn =
  9. myDriver.connect(connectUrl, props);
复制代码



6. 如果是采用WTC调用Tuxedo中的服务,在JSP页面中无法正确显示中文,必须使安装Tuxedo的服务器上的NLS_LANG环境变量与数据库中的字符集的设置一样。如后台Oracle数据库中的字符集设置为SIMPLIFIED CHINESE_CHINA.ZHS16GBK,那么Tuxedo应用服务器上的NLS_LANG环境变量应设置为:

  1. export NLS_LANG=SIMPLIFIED CHINESE_CHINA.ZHS16GBK
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP