免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3550 | 回复: 5
打印 上一主题 下一主题

[Web] [学习] Web服务器中文URL研究心得(学习所得,跟大家分享) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2005-12-11 21:09 |只看该作者 |倒序浏览
经测试和研究,有如下规则:
1.IE访问WEB的简单顺序为:
    IE<->WebServer<->文件系统
    即IE向WebServer发送URL请求,该请求是通过某种编码做了encode的,WebServer接到请求后对其进行解码,然后再用解码后的地址到文件系统获取请求的内容返回到客户端的IE。
    从以上顺序可以看出,如果要正常使用中文路径的URL,必须保证:1,IE端到WebServer端的URL请求的编码和解码的字符集必须一致,2,WebServer到文件系统获取中文路径内容使用的字符集也要跟文件系统的文件名的编码一致。

2.ext2、ext3等文件系统(ufs文件系统估计也是)不像ntfs或者fat32文件系统,前者文件名是用原码的,不作任何编码,而后者是通过Unicode编码的,故而在win机器上的WebServer到文件系统获取中文路径的文件的问题不大,但是在Linux/Unix上,就必须保证使用正确的字符编码才能正确访问中文路径了。

3.IE默认是通过UTF8发送URL请求的,如果不想用UTF-8,即必须修改IE的配置,具体方法是IE选项->高级->不选总是以UTF-8发送URL。

4.ftp协议一般都是通过GBK编码作为路径编码传输文件的,故而要正确访问ext2、ext3经过ftp传输的中文路径文件,必须使用GBK才能正确访问到,我用zh_CN.GB18030编码可以成功访问。
  
根据以上等出结论,对Tomcat和Apache做了测试结果如下:

Tomcat在Linux/Solaris上:
    1.将启动tomcat进程的用户的编码设置为zh_CN.GB18030,这样可以保证Tomcat服务器正确访问文件系统的中文路径的文件,我测试了其它字符集,即不能正常访问到;
    2.修改Tomcat配置,指定请求解码字符集(URIEncoding="UTF-8"),那么,IE如果用UTF-8发送URL请求的话是可以正确访问到中文路径的内容的;
     3. 修改Tomcat配置,指定请求解码字符集(URIEncoding="GBK"),那么,IE如果用UTF-8发送URL请求的话将不能正确访问到中文路径的内容,可以将IE设置为“不总是以UTF-8发送URL请求”,即此时可以正确访问。
     注意:如果请求的是jsp等java内容,还必须对程序做修改,使其使用正确的编码和解码字符集做get和put操作,才能正常,这个由开发人员完成测试。

Apache在Linux/Solaris上:
     1.尚未找到Apache修改请求解码字符集设置的地方,或者根本apache本来就没得修改,已经写死在apache程序里面,除非修改程序才能修改指定URL请求的解码字符集,在这种情况下,将IE设置成了“不总是以UTF-8发送URL请求”,那么也是可以正确访问中文路径的内容的。

    综上所述,如同只是单独使用Tomcat,那么可以根据实际情况选择某种方式;如果使用Apache或者apache结合tomcat,那么只能迁就Apache,故而必须要求客户端将IE修改成了“不总是以UTF-8发送URL请求”才能正常使用中文路径URL。由于IE默认情况下就是配置成用UTF-8发送请求,故而后者比较麻烦!

[ 本帖最后由 HonestQiao 于 2005-12-13 14:43 编辑 ]

论坛徽章:
1
技术图书徽章
日期:2013-12-05 23:25:45
2 [报告]
发表于 2005-12-13 14:18 |只看该作者
不错不错
fcwsoft 该用户已被删除
3 [报告]
发表于 2005-12-22 18:21 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
4 [报告]
发表于 2005-12-23 13:00 |只看该作者
幼稚!

论坛徽章:
0
5 [报告]
发表于 2005-12-29 18:21 |只看该作者
使用IE的太多了,可是改编码迁就apache不太现实,还是在做网站时不要使用中文路径和文件名吧

论坛徽章:
0
6 [报告]
发表于 2006-01-01 15:11 |只看该作者
哈,感觉麻烦。不过如果能再加上实际操作的方法。会受益更多。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP