免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12345下一页
最近访问板块 发新帖
查看: 20681 | 回复: 48
打印 上一主题 下一主题

[Web] 象google.com等网站,她是怎么实现用户一输入www.google.com [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-03-16 08:47 |只看该作者 |倒序浏览
象google.com等网站,她是怎么实现用户一输入www.google.com网址后,
自动帮助用户选择相应的编码来显示web页,而没乱码的?
我见她web页的编码是UTF-8哦,而www.baidu.com等仅是GB2312,
选择UTF-8后,居然一堆乱码!
GOOGLE是怎么做的呢?!

论坛徽章:
0
2 [报告]
发表于 2006-03-16 10:00 |只看该作者
应该是根据访问者的IP地址来判断的.

论坛徽章:
0
3 [报告]
发表于 2006-03-16 10:29 |只看该作者

很简单

好长时间没登陆CU了,害怕停了我的用户,再加上我认为这个东西很简单,就斗胆回答。
我不知道google怎么做的,但是我知道这个问题很容易。您看看apache默认安装时的docroot 目录下的内容,是些:index.html.var index.html.gb2312 index.html.UTF-8 index.html.en index.html.kr ......等等东西,就这么简单。它能根据客户端默认的字符集调用相应的文档作页面.

论坛徽章:
0
4 [报告]
发表于 2006-03-16 10:44 |只看该作者
GET / HTTP/1.1
Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/x-shockwave-flash, application/vnd.ms-powerpoint, application/vnd.ms-excel, application/msword, */*
Accept-Language: zh-cn
Accept-Encoding: gzip, deflate
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)
Host: www.google.com
Connection: Keep-Alive


Accept-Language: zh-cn 根据这个来的

论坛徽章:
0
5 [报告]
发表于 2006-03-16 10:50 |只看该作者
在Apache要怎么设置好呢 ?

论坛徽章:
0
6 [报告]
发表于 2006-03-16 11:21 |只看该作者
他是根据你浏览器语言来选择 的

论坛徽章:
0
7 [报告]
发表于 2006-03-16 11:53 |只看该作者
呵呵,哪更容易了.

论坛徽章:
0
8 [报告]
发表于 2006-03-16 16:16 |只看该作者
我的浏览器是opera英文的,怎么显示的也是中文的啊。访问google的mail服务器显示的是繁体中文。进入邮箱后又是简体中文的。为何?

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
9 [报告]
发表于 2006-03-16 17:04 |只看该作者
很簡單 , 是 IP
而不是什麼 Accept-Language: zh-cn ,
與其用問的,不如多看點 protocol 的東西 (RFC)

  1. [root@rs logs]# telnet www.google.com 80
  2. Trying 66.102.7.104...
  3. Connected to www.google.com.
  4. Escape character is '^]'.
  5. GET / HTTP/1.1
  6. Host: www.google.com

  7. HTTP/1.1 302 Found
  8. Location: http://www.google.com.tw/
  9. Set-Cookie: PREF=ID=cf3518ba5a50719e:TM=1142499731:LM=1142499731:S=rAhPkdMHeW8pZ_th; expires=Sun, 17-Jan-2038 19:14:07 GMT; path=/; domain=.google.com
  10. Content-Type: text/html
  11. Server: GWS/2.1
  12. Content-Length: 222
  13. Date: Thu, 16 Mar 2006 09:02:11 GMT

  14. <HTML><HEAD><meta http-equiv="content-type" content="text/html;charset=utf-8">
  15. <TITLE>302 Moved</TITLE></HEAD><BODY>
  16. <H1>302 Moved</H1>
  17. The document has moved
  18. <A HREF="http://www.google.com.tw/">here</A>.
  19. </BODY></HTML>

  20. Connection closed by foreign host.
  21. [root@rs logs]# telnet www.google.com 80
  22. Trying 66.102.7.99...
  23. Connected to www.google.com.
  24. Escape character is '^]'.
  25. HEAD / HTTP/1.0

  26. HTTP/1.0 302 Found
  27. Location: http://www.google.com.tw/
  28. Set-Cookie: PREF=ID=8b03c56ed5882a43:TM=1142499745:LM=1142499745:S=4Bb3eAjRPw6gpzWw; expires=Sun, 17-Jan-2038 19:14:07 GMT; path=/; domain=.google.com
  29. Content-Type: text/html
  30. Server: GWS/2.1
  31. Content-Length: 222
  32. Date: Thu, 16 Mar 2006 09:02:25 GMT
  33. Connection: Keep-Alive

  34. Connection closed by foreign host.
复制代码



那裏有語系 ? 他就直接知道我是台灣來的

论坛徽章:
62
2016科比退役纪念章
日期:2016-06-28 17:45:06奥兰多魔术
日期:2015-05-04 22:47:40菠菜神灯
日期:2015-05-04 22:35:07菠菜神灯
日期:2015-05-04 22:35:02NBA季后赛大富翁
日期:2015-05-04 22:33:34NBA常规赛纪念章
日期:2015-05-04 22:32:032015年亚洲杯纪念徽章
日期:2015-04-14 16:54:452015年亚洲杯之朝鲜
日期:2015-03-19 23:03:16明尼苏达森林狼
日期:2015-03-16 21:51:152015小元宵徽章
日期:2015-03-06 15:57:202015年迎新春徽章
日期:2015-03-04 09:55:282015年辞旧岁徽章
日期:2015-03-03 16:54:15
10 [报告]
发表于 2006-03-17 09:42 |只看该作者
您太注重技术细节。 找个代理比写脚本还麻烦 ?
125.246.81.62 :3128 是个韩国的代理。

看看区别

未命名.jpg (48.17 KB, 下载次数: 50)

未命名.jpg
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP