免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: tjyihui

[DNS] 一个疑问:为何某些门户网站直接输入IP地址却无法访问 [复制链接]

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
发表于 2004-10-20 20:10 |显示全部楼层

一个疑问:为何某些门户网站直接输入IP地址却无法访问

大的门户网站一般都有分流

论坛徽章:
0
发表于 2004-10-20 20:39 |显示全部楼层

一个疑问:为何某些门户网站直接输入IP地址却无法访问

真是开眼界呀,看来要学的东西还不少呀。

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
发表于 2004-10-20 20:51 |显示全部楼层

一个疑问:为何某些门户网站直接输入IP地址却无法访问

您可以多看看,
不懂可以來問,
這些東西或概念有時都是  點-線-面,慢慢累積的,不太可能一下就能到了
另外,就 HTTP Request Command 或 proxy 或 ICP 等
這些有時候除了看教學外,最重要的是要看懂 "標準"
不是看懂使用

论坛徽章:
0
发表于 2004-10-20 22:29 |显示全部楼层

一个疑问:为何某些门户网站直接输入IP地址却无法访问

晚上在一个BLOG上看到一篇好文章,分析的很棒

中国顶级门户网站架构分析1、2
http://blog.csdn.net/marcolu/archive/2004/07/27/53890.aspx
http://blog.csdn.net/marcolu/archive/2004/07/30/56461.aspx

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
发表于 2004-10-21 03:11 |显示全部楼层

一个疑问:为何某些门户网站直接输入IP地址却无法访问

HTTP/1.0 200 OK
Date: Fri, 30 Jul 2004 05:49:47 GMT
Server: Apache/2.0.49 (Unix)
Last-Modified: Fri, 30 Jul 2004 05:48:16 GMT
Accept-Ranges: bytes
Vary: Accept-Encoding
Cache-Control: max-age=60
Expires: Fri, 30 Jul 2004 05:50:47 GMT
Content-Length: 180747
Content-Type: text/html
Age: 37
X-Cache: HIT from sqsh-230.sina.com.cn
Connection: close

嗯,上面的 Link 感覺沒有交特清楚,或不太對的觀念,原作者的說明:
上面是sina的http头的反馈信息。里面有很多有价值的东东哦:)譬如,它后面的apache是用2.0.49,还设了过期时间为2分钟。最后修改时间。这些都是要在编译apache的时候载入的,特别是Last-Modified还需要小小的改一把源码--至少我是这样做的。


HTTP/1.0 200 OK 這大家都知道
Date: 代表 Web 的 Response 時間,若這個時間不變,基本上可以猜測是 Proxy Server 回應的,也就是 Proxy Server 真正去 sina 後台抓這一頁的時間點
Server: 後台被代理的 Web 版本
Last-Modified: Request 的檔案最後修改時間,也就是你 ls -l 看到的時間,不懂該篇所提的含意
Vary: 這個欄位我不懂,沒有特別研究,但覺得 RFC 2616 有交待不明確的感覺
Cache-Control: max-age=60 每60秒後的 Request 檢查後面的 Web 本頁有無更新,會和 Age: 有關
Expires: 本頁過期時間. Expires 和 Cache-Control 同時存在時,將以 Cache-Control 為運作機制)
Content-Length: 180747
Content-Type: text/html 這兩個大家都知道,但有時要多注意 1.1 中的 Transfer-Encoding: chunked 狀況 Ex: http://bbs.chinaunix.net/forum/viewtopic.php?t=417548
Age: 現在 Cache 的秒數,依本例若超過 60 頁面更新查詢,若 Last-Modified 有異則更新頁面的 Cache,並從0起記
X-Cache: 表示是由 Cache 回應,有 Age 值即有此欄為 HIT,不然為 MISS xxxx.....
Connection: close 由於這是 Proxy 回的,所以通常為 Close,也就是 Server 丟出 Response 後就會 Close Connection.
        每一次 HTTP 的請求及回應都會一個新的 Connection.
        另外一種狀況為 Keep-Alive,通常會由 Keep-Alive: Header 說明其連線時間,ex: timeout=20, max=99 ,IDLE timeout 為20秒
        最多使用 99 秒在同一個 http connection 中

其他欄位...有看到再說囉,當然,我的認知也可能有錯,若有錯希望您能告訴我.
熟知原理,標準,你就可以知道作法,只是外面的套子有點不同而以.
至於原貼提到的 Raid 或 NFS,這個重遠端並無法知道,只能用猜.
是不是二層反向代理,我個人猜測是沒有的,原因是你對 www.sina.com.cn 做 HTTP Protocol 實驗即知:

  1. for ip in `dig @168.95.1.1 www.sina.com.cn|grep '^libra' | awk '{print $5}'`
  2. do
  3.         echo $ip;echo -e "GET / HTTP/1.1\nHost: www.sina.com.cn\n\n"| nc $ip 80 | sed -n '1,20p'|grep -E 'Date|Last-|Expire'
  4. done
复制代码


結果:

  1. 61.135.153.183
  2. Date: Wed, 20 Oct 2004 18:42:30 GMT
  3. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  4. Expires: Wed, 20 Oct 2004 18:43:30 GMT
  5. 61.135.153.184
  6. Date: Wed, 20 Oct 2004 18:42:54 GMT
  7. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  8. Expires: Wed, 20 Oct 2004 18:43:54 GMT
  9. 61.135.152.65
  10. Date: Wed, 20 Oct 2004 18:42:04 GMT
  11. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  12. Expires: Wed, 20 Oct 2004 18:43:04 GMT
  13. 61.135.152.66
  14. Date: Wed, 20 Oct 2004 18:42:12 GMT
  15. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  16. Expires: Wed, 20 Oct 2004 18:43:12 GMT
  17. 61.135.152.67
  18. Date: Wed, 20 Oct 2004 18:43:54 GMT
  19. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  20. Expires: Wed, 20 Oct 2004 18:44:54 GMT
  21. 61.135.152.68
  22. Date: Wed, 20 Oct 2004 18:42:15 GMT
  23. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  24. Expires: Wed, 20 Oct 2004 18:43:15 GMT
  25. 61.135.152.69
  26. Date: Wed, 20 Oct 2004 18:42:05 GMT
  27. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  28. Expires: Wed, 20 Oct 2004 18:43:05 GMT
  29. 61.135.152.70
  30. Date: Wed, 20 Oct 2004 18:44:41 GMT
  31. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  32. Expires: Wed, 20 Oct 2004 18:45:41 GMT
  33. 61.135.152.71
  34. Date: Wed, 20 Oct 2004 18:42:41 GMT
  35. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  36. Expires: Wed, 20 Oct 2004 18:43:41 GMT
  37. 61.135.152.72
  38. Date: Wed, 20 Oct 2004 18:42:34 GMT
  39. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  40. Expires: Wed, 20 Oct 2004 18:43:34 GMT
  41. 61.135.152.73
  42. Date: Wed, 20 Oct 2004 18:43:50 GMT
  43. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  44. Expires: Wed, 20 Oct 2004 18:44:50 GMT
  45. 61.135.152.74
  46. Date: Wed, 20 Oct 2004 18:42:34 GMT
  47. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  48. Expires: Wed, 20 Oct 2004 18:43:34 GMT
  49. 61.135.152.75
  50. Date: Wed, 20 Oct 2004 18:44:49 GMT
  51. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  52. Expires: Wed, 20 Oct 2004 18:45:49 GMT
  53. 61.135.153.180
  54. Date: Wed, 20 Oct 2004 18:42:53 GMT
  55. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  56. Expires: Wed, 20 Oct 2004 18:43:53 GMT
  57. 61.135.153.181
  58. Date: Wed, 20 Oct 2004 18:42:10 GMT
  59. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  60. Expires: Wed, 20 Oct 2004 18:43:10 GMT
  61. 61.135.153.182
  62. Date: Wed, 20 Oct 2004 18:42:06 GMT
  63. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  64. Expires: Wed, 20 Oct 2004 18:43:06 GMT
复制代码

這個 IP List (www.sina.com.cn) 不見得和你一樣,但你可以發現 Date 多不同,若有兩次反向代理,應該會分成幾個群才是
Last-Modified 可以看出大概是同一來源,所以理論上,用戶最多全 touch 到最 Fresh 的最新的首頁(後台),一天最多不過 1440 次(MISS),
就算跑個 100 台 squid,144000 次對一般的 Apache Server 而言,並不算什麼,尤其又平均拆到一分鐘去算
至於動態頁面的 Cache 估計也是有做(如搜尋功能),且 Cache 時間應會遠比首頁來的長很多,主要即是看頁面更新頻率,來決定 Cache-Control 時間


用新網來試的例子:

  1. for ip in `dig @210.51.170.66 www.sina.com.cn|grep '^pavo' | awk '{print $5}'`
  2. do
  3.         echo $ip;echo -e "GET / HTTP/1.1\nHost: www.sina.com.cn\n\n"| nc $ip 80 | sed -n '1,20p'|grep -E 'Date|Last-|Expire|Age|Cache-';
  4. done
复制代码

  1. 210.51.179.89
  2. Date: Wed, 20 Oct 2004 19:04:15 GMT
  3. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  4. Cache-Control: max-age=60
  5. Expires: Wed, 20 Oct 2004 19:07:21 GMT
  6. Age: 89
  7. 210.51.179.90
  8. Age: 125
  9. Date: Wed, 20 Oct 2004 19:05:23 GMT
  10. Expires: Wed, 20 Oct 2004 19:06:23 GMT
  11. Cache-Control: max-age=60
  12. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  13. 210.51.179.91
  14. Date: Wed, 20 Oct 2004 18:53:55 GMT
  15. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
  16. Cache-Control: max-age=60
  17. Expires: Wed, 20 Oct 2004 18:57:09 GMT
  18. Age: 9
  19. 210.51.179.88
  20. Date: Wed, 20 Oct 2004 19:04:43 GMT
  21. Last-Modified: Wed, 20 Oct 2004 18:41:47 GMT
复制代码

發現有什麼狀況嗎 ?

论坛徽章:
0
发表于 2004-10-23 15:50 |显示全部楼层

一个疑问:为何某些门户网站直接输入IP地址却无法访问

sina.com.cn 跑的是 Squid 反向代理
前面有人将过负载的问题。

论坛徽章:
0
发表于 2004-10-25 16:42 |显示全部楼层

一个疑问:为何某些门户网站直接输入IP地址却无法访问

好贴,顶

留念

论坛徽章:
0
发表于 2004-10-28 08:52 |显示全部楼层

一个疑问:为何某些门户网站直接输入IP地址却无法访问

虚拟主机拉。看看www.036.com.cn和211.98.28.1同样的拉。

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
发表于 2004-10-28 11:50 |显示全部楼层

一个疑问:为何某些门户网站直接输入IP地址却无法访问

[quote]原帖由 "moomoon"]虚拟主机拉。看看www.036.com.cn和211.98.28.1同样的拉。[/quote 发表:

請教,您如何證明 www.sina.com.cn 是 VirtualHost 呢 !?

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
发表于 2004-10-28 19:35 |显示全部楼层

一个疑问:为何某些门户网站直接输入IP地址却无法访问

VirtualHos可以做成只有域名才能访问,

当然也有可能是因为代理
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP