免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 12426 | 回复: 7
打印 上一主题 下一主题

[proxy] [求助] squid 如何强制缓存 no-cache 头的响应 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-01-09 15:12 |只看该作者 |倒序浏览
10可用积分
各位,
    第一次在这里发帖求助。
   
    我现在需要在squid 中缓存 服务器响应,这些响应中有几种情况,在默认配置下squid 无法缓存。
    1 。 服务器响应发送 cache-control : no-cache或者 cache-control: max-age=0
      2 。 服务器响应头 有 Expires 头,并且设置时间为 过去的时间,如果 2008 年。
    这些设置都导致 squid 无法缓存该响应,(查看 store.log 日志 ,该响应 为: release -1  。)

请各位高手看看,是否有配置可以让squid 强制缓存有 no-cache  等不可以缓存头的服务器响应?
或者有其他解决方法

[ 本帖最后由 suhanzhong 于 2009-1-9 15:41 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2009-01-09 17:26 |只看该作者
igore-reload

论坛徽章:
0
3 [报告]
发表于 2009-01-09 17:44 |只看该作者
igore-reload  是针对客户端的,不是针对服务器响应的吧?

论坛徽章:
0
4 [报告]
发表于 2009-01-09 20:39 |只看该作者
你指的服务器响应是什么?

论坛徽章:
0
5 [报告]
发表于 2009-01-14 16:45 |只看该作者
squid 作为内网代理,服务器响应就应该是指 例如 www.163.com 等服务器的响应了。
igore-reload   应该是忽略 浏览器(例如IE) 的refresh 动作 发送 no-cache 头吧。

论坛徽章:
0
6 [报告]
发表于 2009-01-14 16:51 |只看该作者
用Squid缓存Google Earth/Map数据2007/7/4 at 04:21 · Server

其实我本不想写这个标题,我的本意是缓存yupoo api的查询数据,这个过程中找到了参考方法(Caching Google Earth with Squid)。呵呵,所以偶也来一回标题党。

这篇参考流传非常广,Digg上也被提过,我也不知道原出处是哪里了。

可是。。。。你按照它的指示设置,它并不能正确工作!!

话说回来,先说说我的需求。

最近yupoo的访问速度很慢,我有一堆api请求经常无法完成,猜测要么对方限制了同一ip的连接数,要么是yupoo又遇到了新一轮的流量瓶颈。跟Yupoo的zola联系后,确认是他们的负荷太高引起的,并没有限制连接数。所以我要想办法在我这边做一些缓存了。

因为我这边本身就是用squid代理来解决Ajax中调用API的跨域问题的,所以自然是目标瞄准了squid的配置文件。

yupoo api的请求地址是 www.yupoo.com/api/rest/?method=xx&xxxxxxx...

大家都知道squid会自动缓存静态文件,可对于这种动态网页怎么让它也缓存起来呢,所以在google上找啊找,找到上面提得那片缓存Google Earth的博客文章。
他的方法是:

acl QUERY urlpath_regex cgi-bin \? intranet
acl forcecache url_regex -i kh.google keyhole.com
no_cache allow forcecache
no_cache deny QUERY

# ----
refresh_pattern -i kh.google 1440 20% 10080 override-expire override-lastmod reload-into-ims ignore-reload

refresh_pattern -i keyhole.com 1440 20% 10080 override-expire override-lastmod reload-into-ims ignore-reload

原理就是用 no_cache allow 和 refresh_pattern 来设定一些缓存规则,将google earth的请求强行缓存起来。

此文一出,自然早有人去验证,可是没人成功,原作者也音讯全无 ... squid的邮件列表里也提到。 ( 看标题进来的朋友,不要急,继续往下读,不会让你空手而回的 )

我也没在意,估计人家功力问题 。先试着用改写一下解决yupoo api的缓存问题。

acl QUERY urlpath_regex cgi-bin \?
acl forcecache url_regex -i yupoo\.com
no_cache allow forcecache
no_cache deny QUERY

refresh_pattern -i yupoo\.com 1440 50% 10080 override-expire override-lastmod reload-into-ims ignore-reload

嘿,果然nnd毫无用处,访问记录里还是 一坨坨 TCP_MISS

于是翻来覆去看文档,找资料,发现是squid的bug惹得祸,不过早已经修正(严格来说是功能扩展补丁)。

我的squid是2.6.13,翻了一下源代码,确实已经打好补丁了。

解决这个问题需要refresh_pattern的几个扩展参数(ignore-no-cache ignore-private),这几个参数在squid的文档和配置例子中均没有提到,看来squid还不够与时俱进。

下面讲一下问题所在。

先看看yupoo api返回的HTTP头部信息(cache 相关部分)

Cache-Control: no-cache, must-revalidate
Pragma: no-cache

这两行是控制浏览器的缓存行为的,指示浏览器不得缓存。squid也是遵循RFC的,正常情况下自然不会去缓存这些页面。override-expire override-lastmod reload-into-ims ignore-reload 统统不能对付它。

而那个补丁正是对付这两个Cache-Control:no-cache 和 Pragma: no-cache的。

因此把 refresh_pattern那句要改写成

refresh_pattern -i yupoo\.com 1440 50% 10080 override-expire override-lastmod reload-into-ims ignore-reload ignore-no-cache ignore-private

这样就大功告成了, squid -k reconfigure 看看 access.log ,这回里面终于出现
TCP_HIT/200 TCP_MEM_HIT/200 了,说明缓存规则确实起作用了,那个激动啊 555~~~~

====================
补充:
后来我看了一下google earth 服务器 hk1.google.com的HTTP头部,只有

Expires: Wed, 02 Jul 2008 20:56:20 GMT
Last-Modified: Fri, 17 Dec 2004 04:58:08 GMT

,这么看来照理不需ignore-no-cache ignore-private也能工作,可能是作者这里写错了
kh.google 应该是 kh.\.google才对。

最后总结一下,缓存Google Earth/Map的正确的配置应该是

acl QUERY urlpath_regex cgi-bin \? intranet
acl forcecache url_regex -i kh.\.google mt.\.google mapgoogle\.mapabc keyhole.com
no_cache allow forcecache
no_cache deny QUERY

# ----
refresh_pattern -i kh.\.google 1440 20% 10080 override-expire override-lastmod reload-into-ims ignore-reload ignore-no-cache ignore-private
refresh_pattern -i mt.\.google 1440 20% 10080 override-expire override-lastmod reload-into-ims ignore-reload ignore-no-cache ignore-private
refresh_pattern -i mapgoogle\.mapabc 1440 20% 10080 override-expire override-lastmod reload-into-ims ignore-reload ignore-no-cache ignore-private

refresh_pattern -i keyhole.com 1440 20% 10080 override-expire override-lastmod reload-into-ims ignore-reload ignore-no-cache ignore-private

注:
khX.google.com 是google earth的图片服务器
mtX.google.com 是google map 的图片服务器
mapgoogle.mapabc.com 是google ditu的图片服务器
http://nukq.malmam.com/archives/16

论坛徽章:
0
7 [报告]
发表于 2009-01-15 10:52 |只看该作者
始终发现还是没有完全解决,按照楼上的方法还是 发现可以缓存 有no-cache头的服务器响应;
但是对于 Expires 头  ,并且设置过去日期的情况,还是没有办法缓存。
不知道还有没有其他的好办法?

[ 本帖最后由 suhanzhong 于 2009-1-15 11:25 编辑 ]

论坛徽章:
0
8 [报告]
发表于 2009-02-19 23:53 |只看该作者
refresh_pattern -i .rar 180 20% 10080 override-expire ignore-reload reload-into-ims

refresh_pattern -i .rar 180 20% 10080 override-expire reload-into-ims

refresh_pattern -i .rar 180 20% 10080 reload-into-ims

这3种,试下吧,用违背http协议的方法
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP