经常在网上查找资料的朋友可能遇到一个问题,常常要找的资料,从搜索引擎找不到文章原始出处,而拷贝的页面要么不完整,要么就乱成一团(没换行), 要么在文章中硬加关键词让人看得莫名其妙。这些都是因为是采集来的缘故。但防止采集有效的方法确少之又少。
防采集功能保护的并不仅仅是网站内容,同时保护了站长的热情,站长的劳动成功。
在开源的PHP论坛里,做的最好的应该说是DZ。使用DZ论坛的用户也非常多。
这里我们介绍用kangle防dz论坛下载附件被采集的详细操作。
操作中,需要用到四个功能模块。在此先作一个简单说明。
ip_rate : 限ip的访问频率(多少秒多少次请求)。
ip_speed_limit : 限ip的访问速度。
reg_path :匹配路径。可以使用正则表达式。
reg_param :匹配url参数。可以使用正则表达式。
第一步:在kangle管理后台,请求控制内,点击【增加表】按钮。新增一个表,表名:attachment
在attachment 表内,使用匹配模块ip_rate、标记模块ip_speed_limit 设置ip访问频率和ip访问速度。
![]()
目标:选择“拒绝” 本例中设置ip访问频率每60秒30次请求。具体设置中根据需要自行设置。
目标:选择“继续”本例中设置ip的访问速度是每秒50kb,具体设置中根据需要自行设置。
第二步:在请求控制BEGIN 表内,使用匹配模块reg_path(指定路径)、reg_param(匹配参数 ) 目标:选择“attachment 表”
设置完成,在kangle管理后请求控制内显示如下:
为方便朋友了解kangle访问控制,在此作简要介绍。
kangle的访问控制非常强大,灵活,操作起来却极简单。
有iptables经验的用户更不费吹灰之力便可理解,因为kangle的访问控制非常像iptables。
访问控制分成请求控制和回应控制。 请求控制和回应控制各自拥有若干匹配功能模块和标记功能模块。灵活组合,可以实现用户各种需求及非常复杂的需求。
表:
每个控制由一张或多张表加一个默认目标组成,其中BEGIN表是系统内建表,所有控制从BEGIN开始。
每张表由多条规则链组成,在一张表中控制按顺序从上到下对规则链进行匹配。
规则链由一个目标和任意个匹配模块和任意个标记模块组成。
|