免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 5391 | 回复: 18
打印 上一主题 下一主题

对于 关键词过滤 大家有什么心得 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-04-12 09:47 |只看该作者 |倒序浏览
在发布信息时  对于含有 规定的“非法词语(大量的)” 的贴子,禁止发布。
关键是 如何判断 贴子中含有“非法词语” ,对于大量的“非法词语”有什么好的算法。
这方面用php如何实现。现成的程序,心得,思路都可以。请教了

论坛徽章:
0
2 [报告]
发表于 2006-04-12 10:23 |只看该作者
一般的过滤系统像  法..轮..功  这样是过滤不了的,这是我发现的
如果这样设置
法{1,3}轮{1,3}功
通过正则,过滤效果应该会增强

论坛徽章:
0
3 [报告]
发表于 2006-04-12 10:35 |只看该作者

回复 2楼 arcow 的帖子

您说的 这是具体到某一个词 的过滤 方法。
我想问的是 如果这样的词非常多,有什么比较合理,快捷的 算法。

论坛徽章:
0
4 [报告]
发表于 2006-04-12 10:53 |只看该作者
我这只是举一反三,这是思想
根据这个思想,你在程序处理中实现这种思想,那么词再多也可以实现

论坛徽章:
0
5 [报告]
发表于 2006-04-12 11:00 |只看该作者
要是 词很多 的话您有什么办法处理呢? 一个一个判断吗?
还是有什么别的方法

论坛徽章:
0
6 [报告]
发表于 2006-04-12 11:53 |只看该作者
说实在的,法..轮..功关你我什么事了
你就加个简单的,以后我党问起来有个交代就行了,何必多管闲事

论坛徽章:
0
7 [报告]
发表于 2006-04-12 12:02 |只看该作者
原帖由 Namelessxp 于 2006-4-12 11:53 发表
说实在的,法..轮..功关你我什么事了
你就加个简单的,以后我党问起来有个交代就行了,何必多管闲事

怎么不关你的事?要是他们发了个文章在你的网站上被相关部门发现了,等着被封交罚款吧

论坛徽章:
0
8 [报告]
发表于 2006-04-12 12:54 |只看该作者
原帖由 Namelessxp 于 2006-4-12 11:53 发表
说实在的,法..轮..功关你我什么事了
你就加个简单的,以后我党问起来有个交代就行了,何必多管闲事



大家一定要注意这个问题啊,像有关政治的没有小问题的,动辄坐牢啊

论坛徽章:
0
9 [报告]
发表于 2006-04-12 13:44 |只看该作者
原帖由 bandw 于 2006-4-12 12:54 发表



大家一定要注意这个问题啊,像有关政治的没有小问题的,动辄坐牢啊


没那么夸张,只要站长没问题,一般就是关上几个月网站。


另外: 过滤的效果越好,关键字越多 , 速度越慢, 这个是没有办法的

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
10 [报告]
发表于 2006-04-13 00:27 |只看该作者
原帖由 achieverain 于 2006-4-12 13:44 发表
没那么夸张,只要站长没问题,一般就是关上几个月网站。
另外: 过滤的效果越好,关键字越多 , 速度越慢, 这个是没有办法的


还要搬走服务器的.

过滤的话题讨论的很多吧.

总之是一个一个比较.
想要快一点.把所有要过滤的词放在内存里比较.
别告诉你要过滤的词越过1G.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP