Chinaunix

标题: php搜索,给点建议 [打印本页]

作者: spirit_mly    时间: 2009-08-10 16:02
标题: php搜索,给点建议
想弄个搜索,用于搜索好么好么多内容的文章
1.看过PHPCMS,貌似她的是没生成一篇文章的时候,都会切词,然后放到一个search表里面,然后,搜索的时候就从这个search表搜索,里面有实际文章的id,这样的做法有什么好处呢?
2.chinaunix 的搜索是怎么弄的呀?真快,嘿嘿
3.关键字标红是咋弄的呀?用str_replace($key, '<font color="red"'.$key.'</font>', $content)吗?

呵呵,先谢啦
作者: ziggler    时间: 2009-08-10 16:02
标题: 回复 #5 也是菜鸟 的帖子
是很大,特征向量很大。
作者: ziggler    时间: 2009-08-10 16:23
看看基于文本的内容搜索和基于内容的搜索。CBTR,CBIR等。
作者: spirit_mly    时间: 2009-08-10 16:32
原帖由 ziggler 于 2009-8-10 16:23 发表
看看基于文本的内容搜索和基于内容的搜索。CBTR,CBIR等。

CBIR(Content Based Image Retrieval),即基于内容的图像检索,是指直接采用图像内容进行图像信息查询的检索,即在图像数据库中检索与用户所提交样本图像在内容上一致或相似的图像集合的过程,通过对图像底层特征的比较来实现检索。主要研究技术包括特征抽取、相似度量、图像匹配、用户反馈。目前CBIR技术和方法的研究虽然已有不少算法,但总体效果还是不尽如人意。仅基于色彩特征的检索方法是CBIR的主要方法之一,它所抽取的特征向量是颜色直方图,虽然能够较好地反映图像中各种颜色的频率分布,而且对图像中对象的旋转以及观察位置的变化不敏感,但无法保留各像素。

另一个没找到。。。。。。
作者: ziggler    时间: 2009-08-10 17:00
标题: 回复 #3 spirit_mly 的帖子
lucene.apache.org/ 看看这个。

传统的google等搜索引擎都属于与CBTR===Content Based text Retrieval
作者: 也是菜鸟    时间: 2009-08-10 17:11
原帖由 spirit_mly 于 2009-8-10 16:32 发表

CBIR(Content Based Image Retrieval),即基于内容的图像检索,是指直接采用图像内容进行图像信息查询的检索,即在图像数据库中检索与用户所提交样本图像在内容上一致或相似的图像集合的过程,通过对图像底 ...

那运算量的有多大呀
作者: spirit_mly    时间: 2009-08-10 17:12
原帖由 ziggler 于 2009-8-10 17:00 发表
lucene.apache.org/ 看看这个。

传统的google等搜索引擎都属于与CBTR===Content Based text Retrieval

lucene,是不是那个和sphinx差不多的搜索引擎啊(这么描述可能不恰当,呵呵),刚才找sphinx的时候看到这个的,谢谢你
作者: 也是菜鸟    时间: 2009-08-10 17:20
原帖由 ziggler 于 2009-8-10 17:13 发表
是很大,特征向量很大。

呵呵,网络搜索引擎不能用这个吧,网上那么多图片,一张张比较,用户等不及。
目前能把基于文件名的做好已经不易了
作者: spirit_mly    时间: 2009-08-10 17:23
原帖由 ziggler 于 2009-8-10 17:13 发表
是很大,特征向量很大。

呵呵,看过您的积分,我想我这10分对于您来说应该不算什么,主要您是看着问题来的,积分不是目的,对吧?
最佳答案给您吧,只是我还是对这方面不了解,但是又不知道问什么,可能这个阶段就是这样吧?
再次感谢,我准备在虚拟机上安装个sphinx,呵呵
作者: ziggler    时间: 2009-08-10 17:33
标题: 回复 #8 也是菜鸟 的帖子
是未来的发展方向。
作者: hightman    时间: 2009-08-10 21:26
全文搜索技术上目前有很多不错的免费的解决方案, 但离实际运用还有一定距离, 参见: lucene(java)还有sphinxsearch (你可以GOOGLE搜索一下这2个词了解详情)

如果仅仅是对搜索技术感兴趣可以搜索这些词: 全文检索 全文搜索 中文分词

如果您关注的只是实现搜索, 特别是论坛搜索看我的最新小作品 - 迅狗: http://www.xungle.com

免费提供论坛搜索(含各版本的dz,pw), 其它应用的搜索可联系免费定制.

[ 本帖最后由 hightman 于 2009-8-10 21:28 编辑 ]




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2