免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3229 | 回复: 10
打印 上一主题 下一主题

php搜索,给点建议 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-08-10 16:02 |只看该作者 |倒序浏览
10可用积分
想弄个搜索,用于搜索好么好么多内容的文章
1.看过PHPCMS,貌似她的是没生成一篇文章的时候,都会切词,然后放到一个search表里面,然后,搜索的时候就从这个search表搜索,里面有实际文章的id,这样的做法有什么好处呢?
2.chinaunix 的搜索是怎么弄的呀?真快,嘿嘿
3.关键字标红是咋弄的呀?用str_replace($key, '<font color="red"'.$key.'</font>', $content)吗?

呵呵,先谢啦

最佳答案

查看完整内容

是很大,特征向量很大。

论坛徽章:
0
2 [报告]
发表于 2009-08-10 16:02 |只看该作者

回复 #5 也是菜鸟 的帖子

是很大,特征向量很大。

论坛徽章:
0
3 [报告]
发表于 2009-08-10 16:23 |只看该作者
看看基于文本的内容搜索和基于内容的搜索。CBTR,CBIR等。

论坛徽章:
0
4 [报告]
发表于 2009-08-10 16:32 |只看该作者
原帖由 ziggler 于 2009-8-10 16:23 发表
看看基于文本的内容搜索和基于内容的搜索。CBTR,CBIR等。

CBIR(Content Based Image Retrieval),即基于内容的图像检索,是指直接采用图像内容进行图像信息查询的检索,即在图像数据库中检索与用户所提交样本图像在内容上一致或相似的图像集合的过程,通过对图像底层特征的比较来实现检索。主要研究技术包括特征抽取、相似度量、图像匹配、用户反馈。目前CBIR技术和方法的研究虽然已有不少算法,但总体效果还是不尽如人意。仅基于色彩特征的检索方法是CBIR的主要方法之一,它所抽取的特征向量是颜色直方图,虽然能够较好地反映图像中各种颜色的频率分布,而且对图像中对象的旋转以及观察位置的变化不敏感,但无法保留各像素。

另一个没找到。。。。。。

论坛徽章:
0
5 [报告]
发表于 2009-08-10 17:00 |只看该作者

回复 #3 spirit_mly 的帖子

lucene.apache.org/ 看看这个。

传统的google等搜索引擎都属于与CBTR===Content Based text Retrieval

论坛徽章:
0
6 [报告]
发表于 2009-08-10 17:11 |只看该作者
原帖由 spirit_mly 于 2009-8-10 16:32 发表

CBIR(Content Based Image Retrieval),即基于内容的图像检索,是指直接采用图像内容进行图像信息查询的检索,即在图像数据库中检索与用户所提交样本图像在内容上一致或相似的图像集合的过程,通过对图像底 ...

那运算量的有多大呀

论坛徽章:
0
7 [报告]
发表于 2009-08-10 17:12 |只看该作者
原帖由 ziggler 于 2009-8-10 17:00 发表
lucene.apache.org/ 看看这个。

传统的google等搜索引擎都属于与CBTR===Content Based text Retrieval

lucene,是不是那个和sphinx差不多的搜索引擎啊(这么描述可能不恰当,呵呵),刚才找sphinx的时候看到这个的,谢谢你

论坛徽章:
0
8 [报告]
发表于 2009-08-10 17:20 |只看该作者
原帖由 ziggler 于 2009-8-10 17:13 发表
是很大,特征向量很大。

呵呵,网络搜索引擎不能用这个吧,网上那么多图片,一张张比较,用户等不及。
目前能把基于文件名的做好已经不易了

论坛徽章:
0
9 [报告]
发表于 2009-08-10 17:23 |只看该作者
原帖由 ziggler 于 2009-8-10 17:13 发表
是很大,特征向量很大。

呵呵,看过您的积分,我想我这10分对于您来说应该不算什么,主要您是看着问题来的,积分不是目的,对吧?
最佳答案给您吧,只是我还是对这方面不了解,但是又不知道问什么,可能这个阶段就是这样吧?
再次感谢,我准备在虚拟机上安装个sphinx,呵呵

论坛徽章:
0
10 [报告]
发表于 2009-08-10 17:33 |只看该作者

回复 #8 也是菜鸟 的帖子

是未来的发展方向。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP