- 论坛徽章:
- 0
|
原帖由 北京野狼 于 2009-2-16 19:53 发表
Java版Lucene 是全文检索的好工具, 但Lucene 不能代替DB。 想想用数据库做过什么,Lucene现在仅仅是关键字检索。
并且Lucene 也有很多弊端, 比如几乎不支持群集,倒排索引的不足。
最主要的是当达到楼上兄弟的800W数据时,Lucene 性能极差。 如果再频繁update数据, 增量索引将产生巨大i/o影响, 达到不可用的地步。
老大, 我只说lucene部分
lucene的确有很多不足, 但有几点我不同看法.
800w数据lucene性能极差, 这可能是基于单机把, 我做过千万级别的(分布式), 速度还行在1-2秒内.
至于频繁update数据, lucene不适合频繁update数据的场景, 简单点解决方法分布式. 通常搜索和更新索引两块是分离的.
LUCENE目前应该还是最好的开源搜索引擎, 适用范围最广泛的(看下其应用案例), 文档最全的, mail-list讨论最热闹的. 如果有更好的你可以推荐给我.
说个题外话:
不同应用场景需要不同工具, 比如lucene明显不适合做实时搜索, 但是一些人还是用它做实时搜索, 边用边骂, 给我的感觉是 骑着自行车, 想赶超轿车, 赶不上就要骂自行车不及轿车.
举例不当, 自行车需要买的, lucene是开源的.
它都开源了,你完全可以读它代码,自己做个更好的,当然你不xue于看它代码,你完全可以自己写个原创的, 记得开源, 让大家免费使用, 建立个wiki, mail-list, 写点教程, 记得要不断更新. 这样很多人都会慕名而来, 哭着闹着请你签名,指教, 然后他们中部分人写博称这东西怎么怎么厉害,安装是怎么怎么做的(之所以说安装,是随便一搜到处都是安装),玩的多了出个书, 深入浅出**, 比LUCENE还要牛逼的**, 山寨版LUCENE(怎么吸引眼球怎么弄, 弄几个美女图片), 这些人的简历就会多这项, 然后去应聘什么C*O, BOSS一听**这么牛叉, 大笔一挥, C*O就让做了, 当了官招点**的新手, 稳固下自己**江湖的地位. 而你身为**的father, 俯视中国大地, 这么多弟子. 应该也能满足你的虚荣心, 水涨船高, 你的收入也会很高.媒体也会大肆宣传:"中国的**之父"
啥时候能看到中国的**之父? 希望在我有生之年~ |
|