- 论坛徽章:
- 0
|
我也搞了一个全文检索的套件在 www.ftphp.com
楼主的东西浏览了一下,大概是讲述如何从头构建一个像Google,baidu之类的web搜索引擎, 但小弟认为目前再去构建这样的东西除了兴趣研究之外,似乎没有什么好的发展前景, 且不说能否做得更优秀(不得不承认这是极难的), 做好以后面对的市场竞争也是难上加难.
我弄的ftphp支持的量没有楼主提到的亿\上百亿\上千亿或更多级别,目前基本上能较好的支持千万级,作为全文索引库, 主要目标是站内搜索, 站内搜索和通用的WEB搜索引擎(google,baidu为代表)有着许多本质的区别, 站内搜索通常对"查全"有更高的要求, 此外排序也应更灵活(类似SQL的字段排序), 这些的运算都是目前我无法较好解决的疑难之一呵.
特别是排序, 如果不预排序,成千上百亿的数量肯定会有亿命中的数量,如果要根据"点击次数"排名,有何良方?? 而且 web 搜索对于查全没有这么高的要求, 排序也相对单一只要按一种自己认为的和搜索关键词相关\重要性排序即可.
有兴趣在此方面进行探讨,可惜文章中说到的技术部分比较,期待技术文章....
现在搞搜索的个人也蛮多呀,之前看到一个 www.sqlet.com 也是在做亿级WEB通用搜索引擎.... |
|