- 论坛徽章:
- 0
|
新年快乐!
之前我也发过少许 myft 系列的小东西, 现在 libscws 已经比较成熟好用, 故在 myql-5.1.30 的基础上开发了分词插件(plugin/scws).
该分词插件的提供的功能有: 让您在MYSQL上创建FULLTEXT的索引和检索时可以直接支持中文分词(仅MyISAM表), 同时提供两个自定义
函数(UDF) 分别为
scws_segment(string buf [, int multi [, int duality [, int ignore]]] ) - 针对 buf 分词, 返回分好的词汇并以空格相连
scws_topwords(string buf [, int limit [, string xattr]]) - 针对 buf 进行分词并自动提取前 limit 个关键/重要词汇
MYSQL 内置的 FULLTEXT 功能仅仅是比 LIKE 更好的选择而已, 对于大的数据量仍然不佳, 最大的优点是不必担心索引同步的问题, 伴随
着您的 update/delete 它会自动处理. 在十万层级的标题检索应用是非常高效的,可用它实现简单的标签检索等, 比 LIKE 好用而且高效.
下载地址: http://www.hightman.cn/down/myft-5.1.30-081231.tgz
详细介绍及说明在压缩包中有, 或者进入我的论坛去查看. http://www.hightman.cn/bbs/showthread.php?tid=503
 |
|