免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2798 | 回复: 6
打印 上一主题 下一主题

sphinx+mysql的中文小问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-07-07 10:46 |只看该作者 |倒序浏览
昨天应公司要求架设个sphinx+mysql。弄是弄好了。并且也在sphinx提供的测试表上能使用中文搜索。
但是我用自己的表建了索引后。竟然不能用中文搜索了(匹配不到结果了)
设置都是一样的。
第一个字段也是主键是bigint型(sphinx自带的是int型,文档中说只要是主键.整数非复数就可以了阿),。大家有用sphinx中文方面的建议或者资料么。

论坛徽章:
1
白银圣斗士
日期:2015-11-23 08:33:04
2 [报告]
发表于 2009-07-07 11:30 |只看该作者
mmseg分词和www.coreseek.com补丁看看。

之前一直在用这两个。

论坛徽章:
0
3 [报告]
发表于 2009-07-07 12:13 |只看该作者
这个网站进去就是Forbidden.我用的是sphinx官方最新的0.9.9 rc2
补丁也适用么?

论坛徽章:
0
4 [报告]
发表于 2009-07-07 13:13 |只看该作者
我用的0.98打了中文补丁,没有问题

论坛徽章:
0
5 [报告]
发表于 2009-07-07 15:12 |只看该作者
现在似乎是可以搜索中文了,只是出来匹配到了数据,但是跑到官方去看说这样的情况是sphinx没有起作用。仍然是mysql查询出来的.不知道你们查询出来是什么样子。实际上我用测试的表查的时候也不是这个样子。测试的表貌似会显示出来匹配到的详情的,下面是我查询出匹配的显示。帮忙看看
我是没有用mmesg的。也没有打中文补丁。我用的是最新的0.9.9-rc2的.用cjk编码。0.9.9-RC2好像还没有补丁。coreseek.com 已经不让人访问了。

  1. [root@localhost sphinx]# ./bin/search 路
  2. Sphinx 0.9.9-rc2 (r1785)
  3. Copyright (c) 2001-2009, Andrew Aksyonoff

  4. using config file '/usr/local/sphinx/etc/sphinx.conf'...
  5. index 'test1': query '路 ': returned 35 matches of 35 total in 0.000 sec

  6. displaying matches:
  7. 1. document=77456, weight=2
  8. 2. document=77595, weight=2
  9. 3. document=77597, weight=2
  10. 4. document=77630, weight=2
  11. 5. document=77733, weight=2
  12. 6. document=323062, weight=2
  13. 7. document=323063, weight=2
  14. 8. document=57083, weight=1
  15. 9. document=77406, weight=1
  16. 10. document=77408, weight=1
  17. 11. document=77409, weight=1
  18. 12. document=77468, weight=1
  19. 13. document=77474, weight=1
  20. 14. document=77526, weight=1
  21. 15. document=77616, weight=1
  22. 16. document=77633, weight=1
  23. 17. document=77681, weight=1
  24. 18. document=77704, weight=1
  25. 19. document=77708, weight=1
  26. 20. document=77709, weight=1
复制代码

[ 本帖最后由 crisman 于 2009-7-7 15:17 编辑 ]

论坛徽章:
0
6 [报告]
发表于 2009-07-07 18:16 |只看该作者
以前遇到这样的问题,最终定位到中文分词方面词库错了。后来用的官方的分词代码搞定。

论坛徽章:
1
技术图书徽章
日期:2013-12-05 23:25:45
7 [报告]
发表于 2010-03-15 22:35 |只看该作者
coreseek.com被强了,coreseek.cn
可以使用,已经在较多用户使用。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP