sphinx索引系统搭建(一)

上一个项目有用过迅搜的解决方案做全文索引和中文分词,这次好书淘在重构LBS模块时,考虑到更多的将是用户数据索引的问题,所以一个高效的可拓展的搜索引擎需要建立起来。sphinx是比较好的选择,而且国内结合sphinx开发的中文分词和全文索引系统coreseek还是不错的。螃蟹也喜欢尝鲜,看到sphinx原生支持php和python,那就没有理由抗拒了。

按照coreseek4.1的参考手册(http://www.coreseek.cn/docs/coreseek_4.1-sphinx_2.0.1-beta.html#sources),螃蟹在阿里云的Centos服务器上搭建好了,也是中间遇到的挫折很多,还好官方论坛很多有解决方案,最后结果是好的。

螃蟹按照手册导入mysql数据源的用户表,建立索引,结果发现搜索一直报错,不过在sphinx的英文网站又找到了解决办法,最后测试成功。

[root@AY1************* bin]# ./search caroltc
Sphinx 2.1.9-release (rel21-r4761)
Copyright (c) 2001-2014, Andrew Aksyonoff
Copyright (c) 2008-2014, Sphinx Technologies Inc (http://sphinxsearch.com)

using config file '/***********/etc/sphinx.conf'...
index 'test1': query 'caroltc ': returned 3 matches of 3 total in 0.000 sec

displaying matches:
1. document=7, weight=1611, group=1, ptimes=Thu Jan  1 08:33:34 1970
2. document=14, weight=1611, group=1, ptimes=Thu Jan  1 08:33:34 1970
3. document=16, weight=1611, group=1, ptimes=Thu Jan  1 08:33:34 1970

words:
1. 'caroltc': 3 documents, 3 hits

index 'test1stemmed': query 'caroltc ': returned 3 matches of 3 total in 0.000 s                                                                                        ec

displaying matches:
1. document=7, weight=1611, group=1, ptimes=Thu Jan  1 08:33:34 1970
2. document=14, weight=1611, group=1, ptimes=Thu Jan  1 08:33:34 1970
3. document=16, weight=1611, group=1, ptimes=Thu Jan  1 08:33:34 1970

words:
1. 'caroltc': 3 documents, 3 hits



你可能感兴趣的:(sphinx)