coreseek ---------gbk-----------Unigram dictionary load Error

安装好所有的内容 coreseek mmseg

/usr/local/coreseek/bin/indexer --config /usr/local/coreseek/etc/info.conf --all

 

创建索引出现

Coreseek Full Text Server 3.1
 Copyright (c) 2006-2008 coreseek.com
using config file '/usr/local/sphinx/etc/sphinx.conf'...
indexing index 'tpzj_84'...
Unigram dictionary load Error
段错误

 

反复检查字典路径 确认正确

从新创建索引 仍然这样的错误

 

修改字典路径 无果 仍然如此

 

介绍下配置情况  mysql使用字符 gbk

配置文件中的配置如下

 

source:

     sql_query_pre = SET NAMES 'gbk'

    

index:


        charset_type = zh_cn.gbk

        #charset_type = utf-8
        # 'utf-8' default value is
        charset_table         = 0..9, A..Z->a..z, _, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F
        charset_dictpath = /usr/local/coreseek/dict/

 

 

 

 

字典操作:

 

产生字典
cd /root/soft/mmseg-3.1/data
/usr/local/mmseg/bin/mmseg -u unigram.txt
产生了unigram.txt.uni,移到相应目录。
cp unigram.txt.uni /usr/local/coreseek/dict/uni.lib

创建 /usr/local/coreseek/dict/mmseg.ini 内容:


[mmseg]
merge_number_and_ascii=1;
number_and_ascii_joint=-;
compress_space=0;
seperate_number_ascii=1;

#merge_number_and_ascii: 字母和数字连续出现是非切分
#number_and_ascii_joint:连接数字和字母可用的符号,如'-' '.' 等
#compress_space:暂时无效
#seperate_number_ascii:是否拆分数字,如 1988 -> 1/x 9/x 8/x 8/x

 

 

所有的操作都完成。创建索引均不行。

 

 

gg baidu 下 发现有这样一条说明

 

需要把/coreseek/dict/unigram.txt.uni 文件重命名 为 uni.lib

 

尝试操作 。。。。

 

再次运行 /usr/local/coreseek/bin/indexer --config /usr/local/coreseek/etc/info.conf --all

 

 

 

ok  运行通过 正常搜索~~

 

 

 

 

你可能感兴趣的:(coreseek ---------gbk-----------Unigram dictionary load Error)