Paoding analysis使用小结

对paoding je、IK等进行测试,发现JE使用时一不注意就容易出现在索引或者检索时内存泄漏,其加载字典时花费内存45m左右,所以在运行时一般会在环境下设置内存参数 -Xmx256M等方法解决

paoding 比较麻烦的是要设置字典的环境变量,一般做法是新建环境变量
PAODING_DIC_HOME
再加入字典路径(如 F:\paoding-analysis\dic)
这种方法在项目移位后还得配置字典环境,麻烦
可以直接把paoding源文件夹下的paoding-dic-home.properties拷贝的你自己的
项目src文件夹下,然后将paoding-dic-home.properties文件中的
#paoding.dic.home=dic修改成
paoding.dic.home=F:/paoding-analysis/dic即可

当然你可以自己建一个名为paoding-dic-home.properties的文件
在里面加入一条语句paoding.dic.home=F:/paoding-analysis/dic(字典路径,自己换)

别忘记拷贝lib文件夹下的jar文件到项目中,

commons-logging.jar一定不能少


----------------------------下面是对同一个文件分词时间消耗
Time taken for PaoDing Analyzer behaviour : 1156 milli seconds
Time taken for IK Analyzer behaviour : 1531 milli seconds
Time taken for JE Analyzer behaviour : 1719 milli seconds

你可能感兴趣的:(Paoding analysis使用小结)