compass配置paoding中文分词器

在hibernate search和compass间最后还是选择了compass,从用法两者的差别不是特别大,都很简单,只是compass支持的持久框架更多一些

先说说为什么用paoding而不用lunece自带的ChineseAnalyzer
我用ChineseAnalyzer创建了索引后,然后搜索‘山东’这个关键字 能够搜索出包含‘山东’的文本,但是改成‘山东人在北京’啥都搜不出来,看看了其分词算是是一个字一个字的切分,可以说是相当的笨 完全仿照切分英文的方式切中文,这显然不行
后来网上搜索了一下中文分词器,决定采用qieqie兄的paoding
测试了一下效果基本能够达到

废话不多说 直接说说paoding的配置,在spring配置文件中添加庖丁分析器
<property name="compassSettings">
			<props>
				<prop key="compass.engine.connection">file://c:/compass</prop>
				<prop key="compass.transaction.factory">org.compass.spring.transaction.SpringSyncTransactionFactory</prop>
				<prop key="compass.engine.analyzer.default.type">net.paoding.analysis.analyzer.PaodingAnalyzer</prop>
				
			</props>
		</property>

classpath下创建 paoding-dic-home.properties文件
文件内容就一句:paoding.dic.home=e:/paoding
在e;/paoding目录下创建自己的词典文件 *.dic
OK 配置结束

你可能感兴趣的:(spring,c,Hibernate,.net,框架)