solr1.4+IKAnalyzer配置
solr1.4,分词采用IKAnalyzer最新,servlet采用tomcat6
1、修改tomcat目录下conf下的server.xml,查找8080,然后uriencoding=utf-8
完整的配置如下:
<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="UTF-8" />
2、部署solr,在tomcat目录下新建 conf/Catalina/localhost/solr.xml,如果没有,就自己创建。solr.xml里内容是
<Context docBase="/mywork/dist/apache-solr-1.4.0.war" debug="0" crossContext="true" > <Environment name="solr/home" type="java.lang.String" value="/mywork/data/solr" override="true" /> </Context>
"/mywork/data/apache-solr-1.4.0.war"
和 “/mywork/data/solr” 请根据自己实际情况修改。apache-solr-1.4.0.war在你solr的dist文件夹中找到,后者表示索引位置。
3:给于tomcat/bin下权限 chmod 700 *。
4:运行tomcat/bin/startup.sh,,,如果java环境配置都没问题,,那么你可以直接访问http://localhost:8080/solr/admin
5: 此时还不支持中文分词,停用tomcat(运行tomcat/bin/shutdown.sh),在tomcat的webapps里找到solr文件夹,在WEB-INF的lib目录里加入IKAnalyzer3.2.0Stable.jar。然后到solr的example目录下solr/conf/找到schema.xml ,增加text_cn这个新field
然后就可以应用这个类型,,比如修改该schema里面的
原来是
<field name="sku" type="textTight" indexed="true" stored="true" omitNorms="true"/>
改成
<field name="sku" type="text_cn" indexed="true" stored="true" omitNorms="true"/>
6:
保存完毕,测试下。启动tomcat,打开http://localhost:8080/solr/admin/analysis.jsp,,然后测试。。
图片不上传了,文字说下,field这里的下拉改成type,,对应的input框里打入text_cn,
fieldvalue这里两个选择框都打勾,对应的input框里随便你输入什么中文语句。
点“Analyzer”按钮,应该就能看到ik分词信息了。