linux部署Solr及设置中文分词器

一、说明

Solr是一个高性能,采用Java开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。

主要记录自己学习,方便日后查找,如有不对,还请指正。

下面使用到的Solr包、分析器、停用词已经上传到主页资源。下载不了的私信博主

二、linux部署Solr

1、下载地址https://lucene.apache.org/solr/downloads.html
2、上传到linux系统后解压
在这里插入图片描述

3、solr是java语言编写需要jdk,并且运行在Tomcat上,进入解压目录
linux部署Solr及设置中文分词器_第1张图片
4、在dist目录下复制war包到tomcat下的webapps下
linux部署Solr及设置中文分词器_第2张图片
5、命令

cp solr-4.10.3.war /opt/module/apache-tomcat-7.0.47/webapps/solr

6、启动tomcat目的是解压缩这个war包,在tomcat目录下

bin/startup.sh

linux部署Solr及设置中文分词器_第3张图片
7、将解压目录下的example/lib/ext下的jar包复制到部署到tomcat下的solr项目的lib包下
linux部署Solr及设置中文分词器_第4张图片

cp * /opt/module/apache-tomcat-7.0.47/webapps/solr/WEB-INF/lib/

8、创建一个solrHome,/opt/module/solr-4.10.3/example 目录下有一个solr目录就可以直接作为solrhome

linux部署Solr及设置中文分词器_第5张图片
9、修改solr工程的web.xml文件
linux部署Solr及设置中文分词器_第6张图片
差不多在第40行,先将注释去掉,然后把solrhome的全路径复制过去
linux部署Solr及设置中文分词器_第7张图片
10、启动tomcat,访问IP:8080/solr,出现solr的页面说明没有问题。
linux部署Solr及设置中文分词器_第8张图片

三、设置中文分词器

1、把IKAnalyzer2012FF_u1.jar添加到solr工程的lib目录下
2、把扩展词典、配置文件放到solr工程的WEB-INF/classes目录下
在solr工程的WEB-INF下新建一个classes目录
在这里插入图片描述

3、配置一个FieldType,指定使用IKAnalyzer分词器,/opt/module/solr-4.10.3/example/solrhome/collection1/conf 这么目录下修改schema.xml文件
linux部署Solr及设置中文分词器_第9张图片
其中name是可以自定义,其他必须完全按照规定写
在这里插入图片描述
4、重启Tomcat,访问solr页面
(1)选择collection1这个是solrhome里面存的。
(2)选择Analysis
(3)选择配置分词器时候自定义的名称
(4)到百度随便找一段话
(5)测试分词结果
linux部署Solr及设置中文分词器_第10张图片

你可能感兴趣的:(大数据,solr)