实验目的:在linux系统上部署solr6.3.0
实验步骤: ①安装JDK
②安装solr
目录
1 solr概述
1.1 solr的简介
1.2 solr的特点
2 Solr安装
2.1 安装JDK
2.2 安装solr
1 solr概述
1.1 solr的简介
solr是一个基于lucene的全文检索引擎。他包括了全文检索,命中高亮,准实时搜索,富文本检索等特性. Solr是用Java编写的,并作为一个独立的全文搜索服务器,比如tomcat容器内运行。Solr的全文索引和搜索其核心使用了Lucene Java搜索库,并具有类似REST的HTTP / XML和JSON的API,可以很容易地从几乎任何编程语言使用.
什么是全文检索?
全文检索是将存储于数据库中整本书、整篇文章中的任意内容信息查找出来的检索。它可以根据需要获得全文中有关章、节、段、句、词等信息,也就是说类似于给整本书的每个字词添加一个标签,也可以进行各种统计和分析。
对于全文检索来说,倒排索引是最常用的一种技术。倒排索引用来存储某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。
然后再我们检索的时候。系统会将我们需要查询的文本转化为检索词。然后去映射表中查询其对应的文档,然后做文档归并既可以获取到我们希望得到的结果。
Why solr?
既然Solr是基于lucene的,那为什么我们不直接使用Lucene呢?
Lucene是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎 。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎.
Lucene的涉及目标决定了lucene在扩展和管理索引上比较困难。但是solr提供了一个管理页面,并且可以动态的添加和删除索引节点。可以做索引之间的互备,而这些使用lucene则很难实现
1.2 solr的特点
基于标准的开放接口:Solr支持XML,JSON和HTTP的调用形式,所以虽然solr是用java写成,但是我们依然可以使用别的语言来调用solr
先进的全文检索技术:在Solr中,我们不仅可以使用词来作为检索条件,还可以使用时间范围,数字范围等作为检索条件,也可以进行模糊搜索。
线性可扩展性:可以在线的扩展索引节点,自动索引复制,自动故障切换和恢复。
近实时索引:数据添加到索引后,可以很快的被检索到。
管理界面:可以很方便的管理各个节点,包括索引统计信息以及各个节点的状态。
2 Solr安装
2.1 安装JDK
下载JDK:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html 选择对应jdk版本下载,这里我下载的是jdk-8u131-linux-x64.gz(可在Windows下下载完成后,通过文件夹共享到Linux上)
1. 登录Linux,切换到root用户
2. 在usr目录下建立java安装目录
cd /usr
mkdir java
3.将jdk-8u131-linux-x64.gz拷贝到java目录下
4.解压jdk到当前目录
tar -zxvf jdk-8u131-linux-x64.gz
得到文件夹 jdk1.8.0_131
5.安装完毕为他建立一个链接以节省目录长度
(我没用这一步)
ln -s /usr/java/jdk1.8.0_131/ /usr/jdk
6.编辑配置文件,配置环境变量
vim /etc/profile
在文件的最后加上下面三句话,并在控制台内也执行这四句话
添加如下内容:JAVA_HOME根据实际目录来
JAVA_HOME=/usr/java/jdk1.8.0_131
CLASSPATH=$JAVA_HOME/lib.tools.jar
PATH=$JAVA_HOME/bin:$PATH
export JAVA_HOME CLASSPATH PATH
7.重启机器,在控制台查看安装情况
java -version
如果出现下面信息说明JDK安装成功
2.2 安装solr
2.2.1.下载solr6.3.0
http://lucene.apache.org/solr/downloads.html
2.3.2.在usr目录下建立solr 安装目录
cd /usr
mkdir solr
2.2.3解压缩
# tar zxvf solr-6.3.0.tgz.gz
2.2.4JETTY下启动
这将在默认端口8983下启动Solr服务器。我们现在可以在浏览器中打开以下URL,并验证我们的Solr实例正在运行。
120.24.46.77:8983/solr/#