Solr是java开发。
solr的安装文件
需要安装jdk。
安装环境Linux。
需要安装Tomcat。
搭建步骤
第一步:把solr 的压缩包上传到Linux系统
第二步:解压solr。
第三步:安装Tomcat,解压缩即可。
第四步:把solr部署到Tomcat下。
第五步:解压缩war包。启动Tomcat解压。
第六步:把/root/solr-4.10.3/example/lib/ext目录下的所有的jar包,添加到solr工程中。
[root@localhost ext]# pwd
/root/solr-4.10.3/example/lib/ext
[root@localhost ext]# cp * /usr/local/solr/tomcat/webapps/solr/WEB-INF/lib/
第七步:创建一个solrhome。/example/solr目录就是一个solrhome。复制此目录到/usr/local/solr/solrhome
[root@localhost example]# pwd
/root/solr-4.10.3/example
[root@localhost example]# cp -r solr /usr/local/solr/solrhome
[root@localhost example]#
第八步:关联solr及solrhome。需要修改solr工程的web.xml文件。
第九步:启动Tomcat
http://192.168.25.154:8080/solr/
SolrCloud(solr 云)是 Solr 提供的分布式搜索方案,当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud。当一个系统的索引数据量少的时候是不需要使用 SolrCloud的,当索引量很大,搜索请求并发很高,这时需要使用 SolrCloud 来满足这些需求。
SolrCloud 是基于 Solr 和Zookeeper的分布式搜索方案,它的主要思想是使用 Zookeeper作为集群的配置信息中心。
它有几个特色功能:
1)集中式的配置信息
2)自动容错
3)近实时搜索
4)查询时自动负载均衡
【1】物理结构
三个 Solr 实例( 每个实例包括两个 Core),组成一个 SolrCloud。
【2】逻辑结构
索引集合包括两个 Shard(shard1 和 shard2),shard1 和 shard2 分别由三个 Core 组成,其中一个 Leader 两个 Replication,Leader 是由 zookeeper 选举产生,zookeeper 控制每个shard上三个 Core 的索引数据一致,解决高可用问题。
用户发起索引请求分别从 shard1 和 shard2 上获取,解决高并发问题。
(1)Collection
Collection 在 SolrCloud 集群中是一个逻辑意义上的完整的索引结构。它常常被划分为一个或多个 Shard(分片),它们使用相同的配置信息。
比如:针对商品信息搜索可以创建一个 collection。
collection=shard1+shard2+…+shardX
(2) Core
每个 Core 是 Solr 中一个独立运行单位,提供 索引和搜索服务。一个 shard 需要由一个Core 或多个 Core 组成。由于 collection 由多个 shard 组成所以 collection 一般由多个 core 组成。
(3)Master 或 Slave
Master 是 master-slave 结构中的主结点(通常说主服务器),Slave 是 master-slave 结构中的从结点(通常说从服务器或备服务器)。同一个 Shard 下 master 和 slave 存储的数据是一致的,这是为了达到高可用目的。
(4)Shard
Collection 的逻辑分片。每个 Shard 被化成一个或者多个 replication,通过选举确定哪个是 Leader。
环境准备
CentOS-6.5-i386-bin-DVD1.iso
jdk-7u72-linux-i586.tar.gz
apache-tomcat-7.0.47.tar.gz
zookeeper-3.4.6.tar.gz
solr-4.10.3.tgz
步骤:
(1)搭建Zookeeper集群(我们在上一节已经完成)
(2)将已经部署完solr 的tomcat的上传到linux
(3)在linux中创建文件夹 /usr/local/solr-cloud 创建4个tomcat实例
[root@localhost ~]# mkdir /usr/local/solr-cloud
[root@localhost ~]# cp -r tomcat-solr /usr/local/solr-cloud/tomcat-1
[root@localhost ~]# cp -r tomcat-solr /usr/local/solr-cloud/tomcat-2
[root@localhost ~]# cp -r tomcat-solr /usr/local/solr-cloud/tomcat-3
[root@localhost ~]# cp -r tomcat-solr /usr/local/solr-cloud/tomcat-4
(4)将本地的solrhome上传到linux
(5)在linux中创建文件夹 /usr/local/solrhomes ,将solrhome复制4份
[root@localhost ~]# mkdir /usr/local/solrhomes
[root@localhost ~]# cp -r solrhome /usr/local/solrhomes/solrhome-1
[root@localhost ~]# cp -r solrhome /usr/local/solrhomes/solrhome-2
[root@localhost ~]# cp -r solrhome /usr/local/solrhomes/solrhome-3
[root@localhost ~]# cp -r solrhome /usr/local/solrhomes/solrhome-4
(6)修改每个solr的 web.xml 文件, 关联solrhome
solr/home
/usr/local/solrhomes/solrhome-1
java.lang.String
(7)修改每个tomcat的原运行端口8085 8080 8009 ,分别为
8185 8180 8109
8285 8280 8209
8385 8380 8309
8485 8480 8409
------ 知识点小贴士 ------
8005端口是用来关闭TOMCAT服务的端口。
8080端口,负责建立HTTP连接。在通过浏览器访问Tomcat服务器的Web应用时,使用的就是这个连接器。
8009端口,负责和其他的HTTP服务器建立连接。在把Tomcat与其他HTTP服务器集成时,就需要用到这个连接器。
3.2.3配置集群
(1)修改每个 tomcat实例 bin 目录下的 catalina.sh 文件
把此配置添加到catalina.sh中( 第234行 ) :
JAVA_OPTS="-DzkHost=192.168.25.140:2181,192.168.25.140:2182,192.168.25.140:2183"
JAVA_OPTS ,顾名思义,是用来设置JVM相关运行参数的变量 . 此配置用于在tomcat启动时找到 zookeeper集群。
(2)配置 solrCloud 相关的配置。每个 solrhome 下都有一个 solr.xml,把其中的 ip 及端口号配置好(是对应的tomcat的IP和端口)。
solrhomes/solrhome-1/solr.xml
192.168.25.140
8180
h o s t C o n t e x t : s o l r < / s t r > < i n t n a m e = " z k C l i e n t T i m e o u t " > {hostContext:solr}</str> <int name="zkClientTimeout"> hostContext:solr</str><intname="zkClientTimeout">{zkClientTimeout:30000}
g e n e r i c C o r e N o d e N a m e s : t r u e < / b o o l > < / s o l r c l o u d > s o l r h o m e s / s o l r h o m e − 2 / s o l r . x m l < s o l r c l o u d > < s t r n a m e = " h o s t " > 192.168.25.140 < / s t r > < i n t n a m e = " h o s t P o r t " > 8280 < / i n t > < s t r n a m e = " h o s t C o n t e x t " > {genericCoreNodeNames:true}</bool> </solrcloud> solrhomes/solrhome-2/solr.xml <solrcloud> <str name="host">192.168.25.140</str> <int name="hostPort">8280</int> <str name="hostContext"> genericCoreNodeNames:true</bool></solrcloud>solrhomes/solrhome−2/solr.xml<solrcloud><strname="host">192.168.25.140</str><intname="hostPort">8280</int><strname="hostContext">{hostContext:solr}
z k C l i e n t T i m e o u t : 30000 < / i n t > < b o o l n a m e = " g e n e r i c C o r e N o d e N a m e s " > {zkClientTimeout:30000}</int> <bool name="genericCoreNodeNames"> zkClientTimeout:30000</int><boolname="genericCoreNodeNames">{genericCoreNodeNames:true}
solrhomes/solrhome-3/solr.xml
192.168.25.140
8380
h o s t C o n t e x t : s o l r < / s t r > < i n t n a m e = " z k C l i e n t T i m e o u t " > {hostContext:solr}</str> <int name="zkClientTimeout"> hostContext:solr</str><intname="zkClientTimeout">{zkClientTimeout:30000}
g e n e r i c C o r e N o d e N a m e s : t r u e < / b o o l > < / s o l r c l o u d > s o l r h o m e s / s o l r h o m e − 4 / s o l r . x m l < s o l r c l o u d > < s t r n a m e = " h o s t " > 192.168.25.140 < / s t r > < i n t n a m e = " h o s t P o r t " > 8480 < / i n t > < s t r n a m e = " h o s t C o n t e x t " > {genericCoreNodeNames:true}</bool> </solrcloud> solrhomes/solrhome-4/solr.xml <solrcloud> <str name="host">192.168.25.140</str> <int name="hostPort">8480</int> <str name="hostContext"> genericCoreNodeNames:true</bool></solrcloud>solrhomes/solrhome−4/solr.xml<solrcloud><strname="host">192.168.25.140</str><intname="hostPort">8480</int><strname="hostContext">{hostContext:solr}
z k C l i e n t T i m e o u t : 30000 < / i n t > < b o o l n a m e = " g e n e r i c C o r e N o d e N a m e s " > {zkClientTimeout:30000}</int> <bool name="genericCoreNodeNames"> zkClientTimeout:30000</int><boolname="genericCoreNodeNames">{genericCoreNodeNames:true}
(3)让 zookeeper 统一管理配置文件。需要把 solrhome下collection1/conf 目录上传到
zookeeper。上传任意 solrhome 中的配置文件即可。
我们需要使用solr给我们提供的工具上传配置文件:
solr-4.10.3/example/scripts/cloud-scripts/zkcli.sh
将solr-4.10.3压缩包上传到linux,解压,然后进入solr-4.10.3/example/scripts/cloud-scripts目录 ,执行下列命令
./zkcli.sh -zkhost 192.168.25.129:2181,192.168.25.129:2182,192.168.25.129:2183 -cmd upconfig
-confdir /usr/local/custer/solrCloud/solrhome1/collection1/conf -confname myconf
参数解释
-zkhost :指定zookeeper地址列表
-cmd :指定命令。upconfig 为上传配置的命令
-confdir : 配置文件所在目录
-confname : 配置名称
3.2.4启动集群
(1)启动每个 tomcat 实例。要保证 zookeeper 集群是启动状态。
---- 知识点小贴士 -----
如果你想让某个文件夹下都可以执行,使用以下命令实现
chmod -R 777 solr-cloud
(2)访问集群
地址栏输入 http://192.168.25.140:8180/solr ,可以看到Solr集群版的界面
下图表示的是,一个主节点 ,三个从节点。
3.3 SpringDataSolr连接SolrCloud
在SolrJ中提供一个叫做CloudSolrServer的类,它是SolrServer的子类,用于连接solrCloud
它的构造参数就是zookeeper的地址列表,另外它要求要指定defaultCollection属性(默认的 collection名称)
我们现在修改springDataSolrDemo工程的配置文件 ,把原来的solr-server注销,替换为CloudSolrServer .指定构造参数为地址列表,设置默认 collection名称
3.4分片配置
(1)创建新的 Collection 进行分片处理。
在浏览器输入以下地址,可以按照我们的要求 创建新的Collection
http://192.168.25.140:8180/solr/admin/collections?action=CREATE&name=collection2&numShards=2&replicationFactor=2
参数:
name:将被创建的集合的名字
numShards:集合创建时需要创建逻辑碎片的个数
replicationFactor:分片的副本数。
看到这个提示表示成功
(2)删除不用的 Collection。执行以下命令
http://192.168.25.140:8480/solr/admin/collections?action=DELETE&name=collection1