solr7 集群搭建并集成Hanlp分词组件

准备工作

  1. 我们需要事先在网站下载好我们需要版本的的solr和zookeeper,我这里选择的是solr7.72,zookeeper版本为3.4.14
  2. 将我们下载好的tar文件上传服务器解压
  3. 因为solr依赖jdk,所以我们在服务器上安装了对应jdk,我这里选择的是jdk1.8

安装zookeeper集群

首先我们在三台服务器上搭建zookeeper集群。

#配置data目录
dataDir=/usr/local/zookeeper-3.4.14/data
#配置log位置
dataLogDir=/usr/local/zookeeper-3.4.14/log
# the port at which the clients will connect
clientPort=2181
server.1=1.1.1.1:2888:3888
server.2=2.2.2.2:2888:3888
server.3=3.3.3.3:2888:3888

分别在三台服务器上搭建相同的配置,该配置位于解压zookeeper之后conf文件夹下。同时,我们在指定的dataDir目录创建data文件夹,在文件夹内,创建myid文件,根据当前服务器的Ip和我们在配置文件中写的server.x ,将对应的数字填入myid文件,保存。然后依次启动三台zookeeper;

启动成功后,我们执行zKserver.sh status
1.png
可以看到对应的服务器zookeeper的状态,还有是否为leader节点。如果出现上图,则zookeeper集群搭建成功

安装solr集群

solr集群的安装,我们采用solr提供jetty方式。我们首先将下载好的solr包分别上传到我们对应的三台zookeeper服务器上。
image.png
配置内容依次为:

  1. solr使用的jvm大小
  2. GC相关
  3. zookeeper的集群地址
  4. solr节点的内网IP
  5. 是否允许JMX远程
  6. solr端口号

接下来我们开始为我们需要的collection创建配置:包括字段、分词器、词典等配置

/usr/local/solr-7.7.2/server/solr/configsets

假设我们的solr安装在如上目录,我们将我们需要创建的collection配置文件上传到三台节点的其中一台改目录下。位置其实在哪不重要,因为我们的配置文件真正是的存放地址是zookeeper仓库中。
我们上传的文件有如下:
image.png
其中主要配置的字段和字段类型,是否存储、分词器都在
managed-schema文件中存储,详细配置可以打开该文件看一下注释。

在/usr/local/solr-7.7.2/server/solr/configsets/_default/conf中有默认配置文件

配置好后,我们需要通过命令将该文件夹上传到zookeeper仓库

solr zk upconfig -d /usr/local/solr-7.7.2/server/solr/configsets/search_all/conf/ -n search_all -z 1.1.1.1:2181,2.2.2.2:2181,3.3.3.3:2181

然后启动solr三个节点
1.png
至此 solr集群也搭建完毕

你可能感兴趣的:(java,后端,solrcloud,solr)