Github个人博客:https://joeyos.github.io
前提,已经安装tomcat和jdk。
solr/home
/usr/local/solr/solrhome
java.lang.String
查看tomcat的log文件localhost.log,Could not find necessary SLF4j logging jars.
从/root/solr/example/lib/ext下的全部jar拷贝到tomcat7/webapps/solr-4.10.3/WEB-INF/lib
在webapps/solr-4.10.3新建文件夹resource,从~/solr-4.10.3/example/resources/中拷贝log4j.properties到此文件夹
注意solrhome在web.xml的配置路径/usr/local/solr/solrhome的solr/solrhome名称因人而异
[root@localhost solr-4.10.3]# cp ~/solr-4.10.3/example/resources/log4j.properties ./resources/
注意solr-4.10.3路径!!
分析器使用IKAnalyzer。
使用方法:
第一步:把IKAnalyzer依赖的jar包添加到solr工程中。把分析器使用的扩展词典添加到classpath中。
cp IKAnalyzer2012FF_u1.jar /usr/local/solr/tomcat7/webapps/solr-4.10.3/WEB-INF/lib
cp ext_stopword.dic IKAnalyzer.cfg.xml mydict.dic /usr/local/solr/tomcat7/webapps/solr-4.10.3/WEB-INF/classes
第二步:需要自定义一个FieldType。Schema.xml中定义。可以在FieldType中指定中文分析器。
修改/usr/local/solr/solrhome/collection1/conf/schema.xml
设置要查询的关键词:
solrClound需要用到solr+zookeeper。
1、集群管理
主从的管理、负载均衡、高可用的管理。集群的入口。Zookeeper必须是集群才能保证高可用。Zookeeper有选举和投票的机制。集群中至少应该有三个节点。
2、配置文件的集中管理
搭建solr集群时,需要把Solr的配置文件上传zookeeper,让zookeeper统一管理。每个节点都到zookeeper上取配置文件。
3、分布式锁
Zookeeper:3台
Solr:4台
伪分布式,zookeeper三个实例、tomcat(solr)需要四个实例。
Zookeeper需要安装jdk。
解压
新建文件夹/usr/local/solr-cloud
把解压的zookeeper拷贝三份到上面的文件夹zookeeper01、zookeeper02、zookeeper03
zookeeper01目录下创建一个data/myid,myid写入1(02写入2,03写入3)
配置zookeeper01-zookeeper03端口
把/usr/local/solr-cloud/zookeeper01/conf里面的zoo_sample.cfg复制一份zoo.cfg【依次类推】
修改配置文件zoo.zfg【依次类推】
路径:dataDir=/usr/local/solr-cloud/zookeeper01/data/【依次类推】
端口:clientPort=2181【依次类推】
末尾添加:
server.1=192.168.52.129:2881:3881
server.2=192.168.52.129:2882:3882
server.3=192.168.52.129:2883:3883
启动,zookeeper目录下有个bin/zkServer.sh start启动服务
新建shell脚本zookeeper-start-all.sh,并chmod -x zookeeper-start-all.sh
zookeeper01/bin/zkServer.sh start
zookeeper02/bin/zkServer.sh start
zookeeper03/bin/zkServer.sh start
正确开启的状态信息,否则查看防火墙及配置文件端口号
[root@localhost solr-cloud]# ./zookeeper-status
JMX enabled by default
Using config: /usr/local/solr-cloud/zookeeper01/bin/../conf/zoo.cfg
Mode: follower
JMX enabled by default
Using config: /usr/local/solr-cloud/zookeeper02/bin/../conf/zoo.cfg
Mode: leader
JMX enabled by default
Using config: /usr/local/solr-cloud/zookeeper03/bin/../conf/zoo.cfg
Mode: follower
tomcat | 端口1 | 端口2 | 端口3 |
---|---|---|---|
tomcat01 | 8006 | 8081 | 8010 |
tomcat02 | 8007 | 8082 | 8011 |
tomcat03 | 8008 | 8083 | 8012 |
tomcat04 | 8049 | 8084 | 8013 |
注意tomcat04的端口1不能为8009,有冲突。
cp -r /usr/local/solr/tomcat7/webapps/solr-4.10.3/ /usr/local/solr-cloud/tomcat04/webapps/
vi tomcat04/webapps/solr-4.10.3/WEB-INF/web.xml
192.168.52.129
8081
/root/solr-4.10.3/example/scripts/cloud-scripts/zkcli.sh
在/root/solr-4.10.3/example目录下执行 java -jar start.jar 命令。 Ctrl+C或另打开一个连接窗口
./zkcli.sh -zkhost 192.168.52.129:2181,192.168.52.129:2182,192.168.52.129:2183 -cmd upconfig -confdir /usr/local/solr-cloud/solrhome01/collection1/conf -confname myconf
vi /usr/local/solr-cloud/tomcat04/bin/catalina.sh
# Uncomment the following line to make the umask available when using the
# org.apache.catalina.security.SecurityListener
#JAVA_OPTS="$JAVA_OPTS -Dorg.apache.catalina.security.SecurityListener.UMASK=`umask`"
JAVA_OPTS="-DzkHost=192.168.52.129:2181,192.168.52.129:2182,192.168.52.129:2183"
查看某个tomcat是否成功启动:
tail -f /usr/local/solr-cloud/tomcat04/logs/catalina.out
log4j:WARN Please initialize the log4j system properly.
log4j:WARN See http://logging.apache.org/log4j/1.2/faq.html#noconfig for more info.
Nov 14, 2018 8:46:31 AM org.apache.catalina.startup.HostConfig deployDirectory
INFO: Deployment of web application directory /usr/local/solr-cloud/tomcat04/webapps/solr-4.10.3 has finished in 95,114 ms
Nov 14, 2018 8:46:31 AM org.apache.coyote.AbstractProtocol start
INFO: Starting ProtocolHandler ["http-bio-8084"]
Nov 14, 2018 8:46:32 AM org.apache.coyote.AbstractProtocol start
INFO: Starting ProtocolHandler ["ajp-bio-8013"]
Nov 14, 2018 8:46:32 AM org.apache.catalina.startup.Catalina start
INFO: Server startup in 104390 ms
tomcat8开始,默认启动的是NIO模式,7默认启动的是BIO模式,还可以通过配置设置APR模式启动,至于APR,NIO和BIO的区别,是和tomcat并发性能有关的,高并发的系统应该将tomcat的模式设置成APR模式,会大幅度的提高服务器的处理和响应性能。感兴趣的可以自己百度下。当然这个不用在意,跟本文集群搭建没啥关系,就是想到了说一下。
访问http://192.168.52.129:8081/solr/#/~cloud,查看是否全部active【绿色】,且有一个黑的【Leader】
集群分片
http://192.168.52.129:8081/solr/admin/collections?action=CREATE&name=collection2&numShards=2&replicationFactor=2
假使不用collection1,可以删除collection1:
http://192.168.52.129:8081/solr/admin/collections?action=DELETE&name=collection1