solr查询量增加后,单服务器承受不了搜索压力是,需要多服务来支撑,Solr1.4后自己提供了复制机制ReplicationHandler。
ReplicationHandler是个RequestHandler,在solrconfig.xml配置ReplicationHandler即可使用。
Master配置
<requestHandler name="/replication" class="solr.ReplicationHandler" > <lst name="master"> <!--什么时候出发同步,参数名replicateAfter,取值可以是startup commit optimize --> <str name="replicateAfter">startup</str> <str name="replicateAfter">commit</str> <!--数据备份 参数名backupAfter 同样可以似乎startup commit optimize --> <!-- <str name="backupAfter">optimize</str> --> <!--配置要同步的配置文件 --> <str name="confFiles">schema.xml,stopwords.txt,elevate.xml</str> <!--提交同步时间间隔,默认是10秒,一般不用改动 --> <str name="commitReserveDuration">00:00:10</str> </lst> </requestHandler>Slave配置
<requestHandler name="/replication" class="solr.ReplicationHandler" > <lst name="slave"> <!--主服务的同步地址--> <str name="masterUrl">http://master_host:port/corename/replication</str> <!--同步轮询的时间间隔,是应用还击而定 --> <str name="pollInterval">00:00:20</str> <str name="compression">internal</str> <!--Http相关参数设置--> <str name="httpConnTimeout">5000</str> <str name="httpReadTimeout">10000</str> <!-- 如果主服务设置认证,在此设置登录用户名密码 --> <str name="httpBasicAuthUser">username</str> <str name="httpBasicAuthPassword">password</str> </lst> </requestHandler>
1. Slave发出一个filelist命令来收集文件列表。这个命令将返回一系列元数据(size,lastmodified,alias等等)
2. Slave查看它本地是否有这些文件,然后它会开始下载缺失的文件(使用命令filecontent)。如果连接失败,则下载终止。它将重试5次,如果仍然失败则放弃。
3. 文件被下载到了一个临时目录。因此,下载中途出错不会影响到slave。
4. 一个commit命令被ReplicationHandler执行,然后新的索引被加载进来
solr同步复制就那么简单。