Solr索引数据同步ReplicationHandler

solr查询量增加后,单服务器承受不了搜索压力是,需要多服务来支撑,Solr1.4后自己提供了复制机制ReplicationHandler。

ReplicationHandler是个RequestHandler,在solrconfig.xml配置ReplicationHandler即可使用。

Master配置

<requestHandler name="/replication" class="solr.ReplicationHandler" >
    <lst name="master">
        <!--什么时候出发同步,参数名replicateAfter,取值可以是startup commit optimize  -->
        <str name="replicateAfter">startup</str>
        <str name="replicateAfter">commit</str>
 
        <!--数据备份 参数名backupAfter 同样可以似乎startup commit optimize -->
        <!-- <str name="backupAfter">optimize</str> -->
 
        <!--配置要同步的配置文件 -->
        <str name="confFiles">schema.xml,stopwords.txt,elevate.xml</str>
        <!--提交同步时间间隔,默认是10秒,一般不用改动 -->
        <str name="commitReserveDuration">00:00:10</str>
    </lst>
</requestHandler>
 Slave配置

<requestHandler name="/replication" class="solr.ReplicationHandler" >
    <lst name="slave">
 
        <!--主服务的同步地址-->
        <str name="masterUrl">http://master_host:port/corename/replication</str>  
 
        <!--同步轮询的时间间隔,是应用还击而定 -->
        <str name="pollInterval">00:00:20</str>  
        <str name="compression">internal</str>
        <!--Http相关参数设置-->
        <str name="httpConnTimeout">5000</str>
        <str name="httpReadTimeout">10000</str>
 
        <!-- 如果主服务设置认证,在此设置登录用户名密码 -->
        <str name="httpBasicAuthUser">username</str>
        <str name="httpBasicAuthPassword">password</str>
     </lst>
</requestHandler>
 Solr同步是通过Slave周期性轮询来检查Master的版本,如果Master有新版本,那么就开始同步复制。

1. Slave发出一个filelist命令来收集文件列表。这个命令将返回一系列元数据(size,lastmodified,alias等等)

2. Slave查看它本地是否有这些文件,然后它会开始下载缺失的文件(使用命令filecontent)。如果连接失败,则下载终止。它将重试5次,如果仍然失败则放弃。

3. 文件被下载到了一个临时目录。因此,下载中途出错不会影响到slave。

4. 一个commit命令被ReplicationHandler执行,然后新的索引被加载进来

 solr同步复制就那么简单。

你可能感兴趣的:(Solr索引数据同步ReplicationHandler)