分布式搜索方案选型之三:SolrCloud

 

     逛solr官网时无意发现了solrCloud这个开源项目,即solr云或叫分布式solr。它是基于solr的,使用zookeeper作为节点之间通信管理,它具有solr的所有特征,并提供索引分片的功能,不过这是要自己在配置文件中配置分片信息的。它好的地方是它是个实时的搜索引擎,即将推出的lucene4.0将实现实时搜索,而solrCloud就是基于开发中的lucene4.0的,目前solrCloud也是个本成品,本着试试的心态根据官方配置文档搭建了

一个三台机器,三个分片的分布式环境并对其进行测试。查询效率与三台机的solr集群差不多,都比较快。不过它的搜索接口很不好,你要在请求的url中指定分片的地址,如:http://localhost:8983/solr/collection1/select?shards=shard1,shard2,shard3。还有一个不好的地方是和solr一样,建立索引时它没有自动给你做负载均衡,如果你一直往分片1中插数据它也不管你的,你要自己编程去完成索引的均衡分配,这样的话工作量就很大了。于是放弃solrCloud。

solrCloud项目地址:http://wiki.apache.org/solr/SolrCloud

你可能感兴趣的:(负载均衡,搜索引擎,集群,Solr,Lucene,文档)