http://blog.sina.com.cn/s/blog_5ddc071f0101mts1.html
随着solr版本的不断升级, 差异越来越大, 从以前的 solr1.2 到现在的 solr4.3, 无论是类还是功能都有很大的变换, 为了能及时跟上新版本的步伐, 在此将新版本的使用做一个简单的入门说明:
Solr3.6版本
SolrServer实例化类型有httpClient,和本地化,如果Solr服务器不在本地就用httpClient,在本地就用EmbeddedSolrServer
SolrServer可以操作索引,包括更新删除查询等操作
以下是httpClient实例化方式,需要tomcat运行Solr服务
1、ConcurrentUpdateSolrServer实例化SolrServer,该类实例化多用于更新删除索引操作
ConcurrentUpdateSolrServer(String solrServerUrl, int queueSize, int threadCount) |
solrServerUrl是Solr服务器的地址, |
queueSize缓冲区大小 |
threadCount 后台线程数 |
2、HttpSolrServer 实例化SolrServer,该类实例化多用于查询操作
HttpSolrServer(String baseURL) |
baseURL是Solr的服务器地址
3、LBHttpSolrServer实例化SolrServer,用于有多个Solr服务器,负载均衡
LBHttpSolrServer(String... solrServerUrls) |
solrServerUrls是多个Solr的服务器地址,用,号分隔
以下是本地实例化,即项目包含Solr服务,不需要tomcat运行Solr服务
EmbeddedSolrServer
private
static
CoreContainer.Initializer initializer =
null
;
private
static
CoreContainer coreContainer =
null
;
private
static
EmbeddedSolrServer server =
null
;
static
{
try
{
initializer =
new
CoreContainer.Initializer();
coreContainer = initializer.initialize();
server =
new
EmbeddedSolrServer(coreContainer,
""
);
}
catch
(Exception e) {
e.printStackTrace();
}
}
Solr搜索分页
1、SolrQuery类,此类有个方法setStart(10),当设置为10时,表示从第11记录取,默认取值为0,就是从第,1条开始
2、setRows(10),表示取出的记录数,默认就是10条
SolrQuery query = new SolrQuery("url_content:百色学院");
query.setStart(10);
query.setRows(10);
1、SolrQuery类,此类有个方法setHighlight(true),当设置为true时,表示开启了高亮
2、高亮设置,添加html,和设置高亮的Field
// 以下给两个字段开启了高亮,分别是name,description, query.addHighlightField("name"); query.addHighlightField("description"); // 以下两个方法主要是在高亮的关键字前后加上html代码 query.setHighlightSimplePre(""); query.setHighlightSimplePost("");
3、获取高亮内容
Map>> map = response.getHighlighting();
Map的Key为document的Id,即你在schema.xml中设置的Id,Value为该Id对应的document的值,请听下面分 解,Value也为一个Map,该Map的Key为fieldName,Value为List,这个List里面的内容该文 档的高亮字段。
所以当做逻辑处理的时候,只要按照这个层次,依次把东西给取出来即可,如果取出来的东西为空,则用QueryResponse中的SolrDocument的getFieldValue(filedName)的值。
HttpSolrServer
HttpSolrServer使用HTTPClient 和solr服务器进行通信。
String url = http://localhost:8080/solr; SolrServer server = new HttpSolrServer(url);
HttpSolrServer 是线程安全的,建议重复使用HttpSolrServer 实例。
HttpSorlrServer 允许设置链接属性
String url = "http://localhost:8080/solr"; HttpSolrServer server = new HttpSolrServer( url ); server.setSoTimeout(1000); // socket read timeout server.setConnectionTimeout(100); server.setDefaultMaxConnectionsPerHost(100); server.setMaxTotalConnections(100); server.setFollowRedirects(false); // defaults to false // allowCompression defaults to false. // Server side must support gzip or deflate for this to have any effect. s erver.setAllowCompression(true); server.setMaxRetries(1); // defaults to 0. > 1 not recommended.
EmbeddedSolrServer
EmbeddedSorrServer提供和HttpSorlrServer相同的接口,它不需要http连接
//注意,下面的属性也是可以在jvm参数里面设置的 System.setProperty("solr.solr.home", "/home/shalinsmangar/work/oss/branch-1.3/example/solr"); CoreContainer.Initializer initializer = new CoreContainer.Initializer(); CoreContainer coreContainer = initializer.initialize(); EmbeddedSolrServer server = new EmbeddedSolrServer(coreContainer, "");
如果你想要使用 Multicore 特性,那么你可以这样使用:
File home = new File( getSolrHome() ); File f = new File( home, "solr.xml" ); multicore.load( getSolrHome(), f ); EmbeddedSolrServer server = new EmbeddedSolrServer( multicore, "core name as defined in solr.xml" );
如果你在你的项目中内嵌solr服务,这将是一个不错的选择。无论你能否使用http,它都提供相同的接口
用法
solrj 被设计成一个可扩展的框架,用以向solr服务器提交请求,并接收回应。
我们已经将最通用的一些命令封装在了solrServer类中了。
Adding Data to Solr添加DOC到Solr索引
首先需要获得一个server的实例,
SolrServer server = getSolrServer();
如果,你使用的是一个远程的solrServer的话呢,你或许会这样来实现getSolrServer()这个方法:
public SolrServer getSolrServer(){ return new HttpSolrServer(url); }
如果,你使用的是一个本地的solrServer的话,你或许会这样来实现getSolrServer()方法:
public SolrServer getSolrServer(){ //the instance can be reused return new EmbeddedSolrServer(); }
如果,你在添加数据之前,想清空现有的索引,那么你可以这么做:
server.deleteByQuery( "*:*" );// delete everything!
构造一个document
SolrInputDocument doc1 = new SolrInputDocument(); doc1.addField( "id", "id1", 1.0f ); doc1.addField( "name", "doc1", 1.0f ); doc1.addField( "price", 10 );
构造另外一个文档,每个文档都能够被独自地提交给solr,但是,批量提交是更高效的。每一个对SolrServer的请求都是http请求,当然对于EmbeddedSolrServer来说,是不一样的。
SolrInputDocument doc2 = new SolrInputDocument(); doc2.addField( "id", "id2", 1.0f ); doc2.addField( "name", "doc2", 1.0f ); doc2.addField( "price", 20 );
构造一个文档的集合
Collection docs = new ArrayList(); docs.add( doc1 ); docs.add( doc2 );
将documents提交给solr
server.add( docs );
提交一个commit
server.commit();
在添加完documents后,立即做一个commit,你可以这样来写你的程序:
UpdateRequest req = new UpdateRequest(); req.setAction( UpdateRequest.ACTION.COMMIT, false, false ); req.add( docs ); UpdateResponse rsp = req.process( server );
Directly adding POJOs to Solr
使用 java 注释创建java bean。@Field ,可以被用在域上,或者是setter方法上。如果一个域的名称跟bean的名称是不一样的,那么在java注释中填写别名,具体的,可以参照下面的域categories
import org.apache.solr.client.solrj.beans.Field; public class Item { @Field String id; @Field("cat") String[] categories; @Field List features; }
java注释也可以使用在setter方法上,如下面的例子:
@Field("cat") public void setCategory(String[] c){ this.categories = c; }
创建bean实例
Item item = new Item(); item.id = "one"; item.categories = new String[] { "aaa", "bbb", "ccc" };
添加给Solr
server.addBean(item);
将多个bean提交给solr
List beans ; //add Item objects to the list server.addBeans(beans);
注意: 你可以重复使用SolrServer,这样可以提高性能。
Reading Data from Solr搜索
获取solrserver的实例
SolrServer server = getSolrServer();
构造 SolrQuery
SolrQuery query = new SolrQuery(); query.setQuery( "*:*" ); query.addSortField( "price", SolrQuery.ORDER.asc );
向服务器发出查询请求
QueryResponse rsp = server.query( query );
获取结果。
SolrDocumentList docs = rsp.getResults();
想要以javabean的方式获取结果,那么这个javabean必须像之前的例子一样有java注释
List beans = rsp.getBeans(Item.class);
高级用法
solrJ 提供了一组API,来帮助我们创建查询,下面是一个faceted query的例子。
SolrServer server = getSolrServer(); SolrQuery solrQuery = new SolrQuery(). setQuery("ipod"). setFacet(true). setFacetMinCount(1). setFacetLimit(8). addFacetField("category"). addFacetField("inStock"); QueryResponse rsp = server.query(solrQuery);
所有的 setter/add 方法都是返回它自己本身的实例,所以就像你所看到的一样,上面的用法是链式的
Solr3.6版本
SolrServer实例化类型有httpClient,和本地化,如果Solr服务器不在本地就用httpClient,在本地就用EmbeddedSolrServer
SolrServer可以操作索引,包括更新删除查询等操作
以下是httpClient实例化方式,需要tomcat运行Solr服务
1、ConcurrentUpdateSolrServer实例化SolrServer,该类实例化多用于更新删除索引操作
ConcurrentUpdateSolrServer(String solrServerUrl, int queueSize, int threadCount)
solrServerUrl是Solr服务器的地址,
queueSize缓冲区大小
threadCount 后台线程数
2、HttpSolrServer 实例化SolrServer,该类实例化多用于查询操作
HttpSolrServer(String baseURL)
baseURL是Solr的服务器地址
3、LBHttpSolrServer实例化SolrServer,用于有多个Solr服务器,负载均衡
LBHttpSolrServer(String... solrServerUrls)
solrServerUrls是多个Solr的服务器地址,用,号分隔
以下是本地实例化,即项目包含Solr服务,不需要tomcat运行Solr服务
EmbeddedSolrServer
private static CoreContainer.Initializer initializer = null; private static CoreContainer coreContainer = null; private static EmbeddedSolrServer server = null; static { try { System.setProperty("solr.solr.home", "D://test//solrcore//core0"); initializer = new CoreContainer.Initializer(); coreContainer = initializer.initialize(); server = new EmbeddedSolrServer(coreContainer, ""); } catch (Exception e) { e.printStackTrace(); } }