转自: http://tech.jiu-shu.com/Elastic-Technologies/spring-data-elasticsearch-quick-start
通过Spring Data Elasticsearch 实现全文检索; 通过指定 boost 来控制查询语句的相对的权重; 通过自定义ResultMapper 来实现查询聚合功能。
建立对Elasticsearch的初步的认识可以参考:https://mp.weixin.qq.com/s/stC_xMP1n3aQ-0ZNAc3eQA
上面的有些解释只是为了方便初学者快速掌握知识。ES的索引的Type在后期ES中会逐渐消失。
https://www.elastic.co/guide/en/elasticsearch/reference/current/removal-of-types.html
官方的中文文档参考: https://www.elastic.co/guide/cn/elasticsearch/guide/current/index.html
追加补充: 在随后的版本spring-data-elasticsearch 2.1.10.RELEASE 中增加了
AggregatedPage
, 同时org.springframework.data.elasticsearch.core.DefaultResultMapper
也增加了响应的支持。 笔者这里针对聚合的有部分工作,在2.1.10.RELEASE种已经不在需要,或者可以更优化一些。
elasticsearch 是运行于java之上,可以直接下载运行。从https://www.elastic.co/downloads/past-releases/elasticsearch-2-4-6 下载2.4.6 版本。
- ZIP sha —– window安装包
- TAR sha —– Mac 或者linux安装包
- DEB sha
- RPM sha —– linux rpm 包可以安装成系统服务
ZIP包解压的直接进入 bin 目录运行 ./elasticserach
, 运行 ./elasticsearch -d
后台运行
RPM 安装后通过 service elasticsearch start
来启动
和es的类似,elasticsearch2.4 对应kibana的斑斑是4.6; 下载地址: https://www.elastic.co/downloads/past-releases/kibana-4-6-6
kibana 解压方式无后台运行命令,建议通过rpm方式安装
sudo rpm -ivh kibana-4.6.6-x86_64.rpm
, 以服务方式启动和停止。
此版本下没有dev tools,需要单独安装sense插件, 进入Kibana 的安装目录 /opt/kibana
运行./bin/kibana plugin --install elastic/sense
。
https://github.com/choelea/spring-data-elasticsearch-quick-start
spring.data.elasticsearch.repositories.enabled = true
spring.data.elasticsearch.cluster-nodes : 192.168.1.99:9300
参考: com.joe.springdataelasticsearch.document.ProductDoc
. 定义文档需要注意必须有个id字段或者通过注解指定一个id字段,只有在有ID得情况下,文档才可以被更新。 否则会抛出异常:No id property found for class com.joe.springdataelasticsearch.document.ProductDoc
当前版本下需要指定Field的type,否则也会报错。
修改FieldType 会导致无法通过程序启动异常,需要手动删除后创建索引。 比如: 原有的type字段的FieldType是Long,改成String后会出现类似如下错误:
mapper [type] of different type, current_type [long], merged_type [string]
系统启动后,创建索引和创建/更新mapping
elasticsearchTemplate.deleteIndex(ProductDoc.class);
elasticsearchTemplate.createIndex(ProductDoc.class);
elasticsearchTemplate.putMapping(ProductDoc.class);
启动后可以通过http://192.168.1.99:9200/product-index/_mapping/main/
来查看mapping。
elasticsearch 是通过PUT接口来索引文档。https://www.elastic.co/guide/cn/elasticsearch/guide/current/index-doc.html。 在使用Spring Data Elasticsearch的的时候,我们可以很方便的通过防JPA Repository的方式来操作; ProductDocRespository.save(ProductDoc doc)
来索引和更新文档。
public interface ProductDocRespository extends ElasticsearchRepository<ProductDoc, Long>
参考com.joe.springdataelasticsearch.listner.ContextRefreshedListener
来查看索引测试文档数据。
查询主要解决:
* 多个字段搜索查询使用布尔匹配的方式, 参考官方说明 布尔匹配
* 不同字段的权重设置,采用设置Boost方式, 参考: 查询语句提升权重
* 聚合结果集
具体代码参考如下:
public Page search(String keyword, Boolean isSelfRun, Pageable pageable) {
BoolQueryBuilder queryBuilder = QueryBuilders.boolQuery();
if (StringUtils.isNotEmpty(keyword)) {
queryBuilder.should(QueryBuilders.matchQuery(ProductDoc._name, keyword).boost(3)); // 给name字段更高的权重
queryBuilder.should(QueryBuilders.matchQuery(ProductDoc._description, keyword)); // description 默认权重 1
queryBuilder.minimumNumberShouldMatch(1); // 至少一个should条件满足
}
if (isSelfRun!=null && isSelfRun) {
queryBuilder.must(QueryBuilders.matchQuery(ProductDoc._isSelfRun, Boolean.TRUE)); // 精准值条件查询
}
SearchQuery searchQuery = new NativeSearchQueryBuilder().withQuery(queryBuilder)
.withPageable(pageable).build();
LOGGER.info("\n search(): searchContent [" + keyword + "] \n DSL = \n " + searchQuery.getQuery().toString());
return productDocRespository.search(searchQuery);
}
需求: 统计搜索出来的智能手机和普通手机的数量,从而提供进一步的过滤。
聚合的详细理解参考 聚合 | Elasticsearch: 权威指南 | Elastic, 这里我们只通过简单的桶(Bucket)的方式来实现需求。
通过google搜索spring data elasticsearch aggregation example
不难找到类似如下链接中的代码:https://github.com/spring-projects/spring-data-elasticsearch/blob/master/src/test/java/org/springframework/data/elasticsearch/core/aggregation/ElasticsearchTemplateAggregationTests.java; 但是我们需要同时返回桶的信息和检索出来的分页信息。如何利用Spring Data Elasticsearch来完成?
通过查看spring-data-elasticsearch的源代码我们可以发现org.springframework.data.elasticsearch.core.DefaultResultMapper
会被默认用来返回分页检索出来的数据。需要同时返回分页数据及桶的数据,我们就需要定制一个ResultMapper; 参考:com.joe.springdataelasticsearch.core.ProductDocAggregationResultMapper
。
http://localhost:8080/products/aggregation?keyword=China 可以查出总共有5条结果,聚合返回告诉你其中有4个智能手机,1个普通手机。
返回JSON 数据如下:
{
"content": [
{
"id": 2,
"name": "Huawei",
"description": "Made by China",
"type": "SMARTPHONE",
"isSelfRun": false
},
{
"id": 5,
"name": "Iphone X",
"description": "Iphone X is made by China",
"type": "SMARTPHONE",
"isSelfRun": true
},
{
"id": 1,
"name": "Mac Pro",
"description": "Mac Pro is made by China",
"type": "SMARTPHONE",
"isSelfRun": true
},
{
"id": 7,
"name": "Nokia N90",
"description": "Nokia N 90 is made by China",
"type": "GENERAL",
"isSelfRun": false
},
{
"id": 3,
"name": "Huawei Max3",
"description": "Huawei is designed / made by China",
"type": "SMARTPHONE",
"isSelfRun": false
}
],
"bucketsByType": [
{
"key": "SMARTPHONE",
"lable": "type",
"docCount": 4
},
{
"key": "GENERAL",
"lable": "type",
"docCount": 1
}
],
"totalElements": 5,
"last": true,
"totalPages": 1,
"number": 0,
"size": 10,
"sort": null,
"numberOfElements": 5,
"first": true
}