Spring Data Elasticsearch 快速上手全文检索

转自: http://tech.jiu-shu.com/Elastic-Technologies/spring-data-elasticsearch-quick-start

通过Spring Data Elasticsearch 实现全文检索; 通过指定 boost 来控制查询语句的相对的权重; 通过自定义ResultMapper 来实现查询聚合功能。

Elasticsearch 基础知识

建立对Elasticsearch的初步的认识可以参考:https://mp.weixin.qq.com/s/stC_xMP1n3aQ-0ZNAc3eQA

上面的有些解释只是为了方便初学者快速掌握知识。ES的索引的Type在后期ES中会逐渐消失。
https://www.elastic.co/guide/en/elasticsearch/reference/current/removal-of-types.html

官方的中文文档参考: https://www.elastic.co/guide/cn/elasticsearch/guide/current/index.html

版本

  • Spring Boot: 1.4.7
  • Spring Data Elasticsearch 2.0.11
  • Elasticsearch server 2.4

追加补充: 在随后的版本spring-data-elasticsearch 2.1.10.RELEASE 中增加了AggregatedPage , 同时org.springframework.data.elasticsearch.core.DefaultResultMapper 也增加了响应的支持。 笔者这里针对聚合的有部分工作,在2.1.10.RELEASE种已经不在需要,或者可以更优化一些。

安装与运行

Elasticsearch 安装及运行

elasticsearch 是运行于java之上,可以直接下载运行。从https://www.elastic.co/downloads/past-releases/elasticsearch-2-4-6 下载2.4.6 版本。
- ZIP sha —– window安装包
- TAR sha —– Mac 或者linux安装包
- DEB sha
- RPM sha —– linux rpm 包可以安装成系统服务

ZIP包解压的直接进入 bin 目录运行 ./elasticserach, 运行 ./elasticsearch -d 后台运行
RPM 安装后通过 service elasticsearch start 来启动

Kibana 安装及运行

和es的类似,elasticsearch2.4 对应kibana的斑斑是4.6; 下载地址: https://www.elastic.co/downloads/past-releases/kibana-4-6-6

kibana 解压方式无后台运行命令,建议通过rpm方式安装sudo rpm -ivh kibana-4.6.6-x86_64.rpm , 以服务方式启动和停止。

安装Kibana的Sense插件

此版本下没有dev tools,需要单独安装sense插件, 进入Kibana 的安装目录 /opt/kibana 运行./bin/kibana plugin --install elastic/sense

代码

https://github.com/choelea/spring-data-elasticsearch-quick-start

配置

spring.data.elasticsearch.repositories.enabled = true
spring.data.elasticsearch.cluster-nodes : 192.168.1.99:9300

定义Document

参考: com.joe.springdataelasticsearch.document.ProductDoc . 定义文档需要注意必须有个id字段或者通过注解指定一个id字段,只有在有ID得情况下,文档才可以被更新。 否则会抛出异常:No id property found for class com.joe.springdataelasticsearch.document.ProductDoc

当前版本下需要指定Field的type,否则也会报错。

修改FieldType 会导致无法通过程序启动异常,需要手动删除后创建索引。 比如: 原有的type字段的FieldType是Long,改成String后会出现类似如下错误:mapper [type] of different type, current_type [long], merged_type [string]

创建索引

系统启动后,创建索引和创建/更新mapping

elasticsearchTemplate.deleteIndex(ProductDoc.class);
elasticsearchTemplate.createIndex(ProductDoc.class);
elasticsearchTemplate.putMapping(ProductDoc.class);

启动后可以通过http://192.168.1.99:9200/product-index/_mapping/main/ 来查看mapping。

索引文档

elasticsearch 是通过PUT接口来索引文档。https://www.elastic.co/guide/cn/elasticsearch/guide/current/index-doc.html。 在使用Spring Data Elasticsearch的的时候,我们可以很方便的通过防JPA Repository的方式来操作; ProductDocRespository.save(ProductDoc doc) 来索引和更新文档。

public interface ProductDocRespository extends ElasticsearchRepository<ProductDoc, Long>

参考com.joe.springdataelasticsearch.listner.ContextRefreshedListener 来查看索引测试文档数据。

测试数据

Spring Data Elasticsearch 快速上手全文检索_第1张图片

全文检索

查询主要解决:
* 多个字段搜索查询使用布尔匹配的方式, 参考官方说明 布尔匹配
* 不同字段的权重设置,采用设置Boost方式, 参考: 查询语句提升权重
* 聚合结果集

具体代码参考如下

public Page search(String keyword, Boolean isSelfRun, Pageable pageable) {
        BoolQueryBuilder queryBuilder = QueryBuilders.boolQuery();
        if (StringUtils.isNotEmpty(keyword)) {
            queryBuilder.should(QueryBuilders.matchQuery(ProductDoc._name, keyword).boost(3)); // 给name字段更高的权重
            queryBuilder.should(QueryBuilders.matchQuery(ProductDoc._description, keyword));   // description 默认权重 1
            queryBuilder.minimumNumberShouldMatch(1); // 至少一个should条件满足
        }

        if (isSelfRun!=null && isSelfRun) {
            queryBuilder.must(QueryBuilders.matchQuery(ProductDoc._isSelfRun, Boolean.TRUE)); // 精准值条件查询
        }


        SearchQuery searchQuery = new NativeSearchQueryBuilder().withQuery(queryBuilder)
                .withPageable(pageable).build();
        LOGGER.info("\n search(): searchContent [" + keyword + "] \n DSL  = \n " + searchQuery.getQuery().toString());
        return productDocRespository.search(searchQuery);
    }

测试全文检索

  1. http://localhost:8080/products?keyword=huawei
  2. http://localhost:8080/products?keyword=iphone 通过对iphone的搜索可以验证boost值得效果
  3. http://localhost:8080/products?keyword=iphone&isSelfRun=true 验证精准值匹配效果

聚合查询

需求: 统计搜索出来的智能手机和普通手机的数量,从而提供进一步的过滤。

聚合的详细理解参考 聚合 | Elasticsearch: 权威指南 | Elastic, 这里我们只通过简单的桶(Bucket)的方式来实现需求。

通过google搜索spring data elasticsearch aggregation example 不难找到类似如下链接中的代码:https://github.com/spring-projects/spring-data-elasticsearch/blob/master/src/test/java/org/springframework/data/elasticsearch/core/aggregation/ElasticsearchTemplateAggregationTests.java; 但是我们需要同时返回桶的信息和检索出来的分页信息。如何利用Spring Data Elasticsearch来完成?

通过查看spring-data-elasticsearch的源代码我们可以发现org.springframework.data.elasticsearch.core.DefaultResultMapper 会被默认用来返回分页检索出来的数据。需要同时返回分页数据及桶的数据,我们就需要定制一个ResultMapper; 参考:com.joe.springdataelasticsearch.core.ProductDocAggregationResultMapper

聚合查询测试

http://localhost:8080/products/aggregation?keyword=China 可以查出总共有5条结果,聚合返回告诉你其中有4个智能手机,1个普通手机。
返回JSON 数据如下:

{
  "content": [
    {
      "id": 2,
      "name": "Huawei",
      "description": "Made by China",
      "type": "SMARTPHONE",
      "isSelfRun": false
    },
    {
      "id": 5,
      "name": "Iphone X",
      "description": "Iphone X is made by China",
      "type": "SMARTPHONE",
      "isSelfRun": true
    },
    {
      "id": 1,
      "name": "Mac Pro",
      "description": "Mac Pro is made by China",
      "type": "SMARTPHONE",
      "isSelfRun": true
    },
    {
      "id": 7,
      "name": "Nokia N90",
      "description": "Nokia N 90 is made by China",
      "type": "GENERAL",
      "isSelfRun": false
    },
    {
      "id": 3,
      "name": "Huawei Max3",
      "description": "Huawei is designed / made by China",
      "type": "SMARTPHONE",
      "isSelfRun": false
    }
  ],
  "bucketsByType": [
    {
      "key": "SMARTPHONE",
      "lable": "type",
      "docCount": 4
    },
    {
      "key": "GENERAL",
      "lable": "type",
      "docCount": 1
    }
  ],
  "totalElements": 5,
  "last": true,
  "totalPages": 1,
  "number": 0,
  "size": 10,
  "sort": null,
  "numberOfElements": 5,
  "first": true
}

你可能感兴趣的:(Spring,Boot,Elatic-技术栈,Spring技术栈)