RanGe*

(三)elasticsearch 7.6.0整合springboot 2.1.4实现模糊查询/精确查询/高亮查询

本文分为三部分, 第三部分是本文内容, 主要讲述与springboot整合使用

(一)elasticsearch7.6.0 集群搭建 elasticsearch-head Kibana搭建

(二)elasticsearch7.6.0 使用,常见增删改查功能语句

Elasticsearch整合Springboot

1.创建springboot项目,版本选择2.1.x版本

1.1 创建springboot项目

2.添加整合elasticsearch需要用的jar包
3.配置restHighLevelClient客户端
4.创建工具类和实体类

4.1 controller方法接收的参数实体类
4.2Elasticsearch查询结果由json转换接收的实体类
4.3SpringBoot用于返回结果的工具类

5.创建Controller
6.使用Postman测试数据

6.1 模糊查询请求及返回结果
6.2 精确匹配查询请求及返回结果

7.使用vue查看高亮效果

7.1 模糊查询
7.2 精确匹配查询

8.总结
9.项目源码

整合时需要做以下几件事

1.创建springboot项目,版本选择2.1.x版本

1.1 创建springboot项目

我的开发工具使用的VSCode,这里简单介绍一下创建项目(使用IDEA或者Eclipse的患者,相信你们创建一个项目还是不需要看教程的,是在不会创建去查找一些别的文章,创建出来项目再继续看本篇)
VSCode中快捷键Ctrl+Shift+P即可调出窗口,里面第一个选项"Spring Initializr:Generate a Maven Project"
意为生成一个maven项目,点击即可

选择java

输入项目文件路径结构,输入完成之后回车

输入项目名称

选择springboot版本,这里注意选择2.1.13,稍后会在pom文件中改为2.1.4版本

选择需要添加的插件,常用的有这四个

选择生成文件的路径,

生成完成之后添加到当前工作空间

项目创建完毕,对应手动创建一些实体类/配置类/controller/配置文件,目录结构如下

文件名及其功能介绍

序号	文件名	说明
1	ElasticConfig.java	elasticsearch的客户端配置,用户获取客户端对象
2	ElasticSearchController.java	controller控制器,里面对请求进行处理
3	ElasticResult.java	查询Elasticsearch返回的结果由json转换的实体类
4	LibraryQuery.java	controller中用于接收参数的实体类
5	ResultJSON.java	springBoot用于返回的实体类对象
6	DemoApplication.java	项目启动类,程序入口
7	application-dev.yml	配置elasticsearch的配置文件
8	application.yml	指定使用哪个配置文件

2.添加整合elasticsearch需要用的jar包

整合elasticsearch需要添加一些必要的jar包, 具体pom文件如下

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
	xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 https://maven.apache.org/xsd/maven-4.0.0.xsd">
	<modelVersion>4.0.0</modelVersion>
	<parent>
		<groupId>org.springframework.boot</groupId>
		<artifactId>spring-boot-starter-parent</artifactId>
		<version>2.1.4.RELEASE</version>
		<relativePath/> <!-- lookup parent from repository -->
	</parent>
	<groupId>com.example.elastic.demo</groupId>
	<artifactId>elasticsearch_demo</artifactId>
	<version>0.0.1-SNAPSHOT</version>
	<name>demo</name>
	<description>Demo project for Spring Boot</description>

	<properties>
		<java.version>1.8</java.version>
	</properties>

	<dependencies>
		<dependency>
			<groupId>org.springframework.boot</groupId>
			<artifactId>spring-boot-starter-thymeleaf</artifactId>
		</dependency>
		<dependency>
			<groupId>org.springframework.boot</groupId>
			<artifactId>spring-boot-starter-web</artifactId>
		</dependency>

		<dependency>
			<groupId>org.springframework.boot</groupId>
			<artifactId>spring-boot-devtools</artifactId>
			<scope>runtime</scope>
			<optional>true</optional>
		</dependency>
		<dependency>
			<groupId>org.projectlombok</groupId>
			<artifactId>lombok</artifactId>
			<optional>true</optional>
		</dependency>
		<dependency>
			<groupId>org.springframework.boot</groupId>
			<artifactId>spring-boot-starter-test</artifactId>
			<scope>test</scope>
		</dependency>
		
<!-- *********************elasticsearch需要用的jar包 begin********************* -->
		<dependency>
			<groupId>org.elasticsearch.client</groupId>
			<artifactId>elasticsearch-rest-high-level-client</artifactId>
			<version>7.6.0</version>
			<exclusions>
				<exclusion>
					<groupId>org.elasticsearch</groupId>
					<artifactId>elasticsearch</artifactId>
				</exclusion>
				<exclusion>
					<groupId>org.elasticsearch.client</groupId>
					<artifactId>elasticsearch-rest-client</artifactId>
				</exclusion>
			</exclusions>
		</dependency>
		<dependency>
			<groupId>org.elasticsearch.client</groupId>
			<artifactId>elasticsearch-rest-client</artifactId>
			<version>7.6.0</version>
		</dependency>
		<dependency>
			<groupId>org.elasticsearch</groupId>
			<artifactId>elasticsearch</artifactId>
			<version>7.6.0</version>
		</dependency>
<!-- *********************elasticsearch需要用的jar包 end********************* -->
	</dependencies>

	<build>
		<plugins>
			<plugin>
				<groupId>org.springframework.boot</groupId>
				<artifactId>spring-boot-maven-plugin</artifactId>
			</plugin>
		</plugins>
	</build>
</project>

配置文件如下:

application.yml文件

spring:
  profiles:
    active: dev

application-dev.yml文件

server:
  port: 8080
 
spring:
  thymeleaf:
    suffix: .html
    prefix: classpath:/static/
  jmx:
    enabled: false
  #--------------------------elasticsearch config start------------------------

  data:
    elasticsearch:
      cluster-name: my-application
      hosts: 192.168.5.32,192.168.5.33,192.168.5.34
      port: 9200
      scheme: http
      timeout: 5000
  jackson:
    default-property-inclusion: NON_NULL
  
  #----------------------------elasticsearch config end------------------------

这里配置的是三台机器搭建的集群, 具体集群搭建参考文章1

3.配置restHighLevelClient客户端

elasticsearch需要配置一个客户端,在对服务器进行操作时使用
建议各位自己写文章时, java类一定要把导包import的部分粘贴出来, 有时候初学者看着未识别的类文件, 真的不知道是哪个包里的

package com.example.elastic.demo.elasticsearch_demo.config;

import org.apache.http.HttpHost;
import org.elasticsearch.client.RestClient;
import org.elasticsearch.client.RestClientBuilder;
import org.elasticsearch.client.RestHighLevelClient;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

@Configuration
public class ElasticConfig {

    private static final Logger logger = LoggerFactory.getLogger(ElasticConfig.class);

    @Value("${spring.data.elasticsearch.hosts}")
    private String hosts;

    @Value("${spring.data.elasticsearch.port}")
    private int port;

    @Value("${spring.data.elasticsearch.scheme}")
    private String scheme;

    @Value("${spring.data.elasticsearch.timeout}")
    private int timeout;

    @Bean(name = "highLevelClient")
    public RestHighLevelClient restHighLevelClient() {
        // 可以传httpHost数组
        String[] hostArray = hosts.split(",");
        logger.info("elasticsearch初始化配置开始");
        RestClientBuilder builder = RestClient.builder(new HttpHost(hostArray[0], port, scheme),
                new HttpHost(hostArray[1], port, scheme), new HttpHost(hostArray[2], port, scheme));
        builder.setRequestConfigCallback(requestConfigBuilder -> {
            // 设置超时
            return requestConfigBuilder.setSocketTimeout(timeout);
        });
        logger.info("elasticsearch初始化配置完成");
        return new RestHighLevelClient(builder);
    }
}

这里配置类中对获取到的hosts进行了分割, 为的是配置文件直观简洁一些

4.创建工具类和实体类

工具类和实体类主要包括三个:

4.1 controller方法接收的参数实体类

package com.example.elastic.demo.elasticsearch_demo.entity;

public class LibraryQuery{
    private int currentPage;
    private int libraryId;
    private String queryText;
    private int pageSize;//页面显示数据条数,在系统参数中配置

    public int getCurrentPage() {
        return currentPage;
    }

    public void setCurrentPage(int currentPage) {
        this.currentPage = currentPage;
    }

    public int getLibraryId() {
        return libraryId;
    }

    public void setLibraryId(int libraryId) {
        this.libraryId = libraryId;
    }

    public String getQueryText() {
        return queryText;
    }

    public void setQueryText(String queryText) {
        this.queryText = queryText;
    }

    public int getPageSize() {
        return pageSize;
    }

    public void setPageSize(int pageSize) {
        this.pageSize = pageSize;
    }


}

4.2Elasticsearch查询结果由json转换接收的实体类

public class ElasticResult {

    private String pwd;

    private String index; // 索引

    private int id;
     
    private String shopcode;

    public void setPwd(String pwd) {
        this.pwd = pwd;
    }

    public String getPwd() {
        return this.pwd;
    }

    public String getIndex() {
        return index;
    }

    public void setIndex(String index) {
        this.index = index;
    }

    public int getId() {
        return id;
    }

    public void setId(int id) {
        this.id = id;
    }

    public String getShopcode() {
        return shopcode;
    }

    public void setShopcode(String shopcode) {
        this.shopcode = shopcode;
    }

}

4.3SpringBoot用于返回结果的工具类

import org.springframework.util.StringUtils;

public class ResultJSON {

	// code 状态码： 成功：200，失败：500, 202登录失效
	private String code;
	// 错误信息
	private String msg;
	// 返回的数据
	private Object responseData;

	private int currentPage;// 当前页码
	private int pageSize;// 每页数据条数
	private int recordCount; // 总记录数
	// 计算
	private int pageCount; // 总页数

	// 成功返回<无返回数据>
	public static ResultJSON success() {
		ResultJSON result = new ResultJSON("200", "操作成功", null);
		return result;
	}

	// 成功返回<有返回数据>
	public static ResultJSON success(Object responseData) {
		ResultJSON result = new ResultJSON("200", "操作成功", responseData);
		return result;
	}

	// 成功返回<返回分页数据>
	public static ResultJSON success(int currentPage, int pageSize, int recordCount, Object responseData) {
		ResultJSON result = new ResultJSON("200", "操作成功", responseData, currentPage, pageSize, recordCount);
		return result;
	}

	// 代码抛异常
	public static ResultJSON error(String string) {
		ResultJSON result = new ResultJSON("200", string, null);
		result.setCode("500");
		if (StringUtils.isEmpty(string)) {
			result.setMsg("操作失败");
		}
		return result;
	}

	// 自定义返回状态及返回数据
	public ResultJSON(String code, String msg, Object responseData) {
		this.code = code;
		this.msg = msg;
		this.responseData = responseData;
	}

	// 自定义返回分页状态及返回数据
	public ResultJSON(String code, String msg, Object responseData, int currentPage, int pageSize, int recordCount) {
		this.currentPage = currentPage;
		this.pageSize = pageSize;
		this.recordCount = recordCount;
		this.code = code;
		this.msg = msg;
		this.responseData = responseData;
	}

	public String getCode() {
		return code;
	}

	public void setCode(String code) {
		this.code = code;
	}

	public String getMsg() {
		return msg;
	}

	public void setMsg(String msg) {
		this.msg = msg;
	}

	public Object getResponseData() {
		return responseData;
	}

	public void setResponseData(Object responseData) {
		this.responseData = responseData;
	}

	public int getCurrentPage() {
		return currentPage;
	}

	public void setCurrentPage(int currentPage) {
		this.currentPage = currentPage;
	}

	public int getPageSize() {
		return pageSize;
	}

	public void setPageSize(int pageSize) {
		this.pageSize = pageSize;
	}

	public int getRecordCount() {
		return recordCount;
	}

	public void setRecordCount(int recordCount) {
		this.recordCount = recordCount;
	}

	public int getPageCount() {
		if (this.recordCount > 0) {
			if (this.recordCount % this.pageSize == 0) {
				this.pageCount = this.recordCount / this.pageSize;
				return pageCount;
			}
			this.pageCount = this.recordCount / this.pageSize + 1;
			return pageCount;
		}
		return 0;
	}

	public void setPageCount(int pageCount) {
		this.pageCount = pageCount;
	}

}

5.创建Controller

import static org.elasticsearch.index.query.QueryBuilders.matchQuery;

import java.io.IOException;
import java.util.LinkedList;
import java.util.List;

import javax.annotation.Resource;

import com.example.elastic.demo.elasticsearch_demo.entity.ElasticResult;
import com.example.elastic.demo.elasticsearch_demo.entity.LibraryQuery;
import com.example.elastic.demo.elasticsearch_demo.entity.ResultJSON;

import org.elasticsearch.action.search.SearchRequest;
import org.elasticsearch.action.search.SearchResponse;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.client.core.CountRequest;
import org.elasticsearch.client.core.CountResponse;
import org.elasticsearch.search.SearchHit;
import org.elasticsearch.search.builder.SearchSourceBuilder;
import org.elasticsearch.search.fetch.subphase.highlight.HighlightBuilder;
import org.elasticsearch.search.fetch.subphase.highlight.HighlightField;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;

@RestController
@RequestMapping("/elastic")
public class ElasticSearchController {

    @Resource(name = "highLevelClient")
    private RestHighLevelClient client;

    public ElasticSearchController() {
    }

     /**
     * @Author: wangran
     * @Date: 2020-04-14 14:46:41
     * @msg: 模糊查询
     * @param {type}
     * @return:
     */
    @RequestMapping("/searchMatch")
    public ResultJSON searchMatch(LibraryQuery query) throws IOException {
        String index = "es-test-query-analyzer";// 测试环境使用固定的索引
        String fieldName = "shopcode";// 使用固定的列
        String queryText = query.getQueryText();// 获取查询的文本内容
        String preTag = "";// 高亮查询, 使用google的色值
        String postTag = "";
        SearchRequest searchRequest = new SearchRequest(index);
        SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
        int pageNum = (query.getCurrentPage() - 1) * query.getPageSize();
        searchSourceBuilder.query(matchQuery(fieldName, queryText))
                .highlighter(new HighlightBuilder().field(fieldName).preTags(preTag).postTags(postTag));// 需要设置对应的列名和标签前/后缀
        searchSourceBuilder.from(pageNum);// 起始记录
        searchSourceBuilder.size(query.getPageSize());// 返回结果数量
        searchRequest.source(searchSourceBuilder);
        SearchResponse response = client.search(searchRequest, RequestOptions.DEFAULT);
        List<ElasticResult> queryList = new LinkedList<>();// ElasticResult类型为实体类,接收json转换后的对象
        for (SearchHit searchHit : response.getHits()) {
            if (response.getHits().getHits().length <= 0) {
                return null;
            }
            ElasticResult esResult = new ElasticResult();
            HighlightField esField = searchHit.getHighlightFields().get(fieldName);
            if (esField != null) {
                esResult.setShopcode(esField.fragments()[0].toString());
            }
            esResult.setIndex(index);
            queryList.add(esResult);
        }
        Long count = this.count(index, fieldName, queryText);
        // 由于elasticsearch在创建索引时, 默认查询数目需要小于10000, 这个值可以通过设置去改变, 
        //但是改变也是有上限的, 不能修改为无限大, 亲测百亿数据时,就已经设置不了了,10亿还是没问题的,
        //如果10亿可以满足需求,那么可以设置,如果还是满足不了需求,可以跟我一样,最多让用户查询10000条
        //因为用户查询时,模糊查询只会关心第一页的前几条,如果没有想要的结果,他会尽量的把搜索文本补充一些
        // 所以10000条记录足够用了(注意count时Long类型的数据,这里需要转换为int类型)
        return ResultJSON.success(pageNum, query.getPageSize(), count > 10000 ? 10000 : count.intValue(), queryList);
    }

    /**
     * @Author: wangran
     * @Date: 2020-04-14 14:46:41
     * @msg: 精确匹配查询
     * @param {type}
     * @return:
     */
    @RequestMapping("/searchMatchKeyWord")
    public ResultJSON searchMatchKeyWord(LibraryQuery query) throws IOException {
        String index = "es-test-query-analyzer";
        String fieldKeyWord = "shopcode.keyword"; // 精确查询需要使用.keyword
        String queryText = query.getQueryText();
        SearchRequest searchRequest = new SearchRequest(index);
        SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
        String preTag = "";// google的色值
        String postTag = "";
        int pageNum = (query.getCurrentPage() - 1) * query.getPageSize();
        searchSourceBuilder.query(matchQuery(fieldKeyWord, queryText))
                .highlighter(new HighlightBuilder().field(fieldKeyWord).preTags(preTag).postTags(postTag)); // 精确查找
        searchSourceBuilder.from(pageNum);// 起始记录
        searchSourceBuilder.size(query.getPageSize());// 返回结果数
        searchRequest.source(searchSourceBuilder);
        SearchResponse response = client.search(searchRequest, RequestOptions.DEFAULT);
        List<ElasticResult> queryList = new LinkedList<>();
        for (SearchHit searchHit : response.getHits()) {
            if (response.getHits().getHits().length <= 0) {
                return null;
            }
            ElasticResult esResult = new ElasticResult();
            HighlightField esField = searchHit.getHighlightFields().get(fieldKeyWord);
            if (esField != null) {
                esResult.setShopcode(esField.fragments()[0].toString());
            }
            esResult.setIndex(index);
            queryList.add(esResult);
        }
        Long count = this.count(index, fieldKeyWord, queryText);
        return ResultJSON.success(pageNum, query.getPageSize(), count > 10000 ? 10000 : count.intValue(), queryList);
    }

    /**
     * @Author: wangran
     * @Date: 2020-04-14 15:22:27
     * @msg: 获取查询结果的总记录数
     * @param {type}
     * @return:
     */
    public Long count(String index, String name, String text) throws IOException {
        CountRequest countRequest = new CountRequest(index);
        SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
        searchSourceBuilder.query(matchQuery(name, text));
        countRequest.source(searchSourceBuilder);
        CountResponse countResponse = client.count(countRequest, RequestOptions.DEFAULT);
        long count = countResponse.getCount();
        return count;
    }

}

这里需要注意, 模糊查询和精确查询只有一个区别,那就是对同一个索引的同一个字段进行搜索, 但是在搜索的列上面有所区别, 模糊查询使用的是"shopcode"字段,精确匹配查询使用的是"shopcode.keyword"字段,这个需要在elasticsearch创建索引时, 对该字段进行设置, 将其设置为多类型字段, 参考文章
这里介绍了关于分词器的使用,多类型字段的创建和查询等,需要有这个设置的前提下, 才能实现模糊查询和精确查询

6.使用Postman测试数据

6.1 模糊查询请求及返回结果

{
    "code": "200",
    "msg": "操作成功",
    "responseData": [
        {
            "index": "es-test-query-analyzer",
            "id": 0,
            "shopcode": "a@orange.es:orange"
        },
        {
            "index": "es-test-query-analyzer",
            "id": 0,
            "shopcode": "em@orange.fr:orange"
        },
        {
            "index": "es-test-query-analyzer",
            "id": 0,
            "shopcode": "h-as@orange.fr:orange"
        },
        {
            "index": "es-test-query-analyzer",
            "id": 0,
            "shopcode": "orange2b@orange.nl:orange4y"
        },
        {
            "index": "es-test-query-analyzer",
            "id": 0,
            "shopcode": "jbell@orange.ca:orange"
        },
        {
            "index": "es-test-query-analyzer",
            "id": 0,
            "shopcode": "mayen.jm@orange.fr:Orange"
        },
        {
            "index": "es-test-query-analyzer",
            "id": 0,
            "shopcode": "orange@hvdm.nl:orange1"
        },
        {
            "index": "es-test-query-analyzer",
            "id": 0,
            "shopcode": "wahiba.n@orange.fr:ORANGE"
        },
        {
            "index": "es-test-query-analyzer",
            "id": 0,
            "shopcode": "orange[email protected]:orange"
        },
        {
            "index": "es-test-query-analyzer",
            "id": 0,
            "shopcode": "a.orange@ew-inc.com:orange1"
        }
    ],
    "currentPage": 0,
    "pageSize": 10,
    "recordCount": 10000,
    "pageCount": 1000
}

可以看到使用高亮查询的结果中,匹配到的结果已经有了标签高亮, 实际使用中,在前台处理一下标签就可以了

6.2 精确匹配查询请求及返回结果

{
    "code": "200",
    "msg": "操作成功",
    "responseData": [
        {
            "index": "es-test-query-analyzer",
            "id": 0,
            "shopcode": "[email protected]:single3"
        }
    ],
    "currentPage": 0,
    "pageSize": 10,
    "recordCount": 1,
    "pageCount": 1
}

精确匹配查询时,如果使用部分内容进行查询,是没有返回结果的
道理就是 keyword类型的文本是不分词的, 而text类型的文本是会进行分词的, 如果是邮箱类型的数据,需要自定义分词器, 如果是中文类型的分词器,可以使用ik分词器,这里因为功能需求中需要使用的模糊查询和精确查询, 所以这里对shopcode字段设置多类型,满足既可以分词模糊查询又可以精确匹配, 多类型字段还有很多亮点, 这里没有用到就不介绍了, 有兴趣的可以自己查找一下资料

7.使用vue查看高亮效果

7.1 模糊查询

在前面介绍过, 查询结果数量超过10000条时,默认只显示10000条

7.2 精确匹配查询

在导入数据时, 对保存格式进行了响应的处理,elasticsearch有一个特点就是当插入的数据_id相同时,如果重复插入会修改原有的值, 那么在海量数据时, 把需要去重的字段赋值给_id就可以满足数据清洗工作, 将重复的内容去掉.所以这里精确查询时,返回结果若不存在则结果为0条, 如果有结果那肯定是只有1条

vue中处理字符串类型的标签文本使用如下方式就可以

8.总结

Elasticsearch是一个很高效率的搜索引擎, 从搭建到性能调优,到整合项目,最后实际使用, 从零开始真的是很需要时间和精力去学习, 越是新版本的elasticsearch, 对应的文章介绍就越少,需要自己摸索的东西就越多,加油努力吧!

9.项目源码

源码下载

elasticsearch添加kerberos认证完整操作流程鸡蛋可好吃了 elasticsearch jenkins 大数据 java
kerberos认证的教程网上有很多，但是es的真的找遍全网都很少有详细的教程！我苦读官网，到处搜罗零碎信息，才终于完成es的kerberos认证。文章目录一、elasticsearch升级白金版1.下载对应版本源码，修改相关类2.编译后替换jar包中的class文件3.更新license二、搭建kerberos服务1.安装kerberos服务端2.安装kerberos客户端3.服务端配置文件kd
集群部署Elasticsearch+Logstash+Kibana+Filebeat+Kafka+Zookeeper YH746 日志分析系统 linux
目录引言一、安装Zookeeper步骤1、准备阶段（全部节点操作，以node1为例）（1）关闭防火墙和系统安全机制（全部节点操作，以node1为例）（2）同步时钟源（全部节点操作，以node1为例）（3）JDK的安装（全部节点操作，以node1为例）（4）配置hosts（全部节点操作，以node1为例）2、安装Zookeeper软件包（全部节点操作，以node1为例）3、修改配置文件（全部节点操作
Java | 基于Kerberos认证对接华为云Elasticsearch yinbp bboss elastic java 华为云 elasticsearch bboss
可以通过华为官方提供的Java客户端，来实现基于Kerberos认证访问和操作华为云Elasticsearch；亦可以使用更加通用的开源ElasticsearchJava客户端bboss，来实现基于Kerberos认证访问和操作华为云Elasticsearch。本文介绍使用bboss实现基于Kerberos认证访问和操作华为云Elasticsearch的方法。1.bboss介绍bboss是一个高性
elfk+zookeeper+kafka数据流 AustinCien zookeeper kafka elk
申请7台部署elfk+zookeeper+kafka数据流：filebeat(每台app)------>【logstash(2)+kafka(3)】------->logstash(1)------->【elasticsearch(3)+kibana(1)】
【Elasticsearch】动态计算字段的几种方式 risc123456 Elasticsearch elasticsearch
在Elasticsearch中，动态计算字段可以通过以下几种方法实现：1.动态映射（DynamicMapping）动态映射允许Elasticsearch在索引文档时自动检测并添加新字段及其数据类型。虽然动态映射主要用于自动处理新字段，但也可以通过动态模板（DynamicTemplates）来控制新字段的映射规则，从而实现一定程度的动态计算字段的功能。示例：```jsonPUT/my_index{"
Elasticsearch——动态映射 java编程小帅 Elasticsearch elasticsearch 大数据 es java 搜索引擎
目录Dynamicfieldmappingsdatedetection(日期检测)Disablingdatedetection(禁用日期检测)Customizingdetecteddateformats(自定义检测到的日期格式)Numericdetection(数字检测)Dynamictemplates验证动态模板在动态模板映射运行时字段Elasticsearch最重要的功能之一就是它会尽量避开我
Elasticsearch：使用 runtime fields 探索你的数据小贤编程手记 elasticsearch 大数据
考虑要提取字段的大量日志数据。为数据建立索引非常耗时，并且会占用大量磁盘空间，而你只想探索数据结构而无需预先提交schema。你知道你的日志数据包含你要提取的特定字段。在这种情况下，我们要关注@timestamp和消息字段。通过使用运行时字段（runtimefields），你可以定义脚本来计算这些字段在搜索时的值。定义索引字段作为起点你可以从一个简单的示例开始，将@timestamp和messag
Elasticsearch：深入理解 Runtime Fields 和 Elastic 的 Schema on Read 实现代码指四方 elasticsearch jenkins 大数据
Elasticsearch：深入理解RuntimeFields和Elastic的SchemaonRead实现在本文中，我们将探讨Elasticsearch中的RuntimeFields和Elastic的SchemaonRead实现。RuntimeFields允许我们在查询时动态地创建字段，而不需要在索引创建时指定字段映射。这为我们提供了更大的灵活性，并且适用于那些需要根据查询需求动态添加字段的场景
【Elasticsearch】script_fields 和 runtime_fields的区别 risc123456 Elasticsearch elasticsearch
`script_fields`和`runtime_fields`都是Elasticsearch中用于动态计算字段值的功能，但它们在实现方式、应用场景和性能表现上存在显著区别。以下是两者的详细对比：1.定义和应用场景•`script_fields`：•定义：通过Painless脚本在查询阶段动态计算字段值。•应用场景：主要用于在查询结果中添加额外的计算字段，这些字段不会影响查询的执行逻辑。•示例：计
Elasticsearch补充(3) --Linux集群安装ES erainm 大数据学习 elasticsearch
1安装Elasticsearch1.1创建普通用户ES不能使用root用户来启动，必须使用普通用户来安装启动。这里我们创建一个普通用户以及定义一些常规目录用于存放我们的数据文件以及安装包等。创建一个es专门的用户（必须）使用root用户在三台机器执行以下命令useradderainmpasswderainm注：这里我创建的是我的用户，第二个passwd用户名后会设置自己的密码1.2为普通用户era
deepseek部署：ELK + Filebeat + Zookeeper + Kafka AustinCien deepseek elk zookeeper kafka
##1.概述本文档旨在指导如何在7台机器上部署ELK（Elasticsearch,Logstash,Kibana）堆栈、Filebeat、Zookeeper和Kafka。该部署方案适用于日志收集、处理和可视化场景。##2.环境准备###2.1机器分配|机器编号|主机名|IP地址|部署组件|----------|--------------|--------------|--------------
Elasticsearch性能优化实战指南_index 2401_87378872 elasticsearch 性能优化 jenkins
curl-XPUT"localhost:9200/twitter"-H'Content-Type:application/json'-d'{"settings":{"index":{"sort.field":"date","sort.order":"desc"}},"mappings":{"properties":{"date":{"type":"date"}}}}目的：indexsorting是
ElasticSearch 数据老化清理之Curator 思快奇 java elasticsearch linux 大数据分布式
前言随着接入ELK日志分析平台的系统增加，每日海量的日志数据使得磁盘空间越发紧张，从而ES的日志清理也成了一个常规操作。而ES官方也提供了一个很好用的工具——curator来实现这个事情。抽空也部署了一个，以供阅知。Curator简介据官方介绍，curator最早被称为clearESindices.py的python脚本，它的唯一功能就是删除索引清理数据，而后重命名为logstash_index_
【ES一】SpringBoot2.x+ES8.11.1（windows环境）整合 zcccc_ elasticsearch 搜索引擎 spring boot
一、两种整合方式目前有两种最常用的整合方式，一种是ElasticSearch官方提供的JavaHighLevelRestClient，一种是Spring提供的spring-boot-starter-data-elasticsearch方式：1.spring-boot-starter-data-elasticsearch方式由Spring提供，是Spring在ES官方接口基础之上的二次封装，使用简单
Elasticsearch 相关面试题一切顺势而行 elasticsearch
1.Elasticsearch基础Elasticsearch是什么？Elasticsearch是一个分布式搜索引擎，基于Lucene实现。Mapping是什么？ES中有哪些数据类型？Mapping：定义字段的类型和属性。数据类型：text、keyword、integer、float等。2.什么是全文检索？全文检索是一种基于文本内容的检索方式。3.ES支持哪些类型的查询？全文查询：match、que
MySQL 和 Elasticsearch 之间的数据同步解决方案工程师 mysql elasticsearch android
MySQL和Elasticsearch之间的数据同步是常见的需求，通常用于将结构化数据从关系型数据库同步到Elasticsearch以实现高效的全文搜索、聚合分析和实时查询。以下是几种常用的同步方案及其实现方法：1.应用层双写（双写模式）原理在业务代码中同时向MySQL和Elasticsearch写入数据，保证两者数据一致。实现步骤在写入MySQL的事务中，同步或异步写入Elasticsearch
Nginx + ElasticSearch + Kibana结合周天祥 ElasticSearch 大数据
Nginx+ElasticSearch+Kibana结合操作系统软件下载安装编译工具及库文件安装PCRE安装NginxElasticSearch配置Kibana配置Nginx配置启动Nginx对人工智能感兴趣点下面链接现在人工智能非常火爆，很多朋友都想学，但是一般的教程都是为博硕生准备的，太难看懂了。最近发现了一个非常适合小白入门的教程，不仅通俗易懂而且还很风趣幽默。所以忍不住分享一下给大家。点这
nginx 反向代理 ElasticSearch es 布丁萨玛 nginx elasticsearch 运维
本文讲述如何使用nginx代理kibana1、更改kibana.yml文件添加前缀2、nginx添加配置location/kibana/{proxy_passhttp://127.0.0.1:5601/;rewrite^/elk/(.*)$/$1break;proxy_set_headerX-Real-IP$remote_addr;proxy_set_headerHost$host:$server
ElasticSearch-head 谷歌浏览器安装插件夜古诚 ELK elasticsearch
1.windows解压安装包elasticsearch-head-master.zip2.移动解压后的文件夹到你需要的目录3.crx目录下的文件es-head.crx改为es-head.zip然后解压到当前目录4.谷歌浏览器中添加插件5.选择解压的elasticsearch-headcrx文件夹成功...
Nginx代理ElasticSearch 神奇的海马体 #Nginx #ElasticSearch nginx elasticsearch 运维
1、将ES的账号:密码通过Base64加密假设账号密码如下：账号：elastic密码：[email protected]'elastic:[email protected]'|base64ZWxhc3RpYzplbGFzdGljQGh1YXl1bndvcmxkLmNvbQ==2、在Nginx配置中传递认证信息location/es/{proxy_passhttp
精选 ES（elasticsearch）添加、修改、查询、删除详细使用语法代码讲故事架构师成长之路 ELK 中间件 elasticsearch ES 使用查询语法
精选ES（elasticsearch）添加、修改、查询、删除详细使用语法。elasticsearch是一个分布式、RESTful风格的数据搜索和分析引擎。es使用简单，支持集群，适用于海量数据的存储、搜索与分析，应用十分广泛。Elastic有一条完整的产品线：Elasticsearch、Kibana、Logstash等，前面说的三个就是大家常说的ELK技术栈。案例一1、根据用户ID、是否隐藏、帖子
ElasticSearch 基本查询语法 2401_89693619 elasticsearch 大数据搜索引擎
{“aggregations”:{“mid”:{“aggregations”:{“terminal”:{“terms”:{“field”:“terminal”,“size”:0}}},“terms”:{“field”:“mid”,“size”:“1”}}},“from”:0,“query”:{“bool”:{“must”:[{“match_all”:{}}]}},“size”:0}去重Distin
Elasticsearch（ES）基础查询语法的使用 m0_74825108 面试学习路线阿里巴巴 elasticsearch django python
1.MatchQuery(全文检索查询)用于执行全文检索，适合搜索文本字段。{“query”:{“match”:{“field”:“value”}}}match_phrase：精确匹配短语，适合用于短语搜索。{“query”:{“match_phrase”:{“field”:“text”}}}2.TermQuery(精确匹配查询)用于对某个字段的精确值进行查询，常用于不分词的字段（如ID、标签、关
黑马es数据同步mq解决方案 Gungnirss elasticsearch 大数据搜索引擎 rabbitmq
方式一:同步调用优点:实现简单，粗暴缺点:业务耦合度高方式二:异步通知优点:低耦含，实现难度一般缺点:依赖mq的可靠性方式三:监听binlog优点:完全解除服务间耦合缺点:开启binlog增加数据库负担、实现复杂度高利用MQ实现mysql与elasticsearch数据同步利用课前资料提供的hotel-admin项目作为酒店管理的微服务。当酒店数据发生增、删、改时，要求对elasticsearch
Elasticsearch系列-安装部署 m0_67393039 java java 后端
Elasticsearch系列-安装部署准备安装错误准备1.服务器创建es用户useraddespasswdes2.elasticsearch部署环境JDK3.安装包可以去elastic官网下载相应版本文件。我这里安装版本的是7.12.0。Linux版本：//centos下若没有安装curlyuminstallcurl//进入es用户目录执行下载curl-L-Ohttps://artifacts.
Elasticsearch索引设计与分片策略深度优化-手记一起学开源数据库运维 elasticsearch 大数据搜索引擎全文检索
一、索引设计的黄金法则（从踩坑到精通的必经之路）1.字段类型显式声明原则动态映射是新手最易踩的坑，某金融平台曾因金额字段被自动识别为text类型，导致聚合查询时触发OOM。正确做法应显式声明核心字段：PUT/financial_transactions{"mappings":{"dynamic":false,//关闭动态映射"properties":{"txn_id":{"type":"keywo
Elasticsearch安装与应用伟大无须多言 jenkins 运维
ElasticsearchElasticsearch是一个分布式搜索和分析引擎，具有高扩展性和高可用性。它由Elastic公司提供，是ElasticStack（ELKStack）的核心技术之一，ELKStack包括Elasticsearch、Kibana和Logstash等组件。本文将详细介绍Elasticsearch的安装使用、分片机制以及其它相关功能。一、Elasticsearch的安装Ela
jmeter 与大数据生态圈中的服务进行集成小赖同学啊 jmeter专栏 jmeter 大数据
以下为你详细介绍JMeter与大数据生态圈中几种常见服务（HadoopHDFS、Spark、Kafka、Elasticsearch）集成的方法：与HadoopHDFS集成实现思路HDFS是Hadoop的分布式文件系统，JMeter可模拟客户端对HDFS进行文件读写操作，通常借助HDFS的JavaAPI编写自定义JMeter采样器。步骤添加依赖：将Hadoop的客户端JAR包添加到JMeter的li
在线教育系统设计方案翱翔-蓝天 java
在线教育系统设计方案1.系统概述本系统是一个现代化的在线教育平台，采用前后端分离架构，提供课程管理、用户管理、视频点播、直播互动等功能。2.技术栈选型2.1后端技术栈核心框架：SpringBoot3.x数据库：MySQL8.x持久层框架：MyBatisPlus缓存：Redis消息队列：RabbitMQ搜索引擎：Elasticsearch文件存储：阿里云OSS视频点播：阿里云视频点播服务2.2前端技
掌握 ElasticSearch 组合查询：Bool Query 详解与实践全端工程师 elasticsearch elasticsearch jenkins 大数据
掌握ElasticSearch组合查询：BoolQuery详解与实践一、引言(Introduction)二、Bool查询基础2.1什么是Bool查询？2.2Bool查询的四种子句2.3语法结构三、Bool查询的四种子句详解与示例3.1`must`子句3.2`filter`子句3.3`should`子句3.4`must_not`子句四、`minimum_should_match`参数4.1什么是`m
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag

(三)elasticsearch 7.6.0整合springboot 2.1.4实现模糊查询/精确查询/高亮查询

Elasticsearch整合Springboot

1.创建springboot项目,版本选择2.1.x版本

1.1 创建springboot项目

2.添加整合elasticsearch需要用的jar包

3.配置restHighLevelClient客户端

4.创建工具类和实体类

4.1 controller方法接收的参数实体类

4.2Elasticsearch查询结果由json转换接收的实体类

4.3SpringBoot用于返回结果的工具类

5.创建Controller

6.使用Postman测试数据

6.1 模糊查询请求及返回结果

6.2 精确匹配查询请求及返回结果

7.使用vue查看高亮效果

7.1 模糊查询

7.2 精确匹配查询

8.总结

9.项目源码

你可能感兴趣的:(Elasticsearch)