殷丿grd_志鹏

java分布式免费开源搜索引擎 Elasticsearch 详细学习笔记

网页右边，向下滑有目录索引，可以根据标题跳转到你想看的内容
如果右边没有就找找左边

此文是学习尚硅谷Elasticsearch课程的笔记

Elasticsearch

全文检索引擎

Lucene 是 Apache软件基金会Jakarta项目组的一个子项目，提供了简单却强大的应用程序接口，能够全文索引和搜索。Java开发环境中Lucene是成熟的免费开源工具，但Lucene只是一个提供全文搜索功能类库的核心工具包，而真正使用还需要完善的服务框架搭建起来进行应用

于是Elasticsearch 和 Solr出现了（两个都是用Lucene进行开发的，各有优点）

如果除了搜索文本外，还需要它来处理分析查询，Elasticsearch 是更好的选择，

需要分布式索引，良好的可伸缩性，Elasticsearch是更好的选择

如果需要监控和指标，Elasticsearch 暴露了更多关键指标，是更好的选择

其它方面，Slor是更好的选择，当然Solr对新手不太友好，相对较难

Elastic Stack

The Elastic Stack,又称ELK Stack，ELK 技术栈，包括Elasticsearch、Kibana、Beats和Logstash，能够安全可靠的获取任何来源、任何格式的数据，然后实时地对数据进行搜索、分析和可视化。

Elaticsearch简称ES，是一个开源的，高扩展的，分布式全文搜索引擎，整个ELK Static的核心，可以近乎实时的存储、检索数据；扩展性强，可以扩展到百台服务器，处理PB级的数据

一、入门

1. 下载安装windows和Linux版本

进入官网https://www.elastic.co/cn/，下载



解压

启动ES

cmd窗口中，会有两个端口号9300端口为ES集群间组件的通信端口，9200端口是浏览器访问的http协议RESTful端口



浏览器访问9200端口，出现如下内容，表示访问成功

2. 数据格式

Elasticsearch 是面向文档型数据库，一条数据就是一个文档，如果你会Mysql，那么下面这张图是Mysql存储数据概念和Elasticsearch里存储文档数据的类比

Index可以看做一个库，Types相当于表，Documents 相当于行，Fields相当于列

Types概念已经被弱化了，ES 6.X中，一个index下已经只能包含一个type，7.X中Type的概念已经被删除

因为ES需要快速检索，我们需要快速通过索引检索到数据，而type的存在，与我们初心相违背，因此出现了正排索引和倒排索引

正排索引，倒排索引

ES是为了提高搜索效率而出现的，比如，有这样一条数据id=1000，content = zhangsan

比如我们要找id为1000的数据，那么正排索引很有用，直接找到id为1000的数据

但是，当我们想要找到，content里面包含zhang，或者包含san，正排索引就不是很管用了

此时就需要使用倒排索引，key = zhang id = 1000，key = san id = 1000

可见，倒排索引，就是让关键字作为key，content中包含key的数据的id保存的value中，这样，当我们检索关键字zhang时，就可以快速找到相匹配的数据

3. 通过HTTPRestful操作ES

ES向外暴露了很多httpRestFul风格的API，我们通过这些来快速入门，大家看看就好，这些不常用的

1. 索引

1.创建索引

2.获取索引相关信息

获取所有索引信息

http://127.0.0.1:9200/_cat/indices?v

删除指定索引

2. 文档

1. 创建文档

{
    "title":"小米手机",
    "catrgory":"小米",
    "images":"http://www.gulixueyuan.com/xm.jpg",
    "price":3999.00
}

随机生成id

自定义id

2. 查询文档

根据id查http://127.0.0.1:9200/shopping/_doc/1001

查询所有http://127.0.0.1:9200/shopping/_search

3. 修改文档内容

修改指定文档，全部内容



修改指定文档，指定内容

删除指定文档

3. 复杂查询（先多添加点文档）

1. 查询catrgory是小米的文档

写在地址栏

使用json

{
    "query":{
        "match":{
            "category":"小米"
        }
    }
}

2. 全部查询（后面都只给出json条件，因为url都一样）,以及分页等参数的设置

{
    "query":{
        "match_all":{
            
        }
    },
    "from":0,//起始页码
    "size":2,//每页记录数
    "_source":[
        "title",
        "price"
    ],//只显示title和price两个字段
    "sort":{//排序
        "price":{//按价格排序
            "order":"desc"//降序
        }
    }
}

3. 多条件查询，必须成立的条件，and

{
    "query":{//查询条件
        "bool":{//多条件
            "must":[//必须成立
                {//条件1
                    "match":{
                        "catrgory":"小米"
                    }
                },
                {//条件2
                    "match":{
                        "price":"3999.0"
                    }
                }
            ]
        }
    }
}

4. 多条件查询，不必须成立

{
    "query":{//查询条件
        "bool":{//多条件
            "should":[//成立一个即可
                {//条件1
                    "match":{
                        "catrgory":"小米"
                    }
                },
                {//条件2
                    "match":{
                        "catrgory":"华为"
                    }
                }
            ]
        }
    }
}

5. 查询价格大于4000的

{
    "query":{//查询条件
        "bool":{//多条件
            //省略了must或should，可以一起写上
            "filter":{//过滤
                "range":{//范围
                    "price":{//price字段
                        "gt":4000
                    }
                }
            }
        }
    }
}

4. 条件删除

发 POST 请求：http://127.0.0.1:9200/shopping/_delete_by_query

请求参数

{
	"query":{
		"match":{
			"price":4000.00
		}
	}
}

4. 匹配规则

全文检索匹配，自动分词

完全匹配

{
    "query":{//查询条件
        "match_phrase":{//完全匹配
            "catrgory":"小华"
        }
    }
}

5. 高亮

{
    "query":{//查询条件
        "match":{//完全匹配
            "catrgory":"小华"
        }
    },
    "highlight":{
        "fields":{
            "catrgory":{}
        }
    }
}

6. 聚合操作

分组

{
    "aggs":{//聚合操作
        "price_group":{//聚合操作的名称，自己随便起
            "terms":{//分组
                "field":"price"//分组字段
            }
        }
    },
    //"size":0 //如果加上这个，就不显示文档，直接显示聚合统计结果
}

求平均值

{
    "aggs":{//聚合操作
        "price_group":{//聚合操作的名称，自己随便起
            "terms":{//分组
                "field":"price"//分组字段
            }
        },
        "price_avg":{//平均值，随便起的
            "avg":{//平均值
                "field":"price"//求平均值字段
            }
        }
    },
    "size":0
}

7. 映射

创建隐射

先新建一个索引

建立隐射http://127.0.0.1:9200/user/_mapping

{
    "properties":{//映射
        "name":{//第一个字段，name
            "type":"text",//类型为text,文本，可以分词
            "index":true//可以被索引查询
        },
        "sex":{//第二个字段
            "type":"keyword",//不可以分词，必须完整匹配
            "index":true
        },
        "telphone":{//第三个字段
            "type":"keyword",//不可以分词，必须完整匹配
            "index":false //不可以被索引查询
        }
    }
}

创建文档

查询

二、javaAPI 操作Elasticsearch

1. 环境搭建

创建maven工程，引入依赖

   <dependencies>
        <dependency>
            <groupId>org.elasticsearch</groupId>
            <artifactId>elasticsearch</artifactId>
            <version>7.8.0</version>
        </dependency>
        <dependency>
            <groupId>org.elasticsearch.client</groupId>
            <artifactId>elasticsearch-rest-high-level-client</artifactId>
            <version>7.8.0</version>
        </dependency>
        <!-- elasticsearch 依赖 2.x 的 log4j -->
        <dependency>
            <groupId>org.apache.logging.log4j</groupId>
            <artifactId>log4j-api</artifactId>
            <version>2.8.2</version>
        </dependency>
        <dependency>
            <groupId>org.apache.logging.log4j</groupId>
            <artifactId>log4j-core</artifactId>
            <version>2.8.2</version>
        </dependency>
        <dependency>
            <groupId>com.fasterxml.jackson.core</groupId>
            <artifactId>jackson-databind</artifactId>
            <version>2.9.9</version>
        </dependency>
        <!-- junit 单元测试 -->
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>4.12</version>
        </dependency>
    </dependencies>

创建实体类

package com.yzpnb.es.entity;

public class User {
    private String name;
    private Integer age;
    private String sex;

    public String getName() {
        return name;
    }
    public void setName(String name){
        this.name = name;
    }
    public Integer getAge() {
        return age;
    }
    public void setAge(Integer age) {
        this.age = age;
    }
    public String getSex() {
        return sex;
    }
    public void setSex(String sex) {
        this.sex = sex;
    }
}

2. 测试类

测试类，代码量比较大，我们日后使用一些框架提供的工具，不使用这些代码，但是工具就是封装了这些代码，所以要理解这些代码，代码量虽然多，但是基本所有操作都写了,为了方便大家理解，我将每一个用法，都单独写成一个方法，所以，重复的代码很多

import com.fasterxml.jackson.core.JsonProcessingException;
import com.fasterxml.jackson.databind.ObjectMapper;
import com.yzpnb.es.entity.User;
import org.apache.http.HttpHost;
import org.elasticsearch.action.admin.indices.delete.DeleteIndexRequest;
import org.elasticsearch.action.bulk.BulkRequest;
import org.elasticsearch.action.bulk.BulkResponse;
import org.elasticsearch.action.delete.DeleteRequest;
import org.elasticsearch.action.delete.DeleteResponse;
import org.elasticsearch.action.get.GetRequest;
import org.elasticsearch.action.get.GetResponse;
import org.elasticsearch.action.index.IndexRequest;
import org.elasticsearch.action.index.IndexResponse;
import org.elasticsearch.action.search.SearchRequest;
import org.elasticsearch.action.search.SearchResponse;
import org.elasticsearch.action.support.master.AcknowledgedResponse;
import org.elasticsearch.action.update.UpdateRequest;
import org.elasticsearch.action.update.UpdateResponse;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestClient;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.client.indices.CreateIndexRequest;
import org.elasticsearch.client.indices.CreateIndexResponse;
import org.elasticsearch.client.indices.GetIndexRequest;
import org.elasticsearch.client.indices.GetIndexResponse;
import org.elasticsearch.common.unit.Fuzziness;
import org.elasticsearch.common.xcontent.XContentType;
import org.elasticsearch.index.query.BoolQueryBuilder;
import org.elasticsearch.index.query.QueryBuilders;
import org.elasticsearch.index.query.RangeQueryBuilder;
import org.elasticsearch.search.SearchHit;
import org.elasticsearch.search.SearchHits;
import org.elasticsearch.search.aggregations.AggregationBuilders;
import org.elasticsearch.search.builder.SearchSourceBuilder;
import org.elasticsearch.search.fetch.subphase.highlight.HighlightBuilder;
import org.elasticsearch.search.fetch.subphase.highlight.HighlightField;
import org.elasticsearch.search.sort.SortOrder;

import java.io.IOException;
import java.util.Map;

public class Elasticsearch01_Client {

    public static void main(String[] args) throws IOException {
        // 创建客户端对象
        RestHighLevelClient client = new RestHighLevelClient(
                RestClient.builder(new HttpHost("localhost", 9200, "http"))
        );

//        creteIndex(client,"user1");//创建索引
//        getIndex(client,"user1");//获取索引
//        delIndex(client,"user1");//删除索引
//        createDoc(client,"user1","1001");//创建文档
//        getDocbyId(client,"user1","1001");//查询文档
//        updateDoc(client,"user1","1001");//修改文档
//        delDoc(client,"user1","1001");//删除文档
        createDocList(client,"user1");//批量新增文档
        client.close();
    }

    //删除指定索引
    private static void delIndex(RestHighLevelClient client, String indexName) {
        // 删除索引 - 请求对象
        DeleteIndexRequest request = new DeleteIndexRequest(indexName);
        // 发送请求，获取响应
        AcknowledgedResponse response = null;
        try {
            response = client.indices().delete(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        // 操作结果
        System.out.println("操作结果 ： " + response.isAcknowledged());
    }

    //创建指定索引
    public static void creteIndex(RestHighLevelClient client,String indexName){
        // 创建索引 - 请求对象
        CreateIndexRequest request = new CreateIndexRequest(indexName);
        // 发送请求，获取响应
        CreateIndexResponse response = null;
        try {
            response = client.indices().create(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        boolean acknowledged = response.isAcknowledged();
        // 响应状态
        System.out.println("操作状态 = " + acknowledged);

    }
    //查询指定索引
    public static void getIndex(RestHighLevelClient client,String indexName){
        // 查询索引 - 请求对象
        GetIndexRequest request = new GetIndexRequest(indexName);
        // 发送请求，获取响应
        GetIndexResponse response = null;
        try {
            response = client.indices().get(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        System.out.println("aliases:"+response.getAliases());
        System.out.println("mappings:"+response.getMappings());
        System.out.println("settings:"+response.getSettings());
    }
    /**
     * 创建文档
     * @param client 客户端对象
     * @param indexName 索引名
     * @param docId //指定文档id
     */
    public static void createDoc(RestHighLevelClient client,String indexName,String docId){
        // 新增文档 - 请求对象
        IndexRequest request = new IndexRequest();
        // 设置索引及唯一性标识
        request.index(indexName).id(docId);
        // 创建数据对象
        User user = new User();
        user.setName("zhangsan");
        user.setAge(30);
        user.setSex("男");
        //将对象，转成json字符串
        ObjectMapper objectMapper = new ObjectMapper();
        String productJson = null;
        try {
            productJson = objectMapper.writeValueAsString(user);
        } catch (JsonProcessingException e) {
            e.printStackTrace();
        }
        // 添加文档数据，数据格式为 JSON 格式
        request.source(productJson, XContentType.JSON);
        // 客户端发送请求，获取响应对象
        IndexResponse response = null;
        try {
            response = client.index(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        3.打印结果信息
        System.out.println("_index:" + response.getIndex());
        System.out.println("_id:" + response.getId());
        System.out.println("_result:" + response.getResult());
    }
    /**
     * 根据id查询文档
     * @param client 客户端对象
     * @param indexName 索引名
     * @param docId //指定文档id
     */
    public static void getDocbyId(RestHighLevelClient client,String indexName,String docId){
        //1.创建请求对象
        GetRequest request = new GetRequest().index(indexName).id(docId);
        //2.客户端发送请求，获取响应对象
        GetResponse response = null;
        try {
            response = client.get(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        3.打印结果信息
        System.out.println("_index:" + response.getIndex());
        System.out.println("_type:" + response.getType());
        System.out.println("_id:" + response.getId());
        System.out.println("source:" + response.getSourceAsString());
    }
    /**
     * 修改文档
     * @param client 客户端对象
     * @param indexName 索引名
     * @param docId //指定文档id
     */
    public static void updateDoc(RestHighLevelClient client,String indexName,String docId){
        // 修改文档 - 请求对象
        UpdateRequest request = new UpdateRequest();
        // 配置修改参数
        request.index(indexName).id(docId);
        // 设置请求体，对数据进行修改
        request.doc(XContentType.JSON, "sex", "女");
        // 客户端发送请求，获取响应对象
        UpdateResponse response = null;
        try {
            response = client.update(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        System.out.println("_index:" + response.getIndex());
        System.out.println("_id:" + response.getId());
        System.out.println("_result:" + response.getResult());
    }
    /**
     * 删除文档
     * @param client 客户端对象
     * @param indexName 索引名
     * @param docId //指定文档id
     */
    public static void delDoc(RestHighLevelClient client,String indexName,String docId){
        //创建请求对象
        DeleteRequest request = new DeleteRequest().index(indexName).id(docId);
        //客户端发送请求，获取响应对象
        DeleteResponse response = null;
        try {
            response = client.delete(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        //打印信息
        System.out.println(response.toString());
    }

    /**
     * 批量新增文档
     * @param client 客户端对象
     * @param indexName 索引名
     */
    public static void createDocList(RestHighLevelClient client,String indexName){
        //创建批量新增请求对象
        BulkRequest request = new BulkRequest();
        request.add(new IndexRequest().index(indexName).id("1001").source(XContentType.JSON, "name", "zhangsan"));
        request.add(new IndexRequest().index(indexName).id("1002").source(XContentType.JSON, "name", "lisi"));
        request.add(new IndexRequest().index(indexName).id("1003").source(XContentType.JSON, "name", "wangwu"));
        //客户端发送请求，获取响应对象
        BulkResponse responses = null;
        try {
            responses = client.bulk(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        //打印结果信息
        System.out.println("took:" + responses.getTook());
        System.out.println("items:" + responses.getItems());
    }

    /**
     * 批量删除
     */
    public static void delDocList(RestHighLevelClient client,String indexName){
        //创建批量删除请求对象
        BulkRequest request = new BulkRequest();
        request.add(new DeleteRequest().index(indexName).id("1001"));
        request.add(new DeleteRequest().index(indexName).id("1002"));
        request.add(new DeleteRequest().index(indexName).id("1003"));
        //客户端发送请求，获取响应对象
        BulkResponse responses = null;
        try {
            responses = client.bulk(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        //打印结果信息
        System.out.println("took:" + responses.getTook());
        System.out.println("items:" + responses.getItems());
    }

    /**
     * 请求体查询，查询全部
     */
    public static void queryBodyDocAll(RestHighLevelClient client){
        // 创建搜索请求对象
        SearchRequest request = new SearchRequest();
        request.indices("student");
        // 构建查询的请求体
        SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
        // 查询所有数据
        sourceBuilder.query(QueryBuilders.matchAllQuery());
        request.source(sourceBuilder);
        SearchResponse response = null;
        try {
            response = client.search(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        // 查询匹配
        SearchHits hits = response.getHits();
        System.out.println("took:" + response.getTook());
        System.out.println("timeout:" + response.isTimedOut());
        System.out.println("total:" + hits.getTotalHits());
        System.out.println("MaxScore:" + hits.getMaxScore());
        System.out.println("hits========>>");
        for (SearchHit hit : hits) {
            //输出每条查询的结果信息
            System.out.println(hit.getSourceAsString());
        }
        System.out.println("<<========");
    }

    /**
     * 请求体查询，term分组查询
     */
    public static void queryBodyDocTerm(RestHighLevelClient client){
        // 创建搜索请求对象
        SearchRequest request = new SearchRequest();
        request.indices("student");
        // 构建查询的请求体
        SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
        sourceBuilder.query(QueryBuilders.termQuery("age", "30"));
        request.source(sourceBuilder);
        SearchResponse response = null;
        try {
            response = client.search(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        // 查询匹配
        SearchHits hits = response.getHits();
        System.out.println("took:" + response.getTook());
        System.out.println("timeout:" + response.isTimedOut());
        System.out.println("total:" + hits.getTotalHits());
        System.out.println("MaxScore:" + hits.getMaxScore());
        System.out.println("hits========>>");
        for (SearchHit hit : hits) {
            //输出每条查询的结果信息
            System.out.println(hit.getSourceAsString());
        }
        System.out.println("<<========");
    }

    /**
     * 请求体查询，分页查询
     */
    public static void queryBodyDoclimit(RestHighLevelClient client){
        // 创建搜索请求对象
        SearchRequest request = new SearchRequest();
        request.indices("student");
        // 构建查询的请求体
        SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
        sourceBuilder.query(QueryBuilders.matchAllQuery());
        // 分页查询
        // 当前页其实索引(第一条数据的顺序号)，from
        sourceBuilder.from(0);
        // 每页显示多少条 size
        sourceBuilder.size(2);
        request.source(sourceBuilder);
        SearchResponse response = null;
        try {
            response = client.search(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        // 查询匹配
        SearchHits hits = response.getHits();
        System.out.println("took:" + response.getTook());
        System.out.println("timeout:" + response.isTimedOut());
        System.out.println("total:" + hits.getTotalHits());
        System.out.println("MaxScore:" + hits.getMaxScore());
        System.out.println("hits========>>");
        for (SearchHit hit : hits) {
            //输出每条查询的结果信息
            System.out.println(hit.getSourceAsString());
        }
        System.out.println("<<========");
    }
    /**
     * 请求体查询，排序
     */
    public static void queryBodyDocSort(RestHighLevelClient client){
        // 创建搜索请求对象
        SearchRequest request = new SearchRequest();
        request.indices("student");
        // 构建查询的请求体
        SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
        sourceBuilder.query(QueryBuilders.matchAllQuery());
        // 排序
        sourceBuilder.sort("age", SortOrder.ASC);
        request.source(sourceBuilder);
        SearchResponse response = null;
        try {
            response = client.search(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        // 查询匹配
        SearchHits hits = response.getHits();
        System.out.println("took:" + response.getTook());
        System.out.println("timeout:" + response.isTimedOut());
        System.out.println("total:" + hits.getTotalHits());
        System.out.println("MaxScore:" + hits.getMaxScore());
        System.out.println("hits========>>");
        for (SearchHit hit : hits) {
            //输出每条查询的结果信息
            System.out.println(hit.getSourceAsString()); }
        System.out.println("<<========");
    }
    /**
     * 请求体查询，过滤
     */
    public static void queryBodyDocFilter(RestHighLevelClient client){
        // 创建搜索请求对象
        SearchRequest request = new SearchRequest();
        request.indices("student");
        // 构建查询的请求体
        SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
        sourceBuilder.query(QueryBuilders.matchAllQuery());
        //查询字段过滤
        String[] excludes = {};
        String[] includes = {"name", "age"};
        sourceBuilder.fetchSource(includes, excludes);
        request.source(sourceBuilder);
        SearchResponse response = null;
        try {
            response = client.search(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        // 查询匹配
        SearchHits hits = response.getHits();
        System.out.println("took:" + response.getTook());
        System.out.println("timeout:" + response.isTimedOut());
        System.out.println("total:" + hits.getTotalHits());
        System.out.println("MaxScore:" + hits.getMaxScore());
        System.out.println("hits========>>");
        for (SearchHit hit : hits) {
            //输出每条查询的结果信息
            System.out.println(hit.getSourceAsString());
        }
        System.out.println("<<========");
    }
    /**
     * 请求体查询，bool
     */
    public static void queryBodyDocBool(RestHighLevelClient client){
        // 创建搜索请求对象
        SearchRequest request = new SearchRequest();
        request.indices("student");
        // 构建查询的请求体
        SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
        BoolQueryBuilder boolQueryBuilder = QueryBuilders.boolQuery();
        // 必须包含
        boolQueryBuilder.must(QueryBuilders.matchQuery("age", "30"));
        // 一定不含
        boolQueryBuilder.mustNot(QueryBuilders.matchQuery("name", "zhangsan"));
        // 可能包含
        boolQueryBuilder.should(QueryBuilders.matchQuery("sex", "男"));
        sourceBuilder.query(boolQueryBuilder);
        request.source(sourceBuilder);
        SearchResponse response = null;
        try {
            response = client.search(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        // 查询匹配
        SearchHits hits = response.getHits();
        System.out.println("took:" + response.getTook());
        System.out.println("timeout:" + response.isTimedOut());
        System.out.println("total:" + hits.getTotalHits());
        System.out.println("MaxScore:" + hits.getMaxScore());
        System.out.println("hits========>>");
        for (SearchHit hit : hits) {
            //输出每条查询的结果信息
            System.out.println(hit.getSourceAsString());
        }
        System.out.println("<<========");
    }
    /**
     * 请求体查询，范围查询 range
     */
    public static void queryBodyDocRange(RestHighLevelClient client){
        // 创建搜索请求对象
        SearchRequest request = new SearchRequest();
        request.indices("student");
        // 构建查询的请求体
        SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
        RangeQueryBuilder rangeQuery = QueryBuilders.rangeQuery("age");
        // 大于等于
        rangeQuery.gte("30");
        // 小于等于
        rangeQuery.lte("40");
        sourceBuilder.query(rangeQuery);
        request.source(sourceBuilder);
        SearchResponse response = null;
        try {
            response = client.search(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        // 查询匹配
        SearchHits hits = response.getHits();
        System.out.println("took:" + response.getTook());
        System.out.println("timeout:" + response.isTimedOut());
        System.out.println("total:" + hits.getTotalHits());
        System.out.println("MaxScore:" + hits.getMaxScore());
        System.out.println("hits========>>");
        for (SearchHit hit : hits) {
            //输出每条查询的结果信息
            System.out.println(hit.getSourceAsString());
        }
        System.out.println("<<========");
    }
    /**
     * 请求体查询，模糊查询 fuzzy
     */
    public static void queryBodyDocFuzzy(RestHighLevelClient client){
        // 创建搜索请求对象
        SearchRequest request = new SearchRequest();
        request.indices("student");
        // 构建查询的请求体
        SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
        sourceBuilder.query(QueryBuilders.fuzzyQuery("name","zhangsan").fuzziness(Fuzziness.ONE));
        request.source(sourceBuilder);
        SearchResponse response = null;
        try {
            response = client.search(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        // 查询匹配
        SearchHits hits = response.getHits();
        System.out.println("took:" + response.getTook());
        System.out.println("timeout:" + response.isTimedOut());
        System.out.println("total:" + hits.getTotalHits());
        System.out.println("MaxScore:" + hits.getMaxScore());
        System.out.println("hits========>>");
        for (SearchHit hit : hits) {
            //输出每条查询的结果信息
            System.out.println(hit.getSourceAsString());
        }
        System.out.println("<<========");
    }
    /**
     * 请求体查询，高亮查询 highlight
     */
    public static void queryBodyDocHighlight(RestHighLevelClient client){
        // 创建搜索请求对象
        SearchRequest request = new SearchRequest();
        request.indices("student");
        //构建高亮字段
        HighlightBuilder highlightBuilder = new HighlightBuilder();
        highlightBuilder.preTags("");//设置标签前缀
        highlightBuilder.postTags("");//设置标签后缀
        highlightBuilder.field("name");//设置高亮字段
        // 构建查询的请求体
        SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
        //设置高亮构建对象
        sourceBuilder.highlighter(highlightBuilder);
        //设置请求体
        request.source(sourceBuilder);
        //3.客户端发送请求，获取响应对象
        SearchResponse response = null;
        try {
            response = client.search(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        //4.打印响应结果
        SearchHits hits = response.getHits();
        System.out.println("took::"+response.getTook());
        System.out.println("time_out::"+response.isTimedOut());
        System.out.println("total::"+hits.getTotalHits());
        System.out.println("max_score::"+hits.getMaxScore());
        System.out.println("hits::::>>");
        for (SearchHit hit : hits) {
            String sourceAsString = hit.getSourceAsString();
            System.out.println(sourceAsString);
            //打印高亮结果
            Map<String, HighlightField> highlightFields = hit.getHighlightFields();
            System.out.println(highlightFields);
        }
        System.out.println("<<::::");
    }
    /**
     * 请求体查询，聚合查询
     */
    public static void queryBodyDocAggregation(RestHighLevelClient client){
        // 高亮查询
        SearchRequest request = new SearchRequest().indices("student");
        SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
        sourceBuilder.aggregation(AggregationBuilders.max("maxAge").field("age"));
        //设置请求体
        request.source(sourceBuilder);
        //3.客户端发送请求，获取响应对象
        SearchResponse response = null;
        try {
            response = client.search(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        //4.打印响应结果
        SearchHits hits = response.getHits();
        System.out.println(response);
    }
    /**
     * 请求体查询，分组统计
     */
    public static void queryBodyDocGroup(RestHighLevelClient client){
        // 高亮查询
        SearchRequest request = new SearchRequest().indices("student");
        SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
        sourceBuilder.aggregation(AggregationBuilders.terms("age_groupby").field("age"));
        //设置请求体
        request.source(sourceBuilder);
        //3.客户端发送请求，获取响应对象
        SearchResponse response = null;
        try {
            response = client.search(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            e.printStackTrace();
        }
        //4.打印响应结果
        SearchHits hits = response.getHits();
        System.out.println(response);
    }

}

三、Linux集群搭建

1. 单机环境

先搭建一个linux单机环境

将tar包上传到linux系统，然后解压缩

修改配置文件

cluster.name: elasticsearch #服务名称
node.name: node-1 # 结点名称
network.host: 0.0.0.0 # 主机地址
http.port: 9200 # 端口
cluster.initial_master_nodes: ["node-1"] # 注册主节点名称

更改系统配置

修改/etc/security/limits.conf文件(里面配置的es是文件目录，你根据自己文件目录更改，或者直接复制我的代码块，用*直接对所有文件配置)

vim /etc/security/limits.conf

#每个进程可以打开的文件数限制
* soft nofile 65536
* hard nofile 65536

编辑文件 /etc/security/limits.d/20-nproc.conf

vim /etc/security/limits.d/20-nproc.conf

修改/etc/sysctl.conf文件VMA（虚拟内存区域）的数量，为655360

vim /etc/sysctl.conf

# 一个进程可以拥有的VMA（虚拟内存区域）的数量，默认65536
vm.max_map_count=655360

重新加载

sysctl -p

因为es为了安全起见，不允许root用户访问，所以我们需要切换成非root用户操作es

使用root用户，给非root用户操作权限

chown -R hadoop100:hadoop100 /opt/module/elasticsearch-7.8.0

进入es安装目录，执行bin/elasticsearch

测试

2. 集群TODO

日后补充

四、重点

1. 核心概念

1. 索引

索引就类似新华字典的目录，可以通过偏旁部首等快速找到汉字

Elasticsearch的精髓，一切设计都是为了提高搜索效率

2. 文档

文档就是一条数据，可以被索引的基础信息单元

一个索引中，可以存储多个文档

3. 字段

对文档数据的不同数据，进行分类标识

4. 映射（Mapping）

mapping 是处理数据的方式和规则方面做一些限制，如：某个字段的数据类型、默认值、分析器、是否被索引等等

5. 分片（Shards）

Elasticsearch 提供了将索引划分成多份的能力，每一份就称之为分片

创建一个索引的时候,可以指定你想要的分片的数量,可以被放置到集群中的任何节点
上

允许你水平分割 / 扩展你的内容容量

允许你在分片之上进行分布式的、并行的操作，进而提高性能/吞吐量

被混淆的概念是，一个 Lucene 索引我们在 Elasticsearch 称作分片。一个Elasticsearch 索引是分片的集合。当 Elasticsearch 在索引中搜索的时候，他发送查询到每一个属于索引的分片(Lucene 索引)，然后合并每个分片的结果到一个全局的结果集。

6. 副本（Replicas）

Elasticsearch 允许你创建分片的一份或多份拷贝，这些拷贝叫做复制分片(副本)

在分片/节点失败的情况下，提供了高可用性。因为这个原因，注意到复制分片从不与原/主要（original/primary）分片置于同一节点上是非常重要的

扩展你的搜索量/吞吐量，因为搜索可以在所有的副本上并行运行

7. 分配（Allocation）

将分片分配给某个节点的过程，包括分配主分片或者副本。如果是副本，还包含从主分片复制数据的过程。这个过程是由 master 节点完成的

2. 单节点集群的不足，和多节点故障转移

我们创建users索引，并传递json，分配3个主分片和一个副本，就是每个主分片都有一个福本

{
    "settings" : {
        "number_of_shards" : 3,
        "number_of_replicas" : 1
    } 
}

分析一些单节点的问题

百度Elasticsearch-head插件，安装到浏览器即可

多节点

当集群中只有一个节点在运行时，意味着会有一个单点故障问题——没有冗余。幸运的是，我们只需再启动一个节点即可防止数据丢失。当你在同一台机器上启动了第二个节点时，只要它和第一个节点有同样的 cluster.name 配置，它就会自动发现集群并加入到其中。但是在不同机器上启动节点的时候，为了加入到同一集群，你需要配置一个可连接到的单播主机列表。之所以配置为使用单播发现，以防止节点无意中加入集群。只有在同一台机器上运行的节点才会自动组成集群

水平扩容

怎样为我们的正在增长中的应用程序按需扩容呢？当启动了第三个节点，我们的集群将会拥有三个节点的集群 : 为了分散负载而对分片进行重新分配

但是如果我们想要扩容超过 6 个节点怎么办呢？

主分片的数目在索引创建时就已经确定了下来。实际上，这个数目定义了这个索引能够存储的最大数据量。（实际大小取决于你的数据、硬件和使用场景。）但是，读操作——搜索和返回数据——可以同时被主分片或副本分片所处理，所以当你拥有越多的副本分片时，也将拥有越高的吞吐量

在运行中的集群上是可以动态调整副本分片数目的，我们可以按需伸缩集群。让我们把副本数从默认的 1 增加到 2

{
 "number_of_replicas" : 2
}

应对故障

为什么我们集群状态是 yellow 而不是 green 呢

虽然我们拥有所有的三个主分片，但是同时设置了每个主分片需要对应 2 份副本分片，而此时只存在一份副本分片。所以集群不能为 green 的状态，不过我们不必过于担心：如果我们同样关闭了 Node 2 ，我们的程序依然可以保持在不丢任何数据的情况下运行，因为Node 3 为每一个分片都保留着一份副本。

3. 路由计算和分片控制

路由计算

当索引一个文档的时候，文档会被存储到一个主分片中。 Elasticsearch 如何知道一个文档应该存放到哪个分片中呢？当我们创建文档时，它如何决定这个文档应当被存储在分片1 还是分片 2 中呢？首先这肯定不会是随机的，否则将来要获取文档的时候我们就不知道从何处寻找了。

实际上，这个过程是根据下面这个公式决定的：

所有的文档 API（ get 、 index 、 delete 、 bulk 、 update 以及 mget ）都接受一个叫做 routing 的路由参数，通过这个参数我们可以自定义文档到分片的映射。一个自定义的路由参数可以用来确保所有相关的文档——例如所有属于同一个用户的文档——都被存储到同一个分片中。

分片控制

我们可以发送请求到集群中的任一节点。每个节点都有能力处理任意请求。每个节点都知道集群中任一文档位置，所以可以直接将请求转发到需要的节点上。在下面的例子中，将所有的请求发送到 Node 1，我们将其称为协调节点(coordinating node)

当发送请求的时候，为了扩展负载，更好的做法是轮询集群中所有的节点

4. 写流程和读流程,以及更新流程

写流程

新建，索引和删除文档所需要的步骤顺序：

客户端向 Node 1 发送新建、索引或者删除请求。

节点使用文档的 _id 确定文档属于分片 0 。请求会被转发到 Node 3，因为分片 0 的主分片目前被分配在 Node 3 上。

Node 3 在主分片上面执行请求。如果成功了，它将请求并行转发到 Node 1 和 Node 2 的副本分片上。一旦所有的副本分片都报告成功, Node 3 将向协调节点报告成功，协调节点向客户端报告成功

在客户端收到成功响应时，文档变更已经在主分片和所有副本分片执行完成，变更是安全的。

有一些可选的请求参数允许您影响这个过程，可能以数据安全为代价提升性能。这些选项很少使用，因为 Elasticsearch 已经很快，但是为了完整起见，请参考下面图片：

新索引默认有 1 个副本分片，这意味着为满足规定数量应该需要两个活动的分片副本。但是，这些默认的设置会阻止我们在单一节点上做任何事情。为了避免这个问题，要求只有当 number_of_replicas 大于 1 的时候，规定数量才会执行

读流程

从主分片或者副本分片检索文档的步骤顺序

客户端向 Node 1 发送获取请求。

节点使用文档的 _id 来确定文档属于分片 0 。分片 0 的副本分片存在于所有的三个节点上。在这种情况下，它将请求转发到 Node 2 。

Node 2 将文档返回给 Node 1 ，然后将文档返回给客户端。

在处理读取请求时，协调结点在每次请求的时候都会通过轮询所有的副本分片来达到负载均衡。在文档被检索时，已经被索引的文档可能已经存在于主分片上但是还没有复制到副本分片。在这种情况下，副本分片可能会报告文档不存在，但是主分片可能成功返回文档。一旦索引请求成功返回给用户，文档在主分片和副本分片都是可用的

更新流程

部分更新一个文档的步骤如下

客户端向 Node 1 发送更新请求。

它将请求转发到主分片所在的 Node 3 。

Node 3 从主分片检索文档，修改 _source 字段中的 JSON ，并且尝试重新索引主分片的文档。如果文档已经被另一个进程修改，它会重试步骤 3 ，超过 retry_on_conflict 次后放弃。

如果 Node 3 成功地更新文档，它将新版本的文档并行转发到 Node 1 和 Node 2 上的副本分片，重新建立索引。一旦所有副本分片都返回成功， Node 3 向协调节点也返回成功，协调节点向客户端返回成功

当主分片把更改,转发到副本分片时，它不会转发更新请求。相反，它转发完整文档的新版本。请记住，这些更改将会异步转发到副本分片，并且不能保证它们以发送它们相同的顺序到达。如果 Elasticsearch 仅转发更改请求，则可能以错误的顺序应用更改，导致得到损坏的文档。

5. 多文档的操作流程

mget 和 bulk API 的模式类似于单文档模式。区别在于协调节点知道每个文档存在于哪个分片中。它将整个多文档请求分解成每个分片的多文档请求，并且将这些请求并行转发到每个参与节点。

用单个 mget 请求取回多个文档所需的步骤顺序(可以对 docs 数组中每个文档设置 routing 参数)

客户端向 Node 1 发送 mget 请求

Node 1 为每个分片构建多文档获取请求，然后并行转发这些请求到托管在每个所需的主分片或者副本分片的节点上。一旦收到所有答复， Node 1 构建响应并将其返回给客户端

bulk API，允许在单个批量请求中执行多个创建、索引、删除和更新请求,按如下步骤顺序执行

客户端向 Node 1 发送 bulk 请求。

Node 1 为每个节点创建一个批量请求，并将这些请求并行转发到每个包含主分片的节点主机。

主分片一个接一个按顺序执行每个操作。当每个操作成功时，主分片并行转发新文档（或删除）到副本分片，然后执行下一个操作。一旦所有的副本分片报告所有操作成功，该节点将向协调节点报告成功，协调节点将这些响应收集整理并返回给客户端

6. 分片原理和倒排索引

分片

分片是 Elasticsearch 最小的工作单元。但是究竟什么是一个分片，它是如何工作的？传统的数据库每个字段存储单个值，但这对全文检索并不够。文本字段中的每个单词需要被搜索，对数据库意味着需要单个字段有索引多值的能力。最好的支持是一个字段多个值需求的数据结构是倒排索引

倒排索引

Elasticsearch 使用一种称为倒排索引的结构，它适用于快速的全文搜索

先说所谓的正向索引，就是搜索引擎会将待搜索的文件都对应一个文件 ID，搜索时将这个ID 和搜索关键字进行对应，形成 K-V 对，然后对关键字进行统计计数

但是互联网上收录在搜索引擎中的文档的数目是个天文数字，这样的索引结构根本无法满足实时返回排名结果的要求

所以，搜索引擎会将正向索引重新构建为倒排索引，即把文件ID对应到关键词的映射转换为关键词到文件ID的映射，每个关键词都对应着一系列的文件，这些文件中都出现这个关键词

举个倒排索引的例子

一个倒排索引由文档中所有不重复词的列表构成，对于其中每个词，有一个包含它的文档列表。例如，假设我们有两个文档，每个文档的 content 域包含如下内容：

The quick brown fox jumped over the lazy dog

Quick brown foxes leap over lazy dogs in summer

为了创建倒排索引，我们首先将每个文档的 content 域拆分成单独的词（我们称它为词条或 tokens ），创建一个包含所有不重复词条的排序列表，然后列出每个词条出现在哪个文档。结果如下所示

现在，如果我们想搜索 quick brown ，我们只需要查找包含每个词条的文档


为了解决搜索+Quick和+fox 这样的索引查找不到文档的问题（Quick和quick是我们都希望检索到的，但Q和q不同，会检索不到），我们需要将词条规范为标准模式，就是找到与用户搜索的词条不完全一致，但具有足够相关性的文档



此时我们索引的Quick就不复存在了（因为标准化成quick了），那么如果我们还索引+Quick，就找不到了，所有此时我们对搜索的字符串使用与 content 域相同的标准化规则，会变成查询+quick +fox，这样两个文档都会匹配！分词和标准化的过程称为分析

你只能搜索在索引中出现的词条，所以索引文本和查询字符串必须标准化为相
同的格式

7. 文档搜索

早期的全文检索会为整个文档集合建立一个很大的倒排索引并将其写入到磁盘。一旦新的索引就绪，旧的就会被其替换，这样最近的变化便可以被检索到。

倒排索引被写入磁盘后是不可改变的:它永远不会修改

不变性有重要的价值

不需要锁。如果你从来不更新索引，你就不需要担心多进程同时修改数据的问题。

一旦索引被读入内核的文件系统缓存，便会留在哪里，由于其不变性。只要文件系统缓存中还有足够的空间，那么大部分读请求会直接请求内存，而不会命中磁盘。这提供了很大的性能提升。

其它缓存(像 filter 缓存)，在索引的生命周期内始终有效。它们不需要在每次数据改变时被重建，因为数据不会变化。

写入单个大的倒排索引允许数据被压缩，减少磁盘 I/O 和需要被缓存到内存的索引的使用量。

当然，一个不变的索引也有不好的地方。主要事实是它是不可变的! 你不能修改它。如果你需要让一个新的文档可被搜索，你需要重建整个索引。这要么对一个索引所能包含的数据量造成了很大的限制，要么对索引可被更新的频率造成了很大的限制

8.文档刷写和文档合并

动态更新索引

如何在保留不变性的前提下实现倒排索引的更新？

用更多的索引。通过增加新的补充索引来反映新近的修改，而不是直接重写整个倒排索引。每一个倒排索引都会被轮流查询到，从最早的开始查询完后再对结果进行合并

Elasticsearch 基于 Lucene, 这个 java 库引入了按段搜索的概念.每一段本身都是一个倒排索引，但索引在 Lucene 中除表示所有段的集合外,还增加了提交点的概念 — 一个列出了所有已知段的文件

按段搜索会以如下流程执行

新文档被收集到内存索引缓存

不时地, 缓存被提交

一个新的段—一个追加的倒排索引—被写入磁盘。

一个新的包含新段名字的提交点被写入磁盘

磁盘进行同步 — 所有在文件系统缓存中等待的写入都刷新到磁盘，以确保它们被写入物理文件

新的段被开启，让它包含的文档可见以被搜索

内存缓存被清空，等待接收新的文档

当一个查询被触发，所有已知的段按顺序被查询。词项统计会对所有段的结果进行聚合，以保证每个词和每个文档的关联都被准确计算。这种方式可以用相对较低的成本将新文档添加到索引。

段是不可改变的，所以既不能从把文档从旧的段中移除，也不能修改旧的段来进行反映文档的更新。取而代之的是，每个提交点会包含一个 .del 文件，文件中会列出这些被删除文档的段信息。当一个文档被 “删除” 时，它实际上只是在 .del 文件中被标记删除。一个被标记删除的文档仍然可以被查询匹配到，但它会在最终结果被返回前从结果集中移除

文档更新也是类似的操作方式：当一个文档被更新时，旧版本文档被标记删除，文档的新版本被索引到一个新的段中。可能两个版本的文档都会被一个查询匹配到，但被删除的那个旧版本文档在结果集返回前就已经被移除

近实时搜索

随着按段（per-segment）搜索的发展，一个新的文档从索引到可被搜索的延迟显著降低了,新文档在几分钟之内即可被检索，但这样还是不够快。磁盘在这里成为了瓶颈

每提交一次新段，都要刷写到磁盘，虽然保证数据安全性，但是性能问题很大

Lucene 允许新段被写入和打开—使其包含的文档在未进行一次完整提交时便对搜索可见。这种方式比进行一次提交代价要小得多，并且在不影响性能的前提下可以被频繁地执行。在ES中写入和打开一个新段的轻量的过程叫做 refresh，它的刷新时间可以配置，当然也可以请求api/users/_refresh手动刷新

refresh_interval 可以在既存索引上进行动态更新。 在生产环境中，当你正在建立一个大的
新索引时，可以先关闭自动刷新，待开始使用该索引时，再把它们调回来
 # 关闭自动刷新
PUT /users/_settings
{ "refresh_interval": -1 } 
# 每一秒刷新
PUT /users/_settings
{ "refresh_interval": "1s" }

持久化变更

有了近实时搜索，我们就不能保证数据在断电甚至是程序正常退出之后依然存在，

即使通过每秒刷新（refresh）实现了近实时搜索，我们仍然需要经常进行完整提交来确保能从失败中恢复。但在两次提交之间发生变化的文档怎么办？我们也不希望丢失掉这些数据。Elasticsearch 增加了一个 translog ，或者叫事务日志，在每一次对Elasticsearch 进行操作时均进行了日志记录

持久化流程

首先我们要写入段落，此时将其提交Segment，近实时搜索

同时Translog记录日志

然后先刷到系统缓存区，refresh代表此过程，可以调整每次刷新时长

系统缓存区将内容刷入磁盘

日志也会刷入磁盘，但不经过缓冲区

9. 文档分析和IK分词器

将一块文本分成适合于倒排索引的独立的词条

将这些词条统一化为标准格式以提高它们的“可搜索性”，或者 recall

分析器执行上面的工作。分析器实际上是将三个功能封装到了一个包里

字符过滤器:首先，字符串按顺序通过每个字符过滤器。他们的任务是在分词前整理字符串。一个字符过滤器可以用来去掉 HTML，或者将 & 转化成 and

分词器:其次，字符串被分词器分为单个的词条。一个简单的分词器遇到空格和标点的时候，可能会将文本拆分成词条

Token 过滤器:最后，词条按顺序通过每个 token 过滤器。这个过程可能会改变词条（例如，小写化Quick ），删除词条（例如，像 a， and， the 等无用词），或者增加词条（例如，像 jump 和 leap 这种同义词）

内置分析器

下面列出最重要的分析器我,我们看看每个分析器会从"Set the shape to semi-transparent by calling set_trans(5)"这个字符串得到哪些词条

标准分析器

标准分析器是 Elasticsearch 默认使用的分析器。它是分析各种语言文本最常用的选择。它根据 Unicode 联盟定义的单词边界划分文本。删除绝大部分标点。最后，将词条小写。

它会产生:set, the, shape, to, semi, transparent, by, calling, set_trans, 5

简单分析器

简单分析器在任何不是字母的地方分隔文本，将词条小写。

它会产生：set, the, shape, to, semi, transparent, by, calling, set, trans

空格分析器

空格分析器在空格的地方划分文本。

它会产生：Set, the, shape, to, semi-transparent, by, calling, set_trans(5)

语言分析器

特定语言分析器可用于很多语言。它们可以考虑指定语言的特点。例如，英语分析器附带了一组英语无用词（常用单词，例如 and 或者 the ，它们对相关性没有多少影响），它们会被删除。由于理解英语语法的规则，这个分词器可以提取英语单词的词干。

会产生下面的词条：set, shape, semi, transpar, call, set_tran, 5

注意看 transparent、 calling 和 set_trans 已经变为词根格式

IK分词器

因为默认分词器对中文支持不好，所以我们需要使用IK分词器，这个分词器对中文分词支持很好

下载地址：https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v7.8.0

将解压后的后的文件夹放入 ES 根目录下的 plugins 目录下，重启 ES 即可使用

//下面可以测试ik分词器的效果
# GET http://localhost:9200/_analyze
{
"text":"测试单词",
"analyzer":"ik_max_word"
}
ik_max_word：会将文本做最细粒度的拆分
ik_smart：会将文本做最粗粒度的拆分

扩展词汇（自定义一些搜索单词，比如弗雷尔卓德）

首先进入 ES 根目录中的 plugins 文件夹下的 ik 文件夹，进入 config 目录，创建 custom.dic文件，写入弗雷尔卓德。同时打开 IKAnalyzer.cfg.xml 文件，将新建的custom.dic 配置其中，重启 ES 服务器

自定义分词器

# PUT http://localhost:9200/my_index
{
 "settings": {
	 "analysis": {
		 "char_filter": {
			 "&_to_and": {//自定义字符过滤器
				 "type": "mapping",//类型为映射
				 "mappings": [ "&=> and "]//将&映射为and
	 }},
	 "filter": {//定义过滤器
		 "my_stopwords": {
			 "type": "stop",//类型为不匹配
			 "stopwords": [ "the", "a" ]//遇到the a 不作为分词处理
	 }},
	 "analyzer": {
		 "my_analyzer": {//分词器名字
			 "type": "custom",//类型为分词器
			 "char_filter": [ "html_strip", "&_to_and" ],//使用的字符过滤器
			 "tokenizer": "standard",//使用标准分词器
			 "filter": [ "lowercase", "my_stopwords" ]//使用的过滤器
	 }}
}}}

10 客户端管理工具

Kibana 是一个免费且开放的用户界面，能够让你对 Elasticsearch 数据进行可视化，并让你在 Elastic Stack 中进行导航。你可以进行各种操作，从跟踪查询负载，到理解请求如何流经你的整个应用，都能轻松完成。

1.下载：
https://www.elastic.co/cn/downloads/kibana
https://artifacts.elastic.co/downloads/kibana/kibana-7.8.0-windows-x86_64.zip
2. 修改 config/kibana.yml 文件

# 默认端口
server.port: 5601
# ES 服务器的地址
elasticsearch.hosts: ["http://localhost:9200"]
# 索引名
kibana.index: ".kibana"
# 支持中文
i18n.locale: "zh-CN"

Windows 环境下执行 bin/kibana.bat 文件

通过浏览器访问 : http://localhost:5601

五、使用集成框架操作Elasticsearch

Spring Data 是一个用于简化数据库、非关系型数据库、索引库访问，并支持云服务的开源框架。其主要目标是使得对数据的访问变得方便快捷，并支持 map-reduce 框架和云计算数据服务。 Spring Data 可以极大的简化 JPA（Elasticsearch„）的写法，可以在几乎不用写实现的情况下，实现对数据的访问和操作。除了 CRUD 外，还包括如分页、排序等一些常用的功能

spring data常用模块

官网查找版本对应

接下来只需要创建maven项目搭建环境即可

创建项目，引入依赖

    <parent>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-parent</artifactId>
        <version>2.3.6.RELEASE</version>
        <relativePath/>
    </parent>

    <dependencies>
        <dependency>
            <groupId>org.projectlombok</groupId>
            <artifactId>lombok</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-data-elasticsearch</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-devtools</artifactId>
            <scope>runtime</scope>
            <optional>true</optional>
        </dependency>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-test</artifactId>
            <scope>test</scope>
        </dependency>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-test</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework</groupId>
            <artifactId>spring-test</artifactId>
        </dependency>
        <!-- junit 单元测试 -->
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
        </dependency>
    </dependencies>

配置文件

elasticsearch:
  host: 127.0.0.1
  port: 9200
logging:
  level:
    com:
      yzpnb:
        es: debug # 配置com.yzpnb.es这个路径下的日志等级

配置类

import lombok.Data;
import org.apache.http.HttpHost;
import org.elasticsearch.client.RestClient;
import org.elasticsearch.client.RestClientBuilder;
import org.elasticsearch.client.RestHighLevelClient;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.context.annotation.Configuration;
import org.springframework.data.elasticsearch.config.AbstractElasticsearchConfiguration;
@Configuration
@Data
public class ElasticsearchConfig extends AbstractElasticsearchConfiguration {
    @Value("${elasticsearch.host}")
    private String host ;
    @Value("${elasticsearch.port}")
    private Integer port ;
    //重写父类方法
    @Override
    public RestHighLevelClient elasticsearchClient() {
        RestClientBuilder builder = RestClient.builder(new HttpHost(host, port));
        RestHighLevelClient restHighLevelClient = new RestHighLevelClient(builder);
        return restHighLevelClient;
    }
}

实体类，映射索引和文档

package com.yzpnb.es.entity;

import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;
import lombok.ToString;
import org.springframework.data.annotation.Id;
import org.springframework.data.elasticsearch.annotations.Document;
import org.springframework.data.elasticsearch.annotations.Field;
import org.springframework.data.elasticsearch.annotations.FieldType;
@Data
@NoArgsConstructor
@AllArgsConstructor
@ToString//上面4个注解是lomback的，自动生成get、set、toString、构造方法
@Document(indexName = "product", shards = 3, replicas = 1)//映射到ES，表示此类是product索引的映射，主分片3个，副本1个，每个主片，都有一个副本
public class Product {
    //必须有 id,这里的 id 是全局唯一的标识，等同于 es 中的"_id"
    @Id
    private Long id;//商品唯一标识
    /**
     * type : 字段数据类型
     * analyzer : 分词器类型
     * index : 是否索引(默认:true)
     * Keyword : 短语,不进行分词
     */
    @Field(type = FieldType.Text, analyzer = "ik_max_word")
    private String title;//商品名称
    @Field(type = FieldType.Keyword)
    private String category;//分类名称
    @Field(type = FieldType.Double)
    private Double price;//商品价格
    @Field(type = FieldType.Keyword, index = false)
    private String images;//图片地址
}

dao层

import com.yzpnb.es.entity.Product;
import org.springframework.data.elasticsearch.repository.ElasticsearchRepository;
import org.springframework.stereotype.Repository;
@Repository
public interface ProductDao extends ElasticsearchRepository<Product,Long> {
}

启动类

测试类

import com.yzpnb.es.Application;
import com.yzpnb.es.dao.ProductDao;
import com.yzpnb.es.entity.Product;
import org.elasticsearch.index.query.QueryBuilders;
import org.elasticsearch.index.query.TermQueryBuilder;
import org.junit.Test;
import org.junit.runner.RunWith;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.boot.test.context.SpringBootTest;
import org.springframework.data.domain.Page;
import org.springframework.data.domain.PageRequest;
import org.springframework.data.domain.Sort;
import org.springframework.data.elasticsearch.core.ElasticsearchRestTemplate;
import org.springframework.test.context.junit4.SpringRunner;
import java.util.ArrayList;
import java.util.List;
@RunWith(SpringRunner.class)
@SpringBootTest(classes = Application.class)
public class SpringDataESIndexTest {
    //注入 ElasticsearchRestTemplate
    @Autowired
    private ElasticsearchRestTemplate elasticsearchRestTemplate;

    /**
     * 索引相关操作
     */
    //创建索引并增加映射配置,如果ES中现在没有我们实体类隐射的Product索引，那么会自动创建
    @Test
    public void createIndex(){
        //创建索引，系统初始化会自动创建索引
        System.out.println("创建索引");
    }
    @Test
    public void deleteIndex(){
        //创建索引，系统初始化会自动创建索引
        boolean flg = elasticsearchRestTemplate.deleteIndex(Product.class);
        System.out.println("删除索引 = " + flg);
    }
    /**
     * 文档相关操作
     */
    @Autowired
    private ProductDao productDao;
    /**
     * 新增
     */
    @Test
    public void save(){
        Product product = new Product();
        product.setId(2L);
        product.setTitle("华为手机");
        product.setCategory("手机");
        product.setPrice(2999.0);
        product.setImages("http://www.atguigu/hw.jpg");
        productDao.save(product);
    }
    //修改
    @Test
    public void update(){
        Product product = new Product();
        product.setId(1L);
        product.setTitle("小米 2 手机");
        product.setCategory("手机");
        product.setPrice(9999.0);
        product.setImages("http://www.atguigu/xm.jpg");
        productDao.save(product);
    }
    //根据 id 查询
    @Test
    public void findById(){
        Product product = productDao.findById(1L).get();
        System.out.println(product);
    }
    //查询所有
    @Test
    public void findAll(){
        Iterable<Product> products = productDao.findAll();
        for (Product product : products) {
            System.out.println(product);
        }
    }
    //删除
    @Test
    public void delete(){
        Product product = new Product();
        product.setId(1L);
        productDao.delete(product);
    }
    //批量新增
    @Test
    public void saveAll(){
        List<Product> productList = new ArrayList<>();
        for (int i = 0; i < 10; i++) {
            Product product = new Product();
            product.setId(Long.valueOf(i));
            product.setTitle("["+i+"]小米手机");
            product.setCategory("手机");
            product.setPrice(1999.0+i);
            product.setImages("http://www.atguigu/xm.jpg");
            productList.add(product);
        }
        productDao.saveAll(productList);
    }
    //分页查询
    @Test
    public void findByPageable(){
        //设置排序(排序方式，正序还是倒序，排序的 id)
        Sort sort = Sort.by(Sort.Direction.DESC,"id");
        int currentPage=0;//当前页，第一页从 0 开始，1 表示第二页
        int pageSize = 5;//每页显示多少条
        //设置查询分页
        PageRequest pageRequest = PageRequest.of(currentPage, pageSize,sort);
        //分页查询
        Page<Product> productPage = productDao.findAll(pageRequest);
        for (Product Product : productPage.getContent()) {
            System.out.println(Product);
        }
    }
    /**
     * 查询相关操作
     */

    /**
     * term 查询
     * search(termQueryBuilder) 调用搜索方法，参数查询构建器对象
     */
    @Test
    public void termQuery(){
        TermQueryBuilder termQueryBuilder = QueryBuilders.termQuery("title", "机");
        Iterable<Product> products = productDao.search(termQueryBuilder);
        for (Product product : products) {
            System.out.println(product);
        }
    }
    /**
     * term 查询加分页
     */
    @Test
    public void termQueryByPage(){
        int currentPage= 0 ;
        int pageSize = 5;
        //设置查询分页
        PageRequest pageRequest = PageRequest.of(currentPage, pageSize);
        TermQueryBuilder termQueryBuilder = QueryBuilders.termQuery("title", "小");
                Iterable<Product> products = productDao.search(termQueryBuilder,pageRequest);
        for (Product product : products) {
            System.out.println(product);
        }
    }
}

你可能感兴趣的:(java框架,java,搜索引擎,elasticsearch)

Spring Boot01(注解、)---java八股凉漠 java八股 java spring boot 开发语言
SpringBoot中常用注解及其底层实现1、@SpringBootApplication注解：@SpringBootApplication注解：这个注解标识了一个SpringBoot工程，它实际上是另外三个注解的组合，这三个注解是：a@SpringBootConfiguration：这个注解实际就是一个@Configuration，表示启动类也是一个配置类b@EnableAutoConfigur
Vue.js 组件开发：构建高效、可重用的用户界面 m1chiru vue.js
Vue.js组件开发：构建高效、可重用的用户界面Vue.js是一个流行的JavaScript框架，它致力于通过简单的API和高度响应的设计，帮助开发者构建高效、动态的前端应用。在Vue.js中，组件是构建用户界面的核心单元。它们使得应用的结构更加模块化、可维护且易于重用。在这篇博客中，我们将深入探讨Vue.js组件的开发方法，包括组件的基本概念、创建、传递数据、事件处理以及组件之间的通信等关键内容
用数组实现栈(java) JD_LONG 算法数据结构 java 栈
数据结构与算法学习(java)-栈题目一:用数组实现栈要求:*用数组形式实栈的基本功能,入栈,出栈及显示栈元素功能思路:1.准备一个数组int[]stack;需要变量maxSize表示栈的大小2.入栈(push):需要一个变量(top)来表示栈顶,初始化为-1;当有数据入栈时,top增加,同时将数据传递给stack[top].3.出栈(pop):需要定义变量来接住stack[top],然后top减
一些流行的拖拽化和低代码平台(汇总) 视频砖家文章存档低代码低代码平台
一些流行的拖拽化和低代码平台，这些工具可以帮助用户快速构建应用程序，无需深入的编程知识：1.开源拖拽库dragula：一款强大且兼容性极好的拖拽排序库，支持多种框架，如vanillaJavaScript、Angular、React等。Interact.js：提供拖拽、调整尺寸和多点触摸手势功能，适用于现代浏览器。react-dnd：React组件库，用于实现拖拽功能。Sortable：适用于多种框
python异常处理链与自定义异常体系设计懒大王爱吃狼 python python 开发语言 linux 数据库 python学习 Python基础
在Python中，异常处理链和自定义异常体系是两个重要的概念，它们有助于更好地管理程序中的错误和异常情况。异常处理链异常处理链指的是在捕获一个异常后，能够将其信息保留并传递给另一个异常或日志系统。这在多层调用或复杂系统中尤其有用，因为它允许你追踪异常最初发生的位置，同时也可以在每一层添加额外的上下文信息。Python本身并不直接支持异常链的某些高级特性（如Java中的initCause方法），但你
蓝桥杯 Java B 组之总结与模拟题练习计算机小白一个蓝桥杯 java 职场和发展数据结构
蓝桥杯JavaB组-第七天：周总结与模拟题练习Day7：周总结与模拟题练习在这一周的学习中，我们已经接触了动态规划的基本概念和常见应用。今天，我们将通过刷一些蓝桥杯的模拟题，来熟悉并巩固所学的知识，特别是动态规划的问题。一、模拟题：Fibonacci数列求余题目描述：给定正整数n，求斐波那契数列的第n项，并计算其对一个数m的余数。即：f(n)f(n)%m例如：输入n=10，m=100输出：f(10
Java CopyOnWriteArrayList 源码分析及使用案例铁甲小宝摸鱼 Java面试八股文 java windows 开发语言
CopyOnWriteArrayList是Java中一种线程安全的List实现，它通过在每次修改时复制底层数组来实现线程安全。本文将详细分析CopyOnWriteArrayList的源码，并结合具体使用案例来展示其使用场景和优缺点。一、CopyOnWriteArrayList简介CopyOnWriteArrayList是java.util.concurrent包中的一个类，适用于读多写少的场景。它
智能图像处理平台：技术融合与实践的结晶顾北辰20 智能图像处理平台图像处理人工智能
目录项目目标项目功能用户模块图像处理模块异步任务模块技术栈数据库设计核心功能实现方式图片上传图片处理异步任务项目扩展近日DeepSeek很火，我让他给我出了个小项目练练手，带大家一起做一下，可做为毕业设计参考。在当今数字化时代，图像处理技术广泛应用于各个领域，从医学影像到社交媒体，其重要性不言而喻。本文将介绍一个智能图像处理平台的练手项目，旨在巩固Java、MySQL、SpringBoot、Red
前端构建工具——Webpack和Vite的主要区别像素检测仪前端前端 webpack
目录1.设计理念2.性能表现3.使用场景4.配置复杂度5.生态系统6.性能对比总结7.选择建议1.设计理念Webpack设计理念：Webpack是一个通用的模块打包工具，它将项目中的各种资源（如JavaScript、CSS、图片等）视为模块，并通过loader和plugin进行处理和打包。适用范围：适用于复杂项目，支持高度定制化，适合需要精细控制构建过程的场景。Vite设计理念：Vite（法语“快
ffmpeg-cli-wrapper操作ffmpeg的工具 NaughtyBo 视频&流媒体 ffmpeg
学习链接ffmpeg-cli-wrapper-内部封装了操作ffmpeg命令的java类库，它提供了一些类和方法，可以方便地构建和执行ffmpeg命令，而不需要直接操作字符串或进程。并且支持异步执行和进度监听springboot-ffmpeg-m3u8-convertor-gitee代码-springboot+ffmpeg，将视频转换为m3u8格式。支持.mp4|.flv|.avi|.mov|.w
利用javaCV 将视频转为m3u8格式 daqinzl 流媒体视频音频 ffmpeg javacv 视频转m3u8
参考链接https://blog.csdn.net/laow1314/article/details/128797915
百万架构师第三十九课：RabbitMq：Linux安装RabbitMq｜JavaGuide 后端
来源：https://javaguide.netRPM包安装RabbitMQRabbitMQ的安装非常简单，由于RabbitMQ依赖于Erlang，所以需要先安装Erlang，解决依赖关系后，就可以安装RabbitMQ了。注意，在安装Erlang前，需要先安装socat安装socat[root@nogeek]#yum-yinstallsocat下载RPM包RabbitMQ：http://www.r
在IntelliJIDEA中使用Gradle创建Web项目的步骤大G哥前端 intellij-idea java ide
1.打开IntelliJIDEA启动IntelliJIDEA。2.创建新项目点击File>New>Project。在弹出的窗口中，选择Gradle作为项目类型。确保Java被选中。点击Next。3.配置项目GroupId:输入你的组织或项目组ID(例如：com.example)。ArtifactId:输入项目名称(例如：mywebapp)。点击Next。4.配置项目名称和位置Projectname
Java 基于 SpringBoot+Vue 的动漫平台（附源码，文档）程序员徐师兄 java spring boot vue.js 动漫平台动漫网站
博主介绍：✌程序员徐师兄、8年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战*✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《500套》Java微信小程序项目实战《200套》Python项目实战《200套
学习笔记分享-快速掌握前端-html进阶（利用telnet发送json请求、利用telnet发送multipart请求） 2301_81243975 前端学习笔记
前言图片上面的personal表示只有图片上面的一行语句是解释图片内容的、local表示这个图片所在标题下的所有语句都是解释图片内容的、global表示有多个标题下的所有语句都是解释图片内容的我是一名大二的学生，学了差不多一年java技术栈了，想记录一下自己对知识点的心得，目前还是个小白，期望大佬们可以指出我笔记中的不足之处、对知识点的认知错误、笔记结构的混乱等这些图片内容都是在观看黑马课程时的视
学习笔记分享-数据结构与算法-图-Dijkstra（算法描述、算法实现） 2301_81243975 算法学习笔记
前言图片上面的personal表示只有图片上面的一行语句是解释图片内容的、local表示这个图片所在标题下的所有语句都是解释图片内容的、global表示有多个标题下的所有语句都是解释图片内容的我是一名大二的学生，学了差不多一年java技术栈了，想记录一下自己对知识点的心得，目前还是个小白，期望大佬们可以指出我笔记中的不足之处、对知识点的认知错误、笔记结构的混乱等这些图片内容都是在观看黑马课程时的视
Webpack 基础入门懒羊羊我小弟前端工程化 webpack rust 前端 es6 node.js
一、Webpack是什么Webpack是一款现代JavaScript应用程序的静态模块打包工具。在Web开发中，我们的项目会包含各种类型的文件，如JavaScript、CSS、图片等。Webpack可以将这些文件打包成一个或多个文件，以便在浏览器中高效加载。它就像是一个超级管家，把项目中的各种资源整理打包，让它们能更好地协同工作。二、为什么要使用Webpack代码拆分：可以将代码拆分成多个块，实现
Elasticsearch详解久梦歌行 elasticsearch jenkins 大数据
Elasticsearch是什么Elasticsearch是使用Lucene为基础建立的开源可用全文搜索引擎，它可以快速地储存、搜索和分析海量数据Elasticsearch的特点和传统的关系数据库对比关系型数据库查询性能，数据量超过百万级千万级之后下降厉害，本质是索引的算法效率不行，B+树算法不如倒排索引算法高效。关系型数据库索引最左原则限制，查询条件字段不能任意组合，否则索引失效，相反Elast
【Java线程中断】线程中断后为什么要调用interrupt()? 星星点点洲 Java java
我们在处理中断异常时InterruptedException，往往会调用Thread.currentThread().interrupt()，你知道这么做的目的和用处吗？这是Java多线程编程中一个重要的实践，主要原因有以下：interrupt为了继续传递中断信号1.恢复中断状态当线程在阻塞方法（如sleep()、wait()、join()）中被中断时，JVM会做两件事：抛出Interrupted
Maven 构建分发包与依赖管理 drebander Maven maven java
Maven是Java开发中广泛使用的构建和依赖管理工具，它不仅能帮助开发者高效地构建项目，还提供了强大的依赖管理和版本控制功能。通过Maven，你可以轻松地构建并发布JAR、WAR等分发包，并管理不同版本的依赖。本文将讲解如何使用Maven构建并发布JAR/WAR包，以及如何管理不同的发布版本，包括如何配置发布仓库、版本号管理和依赖范围。1.Maven构建分发包（JAR/WAR）1.1JAR包构建
Windows环境下es8的集群部署想养一只萨摩耶～ Elasticsearch elasticsearch 大数据服务器
原创文章：Windows环境下es8的集群部署–编程屋目录1相关概念1.1单机集群1.2集群Cluster1.3节点Node2Windows下部署2.1节点node-10012.2节点node-10022.3节点node-10031相关概念1.1单机集群单台Elasticsearch服务器提供服务，往往都有最大的负载能力，超过这个阀值，服务器新能就会大大降低不可用，所以生产环境中，一般都是运行在指
validation 实现参数校验程序员老王wd java
简述在Java中，参数校验是非常重要的，因为它可以确保方法或函数在执行时接收到的参数是合法的，有效的，从而提高代码的健壮性和安全性。参数校验可以防止无效的输入导致的异常或错误，同时也能减少因为无效参数导致的安全漏洞Java中的参数校验可以通过手动编写校验逻辑来实现，但这样会增加代码的复杂度和重复性。为了简化参数校验的实现，可以使用ValidationAPI，它是JavaEE平台的一部分，提供了一套
Java 编码系列：集合框架（List、Set、Map 及其常用实现类） pjx987 java编码 java list map
引言在Java开发中，集合框架是不可或缺的一部分，它提供了存储和操作一组对象的工具。Java集合框架主要包括List、Set和Map接口及其常用的实现类。正确理解和使用这些集合类不仅可以提高代码的可读性和性能，还能避免一些常见的错误。本文将深入探讨Java集合框架的底层原理，并结合大厂的最佳实践，帮助读者掌握这些核心概念。1.List接口及其常用实现类1.1基本概念List接口表示一个有序的集合，
Java程序设计（五）：基于SpringBoot+Vue的苗族文化分享平台的设计与实现人工智能_SYBH 2025年java程序设计 java spring boot vue.js
1.引言随着互联网技术的发展，文化传承与传播方式发生了巨大的变革。传统文化的传承不再仅依赖于线下活动，而是越来越多地通过数字化平台进行传播。为了促进苗族文化的传承与推广，本文设计并实现了一个基于SpringBoot和Vue的苗族文化分享平台。该平台通过现代化的技术架构，提供了多种功能模块，包括公告管理、文化遗产管理、资源管理、活动管理、跨文化交流等，既为管理员提供便捷的管理工具，也为普通用户提供了
Elasticsearch【复合搜索、结果排序、分页查询、高亮查询、SQL查询】(四)-全面详解（学习总结---从入门到深化）童小纯中间件大全---全面详解 jenkins 运维 elasticsearch 搜索引擎
目录Elasticsearch搜索文档_复合搜索Elasticsearch搜索文档_结果排序Elasticsearch搜索文档_分页查询Elasticsearch搜索文档_高亮查询Elasticsearch搜索文档_SQL查询原生JAVA操作ES_搭建项目原生JAVA操作ES_索引操作Elasticsearch搜索文档_复合搜索GET/索引/_search{"query":{"bool":{//必
探索Node.js的原生插件新境界：使用`node-gyp` 洪新龙
探索Node.js的原生插件新境界：使用node-gypnode-gypNode.jsnativeaddonbuildtool项目地址:https://gitcode.com/gh_mirrors/no/node-gyp在Node.js的生态系统中，将高性能的C/C++代码融入到JavaScript世界已经成为提升应用性能的关键手段。今天，我们要向大家隆重推荐一个不可或缺的工具——node-gyp
_05JavaScript The_era_achievs_hero 学习前端 js
第五次网课1.JavaScript的书写位置内部JS//页面弹出警示框alert('你好,js~')外部JS（最多）内联（行内）(以后vue框架会用这种模式）点我月薪过万2.JavaScript的注释与结束符单行注释符号：//ctrl+/多行注释符号：/**/shift+alt+a结束符用；表示结束可写可不写，要么全都写，要么全不写vue.js不加分号3.JavaScript的输入输出语法输出中文
Java 集成MySQL+MyBatis实战（含代码） C_V_Better java mysql 架构设计 java mysql mybatis 后端数据库
在Java开发中，MyBatis是一个功能强大的持久层框架，它支持定制化SQL、存储过程以及高级映射。MyBatis避免了几乎所有的JDBC代码和手动设置参数以及获取结果集。MyBatis使用简单的XML或注解用于配置和原始映射，将接口和Java的POJOs映射成数据库中的记录。本文将通过实战案例，详细展示如何使用MyBatis集成MySQL，实现对数据库的增删改查操作。一、环境准备在开始编写代码
Java 移除List中的元素，这玩意讲究！ 2401_86401508 java list windows
接着看。循环+remove（Objecto）/remove（Indexi）：没错，我们可以配合循环，把list里面的“C”元素都移除。循环自然有分while循环和for循环（包含foreach）。先看foreach方式：不得行！切记！for(Stringstr:list){if(“C”.equals(str)){list.remove(str);}}代码看似没问题，但是在foreach使用list
Windows环境下构建本地多节点Elasticsearch集群静谧星光c windows elasticsearch jenkins 大数据
Windows环境下构建本地多节点Elasticsearch集群在大数据领域，Elasticsearch是一个经常使用的分布式搜索和分析引擎。本文将介绍如何在Windows操作系统下搭建一个本地的多节点Elasticsearch集群。通过搭建本地集群，我们可以在单一系统上模拟出多个节点，从而加深对Elasticsearch集群内工作原理的理解。准备工作首先，确保你的系统已经安装了Java开发环境（
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交