老李头喽

6.5 工具-ElasticSearch

6.5.1 ElasticSearch概述

6.5.1.1 什么是ElasticSearch

6.5.1.2 Lucene

6.5.1.3 Elastic Stack

6.5.1.4 Solr与ES

6.5.1.4.1 背景

6.5.1.4.2 区别

6.5.1.5 正向索引与倒排索引

6.5.1.5.1 正向索引

6.5.1.5.2 倒排索引

6.5.2 Elasticsearch安装

6.5.3 Elasticsearch操作

6.5.3.1 索引、文档、类型

6.5.3.2 CRUD

6.5.3.2.1 增加和更新

6.5.3.2.2 查询

6.5.3.2.3 删除

6.5.3.3 URI查询

6.5.3.4 Request Body查询

6.5.3.5 自动补全功能

6.5.4 SpringBoot整合Elasticsearch

6.5.4.1 简单整合

6.5.4.2 实现推荐搜索功能

6.5.1 ElasticSearch概述

6.5.1.1 什么是ElasticSearch

Elasticsearch([ɪˈlæstɪk sɜːtʃ])是一个基于Apache Lucene(TM)的开源搜索分析引擎。底层基于Lucene（['lusen] ）。无论在开源还是专有领域，Lucene可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库。

Elasticsearch 是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能搜索、分析海量数据

Elasticsearch 是一个文档型的，以用于搜索各种文档

Elasticsearch也使用Java开发并使用Lucene作为其核心来实现所有索引和搜索的功能，但是它的目的是通过简单的RESTful API来隐藏Lucene的复杂性，从而让全文搜索变得简单。

6.5.1.2 Lucene

是一个开放源代码的全文检索引擎工具包

Lucene的目的是为软件开发人员提供一个简单易用的工具包

简单来说Lucene只是一个库。使用它必须使用Java来作为开发语言并将其直接集成到应用中，而且Lucene底层是非常复杂的

6.5.1.3 Elastic Stack

Elastic Stack，又称ELK stack，ELK

E:Elasticsearch类似于数据库，可以增删改查

L:Logstash [lɔɡ][stæ:ʃ]采集、转换数据并将其存储在 Elasticsearch 中

K:Kibana [kɪbana] 可视化操作类似于Navicat

6.5.1.4 Solr与ES

6.5.1.4.1 背景

Solr诞生于2004年，比ES早。前几年Solr还不错，但是最近几年随着大数据时代的到来，在海量数据面前Solr性能低。而ES适合海量数据，因此目前ES使用率较高。

6.5.1.4.2 区别

相同点

都是基于Lucene搜索服务器基础之上开发，一款优秀的、高性能的企业级搜索服务器。【是因为他们都是基于分词技术构建的倒排索引的方式进行查询】
开发语言都是Java

不同点

当实时建立索引的时候，solr会产生IO阻塞，而es则不会，es查询性能要高于solro
在不断动态添加数据的时候，solr的检索效率会变的低下，而es则没有什么变化。
Solr利用zookeeper进行分布式管理，而es自身带有分布式系统管理功能。Solr一般都要部署到web服务器上，比如tomcat。启动tomcat的时候需要配置tomcat与solr的关联。【Solr 的本质是一个动态web项目】
Solr支持更多的格式数据[xml,json,csv等]，而es仅支持json文件格式。
Solr是传统搜索应用的有力解决方案，但是es更适用于新兴的实时搜索应用。单纯的对已有数据进行检索的时候，solr效率高于es。
6.Solr官网提供的功能更多，而es本身更注重于核心功能，高级功能多由第三方插件。

6.5.1.5 正向索引与倒排索引

先来简单了解分词

顾名思义就是分成一个一个的词语

网页1：新年来到，祝大家新年快乐

新年年来到新年来到祝大家祝大家新年年快乐新年快乐

网页2：希望大家新年好

希望大家希望大家新年年好新年好

6.5.1.5.1 正向索引

一般是通过key，去找value

假设我们现在使用正向索引搜索新年这个词

那么就需要扫描索引库中的所有网页(文档)（由于后期应用于B/S架构，文档更多是网页的形式），找出所有包含关键词“新年”的网页(文档)

那么会到从第一个网页（文档）中从头开始去查找是否包含有 新年 这个关键词，如果有就将网页（文档）加入到结果集中；之后遍历其余的网页(文档)，流程同理。

网页	关键字
网页1	新年年来到新年来到祝大家祝大家新年年快乐新年快乐
网页2	希望大家希望大家新年年好新年好

如果有成千上百个网页(文档)，每个网页(文档)非常多的分词，那么搜索的效率将会非常低

6.5.1.5.2 倒排索引

倒排索引是按照分词与网页(文档)进行映射，我们来看看如果按照倒排索引的效果

关键字	网页
新年	网页1，网页2
年	网页1，网页2
来到	网页1
新年来到	网页1
祝	网页1，网页2
希望	网页2
......	......

采用倒排索引的方式搜索新年这个词，那么会直接找到关键词库中查找到 新年 ，然后查找到对应的网页(文档)。

正向索引是通过网页(文档)去查找关键词，反向索引则是通过关键词去查找网页(文档)。

倒排索引的优点还包括在处理复杂的多关键字查询时，可在倒排表中先完成查询的并、交等逻辑运算，得到结果后再对记录进行存取，这样把对网页(文档)的查询转换为地址集合的运算，从而提高查找速度

6.5.2 Elasticsearch安装

详见《6.6 工具-ELK安装》

6.5.3 Elasticsearch操作

6.5.3.1 索引、文档、类型

6.5.3.2 CRUD

6.5.3.2.1 增加和更新

POST 添加数据，没有指定ID, 系统会生成ID

新建索引user,类型为文档型
POST user/_doc
{
  "name": "tom",
  "age": 20,
  "address": "beijing"
}

POST user/_doc
{
  "name": "marry",
  "age": 21,
  "address": "shanghai"
}

查看user里的数据
GET user/_search

添加数据，并指明id（主键）为1111

POST user/_doc/1111
{
  "name": "shack",
  "age": 23,
  "address": "nanjing"
}

如果主键1111存在,如果新增数据时还指定主键为1111，就会更新数据

POST user/_doc/1111
{
  "name": "dingk",
  "age": 19,
  "address": "ningxia"
}

POST既可以是添加也可以是更新

也可以通过_create 添加数据，如果指定id已存在就会报错

POST user/_create/1111
{
  "name": "red",
  "age": 21,
  "address": "zhengzhou"
}

指定ID，创建文档，如果文档存在就覆盖

PUT user/_doc/1111
{
   "name": "green",
  "age": 24,
  "address": "lanzhou"
}

修改原有数据的结构

POST user/_doc/1111
{
   "name": "green2",
  "age": 26,
  "address": "zhejiang"
}

批量插入(可以指定ID，也可以不指定ID)

POST user/_bulk
{"index":{"_id": 23}}
{"name":"black", "age":"31", "address": "nanchang"}
{"index":{}}
{"name":"pink", "age":"17", "address": "hangzhou"}

6.5.3.2.2 查询

GET命令为查询

类似于主键查询，查询主键为1111
GET user/_doc/1111

批量查询

GET _mget
{
  "docs": [
    {"_index":"user", "_id":"1111"},
    {"_index":"user", "_id":"dxU2j4UBK1wP_TQZyv_7"}
  ]
}

分页查询

GET user/_search
{
  "from": 0,
  "size": 3
}

6.5.3.2.3 删除

删除指定id的文档

删除id为dhUyj4UBK1wP_TQZqP9L的数据
DELETE user/_doc/dhUyj4UBK1wP_TQZqP9L

6.5.3.3 URI查询

泛查询，就是不指定字段，全字段查找，q表示所有字段。如下查找所有字段中包含有2012的电影

GET movies/_search?q=2012

查询title中包含有2012的所有的电影(df是default field)

GET movies/_search?q=2012&df=title
或者
GET movies/_search?q=title:2012

查询title中包含有2012，取索引从10开始，共8条数据

：表示过滤条件
GET movies/_search?q=title:2012&from=10&size=8

字符串判断查询

# 查询titile中包含有Beautiful, Mind   ：表示过滤条件
GET movies/_search?q=title:Beautiful Mind

#查询title中包含有Beautiful, 并且年份大于2012
GET movies/_search?q=title:Beautiful AND year:>=2012

#查询titile中包含有Beautiful或者Mind   +：或者
GET movies/_search?q=title:(Beautiful Mind)
GET movies/_search?q=title:(+Mind +Beautiful)

#查询title中包含有“Beautiful Mind”的所有的电影
GET movies/_search?q=title:"Beautiful Mind"


#查询title中既包含有Mind又包含有Beautiful的所有的电影，对先后顺序没有要求   AND：并且
GET movies/_search?q=title:(Mind AND Beautiful)
GET movies/_search?q=title:(+Mind AND +Beautiful)

#查询title中包含Mind但是不包含Beautiful的所有的电影    -：不包含
GET movies/_search?q=title:(Mind NOT Beautiful)
GET movies/_search?q=title:(Mind -Beautiful)

年份判断查询

#查询2018年以后上映的电影  ：表示过滤条件
GET movies/_search?q=year:>=2018

#查询2012年到2017年上映的电影
GET movies/_search?q=year:(>=2012 AND <2018)

#查询2016年到2017年所有的电影，注意：必须以 ] 结尾   {：不包含 ]：包含
GET movies/_search?q=year:{2015 TO 2017]

正则判断查询

#查询title中以Mi开头，中间包含一个字符，以d结尾的所有的电影  ?表示一个字符
GET movies/_search?q=title:Mi?d

#查询title中以Min开头，后面为任何内容的电影  *表示多个字符
GET movies/_search?q=title:Min*

6.5.3.4 Request Body查询

复杂的查询，那么就需要使用Request Body查询。

以year的倒序排序，查询电影年份在 [2017, 2018]的数据, query只能单条件查询

GET movies/_search
{
  "sort": [
    {
      "year": {
        "order": "desc"
      }
    }
  ],
  # query中只能有一个条件
  "query": {
    "range": {
      "year": {
        "gte": 2017,
        "lte": 2018
      }
    }
  }
}

gte：大于等于

lte：小于等于

以year的倒序排序，查询titile中包含有Beautiful或者Mind的数据, query只能单条件查询

GET movies/_search
{
  "sort": [
    {
      "year": {
  # 排序方式
        "order": "desc"
      }
    }
  ],
  # query中只能有一个条件
  "query": {
    "match": {
      "title": "Beautiful Mind"
    }
  }
}

按照年份的倒序，分页查询

GET movies/_search
{
  "sort": [
    {
      "year": {
        "order": "desc"
      }
    }
  ],
  "from": 0,
  "size": 20
}

短语匹配，查询title中包含有 “Beautiful Mind” 这个短语的的电影

GET movies/_search
{
  "query": {
    "match_phrase": {
      "title": "Beautiful Mind"
    }
  }
}

只查询部分列

GET movies/_search
{
# 只显示title和year
  "_source": ["title", "year"]
}

多个条件查询，多条件查询必须使用bool

GET movies/_search
{
  "query": {
    "bool": {
# 多条件查询
# must：必要条件  should:或者条件
      "must": [
        {
          "range": {
            "year": {
              "gte": 2017,
              "lte": 2018
            }
          }
        },
# 其他条件
        {
          "match": {
            "title": "Beautiful Mind"
          }
        }
      ]
    }
  }
}

多字段同时匹配某些字符串

GET movies/_search
{
  "query": {
    "multi_match": {
# 查询条件
      "query": "beautiful mind Romance",
# 在哪里查询
      "fields": ["title", "genre"],
      "type": "best_fields"
    }
  }
}

其中type的值有三个:

most_fields：在多字段中匹配的越多排名越靠前

best_fields: 能完全匹配的文档，排名越靠前。

cross_fields: 查询越分散，排名越靠前。

query_string

字符串查询

GET movies/_search
{
  "query": {
    "query_string": {
      "default_field": "title",
      "query": "Beautiful Mind",
# 查询有Beautiful并且Mind的title
      "default_operator": "AND"   #不加默认是OR
    }
  }
}

GET movies/_search
{
  "query": {
    "query_string": {
      "fields": ["title", "genre"],
# 查询有Beautiful或者Mind的title,genre
      "query": "Beautiful Mind"
    }
  }
}

term实现精准匹配，查询title为Beautiful Mind 的电影

GET movies/_search
{
  "query": {
    "term": {
      "title.keyword": {
        "value": "Beautiful Mind, A"
      }
    }
  }
}

多条件或者判断（should表示或者，must表示必须）

GET movies/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "match": {
            "title": "Beautiful Mind"
          }
        },
        {
          "range": {
            "year": {
              "gte": 2017,
              "lte": 2018
            }
          }
        }
      ]
    }
  }
}

推荐搜索

GET movies/_search
{
# suggest推荐查询，从title-suggest里查询
  "suggest": {
# 起了名字叫title-suggest
    "title-suggest": {
# 找minx
      "text": "minx",
      "term": {
        "field": "title",
# 查找不到再推荐
        "suggest_mode": "missing"
      }
    }
  }
}

GET movies/_search
{
  "suggest": {
    "title-suggest": {
      "text": "mine",
      "term": {
        "field": "title",
# 高频率才推荐
        "suggest_mode": "popular"
      }
    }
  }
}

GET movies/_search
{
  "suggest": {
    "title-suggest": {
      "text": "minx",
      "term": {
        "field": "title",
# 总是推荐
        "suggest_mode": "always"
      }
    }
  }
}

suggest_mode 的三种模式：missing 、popular、always

missing: 意思是当词典中没有找到对应的索引信息，才去推荐。

popular: 意思是即使我们去搜索一个被索引了的单词，但是还是会去给我们推荐类似的但是出现频率很高的词。

always： 无论在任何情况下，都给出推荐。

6.5.3.5 自动补全功能

Elasticsearch的自动补全功能是基于 suggest 来实现的，但是需要提前定义好需要进行搜索字段的mapping信息(mapping一旦创建好后是不能修改的)

使用 GET movies 命令查看，定义mapping并执行，设置自动补全的属性的 type 必须是 completion

GET movies

执行如下命令，先删除movies，再重新定义mapping

DELETE movies

PUT movies
  {"mappings" : {
   "properties" : {
      "@version" : {
        "type" : "text",
        "fields" : {
          "keyword" : {
            "type" : "keyword",
            "ignore_above" : 256
          }
        }
      },
      "genre" : {
        "type" : "completion",  
        "fields" : {
          "keyword" : {
            "type" : "keyword",
            "ignore_above" : 256
          }
        }
      },
      "id" : {
        "type" : "text",
        "fields" : {
          "keyword" : {
            "type" : "keyword",
            "ignore_above" : 256
          }
        }
     },
     "title" : {
        "type" : "completion",
        "fields" : {
          "keyword" : {
            "type" : "keyword",
            "ignore_above" : 256
          }
        }
      },
      "year" : {
        "type" : "long"
      }
    }
  }
}

删除 logstash 的配置文件 db_path.log，然后再执行 logstash 命令，重新导入 movies 数据集

logstash.bat -f D:\elasticsearch\logstash-7.4.2\config\logstash.conf

执行推荐

GET movies/_search
{
  "suggest": {
    "title-suggest": {
# 查询前缀为min 有的话就返回，没有的话就自动补全，匹配含有min开头的
      "prefix": "min",
      "completion": {
        "field": "title",
        "skip_duplicates": true #忽略重复
      }
    }
  }
}

6.5.4 SpringBoot整合Elasticsearch

6.5.4.1 简单整合

导入依赖


    org.springframework.boot
    spring-boot-starter-data-elasticsearch

注意es和spring等都会存在版本问题

由于SpringBoot可以自动选择版本

（此次使用的是 springboot是2.3.X 版本，默认匹配7.6.X的elasticsearch ）

RestClientConfig配置类

@Configuration
public class RestClientConfig extends AbstractElasticsearchConfiguration {

    @Bean
    public RestHighLevelClient elasticsearchClient() {
方式一 spring官网提供的客户端工具
     final ClientConfiguration clientConfiguration = ClientConfiguration.builder()
				.connectedTo("localhost:9200")
				.build();

		return RestClients.create(clientConfiguration).rest();

    }
    // 获取ElasticsearchRestTemplate模版对象（elasticsearch 6.x 使用的是ElasticsearchTemplate对象）
    @Bean
    public ElasticsearchRestTemplate elasticsearchRestTemplate() {
        return new ElasticsearchRestTemplate(elasticsearchClient());
    }
}

}

@Configuration
public class RestClientConfig extends AbstractElasticsearchConfiguration {

    @Override
    @Bean
    public RestHighLevelClient elasticsearchClient() {
        // 方式二 elasticsearch官网
        RestHighLevelClient client = new RestHighLevelClient(
                RestClient.builder(
                        new HttpHost("192.168.224.128", 9200, "http")));

        return client;

    }
    // 获取ElasticsearchRestTemplate模版对象（elasticsearch 6.x 使用的是ElasticsearchTemplate对象）
    @Bean
    public ElasticsearchRestTemplate elasticsearchRestTemplate() {
        return new ElasticsearchRestTemplate(elasticsearchClient());
    }
}

注意：如果es的host

实体类

@Data
@AllArgsConstructor
@NoArgsConstructor
@Document(indexName = "movies")//以前是添加表名，现在是索引名
public class Movie {
    private String id;
    private String title;
    private Integer year;
    private List genre;
}

MoviesController

@RestController
@RequestMapping("movies")
public class MoviesController {

    @Autowired
    private ElasticsearchRestTemplate elasticsearchRestTemplate;

    @GetMapping("findAll")
    public List findAll() {

        //构建查询条件
        NativeSearchQuery query = new NativeSearchQueryBuilder().withQuery(new RangeQueryBuilder("year").from(1995, true)
                .to(1996, true)).build();
//注意查询数据的结构，第一层hits是数据总数，第一层hits里包含的hits里才有数据

//这里获取的第一层的hits
        SearchHits movies = elasticsearchRestTemplate.search(query, Movie.class, IndexCoordinates.of("movies"));

//之后获取第一层hits里包含的hits
        List> searchHits = movies.getSearchHits();
        //创建集合并保存数据
        ArrayList list = new ArrayList();

        for (SearchHit searchHit:searchHits
             ) {
//获取第二层hits里的真正的数据
            Movie content = searchHit.getContent();
            System.out.println(content);
            list.add(content);
        }
        return list;
    }
}

访问

6.5.4.2 实现推荐搜索功能

@RestController
@RequestMapping("suggest")
public class MoviesSuggestSearchContorller {
    @Autowired
    private ElasticsearchRestTemplate elasticsearchRestTemplate;


    //        GET movies/_search
//        {
//            "suggest": {
//            "title-suggest": {
//                "prefix": "min",
//                    "completion": {
//                    "field": "title",
//                    "skip_duplicates": true
//                }
//            }
//        }
//        }


    @RequestMapping("findAll")
    //前端传过来的搜索字符text 有可能不全，所以需要推荐搜索，推荐相似的字符
    public Object movieSuggest(String text) {

        //创建推荐搜索的规范
        CompletionSuggestionBuilder completionSuggestionBuilder = new CompletionSuggestionBuilder("title")
                //注意两种写法
                .prefix(text);
        completionSuggestionBuilder.size(10); //展示条数
        completionSuggestionBuilder.skipDuplicates(true); //跳过重复元素

        //创建集合来抓取建议搜索出来自动补全的结果集
        Set suggestResult = new HashSet();
        //构建推荐条件
        SuggestBuilder suggestBuilder = new SuggestBuilder();
        //传入推荐名称和推荐规范
        suggestBuilder.addSuggestion("suggest", completionSuggestionBuilder);
        //开始处理 通过模板工具类
        SearchResponse movies = elasticsearchRestTemplate.suggest(suggestBuilder, IndexCoordinates.of("movies"));
        //获取Suggest对象
        Suggest suggest = movies.getSuggest();
        //获取对应的建议搜索的结果
        Suggest.Suggestion suggesttion = suggest.getSuggestion("suggest");
        //获取结果集
        List entries = suggesttion.getEntries();
        Object object = entries.get(0);
        if (object instanceof CompletionSuggestion.Entry) {
            CompletionSuggestion.Entry entry = (CompletionSuggestion.Entry) object;
            //获取options
            List options = entry.getOptions();
            for (CompletionSuggestion.Entry.Option option : options) {
                suggestResult.add(option.getText().toString());
            }

        }
        System.out.println(movies);

        return suggestResult;
    }
}

调试看一下结构

你可能感兴趣的:(JAVA基础知识体系,elasticsearch,全文检索)

飞算 JavaAI 2.0.0和 AI 编程技术设计的 120 章 Java 系统教程 AI编程员 001AI传统＆编程语言 002AI编程工具汇总 003AI编程作品汇总开发语言深度学习 pillow AI编程人工智能
以下是基于飞算JavaAI2.0.0和AI编程技术设计的120章Java系统教程，涵盖从基础到高阶、理论到实践的全栈知识体系，结合经典案例与企业级项目实战，适合零基础到架构师的学习路径：第一部分：基础入门（第1-30章）Java开发环境配置JDK21+IntelliJIDEA+飞算AI插件安装第一个AI生成的HelloWorld程序基础语法与AI辅助编程数据类型、变量、运算符飞算AI：自动生成算法
【企业研发】ELK开发 flyair_China django python 后端
一、ElasticSearchElasticsearch作为当前最流行的全文检索引擎之一，在众多领域展现出强大的搜索和分析能力。1.1、全文检索与精准检索的差异Elasticsearch提供两种主要的查询方式：全文检索匹配检索(Full-textMatchQuery)和精准匹配检索(ExactMatchQuery)，它们在处理查询词和索引数据时有显著区别。1.精准匹配检索(ExactMatchQu
在 Logstash 中使用 Ruby 脚本 Elastic 中国社区官方博客 Logstash Elastic 大数据 elasticsearch 搜索引擎 ruby 全文检索 logstash
作者：来自ElasticDaiSugimori了解LogstashRubyfilter插件，在你的Logstashpipeline中进行高级数据转换。更多阅读：Logstash：使用Ruby过滤器了解将数据导入Elasticsearch的不同方式，并深入实际示例，尝试一些新方法。Elasticsearch拥有丰富的新功能，帮助你为你的使用场景构建最佳的搜索解决方案。立即开始免费试用。Logstas
JAVA基础--异常 wzdashuaibi java 开发语言 jvm
一、异常分类基类：Throwable，Error和Exception继承Throwable一、运行时异常1.RuntimeException2.NullPointerException3.ClassCastException4.ArrayIndexOutOfBoundsException如果不对这些异常进行处理，那么默认遇到这些异常就会终止程序二、已检查异常1.Exception2.FileNot
推荐几本创业者需要掌握的财务管理类书籍 AI布道师阿彬单独的博客资料创业者财务管理书籍推荐创业
作为创业者，需要建立一个坚实的财务和管理知识体系。这不仅仅是“看书”，而是通过阅读经典来构建商业思维框架。以下是精心挑选的一系列书籍，并按照从**“入门认知”到“高手进阶”**的逻辑进行分类，每本书都附上了推荐理由，确保它们能精准地解决创业者在创业不同阶段可能遇到的问题。第一部分：财务思维篇(让您看懂钱、管好钱、用好钱)对于技术出身的创始人来说，财务知识不是为了让您成为会计，而是为了让您拥有**“
Springboot --- 整合spring-data-jpa和spring-data-elasticsearch 百世经纶『一页書』 Springboot Java springboot
Springboot---整合spring-data-jpa和spring-data-elasticsearch1.依赖2.配置文件3.代码部分3.1Entity3.2Repository3.3Config3.4Service3.5启动类3.6Test3.7项目结构SpringBoot:整合Ldap.SpringBoot:整合SpringDataJPA.SpringBoot:整合Elasticse
Java基础：流程控制语句：条件、循环和跳转越重天 Java 基础入门教程 Java 宝藏 java 开发语言 java流程控制语句零到一学Java
前言Java中的流程控制语句其实和C、C++一样，在Java中，流程控制会涉及到包括if-else、while、do-while、for、return、break以及选择语句switch。下面以此进行分析。流程控制语句，分为三大类：条件语句，循环语句和跳转语句，如下图所示：1.条件语句条件语句可根据不同的条件执行不同的语句。包括if条件语句与switch多分支语句。1.1if语句if语句
如何构建知识库追逐此刻其他其他
构建个人知识库是一个系统化的过程，需要结合工具选择、信息管理和持续优化。以下是分步骤的实用指南，包含现代工具和方法的建议：一、明确知识库定位（Why）核心目标学习型：支持学术研究/职业发展（如医学生构建临床知识体系）创作型：支撑内容产出（如自媒体作者的选题库）项目型：管理特定领域知识（如程序员的技术栈文档）领域聚焦建议采用「T型策略」：1个深度领域+3个辅助领域（如主攻机器学习，辅修心理学/设计/
java基础——java集合map详解喜欢敲代码的程序员学习java 开发语言 java
目录一、引言二、Map接口概述1.常用方法2.实现Map的主要类2.1.HashMap2.2.LinkedHashMap2.3.Hashtable（遗留类，已过时）2.4.TreeMap2.5.ConcurrentHashMap3.总结对比4.不常用的实现类4.1.IdentityHashMap4.2.WeakHashMap4.3.EnumMap4.4.ConcurrentSkipListMap5
Elasticsearch 根据字段值去重前的个数过滤数据（qbit）
前言本文对Elasticsearch7.17适用假定有个ip类型的字段client_ip，需要根据字段值的个数过滤数据在query中使用script只能通过doc['client_ip']获取到去重后的个数研究发现使用runtime_mappings可以动态新建字段获取到不去重的个数示例创建索引PUTmy_index{"mappings":{"dynamic":false,"properties"
向量数据库milvus中文全文检索取不到数据的处理办法 --勇数据库 milvus 全文检索
检查中文分词配置Milvus2.5+支持原生中文全文检索，但需显式配置中文分词器：创建集合时指定分词器类型为chinesepythonschema.add_field(field_name="text",datatype=DataType.VARCHAR,max_length=65535,enable_analyzer=True,analyzer_params={"type":"chinese"}
Elasticsearch 索引文档的流程 jiedaodezhuti elasticsearch 大数据搜索引擎
Elasticsearch索引文档的流程是一个分布式、多阶段的过程，涉及客户端请求、路由、主副本同步及持久化等步骤，具体流程如下：一、客户端请求与路由1.1文档接收与路由计算‌客户端通过RESTAPI发送文档写入请求，需指定索引名、文档ID（可选）及文档内容。Elasticsearch根据文档ID（或自定义routing值）哈希计算目标主分片位置。请求被转发到主分片所在的节点（协调节点或直接定位主
Elasticsearch连接 java.net.ConnectException: Connection refused: getsockopt swany elasticsearch java .net
使用springboot连接Elasticsearch创建全文索引，总是报连接不上的问题，报错如下：org.springframework.beans.factory.UnsatisfiedDependencyException:Errorcreatingbeanwithname'esContentService':Unsatisfieddependencyexpressedthroughfiel
【Rust】——使用消息在线程之间传递数据 Y小夜 Rust（官方文档重点总结）rust 开发语言后端
博主现有专栏：C51单片机（STC89C516），c语言，c++，离散数学，算法设计与分析，数据结构，Python，Java基础，MySQL，linux，基于HTML5的网页设计及应用，Rust（官方文档重点总结），jQuery，前端vue.js，Javaweb开发，Python机器学习等主页链接：Y小夜-CSDN博客目录信道与所有权转移发送多个值并观察接收者的等待通过克隆发送者来创建多个生产者学
【云原生】Docker 部署 Elasticsearch 9 操作详解逆风飞翔的小叔运维 Docker 部署es9 Docker部署es Docker搭建es9 Elasticsearch9 Docker搭建es
目录一、前言二、Elasticsearch9新特性介绍2.1基于Lucene10重大升级2.2BetterBinaryQuantization（BBQ）2.3ElasticDistributionsofOpenTelemetry（EDOT）2.4LLM可观测性2.5攻击发现与自动导入2.6ES|QL增强2.7语义检索三、基于Docker部署Elasticsearch93.1Elasticsearc
使用docker-compose部署elk
使用DockerCompose部署ELK（Elasticsearch、Logstash、Kibana）的好处主要体现在以下几个方面：集中管理日志数据：ELK能够帮助业务实现日志数据的集中管理，通过Elasticsearch进行搜集、分析和存储，Kibana为Elasticsearch提供图形化界面，使得日志数据的查看和分析更加直观和便捷。快速搜索和分析：ELK能够快速搜索和分析日志数据，从而提高故
八股文——JAVA基础：包装类型的缓存机制了解么？ Hellyc java 开发语言
对于包装类中的整形包装类，Byte、Short、Integer、Long等，对于数值在-128到127的内容会在堆中创建缓存，比如拿Integer举例，Integera=10，Integerb=10，10对应在缓存数组CACHE[138]，所以a==b是比较的就是CACHE[138]对应的地址，显然两者地址是相同的。对应源码如下publicstaticIntegervalueOf(inti){if
Java八股文——Java基础篇01(持续更新中...)
2024/11/1第一次记录和发表，后续还会持续更新，喜欢的可以点点关注！谢谢！~目录一、Java基础1.1八种基本数据类型1.2装箱与拆箱1.3shorts=1;s=s+1;和shorts=1;s+=1;的区别1.4基本类型与引用类型的区别1.5Java四大特性1.6==与equals1.7final关键字1.8Java中的异常处理一、Java基础1.1八种基本数据类型包括：byte、short
Elasticsearch模糊查询、多字段in查询、时间范围查询，DSL和java API两种方式 Gzzz__ Elasticsearch elasticsearch java javascript 开发语言后端
项目场景：Elasticsearch模糊查询某字段、多字段in查询、时间范围查询，通过DSL和javaAPI两种方式解决方案：一、模糊查询wildcard通配符检索使用wildcard相当于SQL的like，前后都可拼接*，匹配0到多个任意字符{"query":{"wildcard":{"name.keyword":"*文件*"}}}BoolQueryBuilderqueryBuilder=Que
Elasticsearch从入门到精通编程界的彭于晏qaq java 数据库缓存 es
Elasticsearch从入门到精通一、引言在当今数字化时代，数据呈现出爆炸式增长的态势，如何高效地存储、检索和分析这些海量数据成为了开发者们面临的重要挑战。Elasticsearch（简称ES）作为一款强大的分布式搜索和分析引擎，凭借其出色的性能、高可扩展性和实时搜索能力，在众多领域得到了广泛的应用。而Java作为一种广泛使用的编程语言，以其强大的功能和丰富的生态系统，成为了与ES结合的首选语
JAVA基础：讲一下equals()与hashcode()，什么时候重写，为什么重写，怎么重写？ Hellyc 八股文自用 java jvm 开发语言
当equals方法进行重写后，hashcode方法也需要重写。因为equals方法进行重写，那么原本不同的两个对象可能就会相同了，比如两个学生，我们的eqauls判别标准是两个学生的id相同，就会认为(学生A).equals(学生B)，然而A与B显然是不同的对象，对应不同的地址，那么hashcode此时不重写，此时hashcode就会产生两个不同值，这与哈希表的逻辑不符，所以此时hashcode需
React.js前端开发中的性能优化的常见挑战与解决思路大厂前端小白菜前端开发实战 react.js 性能优化前端
React.js前端开发中的性能优化的常见挑战与解决思路关键词：React性能优化、虚拟DOM、重新渲染、代码分割、内存管理摘要：本文深入探讨React应用开发中常见的性能瓶颈及其解决方案。从虚拟DOM原理到Fiber架构演进，从组件渲染机制到内存泄漏预防，通过算法解析、数学模型验证和实战案例，系统性地构建React应用性能优化知识体系。本文还将提供可落地的性能检测工具链和最佳实践方案。文章目录R
6.24_JAVA_微服务_Elasticsearch搜索灰太狼Coding java 微服务开发语言
1、FinalShell工具：单向工具，能将本地连接到虚拟机。（虚拟机连不到本地）我们用docker建的容器比如MQ，比如ES，我们能够访问它们的WEB操作地址，都是因为前面的地址不是localhost，而是虚拟机的IP。比如ES端口是9200，本地访问localhost:9200会无法访问。但是输入：192.168.XXX.XXX:9200可以访问。我们操作也实际上是操作的虚拟机的数据，而不是本
全栈开发学习路线：前端+后端+DevOps一站式掌握 AI天才研究院 ChatGPT 实战计算 Agentic AI 实战学习前端 devops ai
全栈开发学习路线：前端+后端+DevOps一站式掌握关键词：全栈开发、前端技术、后端技术、DevOps、全栈工程师、全栈学习路线、全栈项目实战摘要：本文系统梳理全栈开发的完整知识体系，从前端、后端、DevOps三大核心领域构建学习路线。通过核心概念解析、算法原理演示、数学模型推导、项目实战案例，帮助读者掌握全栈开发的核心技能。结合最新技术趋势，提供工具资源推荐和职业发展建议，适合0-3年经验的开发
软考高级系统架构设计师备考计划（嵌入式工程师专版）指令集诗人软考系统架构软考
软考高级系统架构设计师备考计划（嵌入式工程师专版）一、备考核心策略嵌入式背景优势系统架构设计硬件架构实时系统知识体系构建备考四阶段二、四阶段备考计划（总时长：5-6个月）阶段1：基础巩固（1.5个月）时间学习内容嵌入式关联强化每日投入第1-2周计算机组成原理嵌入式处理器架构对比(ARMvsRISC-V)2小时第3-4周操作系统原理RTOS与通用OS差异分析2.5小时第5-6周软件工程基础嵌入式开发
八股文——JAVA基础：= =和equals有什么区别？ Hellyc 八股文自用 java
==比较的是地址，equals底层是由==实现，equals对于非基本类型都会进行方法重写，也就是让其去比较值基本例子Stringa="hello";Stringb="hello";//a==b是成立的，因为值是存在常量池中，a与b相当于是相同地址的不同副本。Stringa=newString("hello");Stringb=newString("hello");//a==b不成立，因为==用于
JAVA基础| 反射 2301_79433391 开发语言 java jvm
目录1、反射定义2、class类class类的本质JVM对class的加载Class实例与class的关系获取Class实例的方法Class实例比较与instanceof的区别通过Class实例获取基本信息通过Class实例创建对象3、访问字段、调用方法访问字段调用方法4、调用构造方法、获取继承关系调用构造方法获取继承关系5、小结1、反射定义在Java中，只有JVM能创建Class实例，我们自己的
Android 开发高频面试题之——Flutter 进击的code flutter
Android开发高频面试题之——Java基础篇flutter高频面试题记录Flutter1.dart中的作用域与了解吗2.dart中......分别是什么意思？3.Dart是不是单线程模型？如何运行的？4.Dart既然是单线程模型支持多线程吗？5.Future是什么6.Stream是什么7.Flutter如何和原生交互8.说一下mixin？9.StatefulWidget的生命周期10.main
解决Elasticsearch Python客户端初始化报错：URL must include a ‘scheme‘, ‘host‘, and ‘port‘ Ven% 实用篇 elasticsearch python 阿里云
文章目录问题背景错误复现错误原因分析1.Elasticsearch客户端对URL格式的严格要求2.阿里云Elasticsearch的特殊要求3.环境变量配置不完整解决方案方案一：修改环境变量（推荐）方案二：在代码中自动补全URL方案三：使用客户端的基本认证参数阿里云Elasticsearch连接最佳实践完整代码示例总结问题背景在使用Python的Elasticsearch客户端连接阿里云Elast
Elasticsearch（ES）与 OpenSearch（OS）老兵发新帖 elasticsearch 大数据搜索引擎
Elasticsearch（ES）与OpenSearch（OS）本质上是同源分叉、独立演进的技术，两者关系可概括为“起源相同、目标分化”。以下是关键要点解析：一、核心关系：分叉与独立演进起源相同OpenSearch于2021年由AWS主导，从Elasticsearch7.10.2版本分叉而来[citation:2][citation:3][citation:4]。分叉原因：Elastic公司将El
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end