faith瑞诚

《B站-ElasticSearch》学习笔记

环境安装
- 安装ElasticSearch
- 安装ElasticSearch Hand可视化工具
- 安装Kibana
ES核心概念
- 物理设计
- 逻辑设计
- 文档
- 类型
- 索引
- 倒排索引
IK分词器插件
- 什么是IK分词器？
- 安装IK分词器
- 自定义分词字典
Rest风格说明
- 关于索引的基本操作
- 关于文档的基本操作
- 搜索数据
- - 简单搜索
  - 复杂搜索（排序、分页、高亮、模糊匹配、精准匹配）
  - 总结
SpringBoot集成ES详解
- 熟悉官方文档
- 在代码中集成ElasticSearch Java Client API
- 关于索引的API操作详解
- 关于文档的API操作详解
京东搜索项目
- 项目搭建
- 爬取数据
- 业务编写
- 前后端分离
- 关键字高亮实现

视频地址：【狂神说Java】ElasticSearch7.6.x最新完整教程通俗易懂_哔哩哔哩_bilibili

环境安装

安装ElasticSearch

声明：JDK最低要求1.8版本。（本笔记使用的ElasticSearch 8.1.0版本）

ElasticSearch是基于Java开发的，后续使用Java连接ES时，ES的版本要和Java的核心jar包版本对应。

1、下载

官网地址：https://www.elastic.co/

2、解压安装包

下载到本地后，进行解压，得到目录如下图

目录结构说明

bin/ 		启动文件等可执行文件的目录
config/		配置文件的目录
	log4j2.properties	日志配置
	jvm.options			java虚拟机相关的配置
	elasticsearch.yml	elasticsearch的配置文件
lib/ 		相关jar包的目录
modules/	功能模块的目录
logs/		日志的目录
plugins/	插件的目录，如ik分词器等

3、修改配置文件：
打开elasticsearch.yml文件，对如下配置项进行修改：

xpack.security.enabled: false

xpack.security.enrollment.enabled: false

xpack.security.transport.ssl:
  enabled: false

4、启动
运行bin目录下的elasticsearch.bat文件，待ES服务启动好后，使用浏览器访问http://127.0.0.1:9200/，看到如下界面，代表ES启动成功。

安装ElasticSearch Hand可视化工具

hand的github地址：https://github.com/mobz/elasticsearch-head
下载后，进行解压，解压后，进入elasticsearch-head-master目录，在其中执行命令（此步骤需要安装nodejs环境）

# 安装项目所需的依赖包
npm install
# 启动项目
npm run start

在浏览器中访问：http://localhost:9100/，看到如下界面

打开后，若发现无法链接，可打开浏览器的控制台查看报错信息，若是因为跨域问题导致了报错，那此时可以通过修改ES的配置文件解决问题，打开elasticsearch.yml配置文件，在其中添加如下配置：

http.cors.enabled: true
http.cors.allow-origin: "*"

然后重启ES服务，此时，刷新hand的界面，就能看到ES已经链接成功了。

对于初学者，可以把ES看成一个数据库，不要考虑其是搜索服务器，索引可以理解为关系型数据库中的库，文档可以理解为具体的数据。

hand可以把它当做数据展示的工具，后面所有的查询，可以通过kibana实现。

安装Kibana

了解ELK
ELK是ElasticSearch、Logstash、Kibana三大开源框架的首字母大写简称。市面上也被称为Elastic Stack。其中ElasticSearch是一个基于Lucene、分布式、通过RestFul方式进行交互的近实时搜索平台框架。像类似百度、谷歌这种大数据全文搜索引擎的场景都可以使用ElasticSearch作为底层支持框架，可见ElasticSearch提供的搜索能力确实强大，很多时候，我们简称ElasticSearch为ES。Logstash是ELK的中央数据流引擎，用于从不同目标（文件/数据存储/MQ等）收集的不同格式数据，经过过滤后输出到不同目的地（文件/MQ/redis/ElasticSearch/kafka等）。Kibana可以将ElasticSearch的数据通过友好的界面展示出来，提供实时分析的功能。
市面上很多开发只要提到ELK能够一致说出它是一个日志分析架构技术栈总称，但实际上ELK不仅仅适用于日志分析，它还可以支持其他任何数据收集和分析的场景，日志分析和收集只是更具有代表性，并非唯一性。

安装Kibana
Kibana是一个针对ElasticSearch的开源分析及可视化平台，用来搜索、查看交互存储在ElasticSearch索引中的数据，使用Kibana，可以通过各种图表进行高级数据分析及展示。Kibana让海量数据更容易理解。它操作简单，基于浏览器的用户界面可以快速创建仪表板（dashboard）实时显示ElasticSearch查询动态。设计Kibana非常简单。无需编码或者额外基础架构，几分钟内就可以完成Kibana安装并启动ElasticSearch索引监控。
1、下载：
官网：https://www.elastic.co/cn/kibana/
注意：Kibana的版本需要与ElasticSearch的版本一致！！！
Kibana也是开箱即用的工具。
2、解压安装：
下载到本地后，进行解压，得到目录如下图

3、启动
运行bin目录下的kibana.bat文件，看到如下界面，代表Kibana已启动

使用浏览器访问http://localhost:5601/?code=840671，看到Kibana系统界面

4、找到开发工具（Dev Tools）：

我们可以使用curl、Postman、谷歌插件等开发工具对ES进行测试，同时，Kibana也提供了相应的开发工具。

我们之后所有的操作都在这里进行。
5、汉化Kibana：
在Kibana安装目录的config目录下，找到kibana.yml配置文件，修改其中关于国际化的配置如下：

i18n.locale: "zh-CN"

在修改前，要确保kibana安装目录下x-pack\plugins\translations\translations目录里存在zh-CN.json文件。
然后重启Kibana服务即可。

ES核心概念

1、索引（index）
2、字段类型（mapping）；
3、文档（documents）

elasticsearch是面向文档的！

关系型数据库和ElasticSearch的对比：

Relational DB	ElasticSearch	ElasticSearch备注
数据库（database）	索引（indices）	就和关系型数据库中的库一样
表（tables）	类型（types）	7.x已经过时，8.0以后会彻底弃用
行（rows）	文档（documents）	一条条的数据
字段（columns）	fields	每条数据内的字段
ElasticSearch中存储的一切都是JSON！

ElasticSearch（集群）中可以包含多个索引（数据库），每个索引中可以包含多个类型（表），每个类型下面有包含多个文档（行），每个文档中又包含了多个字段（列）。

物理设计

ElasticSearch在后台把每个索引划分成多个分片，每份分片可以在集群中的不同服务器间迁移。
在ES里，即使只有一个节点，也是集群，默认的集群名是elasticsearch

逻辑设计

一个索引类型中，可以包含多个文档，比如文档1、文档2。当我们索引一篇文档时，可以通过这样的一个顺序找到它：索引 > 类型 > 文档ID，通过这个组合我们就能索引到具体的某个文档。注意：ID不必是整数，实际上它是个字符串。

文档

就是我们的一条条数据！

ElasticSearch是面向文档的，那么就意味着索引和搜索数据的最小单位是文档，ElasticSearch中，文档有几个重要的属性：

自我包含，一篇文档同时包含字段和对应的值，也就是同时包含key和value；
可以是层次性的，一个文档中包含自文档，复杂的逻辑实体就是这么来的（就是一个json对象，在java中可以使用fastjson进行自动转换）；
灵活的结构，文档不依赖预先定义的模式，我们知道关系型数据库中，要提前定义字段才能使用，在ElasticSearch中，对于字段是非常灵活的，有时候，我们又可以忽略该字段，或者动态的添加一个新的字段。

尽管我们可以随意的新增或忽略某个字段，但是，每个字段的类型非常重要，比如一个年龄字段的类型，可以是字符串也可以是整型。因为ElasticSearch会保存字段和类型之间的映射及其他的设置。这种映射具体到每个字段的每种类型，这也是为什么在ElasticSearch中，类型有时候也称为映射类型。

类型

类似于关系型数据库的Table中每个字段的数据类型！

类型是文档的逻辑容器，就像关系型数据库一样，表格是行的容器。类型中对于字段的定义称为映射，比如name映射为字符串类型。我们说文档是无模式的，它们不需要映射中定义的所有字段，比如新增一个字段，那么ElasticSearch是怎么做的呢？ElasticSearch会自动改的将新字段加入映射，但这个字段不确定它是什么类型，ElasticSearch会根据内容去猜，如果这个字段的值是18，那ElasticSearch会认为它是整型。但是ElasticSearch也可能猜错，所以最安全的方式就是提前定义好所需要的映射，这点和关系型数据库殊途同归了，先定义好字段，然后再使用。

索引

就是数据库。

索引是映射类型的容器，ElasticSearch中的索引是一个非常大的文档集合。索引存储了映射类型的字段和其他设置。然后它们被存储在各个分片上了。我们来研究下分片是如何工作的。
物理设计：节点和分片如何工作

一个集群至少有一个节点（只有一个ElasticSearch服务时），而一个节点就是一个ElasticSearch进程，节点可以有多个索引，如果你创建索引，那么索引将会有5个分片（primary shard，又称为主分片）构成，每一个主分片会有一个副本（replica shard，又称为复制分片）

上图是一个3个节点的集群，可以看到主分片和对应的复制分片都不会在同一个节点内，这样有利于某个节点挂掉了，数据也不会丢失。实际上，一个分片是一各Lucene索引，一个包含倒排索引的文件目录，倒排索引的结构使得ElasticSearch在不扫描全部文档的情况下，就能告诉你哪个文档包含特定的关键字。

倒排索引

ElasticSearch使用的是一种称为倒排索引的结构，采用Lucene倒排索引作为底层。这种结构适用于快速的全文检索，一个索引由文档中所有不重复的列表构成，对于每一个词，都有一个包含它的文档列表。例如，现在有两个文档，每个文档包含如下内容：

Study every day, good good up to forever		# 文档1包含的内容
To forever, study every day, good good up		# 文档2包含的内容

为了创建倒排索引，我们首先要将每个文档拆分成独立的词（或称为词条或者tokens），然后创建一个包含所有不重复的词条的排序列表，然后列出每个词条出现在哪个文档：

term	doc_1	doc_2
Study	√	×
To	×	√
every	√	√
forever	√	√
day	√	√
study	×	√
good	√	√
to	√	×
up	√	√
现在，我们试图搜索to forever，只需要查看包含每个词条的文档
term	doc_1	doc_2
–	–	–
to	√	×
forever	√	√
total	2	1
两个文档都匹配，但是第一个文档比第二个文档匹配程度更高。如果没有别的条件，现在，这两个包含关键字的文档都将返回。
再来看一个示例，比如我们通过博客标签来搜索博客文章。那么倒排索引列表就是这样一个结构：

如果要搜索含有python标签的文章，那相对于查找所有原始数据而言，查找倒排索引后的数据会快很多。只需要查看标签这一栏，然后获取相关文章的ID即可。完全过滤掉所有无关的数据，提高效率！
ElasticSearch的索引和Lucene的索引对比：
在ElasticSearch中，索引（库）这个词被频繁使用，这就是术语的使用。在ElasticSearch中，索引被划分为多个分片，每份分片是一个Lucene的索引。所以一个ElasticSearch索引是由多个Lucene索引组成的，因为ElasticSearch是使用Lucene作为底层。如无特指，说起索引都是只ElasticSearch的索引。
接下来的一切操作都在Kibana中的Dev Tools下的Console里完成

IK分词器插件

什么是IK分词器？

分词：即把文字（中文或其他语言）划分成一个个的关键字，我们在搜索的时候会把自己的信息进行分词，会把数据库中或索引库中的数据进行分词，然后进行匹配操作，默认的中文分词是将每一个字看成一次词，比如“我爱狂神”会被分成“我”，“爱”，“狂”，“神”，这显然是不符合要求的，所以我们需要安装IK分词器来解决这个问题。
如果要使用中文，建议使用IK分词器！
IK分词器提供了两个分词算法：ik_smart和ik_max_word，其中ik_smart为最少切分，ik_max_word为最细粒度划分！

安装IK分词器

1、下载：
下载地址：https://github.com/medcl/elasticsearch-analysis-ik/releases

2、解压安装：
将下载得到的IK分词器的压缩包解压到ElasticSearch安装目录的plugins目录下，目录命名为ik即可。

3、重启并观察ES服务：
在ES启动日志中，可以看到IK分词器的插件被加载。

4、使用elasticsearch-plugin命令查看现有的插件：
可以通过elasticsearch-plugin命令查看加载进来的插件有哪些。
在ElasticSearch安装目录的bin目录下，使用命令行输入命令elasticsearch-plugin list即可查看。

5、使用Kibana进行测试：
在Kibana中打开开发工具界面，在其中对IK分词器进行确认。
先测试ik_smart（最少切分）分词算法，在控制台中输入

GET _analyze
{
  "analyzer": "ik_smart",
  "text": "中国共产党"
}

发送请求后，可以看到右侧的结果为：

{
  "tokens" : [
    {
      "token" : "中国共产党",
      "start_offset" : 0,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 0
    }
  ]
}

发现没有进行切分。

然后测试ik_max_word（最细粒度切分）分词算法，在控制台中输入

GET _analyze
{
  "analyzer": "ik_max_word",
  "text": "中国共产党"
}

发送请求后，可以看到右侧的结果为：

{
  "tokens" : [
    {
      "token" : "中国共产党",
      "start_offset" : 0,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 0
    },
    {
      "token" : "中国",
      "start_offset" : 0,
      "end_offset" : 2,
      "type" : "CN_WORD",
      "position" : 1
    },
    {
      "token" : "国共",
      "start_offset" : 1,
      "end_offset" : 3,
      "type" : "CN_WORD",
      "position" : 2
    },
    {
      "token" : "共产党",
      "start_offset" : 2,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 3
    },
    {
      "token" : "共产",
      "start_offset" : 2,
      "end_offset" : 4,
      "type" : "CN_WORD",
      "position" : 4
    },
    {
      "token" : "党",
      "start_offset" : 4,
      "end_offset" : 5,
      "type" : "CN_CHAR",
      "position" : 5
    }
  ]
}

发现其除了包含最小切分的结果外，还包含了其他多种可能的分词结果。

自定义分词字典

1、输入一些自定义词组进行测试
例如：超级喜欢狂神说Java。其中“狂神说”是一个自定义词组。

发现了问题：“狂神说”被拆开了！
这种自己需要的词，需要自己加到分词器的字典中！
2、增加自己的字典：
在ik分词器插件的config目录里，可以新建自己的字典。

打开新建的kuang.dic文件，在其中补充自己想要的字典内容。

3、在配置文件中增加自定义字典：
在ik分词器插件的config目录里，可以看到IKAnalyzer.cfg.xml配置文件。

在配置文件中，配置自己新建的自定义字典。

4、重启ES并进行测试：
通过观察ES启动日志，可以发现ES在启动过程中加载了刚才自定义的字典。

5、再次测试自定义词组的分词结果：
输入“超级喜欢狂神说Java”，查看分词结果。

ik_smart（最少切分）算法分词结果：

ik_max_word（最细粒度切分）算法分词结果：

发现无论哪种分词算法，“狂神说”都已经作为了一个固定的词组被切分。
以后，我们自定义的词组，只需要在自定义的dic文件中进行配置即可！

Rest风格说明

REST是一种软件架构风格，或者说是一种规范，其强调HTTP应当以资源为中心，并且规范了URI的风格；规范了HTTP请求动作（GET/PUT/POST/DELETE/HEAD/OPTIONS）的使用，具有对应的语义。它主要用于客户端和服务器端交互类的软件。基于这个风格设计的软件可以更简洁，更有层次，更易于实现缓存等机制。
基本Rest命令说明：

method	url地址	描述
PUT	IP:9200/索引名称/_create/文档id	创建文档（指定文档id）
POST	IP:9200/索引名称/_create	创建文档（随机文档id）
POST	IP:9200/索引名称/_update/文档id	修改文档
DELETE	IP:9200/索引名称/_doc/文档id	删除文档
GET	IP:9200/索引名称/_doc/文档id	通过文档id查询文档
GET	IP:9200/索引名称/_search	查询所有数据

ES支持的数据类型：

字符串类型
text、keyword
数值类型
long、integer、short、byte、double、float、half float、scaled float、unsigned_long
日期类型
date、date_nanos
布尔值类型
boolean
二进制类型
binary
数组类型
array
空间数据类型
geo_point、geo_shape、point、shape
对象和关系类型
object、flattened、nested、join
其他类型

关于索引的基本操作

1、创建一个索引：
在Kibana的开发工具的控制台中输入如下命令，便可创建一个索引为test1，文档id为1的文档

# PUT /索引名称/_create/文档id
PUT /test001/_create/1
{
  "name": "狂神说",
  "age": 3
}

创建成功后，响应的 json 如下：

{
  "_index" : "test001",
  "_id" : "1",
  "_version" : 1,
  "result" : "created",
  "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 0,
  "_primary_term" : 1
}

如果当前索引和文档已经存在，再次执行上面的命令，则会报错，具体效果如下：

使用hand查看索引数据：

2、创建索引并明确其中的映射规则：
在Kibana中执行以下命令：

# PUT /索引名称
# {
#   "mappings": {
#     "properties": {
#       "字段名": {
#         "type": "字段类型"
#       },
#       ……
#     }
#   }
# }
PUT /test002
{
  "mappings": {
    "properties": {
      "name": {
        "type": "text"
      },
      "age": {
        "type": "long"
      },
      "birthday": {
        "type": "date"
      }
    }
  }
}

上述命令的含义是：创建索引test002，然后设置字段的映射关系，name字段的类型为text、age字段的类型为long、birthday字段的类型为date。
其执行结果如下所示：

3、获取指定索引信息：

# GET /索引名称
GET /test002

执行结果如下所示：

4、查看索引的默认信息

新建一个索引和文档

# PUT 索引名称/_doc/文档ID
# {
#   "字段名": 字段值,
#   ……
# }
PUT test003/_doc/1
{
  "namme": "狂神说",
  "age": 13,
  "birth": "1997-01-05"
}

然后使用GET命令获取test003索引的信息：

如果文档的字段没有指定类型，那么ES就会给我们默认配置字段类型！
扩展：通过命令获取ElasticSearch的状态信息：
1）通过GET _cat/health命令获取ES的健康状态

和ElasticSearch hand插件中显示的信息一样

2）通过GET _cat/indices?v命令获取所有索引的版本信息

5、删除索引：

# DELETE 索引名称
DELETE test001

删除test001索引

关于文档的基本操作

1、创建文档：
创建一个文档

# PUT 索引名称/_doc/文档ID
# {
#   "字段名": 字段的值,
#   ……
# }
PUT kuangshen/_doc/1
{
  "name": "狂神说",
  "age": 23,
  "desc": "一顿操作猛如虎，一看工资2500",
  "tags": [
    "技术宅",
    "温暖",
    "直男"
  ]
}

执行结果：

创建同类型的第二个文档

PUT kuangshen/_doc/2
{
  "name": "张三",
  "age": 3,
  "desc": "法外狂徒",
  "tags": [
    "交友",
    "旅游",
    "渣男"
  ]
}

执行结果：

创建第三个文档：

PUT kuangshen/_doc/3
{
  "name": "李四",
  "age": 30,
  "desc": "mmp，不知道如何形容",
  "tags": [
    "靓女",
    "旅游",
    "唱歌"
  ]
}

执行结果：

2、获取数据：
获取kuangshen索引中，文档ID为1的文档内容

# GET 索引名称/_doc/文档ID
GET kuangshen/_doc/1

查询结果：

3、修改文档：
1）使用PUT命令修改数据：

# PUT 索引名称/_doc/文档ID
# {
#   "字段名": 更新的目标值,
#     ……
# }

PUT kuangshen/_doc/3
{
  "name": "李四233",
  "age": 30,
  "desc": "mmp，不知道如何形容",
  "tags": [
    "靓女",
    "旅游",
    "唱歌"
  ]
}

执行命令后，可以看到如下效果：

使用PUT命令更新数据，是全量覆盖的模式，如果某个字段在更新的时候漏掉或者没有赋值，那么ES中对应的字段也会消失，如下图所示：

先执行上面的PUT命令，再使用GET命令查询文档。会发现desc字段消失了，因为在最新一次执行的PUT命令中，没有desc字段。

2）使用POST命令修改数据（推荐使用这种更新方式！！！）
先使用GET命令查看kuangshen索引中文档ID为1的文档的内容：

然后使用POST命令更新文档内容

# POST 索引名称/_update/文档ID
# {
#   "doc": {
#     "字段名": 更新的目标值,
#     ……
#   }
# }
POST kuangshen/_update/1
{
  "doc": {
    "name": "狂神说Java"
  }
}

执行结果

然后使用GET命令查看刚才修改的文档：

发现只有给定的字段的值发生了变化，其他值还是保持原来的内容。

3、删除文档：
根据文档ID删除文档

# DELETE 索引名称/_doc/文档ID
DELETE test001/_doc/1

删除test001索引中ID为1的文档

搜索数据

简单搜索

根据某个字段模糊搜索数据

# GET 索引名称/_search?q=字段名:搜索内容
GET kuangshen/_search?q=name:狂神说

执行结果：

在上面的返回结果中，可以看到一个_score字段，这个字段代表着搜索到的结果和搜索条件的匹配度分数，匹配度越高，分数也就越高，这里可以通过切换不同的搜索条件进行测试，会发现如果搜索条件和结果完全一样时，其分数会比不完全一样时更高。

复杂搜索（排序、分页、高亮、模糊匹配、精准匹配）

1、单条件查询数据：

# GET 索引名称/_search
# {
#   "query": {
#     "match": {
#       "字段名": "搜索内容" # 这里要注意字段的数据类型，如果是字符串型则是模糊匹配，如果是非字符串型则是精确匹配
#     }
#   }
# }
GET kuangshen/_search
{
  "query": {
    "match": {
      "name": "狂神"
    }
  }
}

查询结果如下：

为了方便后面演示，再插入一条相似的数据

PUT kuangshen/_doc/4
{
  "name": "狂神说前端",
  "age": 3,
  "desc" : "一顿操作猛如虎，一看工资2500",
  "tags" : [
    "技术宅",
    "温暖",
    "直男"
  ]
}

然后再执行上面的查询操作，可以看到如下结果：

2、查询结果中只显示指定的几个字段：
相当于SQL中的select a, b, c from table。一般推荐使用该方式进行查询。

# 通过"_source": ["FIELD_A", "FIELD_B", ...]参数来限制查询所得的字段
GET kuangshen/_search
{
  "query": {
    "match": {
      "name": "狂神"
    }
  },
  "_source": ["name", "desc"]
}

查询结果：

之后通过Java调用ES时，所有的对象和方法就是查询参数和结果中的key。
3、对查询结果排序：
通过sort参数可以实现对查询结果的排序：

# "sort": [
#     {
#       "FIELD": {
#         "order": "desc"
#       }
#     }
#   ]
# 以年龄降序查询name中包含狂神的数据
GET kuangshen/_search
{
  "query": {
    "match": {
      "name": "狂神"
    }
  },
  "sort": [
    {
      "age": {
        "order": "desc"
      }
    }
  ]
}

查询结果为：

也可以将排序方式改成升序（ASC），查询结果如下：

4、对查询结果分页：
使用from（从第几条开始）和size（每页显示数量）两个参数实现分页，相当于SQL中limit的两个参数offset和pagesize：

GET kuangshen/_search
{
  "query": {
    "match": {
      "name": "狂神"
    }
  },
  "sort": [
    {
      "age": {
        "order": "asc"
      }
    }
  ],
  "from": 0,
  "size": 1
}

查询结果：

ES中的数据下标也是从0开始的。
5、多条件查询：
1）在ES中，实现类似于SQL中的AND方式的多条件查询

# GET 索引名称/_search
# {
#   "query": {
#     "bool": {
#       "must": [
#         {
#           "match": {
#             "字段1": "对应的搜索内容"
#           }
#         },
#         {
#           "match": {
#             "字段2": "对应的搜索内容"	# 这里要注意字段的数据类型，如果是字符串型则是模糊匹配，如果是非字符串型则是精确匹配
#           }
#         }
#       ]
#     }
#   }
# }
GET kuangshen/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "name": "狂神"
          }
        },
        {
          "match": {
            "age": 3
          }
        }
      ]
    }
  }
}

查询结果如下：

2）在ES中，实现类似于SQL中的OR方式的多条件查询

GET kuangshen/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "match": {
            "name": "狂神"
          }
        },
        {
          "match": {
            "age": 23
          }
        }
      ]
    }
  }
}

查询结果：

3）查询不等于某一个值的数据

GET kuangshen/_search
{
  "query": {
    "bool": {
      "must_not": [
        {
          "match": {
            "age": 23
          }
        }
      ]
    }
  }
}

查询结果：

6、对查询结果进行过滤：
使用ES的过滤器对查询结果进行过滤。
过滤方式有很多种，其中有一种限制范围的过滤方式，条件有gt（大于）、gte（大于等于）、lt（小于）、lte（小于等于）。
查询name中包含“狂神”的数据，并过滤出age大于10的数据：

# "filter": [
# {
#   "range": {
#     "FIELD": {
#       "gte": 10,
#       "lte": 20
#     }
#   }
# }
# ]
GET kuangshen/_search
{
  "query": {
    "bool": {
      "must_not": [
        {
          "match": {
            "name": "狂神"
          }
        }
      ],
      "filter": [
        {
          "range": {
            "age": {
              "gt": 10
            }
          }
        }
      ]
    }
  }
}

查询结果：

7、同一个字段符合多个查询条件（OR关系）：
在同一个字段中，需要查询多个条件的，可以直接使用空格将查询条件隔开（多个条件之间是OR的关系），比如查询tags中包括“男”和“技术”两个词的数据：

GET kuangshen/_search
{
  "query": {
    "match": {
      "tags": "男 技术"
    }
  }
}

查询结果：

8、精确查询：
使用term参数实现精确查找。

term是单词级别的查询，这些查询通常⽤于结构化的数据，⽐如：number, date, keyword等，⽽不是对text。也就是说，全⽂本查询之前要先对⽂本内容进⾏分词，⽽单词级别的查询直接在相应字段的，反向索引中精确查找，单词级别的查询⼀般⽤于数值、⽇期等类型的字段上。
term查询是直接通过倒排索引指定的词条进行精确查找的！
match查询是通过分词器解析，先分析文档内容，然后通过分析的文档内容进行查询。

这里说明一下text类型和keywrod类型的区别：

text类型的数据可以被分词器分解成多个词；
keyword类型不可以被分解。

1）创建一个新的索引库，并为其字段指定类型

PUT testdb
{
  "mappings": {
    "properties": {
      "name": {
        "type": "text"
      },
      "desc": {
        "type": "keyword"
      }
    }
  }
}

2）按照上面的字段插入数据

PUT testdb/_doc/1
{
  "name":"狂神说Java name",
  "desc":"狂神说Java desc"
}

3）插入第二条数据

PUT testdb/_doc/2
{
  "name":"狂神说Java name",
  "desc":"狂神说Java desc2"
}

4）使用term查询

# GET 索引名称/_search
# {
#   "query": {
#     "term": {
#       "FIELD": {	# 要查询的字段名
#         "value": "VALUE"	# 要查询的值
#       }
#     }
#   }
# }
GET testdb/_search
{
  "query": {
    "term": {
      "name": {
        "value": "狂"
      }
    }
  }
}

查询结果：

由于name字段的类型是text型，其值可以被分词分解的，所以这时候查出了所有name中带“狂”字的数据。

GET testdb/_search
{
  "query": {
    "term": {
      "desc": {
        "value": "狂神说Java desc"
      }
    }
  }
}

查询结果：

由于desc字段是keyword型，其值不可以被分词器分解，所以只能查出完全匹配的数据来。

9、多个值匹配的精确查询：
再插入两条数据：

PUT testdb/_doc/3
{
  "t1": "22",
  "t2": "2022-03-23"
}

PUT testdb/_doc/4
{
  "t1": "33",
  "t2": "2022-03-24"
}

然后查询数据：

GET testdb/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "term": {
            "t1": {
              "value": "22"
            }
          }
        },
        {
          "term": {
            "t1": {
              "value": "33"
            }
          }
        }
      ]
    }
  }
}

执行结果为：

若将查询条件做一些微调，如下：

GET testdb/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "term": {
            "t1": {
              "value": "2"
            }
          }
        },
        {
          "term": {
            "t1": {
              "value": "3"
            }
          }
        }
      ]
    }
  }
}

其执行结果如下：

可以发现精确查询是起到了作用的。
10、查询结果中高亮显示被查询内容：
1）在查询结果中，高亮显示查询内容
通过highlight属性标记需要高亮的字段：

# "highlight": {
#   "fields": {
#     "FIELD_A": {},
#     "FIELD_B": {}
#   }
# }
GET kuangshen/_search
{
  "query": {
    "match": {
      "name": "狂神"
    }
  },
  "highlight": {
    "fields": {
      "name": {},
      "desc": {}
    }
  }
}

执行结果：

上面这种是最简单的高亮结果，除此之外，还可以通过pre_tags、post_tags、type、boundary_scanner_locale等等配置属性对高亮内容进行更多更加个性化的配置。

2）自定义高亮内容包裹的标签

GET kuangshen/_search
{
  "query": {
    "match": {
      "name": "狂神"
    }
  },
  "highlight": {
    "pre_tags": "",
    "post_tags": "
",
    "fields": {
      "name": {}
    }
  }
}

查询结果

这些高亮的属性除了可以作为highlight节点的子节点，也可以作为每一个字段的子节点，作为每个字段的子节点时，可以为每个字段设置不同的高亮配置信息，如有的字段的高亮为红色，有的字段的高亮为蓝色等。

总结

ES所能做的查询，MySQL基本上都能做，但是由于ES是基于Lucene，所以ES查询效率要比MySQL快很多。

匹配
按条件匹配
精确匹配
区间范围匹配
匹配字段过滤
多条件查询
高亮显示

SpringBoot集成ES详解

熟悉官方文档

打开ElasticSearch的官方文档：https://www.elastic.co/guide/index.html
可以看到有一个“Elasticsearch Clients”的链接

点击进入后，可以看到很多对应的链接，由于我使用的是ElasticSearch 8.1.0版本，所以这里使用官方推荐的Java Client

在介绍章节，可以看到可以看到Java API客户端关于功能特性、其和7.15版本相比较的变化及兼容性方面的描述。
了解完基本信息后，进入Introduction章节。

1、找到对应的maven依赖：

  <dependencies>
    <dependency>
      <groupId>co.elastic.clientsgroupId>
      <artifactId>elasticsearch-javaartifactId>
      <version>8.1.1version>
    dependency>
    <dependency>
      <groupId>com.fasterxml.jackson.coregroupId>
      <artifactId>jackson-databindartifactId>
      <version>2.12.3version>
    dependency>
  dependencies>

2、进入Connecting链接，查看如何创建链接

// Create the low-level client
RestClient restClient = RestClient.builder(
    new HttpHost("localhost", 9200)).build();

// Create the transport with a Jackson mapper
ElasticsearchTransport transport = new RestClientTransport(
    restClient, new JacksonJsonpMapper());

// And create the API client
ElasticsearchClient client = new ElasticsearchClient(transport);

3、通过API conventions可以了解如何使用ElasticsearchClient对象和其有哪些方法。
4、由于在使用ElasticSearch时，我们经常会先在Kibana中编写对应的PUT、GET、POST、DELETE语句进行测试，然后再在程序中实现这些语句，考虑到从JSON代码转换到Java代码过程的繁琐和容易出错的情况，ElasticSearch为开发者提供了一个加载JSON的方法——withJson()。具体用法在Creating API objects from JSON data中有相应的介绍。

在代码中集成ElasticSearch Java Client API

源代码地址：https://gitee.com/whh306318848/springboot-es
参考资料：

https://www.elastic.co/guide/en/elasticsearch/client/java-api-client/current/connecting.html
https://www.elastic.co/guide/en/elasticsearch/client/java-api-client/current/api-conventions.html
https://blog.csdn.net/yscjhghngh/article/details/123620860?utm_term=springboot%20es%208.1.0%20pom&utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2_allsobaiduweb~default-0-123620860&spm=3001.4430

1、创建项目：
在https://start.spring.io/创建项目，Group为com.kuang，Artifact为elasticsearch-01-api，Package Name为com.kuang，Java版本为8，然后添加依赖：

Spring Boot DevTools
Lombok
Spring Configuration Processor
Spring Web
Spring Data Elasticsearch (Access+Driver)

然后将构建好的项目下载下来，使用IDEA打开。

若使用IDEA直接创建也是一样的内容：

2、使用maven下载依赖包：
当项目导入IDEA后，使用maven下载项目所需的依赖包，这里建议可以将maven镜像换成阿里云的，具体操作方法可自行百度。
下载完依赖包之后，可以查看对应的spring-data-elasticsearch的底层依赖，发现其所使用的相关ES依赖和我们前面在ES官网上看到的不一致，这会导致我们无法正常的链接ES服务，这时我们需要对依赖做出相应的调整。
ES依赖的版本必须和ES服务器的版本对应

将pom配置文件中的spring-boot-starter-data-elasticsearch依赖替换成ES官方指定的依赖，然后重新编译项目。pom文件内容如下：


<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 https://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0modelVersion>
    <parent>
        <groupId>org.springframework.bootgroupId>
        <artifactId>spring-boot-starter-parentartifactId>
        <version>2.6.5version>
        <relativePath/> 
    parent>
    <groupId>com.kuanggroupId>
    <artifactId>elasticsearch-01-apiartifactId>
    <version>0.0.1-SNAPSHOTversion>
    <name>elasticsearch-01-apiname>
    <description>Demo project for Spring Bootdescription>
    <properties>
        <java.version>1.8java.version>
    properties>
    <dependencies>
        
        
        
        
        
        <dependency>
            <groupId>co.elastic.clientsgroupId>
            <artifactId>elasticsearch-javaartifactId>
            <version>8.1.1version>
        dependency>
        <dependency>
            <groupId>com.fasterxml.jackson.coregroupId>
            <artifactId>jackson-databindartifactId>
            <version>2.12.3version>
        dependency>

        
        <dependency>
            <groupId>org.glassfishgroupId>
            <artifactId>jakarta.jsonartifactId>
            <version>2.0.1version>
        dependency>

        

        <dependency>
            <groupId>org.springframework.bootgroupId>
            <artifactId>spring-boot-starter-webartifactId>
        dependency>

        <dependency>
            <groupId>org.springframework.bootgroupId>
            <artifactId>spring-boot-devtoolsartifactId>
            <scope>runtimescope>
            <optional>trueoptional>
        dependency>
        <dependency>
            <groupId>org.springframework.bootgroupId>
            <artifactId>spring-boot-configuration-processorartifactId>
            <optional>trueoptional>
        dependency>
        <dependency>
            <groupId>org.projectlombokgroupId>
            <artifactId>lombokartifactId>
            <optional>trueoptional>
        dependency>
        <dependency>
            <groupId>org.springframework.bootgroupId>
            <artifactId>spring-boot-starter-testartifactId>
            <scope>testscope>
        dependency>
    dependencies>

    <build>
        <plugins>
            <plugin>
                <groupId>org.springframework.bootgroupId>
                <artifactId>spring-boot-maven-pluginartifactId>
                <configuration>
                    <excludes>
                        <exclude>
                            <groupId>org.projectlombokgroupId>
                            <artifactId>lombokartifactId>
                        exclude>
                    excludes>
                configuration>
            plugin>
        plugins>
    build>
project>

3、创建配置类：
根据官方文档，需要创建一个ES的API client，这里使用配置类的方式对这个对象进行配置和管理。
创建package包，并在其下创建ElasticSearchClientConfig配置类，具体代码如下：

@Configuration
public class ElasticSearchClientConfig {

    @Bean
    public ElasticsearchClient elasticsearchClient() {
        // Create the low-level client
        RestClient restClient = RestClient.builder(
                new HttpHost("127.0.0.1", 9200)).build();
        // Create the transport with a Jackson mapper
        ElasticsearchTransport transport = new RestClientTransport(
                restClient, new JacksonJsonpMapper());
        // And create the API client
        ElasticsearchClient client = new ElasticsearchClient(transport);
        return client;
    }
}

3、编写测试代码：
在测试类中编写测试代码：
1）创建一个索引

@SpringBootTest
class Elasticsearch01ApiApplicationTests {

    @Autowired
    private ElasticsearchClient elasticsearchClient;

    // 测试创建索引
    @Test
    void testCeateIndex() {
        try {
            // 1、创建索引
            CreateIndexRequest kuang_index = new CreateIndexRequest.Builder().index("kuang_index").build();
            // 2、客户端执行请求 ElasticsearchIndicesClient，请求后获得响应
            CreateIndexResponse createIndexResponse = elasticsearchClient.indices().create(kuang_index);
            System.out.println(createIndexResponse);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

代码执行后，可以在Kibana中执行GET kuang_index/命令，就可以看到上述代码创建的索引了

关于索引的API操作详解

1、创建索引

// 测试创建索引
@Test
void testCeateIndex() throws IOException {
    CreateIndexResponse indexResponse = elasticsearchClient.indices().create(c->c.index(ESConst.ES_INDEX));
    System.out.printf("创建索引结果：" + indexResponse);
}

上面的代码，执行结果是创建的索引对象。相当于在Kibana中执行PUT kuang_index/命令。
其中ESConst.ES_INDEX是自定义的常量，其值为字符串kuang_index。
2、判断索引是否存在

// 判断索引是否存在
@Test
void testExistIndex() throws IOException {
    BooleanResponse indexResponse = elasticsearchClient.indices().exists(e -> e.index(ESConst.ES_INDEX));
    System.out.printf("查询索引结果：" + indexResponse.value());
}

上面的代码执行结果，若该索引存在，则返回true，否则返回false。

3、删除索引

// 删除索引
@Test
void testDeleteIndex() throws IOException {
    DeleteIndexResponse indexResponse = elasticsearchClient.indices().delete(d -> d.index(ESConst.ES_INDEX));
    System.out.printf("删除索引结果：" + indexResponse.acknowledged());
}

执行结果如下：

上面的代码相当于在Kibana中执行DELETE kuang_index/命令。其返回值也正好与执行上述命令的返回值对应。

关于文档的API操作详解

1、创建文档
一般需要放入ES的都是一个个的对象或者JSON字符串，所以先创建一个测试用的实体类

package com.kuang.pojo;

@Data
@AllArgsConstructor
@NoArgsConstructor
public class User {
    // 姓名
    private String name;
    // 年龄
    private Integer age;
}

然后在测试类中编写测试代码：

// 插入一个文档
@Test
void testAddDocument() throws IOException {
    User user = new User("张三", 18);
    IndexResponse indexResponse = elasticsearchClient.index(i -> i
            .index(ESConst.ES_INDEX)    // 指定索引
            .id("1")                    // 指定ID，若不指定则随机生成
            .document(user));           // 指定插入的文档内容
    System.out.printf("插入一个文档：" + indexResponse.result());
}

执行结果如下：

可以看到，其执行结果返回的是Created（已创建），如果是该ID已存在，这里则会返回Updated（已更新），同时也可以通过indexResponse.version()的方式获取版本号信息，从而判断该id是否已经存在。
上面的代码相当于在Kibana中执行以下命令：

PUT kuang_index/_doc/1
{
  "name": "张三",
  "age": 18
}

执行上面的代码之后，可以在Kibana中使用GET kuang_index/_doc/1命令查看刚才插入的数据

2、更新文档
除了上面说的使用类似于PUT命令的方式覆盖更新现有数据外，还可以对单个字段进行更新。

// 更新一个文档
@Test
void testUpdateDocument() throws IOException {
    User user = new User("李四", 20);
    UpdateResponse<User> updateResponse = elasticsearchClient.update(userBuilder -> userBuilder
            .index(ESConst.ES_INDEX)
            .id("1")
            .doc(user), User.class);
    System.out.printf("更新一个文档：" + updateResponse.result());
}

执行结果如下：

上面的代码相当于在Kibana中执行以下命令：

POST kuang_index/_update/1
{
  "doc": {
    "name": "李四",
    "age": 20
  }
}

3、删除文档

// 删除一个文档
@Test
void testDeleteDocument() throws IOException {
    DeleteResponse deleteResponse = elasticsearchClient.delete(d -> d
            .index(ESConst.ES_INDEX)
            .id("1"));
    System.out.printf("删除一个文档：" + deleteResponse.result());
}

执行结果如下：

上面的代码相当于在Kibana中执行命令：

DELETE kuang_index/_doc/1

4、批量操作文档
先演示批量插入操作：

// 批量插入数据
@Test
void testBulkAddDocument() throws IOException {
    // 准备要批量插入的数据
    List<User> userList = new ArrayList<>();
    userList.add(new User("张三", 18));
    userList.add(new User("李四", 19));
    userList.add(new User("王五", 20));
    userList.add(new User("赵六", 21));
    userList.add(new User("测试1", 30));
    userList.add(new User("测试2", 40));

    List<BulkOperation> bulkOperationList = new ArrayList<>();
    for (int i = 0; i < userList.size(); i++) {
        int id = i + 1;
        bulkOperationList.add(BulkOperation.of(fn -> fn.index(u -> u
                .id(String.valueOf(id))         // 这里设置文档的ID，如果不写，系统会生成随机ID
                .document(userList.get(id - 1)))));
    }

    BulkResponse bulkResponse = elasticsearchClient.bulk(builder -> builder.index(ESConst.ES_INDEX).operations(bulkOperationList));
    System.out.printf("批量插入数据：" + bulkResponse.items());
}

执行结果如下如所示：

若执行过程中出现了问题，则会返回true，除了使用.errors()方法判断执行结果之外，也可以通过BulkResponse对象的items()方法获取到每一个操作的具体执行结果，然后遍历查看具体每一个操作的执行情况。

批量更新文档代码如下：

// 批量更新文档
@Test
void testBulkUpdateDocument() throws IOException {
    // 准备要批量插入的数据
    List<User> userList = new ArrayList<>();
    userList.add(new User("张三", 28));
    userList.add(new User("李四", 29));

    List<BulkOperation> bulkOperationList = new ArrayList<>();
    for (int i = 0; i < userList.size(); i++) {
        int id = i + 1;
        bulkOperationList.add(BulkOperation.of(fn -> fn.update(io -> io
                .id(String.valueOf(id))         // 需要更新的文档的id
                .action(a -> a.doc(userList.get(id - 1))))));
    }
    BulkResponse bulkResponse = elasticsearchClient.bulk(builder -> builder.index(ESConst.ES_INDEX).operations(bulkOperationList));
    System.out.printf("批量更新数据：" + bulkResponse.errors());
}

批量删除文档代码如下：

// 批量删除数据
@Test
void testBulkDeleteDocument() throws IOException {
    List<BulkOperation> bulkOperationList = new ArrayList<>();
    bulkOperationList.add(BulkOperation.of(fn -> fn.delete(d -> d.id("3"))));
    bulkOperationList.add(BulkOperation.of(fn -> fn.delete(d -> d.id("4"))));

    BulkResponse bulkResponse = elasticsearchClient.bulk(builder -> builder.index(ESConst.ES_INDEX).operations(bulkOperationList));
    System.out.printf("批量删除数据：" + bulkResponse.errors());
}

上述批量操作代码执行之后，可以通过Kibana或者ElasticSearch-hand插件查看ES中的数据信息。
5、搜索文档
使用Java API查询数据有两种方式，一种就是在Java代码中编写查询条件，第二种则是在Kibana中先写好命令，然后通过Java API提供的.withJson()方法读入JSON文件的方式，自动构建查询条件。
第一种，在代码中编写查询条件：

// 根据条件查询数据
@Test
void testSearch() throws IOException {
    // 查询name字段，被分词器分词之后包含“赵”字的数据，与下面的命令等价
//        GET kuang_index/_search
//        {
//            "query": {
//            "term": {
//                "name": {
//                    "value": "赵"
//                }
//            }
//        }
//        }
    SearchResponse<User> searchResponse = elasticsearchClient.search(s -> s
            .index(ESConst.ES_INDEX)        // 设置查询的索引
            .timeout("1s")      // 设置查询超时时间
            // 设置查询的具体条件
            .query(q -> q
                    .term(t -> t
                            .field("name")
                            .value(v -> v.stringValue("赵"))
                    )
            )
            // 设置高亮字段
            .highlight(h -> h
                    .fields("name", f->f
                            .preTags("")
                            .postTags("
")
                    )
            ), User.class);

    // 查询age字段不等于28的数据，与下面的命令等价
//        GET kuang_index/_search
//        {
//            "query": {
//            "bool": {
//                "must_not": [
//                {
//                    "match": {
//                    "age": 28
//                }
//                }
//      ]
//            }
//        },
//            "from": 0,
//                "size": 5
//        }
//        SearchResponse searchResponse = elasticsearchClient.search(s -> s
//                .index(ESConst.ES_INDEX)        // 设置查询的索引
//                .timeout("1s")      // 设置查询超时时间
//                .from(0)        // 分页的偏移量
//                .size(5)         // 当前页面的数据条数
//                // 设置查询的具体条件
//                .query(q -> q
//                        .bool(b -> b
//                                .mustNot(m -> m
//                                        .match(fn -> fn
//                                                .field("age")
//                                                .query(28)
//                                        )
//                                )
//                        )
//                ), User.class);
    if (searchResponse == null || searchResponse.hits() == null || searchResponse.hits().hits() == null || searchResponse.hits().hits().size() < 1) {
        System.out.println("未查询到相关数据");
        return;
    }
    for (Hit<User> hit : searchResponse.hits().hits()) {
        System.out.println(hit.source().toString());
        if (hit.highlight() != null && hit.highlight().size() > 0) {
            for (Map.Entry<String, List<String>> entry : hit.highlight().entrySet()) {
                // 如果有高亮内容，则打印高亮内容
                System.out.println("Key = " + entry.getKey());
                entry.getValue().forEach(System.out::println);
            }
        }
    }
}

通过上面的例子可以看到，只要能够在Kibana中写出查询条件，都可以对应的转换为Java代码，上面的例子中只列举了几种简单的查询条件，其他查询方式，可自行练习。

第二种，通过JSON文件编写查询条件：
假设我们在Kibana中的命令如下：

GET kuang_index/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "range": {
            "age": {
              "gte": 20,
              "lt": 30
            }
          }
        }
      ]
    }
  },
  "from": 0,
  "size": 2
}

那我们可以将上面命令中的JSON字符串部分放入文件（我是在resource目录下新建了一个searchTerms目录，然后在里面创建json文件，放在其他地方也是可以的）

{
  "query": {
    "bool": {
      "filter": [
        {
          "range": {
            "age": {
              "gte": 20,
              "lt": 30
            }
          }
        }
      ]
    }
  },
  "from": 0,
  "size": 2
}

然后编写代码

// 读取JSON文件，进行数据查询
@Test
void testSearchWithJson() throws IOException {
    // 读取查询条件的JSON文件
    ClassPathResource classPathResource = new ClassPathResource("searchTerms/age.json");
    File file = classPathResource.getFile();
    FileReader reader = new FileReader(file);

    SearchResponse<User> searchResponse = elasticsearchClient.search(s -> s
            .index(ESConst.ES_INDEX)
            .withJson(reader), User.class);

    if (searchResponse == null || searchResponse.hits() == null || searchResponse.hits().hits() == null || searchResponse.hits().hits().size() < 1) {
        System.out.println("未查询到相关数据");
        return;
    }
    for (Hit<User> hit : searchResponse.hits().hits()) {
        System.out.println(hit.source().toString());
        if (hit.highlight() != null && hit.highlight().size() > 0) {
            for (Map.Entry<String, List<String>> entry : hit.highlight().entrySet()) {
                // 如果有高亮内容，则打印高亮内容
                System.out.println("Key = " + entry.getKey());
                entry.getValue().forEach(System.out::println);
            }
        }
    }
}

可以看到，使用JSON字符串构建查询条件，与直接在代码中编写查询条件的效果是完全一样的，而且由于少了从json到java代码的转换过程，这样还更加方便了。
除了查询外，.withJson()方法也可以用于创建索引、插入数据、更新数据等操作。

京东搜索项目

项目搭建

1、新建一个项目

勾选一些依赖项，然后创建项目。

2、打开pom.xml文件，添加ElasticSearch相关的依赖信息


<dependency>
    <groupId>co.elastic.clientsgroupId>
    <artifactId>elasticsearch-javaartifactId>
    <version>8.1.1version>
dependency>
<dependency>
    <groupId>com.fasterxml.jackson.coregroupId>
    <artifactId>jackson-databindartifactId>
    <version>2.12.3version>
dependency>


<dependency>
    <groupId>org.glassfishgroupId>
    <artifactId>jakarta.jsonartifactId>
    <version>2.0.1version>
dependency>

3、打开application.properties文件填写基本配置

server.port=9090
# 关闭thymeleaf的缓存
spring.thymeleaf.cache=false

4、将前端代码放入工程resources目录下
前端代码下载链接：https://pan.baidu.com/s/1PT3jLvCksOhq7kgAKzQm7g 提取码：s824
放入后，目录结构如下：

5、添加页面控制器
新建controllerpackage，在其下新建IndexController控制器类，编写如下代码

@Controller
public class IndexController {

    @GetMapping({"/", "/index"})
    public String index() {
        return "index";
    }
}

6、启动项目
启动项目，然后再浏览器中访问http://localhost:9090/，若能够看到如下界面，则代表项目搭建成功。

爬取数据

接下来，需要想办法获取到数据，打开京东官网，在搜索框中搜索关键字（如：Java），观察其url，可以发现其具有一定的规则。

经过测试，发现红框部分是真正对搜索有用的url，根据这个特点，加上京东搜索结果页面的格式，我们可以使用Java代码发起模拟的请求，然后通过解析京东返回的html代码，将其中的数据提取出来。
为了满足上面描述的这个过程，我们需要使用到jsoup包实现对html代码的爬取。
1、在pom.xml中导入jsoup依赖


<dependency>
    <groupId>org.jsoupgroupId>
    <artifactId>jsoupartifactId>
    <version>1.14.3version>
dependency>

注意：jsoup包只能用来爬取网页，不能用来下载电影、音乐等，如果需要下载电影、音乐等，可以使用tika包。
3、新建一个Bean承接从京东解析到的数据
新建pojopackage，在其下新建Commodity类。

@Data
@NoArgsConstructor
@AllArgsConstructor
public class Commodity {
    private String id;
    private String title;
    private String img_url;
    private String price_str;
    private Double price;

    public void setPrice_str(String price_str) {
        this.price_str = price_str;
        if (this.price_str != null && !this.price_str.trim().equals("")) {
            this.price = Double.valueOf(price_str);
        }
    }

    public void setPrice(Double price) {
        this.price = price;
        this.price_str = String.format("%.2f", this.price);
    }
}

从HTML中解析出来的价格数据是String类型的，为了方便后续的查询，可以自己重写Set方法，在set的时候将其转换成Double型。
2、编写解析HTML工具类：
新建utilspackage，在其下新建HtmlParseUtil类。

@Component
public class HtmlParseUtil {

    /**
     * 在京东搜索关键字并解析其结果
     *
     * @param keyword 要搜索的关键字
     * @return {@link List< Commodity>} 返回一个商品列表
     * @throws IOException 解析HTML代码时可能会抛出该异常
     * @author: wuhaohua
     * @date: 2022/4/10
     * @description:
     **/
    public List<Commodity> parseJD(String keyword) throws IOException {
        // 获取请求：https://search.jd.com/Search?keyword=java
        // 注意：使用jsoup无法获取ajax请求，如果想获取ajax请求返回的数据，需要单独用java代码模拟ajax请求
        String url = "https://search.jd.com/Search?keyword=" + keyword.trim();
        // 解析网页（Jsoup返回的Document对象就是浏览器中的Document对象），并设置超时时间为10秒
        Document parse = Jsoup.parse(new URL(url), 10000);
        // 所有在js代码中可以使用的方法，这里也同样可以使用
        // 分析京东网站的代码，获取存放搜索结果的div元素
        Element element = parse.getElementById("J_goodsList");
        // 打印获取的源码
//        System.out.println(element.html());

        // 暂存解析出来的数据
        List<Commodity> result = new ArrayList<>();

        // 获取每一个搜索结果的列表元素
        Elements elements = element.getElementsByTag("li");
        // 获取元素的内容，这里的el就是每一个标签了
        for (Element el : elements) {
            // 获取我们需要的数据
            // 使用下面的这种方法，是无法获取到图片的url的，因为图片是懒加载的方式加载的，当页面刚请求回来时，该图片还没有被加载
//            String img_url = el.getElementsByTag("img").eq(0).attr("src");`
            // 通过分析源码，可以得知在懒加载完成前，图片的url存放在data-lazy-img属性里
            String img_url = el.getElementsByTag("img").eq(0).attr("data-lazy-img");
            String price_str = el.getElementsByClass("p-price").get(0).getElementsByTag("i").eq(0).text();
            String title = el.getElementsByClass("p-name").eq(0).text();
//            System.out.println("标题：" + title + "，价格：" + price_str + "，图片：" + img_url);
            // 将解析的参数放入对象
            Commodity commodity = new Commodity();
            commodity.setId(id);
            commodity.setImg_url(img_url);
            commodity.setPrice_str(price_str);
            commodity.setTitle(title);
            result.add(commodity);
        }

        return result;
    }
}

业务编写

1、将之前编写的ElasticSearchClientConfig类放入本项目
新建configpackage，将ElasticSearchClientConfig类复制到包内。

@Configuration
public class ElasticSearchClientConfig {

    @Bean
    public ElasticsearchClient elasticsearchClient() {
        // Create the low-level client
        RestClient restClient = RestClient.builder(
                new HttpHost("127.0.0.1", 9200)).build();
        // Create the transport with a Jackson mapper
        ElasticsearchTransport transport = new RestClientTransport(
                restClient, new JacksonJsonpMapper());
        // And create the API client
        ElasticsearchClient client = new ElasticsearchClient(transport);
        return client;
    }
}

2、编写Service代码
新建servicepackage，在其下新建CommodityService类。

@Service
public class CommodityService {

    @Autowired
    private ElasticsearchClient client;

    // ES索引名称
    private static final String ES_INDEX = "jd_goods";

    /**
     * 解析商品信息
     *
     * @param keyword 搜索商品的关键字
     * @return {@link Boolean} 解析成功返回true，失败返回false
     * @throws
     * @author: wuhaohua
     * @date: 2022/4/10
     **/
    public Boolean parseCommodity(String keyword) {
        // 解析数据
        List<Commodity> commodityList = null;
        try {
            commodityList = new HtmlParseUtil().parseJD(keyword);
        } catch (IOException e) {
            e.printStackTrace();
            return false;
        }
        if (commodityList == null || commodityList.size() < 1) {
            return false;
        }
        // 把查询出来的数据批量放入ES中
        List<BulkOperation> bulkOperationList = new ArrayList<>();
        for (Commodity commodity : commodityList) {
            bulkOperationList.add(BulkOperation.of(fn -> fn
                            .index(io -> io
                                    .id(commodity.getId())
                                    .document(commodity)
                            )
                    )
            );
        }
        try {
            BulkResponse bulkResponse = client.bulk(builder -> builder
                    .index(ES_INDEX)
                    .operations(bulkOperationList)
            );
            // 如果执行出现错误，则返回失败
            if (bulkResponse.errors()) {
                List<BulkResponseItem> items = bulkResponse.items();
                for (BulkResponseItem item : items) {
                    System.out.println(item.error().reason());
                }
                return false;
            }
        } catch (IOException e) {
            e.printStackTrace();
            return false;
        }

        return true;
    }

    /**
     * 从ES中搜索相关的数据
     *
     * @param keyword  搜索关键字
     * @param pageNum  页码
     * @param pageSize 页面大小
     * @return {@link List} 搜索结果
     * @author: wuhaohua
     * @date: 2022/4/10
     **/
    public List<Commodity> searchPage(String keyword, int pageNum, int pageSize) throws IOException {
        if (pageNum < 1) {
            pageNum = 1;
        }

        // 计算分页偏移量的起始值
        int from = (pageNum - 1) * pageSize;

        // 条件搜索
        SearchResponse<Commodity> commoditySearchResponse = client.search(s -> s
                .index(ES_INDEX)
                .from(from)
                .size(pageSize)
                .query(q -> q
                        .match(m -> m
                                .field("title")
                                .query(keyword)
                        )
                ), Commodity.class);
        if (commoditySearchResponse == null || commoditySearchResponse.hits() == null || commoditySearchResponse.hits().hits() == null || commoditySearchResponse.hits().hits().size() < 1) {
            System.out.println("未查询到相关数据");
            return null;
        }
        List<Commodity> result = new ArrayList<>();
        for (Hit<Commodity> hit : commoditySearchResponse.hits().hits()) {
            result.add(hit.source());
        }

        return result;
    }
}

3、编写Controller代码
在controllerpackage中新建CommodityController类。

@RestController
public class CommodityController {

    @Autowired
    private CommodityService commodityService;

    @GetMapping("/parse/{keyword}")
    public Boolean parse(@PathVariable("keyword") String keyword) {
        return commodityService.parseCommodity(keyword);
    }

    @GetMapping("/search/{keyword}/{pageNum}/{pageSize}")
    public List<Commodity> search(@PathVariable("keyword") String keyword,
                                  @PathVariable("pageNum") int pageNum,
                                  @PathVariable("pageSize") int pageSize) throws IOException {
        return commodityService.searchPage(keyword, pageNum, pageSize);

    }
}

4、新建jd_goods索引
在ElasticSearch-hand中，新建jd_goods索引。

6、启动SpringBoot测试解析代码
启动SpringBoot，在浏览器中访问http://localhost:9090/parse/java，查看其返回值，如果是true，则代表解析代码通过测试，此时可以在Kibana中查看jd_goods相关的数据。

然后再在浏览器中访问http://localhost:9090/search/java/1/10，查看其返回值，若能返回对应的json对象，则代表代码正确。

前后端分离

在项目中引入vue.js和axios.js代码

然后修改index.html文件，编写js控制代码和axios网络请求代码。

DOCTYPE html>
<html xmlns:th="http://www.thymeleaf.org">

<head>
    <meta charset="utf-8"/>
    <title>狂神说Java-ES仿京东实战title>
    <link rel="stylesheet" th:href="@{/css/style.css}"/>
head>

<body class="pg">
<div class="page" id="app">
    <div id="mallPage" class=" mallist tmall- page-not-market ">

        
        <div id="header" class=" header-list-app">
            <div class="headerLayout">
                <div class="headerCon ">
                    
                    <h1 id="mallLogo">
                        <img th:src="@{/images/jdlogo.png}" alt="">
                    h1>

                    <div class="header-extra">

                        
                        <div id="mallSearch" class="mall-search">
                            <form name="searchTop" class="mallSearch-form clearfix">
                                <fieldset>
                                    <legend>天猫搜索legend>
                                    <div class="mallSearch-input clearfix">
                                        <div class="s-combobox" id="s-combobox-685">
                                            <div class="s-combobox-input-wrap">
                                                <input v-model="keyword" type="text" autocomplete="off" value="dd"
                                                       id="mq"
                                                       class="s-combobox-input" aria-haspopup="true">
                                            div>
                                        div>
                                        <button type="submit" @click.prevent="searchKey" id="searchbtn">搜索button>
                                    div>
                                fieldset>
                            form>
                            <ul class="relKeyTop">
                                <li><a>狂神说Javaa>li>
                                <li><a>狂神说前端a>li>
                                <li><a>狂神说Linuxa>li>
                                <li><a>狂神说大数据a>li>
                                <li><a>狂神聊理财a>li>
                            ul>
                        div>
                    div>
                div>
            div>
        div>

        
        <div id="content">
            <div class="main">
                
                <form class="navAttrsForm">
                    <div class="attrs j_NavAttrs" style="display:block">
                        <div class="brandAttr j_nav_brand">
                            <div class="j_Brand attr">
                                <div class="attrKey">
                                    品牌
                                div>
                                <div class="attrValues">
                                    <ul class="av-collapse row-2">
                                        <li><a href="#"> 狂神说 a>li>
                                        <li><a href="#"> Java a>li>
                                    ul>
                                div>
                            div>
                        div>
                    div>
                form>

                
                <div class="filter clearfix">
                    <a class="fSort fSort-cur">综合<i class="f-ico-arrow-d">i>a>
                    <a class="fSort">人气<i class="f-ico-arrow-d">i>a>
                    <a class="fSort">新品<i class="f-ico-arrow-d">i>a>
                    <a class="fSort">销量<i class="f-ico-arrow-d">i>a>
                    <a class="fSort">价格<i class="f-ico-triangle-mt">i><i class="f-ico-triangle-mb">i>a>
                div>

                
                <div class="view grid-nosku">

                    <div class="product" v-for="result in results">
                        <div class="product-iWrap" sku="{{result.id}}">
                            
                            <div class="productImg-wrap">
                                <a class="productImg">
                                    <img :src="result.img_url">
                                a>
                            div>
                            
                            <p class="productPrice">
                                <em><b>¥b>{{result.price_str}}em>
                            p>
                            
                            <p class="productTitle">
                                <a> {{result.title}} a>
                            p>
                            
                            <div class="productShop">
                                <span>店铺： 狂神说Java span>
                            div>
                            
                            <p class="productStatus">
                                <span>月成交<em>999笔em>span>
                                <span>评价 <a>3a>span>
                            p>
                        div>
                    div>
                div>
            div>
        div>
    div>
div>

<script th:src="@{/js/axios.js}">script>
<script th:src="@{/js/vue.js}">script>
<script>
    new Vue({
        el: "#app",
        data: {
            keyword: "",    // 搜索关键字
            results: []     // 搜索结果
        },
        methods: {
            searchKey() {
                var keyword = this.keyword;
                console.log(keyword);
                // 对接后端的接口
                axios.get("/search/" + keyword + "/1/20").then(response => {
                    if (response.status == 200 || response.status == 301 || response.status == 302) {
                        // 请求成功
                        if (response.data && response.data.length > 0) {
                            // 有数据返回
                            this.results = response.data;
                        }else  {
                            // 无数据返回
                            this.results = [];
                        }
                    }else {
                        // 请求失败
                        alert("服务器繁忙，请稍后重试，错误代码："+response.status)
                    }
                    // console.log(response)
                })
            }
        }
    });
script>

body>
html>

然后使用浏览器访问http://localhost:9090/，并在搜索框中输入java，点击搜索按钮，看到如下界面，代表代码没有问题。

关键字高亮实现

在CommodityService类中增加一个函数，用于处理高亮关键字的功能，代码如下：

public List<Commodity> searchHighLightPage(String keyword, int pageNum, int pageSize) throws IOException {
        if (pageNum < 1) {
            pageNum = 1;
        }

        // 计算分页偏移量的起始值
        int from = (pageNum - 1) * pageSize;

        // 条件搜索
        SearchResponse<Commodity> commoditySearchResponse = client.search(s -> s
                .index(ES_INDEX)
                .from(from)
                .size(pageSize)
                .highlight(h -> h
                        .requireFieldMatch(false)       // 只需要第一次匹配的地方高亮
                        .fields("title", fn -> fn   // 设置高亮字段
                                .preTags("")   // 设置高亮标签的前缀
                                .postTags("")                    // 设置高亮标签的后缀
                        )
                )
                .query(q -> q
                        .match(m -> m
                                .field("title")
                                .query(keyword)
                        )
                ), Commodity.class);
        if (commoditySearchResponse == null || commoditySearchResponse.hits() == null || commoditySearchResponse.hits().hits() == null || commoditySearchResponse.hits().hits().size() < 1) {
            System.out.println("未查询到相关数据");
            return null;
        }
        List<Commodity> result = new ArrayList<>();
        for (Hit<Commodity> hit : commoditySearchResponse.hits().hits()) {
            // 搜索出来的结果
            Commodity commodityTemp = hit.source();
            // 解析高亮的字段
            if (hit.highlight() != null && hit.highlight().get("title") != null) {
                // 如果有高亮内容，则替换标题
                List<String> hightLightTitleList = hit.highlight().get("title");
                if (hightLightTitleList.size() > 0) {
                    String newTitle = "";
                    for (String highLightTemp: hightLightTitleList) {
                        newTitle += highLightTemp.trim();
                    }
                    if (!newTitle.trim().equals("")) {
                        commodityTemp.setTitle(newTitle);
                    }
                }
            }
            result.add(commodityTemp);
        }

        return result;
    }

可以看到，上面的代码与普通的搜索代码只是在条件搜索部分增加了关于高亮字段的相关设置

.highlight(h -> h
        .requireFieldMatch(false)       // 只需要第一次匹配的地方高亮
        .fields("title", fn -> fn   // 设置高亮字段
                .preTags("")   // 设置高亮标签的前缀
                .postTags("")                    // 设置高亮标签的后缀
        )
)

然后在结果解析部分，使用高亮的结果替换掉了商品的title字段的内容：

for (Hit<Commodity> hit : commoditySearchResponse.hits().hits()) {
    // 搜索出来的结果
    Commodity commodityTemp = hit.source();
    // 解析高亮的字段
    if (hit.highlight() != null && hit.highlight().get("title") != null) {
        // 如果有高亮内容，则替换标题
        List<String> hightLightTitleList = hit.highlight().get("title");
        if (hightLightTitleList.size() > 0) {
            String newTitle = "";
            for (String highLightTemp: hightLightTitleList) {
                newTitle += highLightTemp.trim();
            }
            if (!newTitle.trim().equals("")) {
                commodityTemp.setTitle(newTitle);
            }
        }
    }
    result.add(commodityTemp);
}

然后在controller代码中调用该函数

@GetMapping("/searchHighLight/{keyword}/{pageNum}/{pageSize}")
    public List<Commodity> searchHighLight(@PathVariable("keyword") String keyword,
                                  @PathVariable("pageNum") int pageNum,
                                  @PathVariable("pageSize") int pageSize) throws IOException {
        if (pageNum < 1) {
            pageNum = 1;
        }
        if (pageSize < 1) {
            pageSize = 10;
        }

        //查询数据
        return commodityService.searchHighLightPage(keyword, pageNum, pageSize);
    }

同时，前端代码index.html中也需要做两处调整，一处是在商品标题的渲染代码，需要由原来的


<p class="productTitle">
    <a>{{result.title}}a>
p>

修改为：


<p class="productTitle">
    <a v-html="result.title">a>
p>

以便浏览器能够正确解析高亮的前缀和后缀。
第二处是修改js代码中修改请求路径为最新的url

axios.get("/searchHighLight/" + keyword + "/1/20").then(response => {

此时，强制刷新浏览器（Ctrl + F5），并搜索java，如果能看到以下效果，则表示代码正确。

可以看到，所有商品标题的第一个Java单词都被高亮显示了。

至此，本学习笔记结束。

你可能感兴趣的:(学习笔记,elasticsearch,学习,java)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
【前端】jQuery数组合并去重方法总结
在jQuery中合并多个数组并去重，推荐使用原生JavaScript的Set对象（高效简单）或$.unique()（仅适用于DOM元素，不适用于普通数组）。以下是完整解决方案：方法1：使用ES6Set（推荐）//定义多个数组constarr1=[1,2,3];constarr2=[2,3,4];constarr3=[3,4,5];//合并数组并用Set去重constmergedArray=[...
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
日历插件-FullCalendar的详细使用老马聊技术 JavaScript 前端 javascript
一、介绍FullCalendar是一个功能强大、高度可定制的JavaScript日历组件，用于在网页中显示和管理日历事件。它支持多种视图（月、周、日等），可以轻松集成各种框架，并提供丰富的事件处理功能。二、实操案例具体代码如下：FullCalendar日期选择body{font-family:Arial,sans-serif;margin:20px;}#calendar{max-width:900
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
RocketMQ 基础教程-应用篇-死信队列码炫课堂-码哥 rocketmq专题 rocketmq java
作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬学习必须往深处挖，挖的越深，基础越扎实！阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析
react-native android 环境搭建
环境：macjava版本：Java11最重要：一定要一定要一定要react涉及到很多的依赖下载，gradle和react相关的，第一次安装环境时有外网环境会快速很多。安装nodejs安装react-nativenpminstallreact-native-clinpminstallreact-native创建一个新项目react-nativeinitfirstReact替换gradle下载源rep
Java 调用 HTTP 接口的 7 种方式：全网最全指南
Java调用HTTP接口的7种方式：全网最全指南在开发过程中，调用HTTP接口是最常见的需求之一。本文将详细介绍Java中7种主流的调用HTTP接口的方式，包括每种工具的优缺点和完整代码实现。1.使用RestTemplateRestTemplate是Spring提供的同步HTTP客户端，适用于传统项目。尽管从Spring5开始被标记为过时，它仍然是许多开发者的首选。示例代码importorg.sp
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
javascript高级程序设计第3版——第12章 DOM2与DOM3 weixin_30687587 javascript 数据结构与算法 ViewUI
12章——DOM2与DOM3为了增强D0M1，DOM级规范定义了一些模块。DOM2核心：为不同的DOM类型引入了一些与XML命名空间有关的方法，还定义了以编程方式创建Document实例的方法；DOM2级样式：针对操作元素的样式而开发；其特性总结：1.每个元素都有一个关联的style对象，可用来确定和修改行内样式；2.要确定某个元素的计算样式，可使用getComgetComputedStyle（）
Java设计模式实战：高频场景解析与避坑指南 mckim_ 笔记学习 java 设计模式
引言设计模式是软件开发的基石，但许多开发者面对23种模式时容易陷入“学完就忘”或“滥用模式”的困境。本文从工业级项目视角出发，精选10种高频设计模式，结合真实代码案例与主流框架应用，帮你建立模式思维，拒绝纸上谈兵。一、创建型模式：告别new的暴力美学1.工厂方法模式（FactoryMethod）核心痛点：对象创建逻辑散落各处，难以统一管理。场景案例：电商平台需要支持多种支付方式（支付宝、微信、银联
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文