是三好

18--Elasticsearch

一 Elasticsearch介绍

1 全文检索

Elasticsearch是一个全文检索服务器

全文检索是一种非结构化数据的搜索方式

结构化数据：指具有固定格式固定长度的数据，如数据库中的字段。

非结构化数据：指格式和长度不固定的数据，如电商网站的商品详情。

结构化数据一般存入数据库，使用sql语句即可快速查询。但由于非结构化数据的数据量大且格式不固定，我们需要采用全文检索的方式进行搜索。全文检索通过建立倒排索引加快搜索效率。

2 倒排索引

索引

将数据中的一部分信息提取出来，重新组织成一定的数据结构，我们可以根据该结构进行快速搜索，这样的结构称之为索引。

索引即目录，例如字典会将字的拼音提取出来做成目录，通过目录即可快速找到字的位置。

索引分为正排索引和倒排索引。

正排索引（正向索引）

将文档id建立为索引，通过id快速可以快速查找数据。如数据库中的主键就会创建正排索引。

倒排索引（反向索引）

非结构化数据中我们往往会根据关键词查询数据。此时我们将数据中的关键词建立为索引，指向文档数据，这样的索引称为倒排索引。

创建倒排索引流程：

3 Elasticsearch数据结构

文档（Document）：文档是可被查询的最小数据单元，一个 Document 就是一条数据。类似于关系型数据库中的记录的概念。

类型（Type）：具有一组共同字段的文档定义成一个类型，类似于关系型数据库中的数据表的概念。

索引（Index）：索引是多种类型文档的集合，类似于关系型数据库中的库的概念。

域（Fied）：文档由多个域组成，类似于关系型数据库中的字段的概念。

Elasticsearch跟关系型数据库中概念的对比：

JAVA	项目	实体类	对象	属性
ES	Index	Type	Document	Filed
Mysql	Database	Table	Row	Column

注：ES7.X之后删除了type的概念，一个索引不会代表一个库，而是代表一张表。本文中使用ES7.17，所以目前的ES中概念对比为：

JAVA	项目	实体类	对象	属性
ES	Index		Document	Filed
Mysql	Database	Table	Row	Column

二 Elasticsearch安装

1 安装ES服务

准备工作

准备一台搭载有CentOS7系统的虚拟机，使用XShell连接虚拟机
关闭防火墙，方便访问ES

#关闭防火墙：
systemctl stop firewalld.service

#禁止防火墙自启动：
systemctl disable firewalld.service

配置最大可创建文件数大小

#打开系统文件：
vim /etc/sysctl.conf

#添加以下配置：
vm.max_map_count=655360

#配置生效：
sysctl -p

由于ES不能以root用户运行，我们需要创建一个非root用户，此处创建一个名为es的用户：

#创建用户：
useradd es

安装服务

使用xftp将linux版的ES上传至虚拟机
解压ES

#解压：
tar -zxvf elasticsearch-7.17.0-linux-x86_64.tar.gz

#重命名：
mv elasticsearch-7.17.0 elasticsearch1

#移动文件夹：
mv elasticsearch1 /usr/local/

#es用户取得该文件夹权限：
chown -R es:es /usr/local/elasticsearch1

改变文件拥有者chown

语法：
chown [-R] 属主名:属组名 文件名

启动ES服务：

#切换为es用户：
su es

#进入ES安装文件夹：
cd /usr/local/elasticsearch1/bin/

#启动ES服务：
./elasticsearch

#查询ES服务是否启动成功
curl 127.0.0.1:9200

2 安装kibana

Kibana是一款开源的数据分析和可视化平台，设计用于和 Elasticsearch协作。我们可以使用Kibana对Elasticsearch索引中的数据进行搜索、查看、交互操作。

使用xftp将将Kibana压缩文件上传到Linux虚拟机
解压

tar -zxvf kibana-7.17.0-linux-x86_64.tar.gz  -C /usr/local/

修改配置

# 进入Kibana解压路径
cd /usr/local/kibana-7.17.0-linux-x86_64/config

# 修改配置文件
vim kibana.yml

# 加入以下内容
# kibana主机IP
server.host: "虚拟机IP"
# Elasticsearch路径
elasticsearch.hosts: ["http://127.0.0.1:9200"]

启动：

kibana不能以root用户运行，我们给es用户设置kibana目录的权限，并使用es用户运行kibana

# 给es用户设置kibana目录权限
chown -R es:es /usr/local/kibana-7.17.0-linux-x86_64/

# 切换为es用户
su es

# 启动kibana
cd /usr/local/kibana-7.17.0-linux-x86_64/bin/
./kibana

访问kibana：http://虚拟机IP:5601
点击 Management =>Stack Management => Index Management 可以查看es索引信息。

3 Docker安装

安装Elasticsearch

拉取镜像

docker pull elasticsearch:7.17.0

启动容器

# docker容器间建立通信
docker network create elastic
# 创建es容器
docker run --restart=always -p 9200:9200 -p 9300:9300 -e "discovery.type=singlenode" -e ES_JAVA_OPTS="-Xms512m -Xmx512m" --name='elasticsearch' --net elastic --cpuset-cpus="1" -m 1G -d elasticsearch:7.17.0

安装Kibana

拉取镜像

docker pull kibana:7.17.0

启动容器

docker run --name kibana --net elastic --link elasticsearch:elasticsearch -p 5601:5601 -d kibana:7.17.0

访问kibana：http://虚拟机IP:5601

三 Elasticsearch常用操作

1 索引操作

Elasticsearch是使用RESTful风格的http请求访问操作的，请求参数和返回值都是Json格式的，我们可以使用kibana发送http请求操作ES。

创建没有结构的索引

路径：ip地址:端口号/索引名

注：在kibana中所有的请求都会省略 ip地址:端口号，之后的路径我们省略写 ip地址:端口号

请求方式：PUT

举例：

PUT /student

为索引添加结构

POST /索引名/_mapping
{
 	"properties":{
 		"域名1":{
 			"type":域的类型,
 			"store":是否存储,
 			"index":是否创建索引,
            "analyzer":分词器
   			},
        
 		"域名2":{
 			...
 			}
 	}
}

举例：

POST /student/_mapping
{
  "properties": {
    "id":{
      "type":"integer"
    },
    "name": {
      "type": "text"
    },
    "age": {
      "type": "integer"
    }
  }
}

创建有结构的索引

PUT /索引名
{
    "mappings":{
        "properties":{
            "域名1":{
                "type":域的类型,
                "store":是否单独存储,
                "index":是否创建索引,
       			"analyzer":分词器
           },
            "域名2":{
                ...
           }
       }
   }
}

举例：

PUT /student1
{
  "mappings": {
    "properties": {
      "name": {
        "type": "text"
      },
      "age": {
        "type": "integer"
      }
    }
  }
}

删除索引

DELETE /索引名

举例:

DELETE /student1

2 文档操作

新增/修改文档

POST /索引/_doc/[id值]
{
 "field名":field值
}

注：id值不写时自动生成文档id，id和已有id重复时修改文档

举例：

POST /student/_doc/1
{
  "name": "lxx",
  "age": 18
}

根据id查询文档

GET /索引/_doc/id值

举例：

GET /student/_doc/1

删除文档

DELETE /索引/_doc/id值

举例：

DELETE /student/_doc/1

根据id批量查询文档

GET /索引/_mget
{
    "docs":[
       {"_id":id值},
       {"_id":id值}
   ]
}

举例：

GET /student/_mget
{
  "docs": [
    {
      "_id": 1
    },
    {
      "_id": 2
    }
  ]
}

查询所有文档

GET /索引/_search
{
   "query": {
       "match_all": {}
   }
}

举例：

GET /student/_search
{
  "query": {
    "match_all": {}
  }
}

修改文档部分字段

POST /索引/_doc/id值/_update
{
    "doc":{
        域名:值
 }
}

注：

Elasticsearch执行删除操作时，ES先标记文档为deleted状态，而不是直接物理删除。当ES存储空间不足或工作空闲时，才会执行物理删除操作。

Elasticsearch执行修改操作时，ES不会真的修改Document中的数据，而是标记ES中原有的文档为deleted状态，再创建一个新的文档来存储数据。

举例：

POST /student/_doc/1/_update
{
  "doc": {
    "name": "newLxx"
  }
}

3 域的属性

index

该域是否创建索引。只有值设置为true，才能根据该域的关键词查询文档。

// 根据关键词查询文档
GET /索引名/_search
{
 "query":{
        "term":{
 			搜索字段: 关键字
 		}
   }
}

案例：

PUT /student1
{
  "mappings": {
    "properties": {
      "name": {
        "type": "text",
        "index": true
      }
    }
  }
}

PUT /student2
{
  "mappings": {
    "properties": {
      "name": {
        "type": "text",
        "index": false
      }
    }
  }
}

POST /student1/_doc/1
{
  "name":"I love you"
}

POST /student2/_doc/1
{
  "name":"I love you"
}

GET /student1/_search
{
  "query":{
    "term":{
      "name":"love"
    }
  }
}
// 可以查询到结果

GET /student2/_search
{
  "query":{
    "term":{
      "name":"love"
    }
  }
}
// 查询不到结果

type

域的类型

核心类型	具体类型
字符串类型	text
整数类型	long, integer, short, byte
浮点类型	double, float
日期类型	date
布尔类型	boolean
数组类型	array
对象类型	object
不分词的字符串	keyword

store

是否单独存储。如果设置为true，则该域能够单独查询。

// 单独查询某个域：
GET /索引名/_search
{
  "stored_fields": ["域名"]
}

举例：

PUT /student3
{
  "mappings": {
    "properties": {
      "name": {
        "type": "text",
        "store": true
      }
    }
  }
}

POST /student3/_doc/1
{
  "name":"I love you1"
}

POST /student3/_doc/2
{
  "name":"I love you2"
}

GET /student3/_search
{
  "stored_fields": [
    "name"
  ]
}

四分词器

1 默认分词器

ES文档的数据拆分成一个个有完整含义的关键词，并将关键词与文档对应，这样就可以通过关键词查询文档。要想正确的分词，需要选择合适的分词器。

analyzer：插入文档时，将text类型的字段做分词然后插入倒排索引。

search_analyzer：查询时，先对要查询的text类型的输入做分词，再去倒排索引中搜索。

如果想要让’索引’和’查询’时使用不同的分词器，ElasticSearch也是能支持的，只需要在字段上加上search_analyzer参数。插入时，只会去看字段有没有定义analyzer，有定义的话就用定义的，没定义就用es预设的。查询时，会先去看字段有没有定义search_analyzer，如果没有定义，就去看有没有analyzer，再没有定义，才会去使用es预设的

standard analyzer：Elasticsearch默认分词器，根据空格和标点符号对英文进行分词，会进行单词的大小写转换。

默认分词器是英文分词器，对中文的分词是一字一词。

查看分词效果

GET /_analyze
{
 "text":"测试语句",
 "analyzer":"分词器"
}

举例

GET /_analyze
{
  "text": "I love you",
  "analyzer": "standard"
}

2 IK分词器

IKAnalyzer是一个开源的，基于java语言开发的轻量级的中文分词工具包。提供了两种分词算法：

ik_smart：最少切分
ik_max_word：最细粒度划分

安装IK分词器

关闭es服务
使用xftp将ik分词器上传至虚拟机

注：ik分词器的版本要和es版本保持一致。

解压ik分词器到elasticsearch的plugins目录下

unzip elasticsearch-analysis-ik-7.17.0.zip -d /usr/local/elasticsearch1/plugins/analysis-ik

启动ES服务

su es

#进入ES安装文件夹：
cd /usr/local/elasticsearch1/bin/

#启动ES服务：
./elasticsearch -d

测试分词器效果

GET /_analyze
{
 "text":"测试语句",
 "analyzer":"ik_smart/ik_max_word"
}

举例：

GET /_analyze
{
  "text": "湖人总冠军",
  "analyzer": "ik_smart"
}

IK分词器词典

IK分词器根据词典进行分词，词典文件在IK分词器的config目录中。(/usr/local/elasticsearch1/plugins/analysis-ik/config)

main.dic：IK中内置的词典。记录了IK统计的所有中文单词。
IKAnalyzer.cfg.xml：用于配置自定义词库。

<properties>
        <comment>IK Analyzer 扩展配置comment>
        
        <entry key="ext_dict">ext_dict.dicentry>
         
        <entry key="ext_stopwords">ext_stopwords.dicentry>
        
        
        
        
properties>

3 拼音分词器

拼音分词器可以将中文分成对应的全拼，全拼首字母等。

安装拼音分词器

关闭es服务
使用xftp将拼音分词器上传至虚拟机

注：ik分词器的版本要和es版本保持一致。

解压拼音分词器到elasticsearch的plugins目录下

unzip elasticsearch-analysis-pinyin-7.17.0.zip -d /usr/local/elasticsearch1/plugins/analysis-pinyin

启动ES服务

su es

#进入ES安装文件夹：
cd /usr/local/elasticsearch1/bin/

#启动ES服务：
./elasticsearch

测试分词器效果

GET /_analyze
{
 "text":"测试语句",
 "analyzer":"pinyin"
}

举例：

GET /_analyze
{
  "text": "湖人总冠军",
  "analyzer": "pinyin"
}

4 自定义分词器

真实开发中我们往往需要对一段内容既进行文字分词，又进行拼音分词，此时我们需要自定义ik+pinyin分词器。

创建自定义分词器

在创建索引时自定义分词器

PUT /索引名
{
    "settings" : {
        "analysis" : {
            "analyzer" : {
                "ik_pinyin" : { //自定义分词器名
                	"tokenizer":"ik_max_word", // 基本分词器
                	"filter":"pinyin_filter" // 配置分词器过滤
               }
           },
            "filter" : { // 分词器过滤时配置另一个分词器，相当于同时使用两个分词器
               "pinyin_filter" : {
                   "type" : "pinyin", // 另一个分词器
                   // 拼音分词器的配置
                   "keep_separate_first_letter" : false, // 是否分词每个字的首字母
                   "keep_full_pinyin" :true, // 是否分词全拼
                   "keep_original" : true,// 是否保留原始输入
                   "remove_duplicated_term": true // 是否删除重复项
               }
           }
       }
   },
    "mappings":{
        "properties":{
            "域名1":{
                "type":域的类型,
                "store":是否单独存储,
                "index":是否创建索引,
       			"analyzer":分词器
           },
            "域名2":{
                                ...
           }
       }
   }
}

举例：

PUT /student4
{
  "settings": {
    "analysis": {
      "analyzer": {
        "ik_pinyin": {
          "tokenizer": "ik_max_word",
          "filter": "pinyin_filter"
        }
      },
      "filter": {
        "pinyin_filter": {
          "type": "pinyin",
          "keep_separate_first_letter": false,
          "keep_full_pinyin": true,
          "keep_original": true,
          "remove_duplicated_term": true
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "name": {
        "type": "text",
        "store": true,
        "index": true,
        "analyzer": "ik_pinyin"
      },
      "age": {
        "type": "integer"
      }
    }
  }
}

测试自定义分词器

GET /索引/_analyze
{
  "text": "测试语句",
  "analyzer": "ik_pinyin"
}

举例：

GET /student4/_analyze
{
  "text": "湖人总冠军",
  "analyzer": "ik_pinyin"
}

五 Elasticsearch搜索文档

1 准备工作

Elasticsearch提供了全面的文档搜索方式，在学习前我们添加一些文档数据

PUT /students
{
  "mappings": {
    "properties": {
      "id": {
        "type": "integer",
        "index": true
      },
      "name": {
        "type": "text",
        "store": true,
        "index": true,
        "analyzer": "ik_smart"
      },
      "info": {
        "type": "text",
        "store": true,
        "index": true,
        "analyzer": "ik_smart"
      }
    }
  }
}
POST /students/_doc/
{
  "id": 1,
  "name": "百战程序员",
  "info": "I love baizhan"
}
POST /students/_doc/
{
  "id": 2,
  "name": "美羊羊",
  "info": "美羊羊是羊村最漂亮的人"
}
POST /students/_doc/
{
  "id": 3,
  "name": "懒羊羊",
  "info": "懒羊羊的成绩不是很好"
}
POST /students/_doc/
{
  "id": 4,
  "name": "小灰灰",
  "info": "小灰灰的年纪比较小"
}
POST /students/_doc/
{
  "id": 5,
  "name": "沸羊羊",
  "info": "沸羊羊喜欢美羊羊"
}
POST /students/_doc/
{
  "id": 6,
  "name": "灰太狼",
  "info": "灰太狼是小灰灰的父亲，每次都会说我一定会回来的"
}

文档搜索

GET /索引/_search
{
 "query":{
        搜索方式:搜索参数
   }
}

2 搜索方式

match_all：查询所有文档

{
 "query":{
        "match_all":{}
   }
}

举例：

GET /students/_search
{
  "query": {
    "match_all": {}
  }
}

match：全文检索。将查询条件分词后再进行搜索。

{
 "query":{
        "match":{
            "搜索字段":"搜索条件"
       }
   }
}

注：在搜索时关键词有可能会输入错误，ES搜索提供了自动纠错功能，即ES的模糊查询。使用match方式可以实现模糊查询。模糊查询对中文的支持效果一般，我们使用英文数据测试模糊查询。
{
    "query":{
        "match":{
            "域名":{
                "query":"搜索条件",
                "fuzziness":"最多错误字符数,不能超过2"
            }
        }
    }
}

举例：

GET /students/_search
{
  "query": {
    "match": {
      "info": "我喜欢成绩好的"
    }
  }
}

GET /students/_search
{
  "query": {
    "match": {
      "info": {
        "query": "lovr",
        "fuzziness": 1
      }
    }
  }
}

range：范围搜索。对数字类型的字段进行范围搜索

{
 "query":{
        "range":{
            搜索字段:{
                "gte":最小值,
                "lte":最大值
           }
       }
   }
}
gt/lt:大于/小于
gte/lte:大于等于/小于等于

举例：

GET /students/_search
{
  "query": {
    "range": {
      "id": {
        "gte": 2,
        "lte": 4
      }
    }
  }
}

match_phrase：短语检索。搜索条件不做任何分词解析，在搜索字段对应的倒排索引中精确匹配。

{
 "query":{
        "match_phrase":{
            搜索字段:搜索条件
       }
   }
}

举例：

GET /students/_search
{
  "query": {
    "match_phrase": {
      "info": "喜欢"
    }
  }
}

term/terms：单词/词组搜索。搜索条件不做任何分词解析，在搜索字段对应的倒排索引中精确匹配

{
 "query":{
        "term":{  
 			搜索字段: 搜索条件
       }
   }
}
{
 "query":{
        "terms":{  
 			搜索字段: [搜索条件1,搜索条件2]
       }
   }
}

举例：

GET /students/_search
{
  "query": {
    "term": {
      "info": "喜欢"
    }
  }
}

GET /students/_search
{
  "query": {
    "terms": {
      "info": ["喜欢","漂亮"]
    }
  }
}

3 复合搜索

GET /索引/_search
{
     "query": {
        "bool": {
            // 必须满足的条件
            "must": [
 				搜索方式:搜索参数,
 				搜索方式:搜索参数
           ],
            // 多个条件有任意一个满足即可
            "should": [
 				搜索方式:搜索参数,
   				搜索方式:搜索参数
   			],
 			// 必须不满足的条件
   			"must_not":[
  				搜索方式:搜索参数,
   				搜索方式:搜索参数
   			]
   		}
   	}
}

举例:

GET /students/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "info": "美羊羊喜欢成绩好的同学"
          }
        }
      ],
      "must_not": [
        {
          "range": {
            "id": {
              "gte": 1,
              "lte": 3
            }
          }
        }
      ]
    }
  }
}

4 结果排序

ES中默认使用相关度分数实现排序，可以通过搜索语法定制化排序。

GET /索引/_search
{
  "query": "搜索条件",
  "sort": [
    {
      "字段1": {
        "order": "asc"
      }
    },
    {
      "字段2": {
        "order": "desc"
      }
    }
  ]
}

由于ES对text类型字段数据会做分词处理，使用哪一个单词做排序都是不合理的，所以ES中默认不允许对text类型的字段做排序。如果需要使用字符串做结果排序，可以使用 keyword类型的字段作为排序依据，因为keyword字段不做分词处理。

举例:

GET /students/_search
{
  "query": {
    "match": {
      "name": "羊"
    }
  },
  "sort": [
    {
      "id": {
        "order": "desc"
      }
    }
  ]
}

5 分页查询

GET /索引/_search
{
     "query": 搜索条件,
     "from": 起始下标,
     "size": 查询记录数
}

举例：

GET /students/_search
{
  "query": {
    "match_all": {}
  },
  "from": 0,
  "size": 2
}

GET /students/_search
{
  "query": {
    "match_all": {}
  },
  "from": 2,
  "size": 2
}

6 高亮查询

在进行关键字搜索时，搜索出的内容中的关键字会显示不同的颜色，称之为高亮。

为什么在网页中关键字会显示不同的颜色，我们通过开发者工具查看网页源码：

我们可以在关键字左右加入标签字符串，数据传入前端即可完成高亮显示，ES可以对查询出的内容中关键字部分进行标签和样式的设置。

GET /索引/_search
{
 "query":搜索条件,
 "highlight":{
     "fields": {
               "高亮显示的字段名": {
                   // 返回高亮数据的最大长度
                   "fragment_size":100,
                   // 返回结果最多可以包含几段不连续的文字
                   "number_of_fragments":5
               }
            },
            "pre_tags":["前缀"],
            "post_tags":["后缀"]
       }
  }
}

举例：

GET /students/_search
{
  "query": {
    "match": {
      "info": "我喜欢成绩好的"
    }
  },
  "highlight": {
    "fields": {
      "info": {
        "fragment_size": 20,
        "number_of_fragments": 5
      }
    },
    "pre_tags": [
      ""
    ],
    "post_tags": [
      ""
    ]
  }
}

7 SQL查询

在ES7之后，支持SQL语句查询文档：

GET /_sql?format=txt
{
 "query": SQL语句
}

开源版本的ES并不支持通过Java操作SQL进行查询，如果需要操作 SQL查询，则需要氪金（购买白金版）

六原生JAVA操作ES

1 搭建项目

原生JAVA可以对ES的索引和文档进行操作，但操作较复杂，我们了解即可。

创建maven项目
maven项目引入以下依赖：

        <dependency>
            <groupId>org.elasticsearchgroupId>
            <artifactId>elasticsearchartifactId>
            <version>7.17.0version>
        dependency>
        <dependency>
            <groupId>org.elasticsearch.clientgroupId>
            <artifactId>elasticsearch-rest-high-level-clientartifactId>
            <version>7.17.0version>
        dependency>

2 索引操作

创建空索引

//索引操作
public class IndexTest {

    // 创建空索引
    @Test
    public void createIndex() throws IOException {
        // 1.创建客户端对象，连接ES
        RestHighLevelClient client = new
                RestHighLevelClient(RestClient.builder(new
                HttpHost("192.168.66.113", 9200, "http")));
        // 2.创建请求对象
        CreateIndexRequest request = new CreateIndexRequest("student");
        // 3.发送请求
        CreateIndexResponse response = client.indices().create(request, RequestOptions.DEFAULT);
        // 4.操作响应结果
        System.out.println(response.index());
        // 5.关闭客户端
        client.close();
    }

外部无法访问ES的解决方案：

打开Elasticsearch安装路径下config目录下的elasticsearch.yml 文件，加入如下配置：
discovery.seed_hosts: ["host1"]
network.host: 0.0.0.0
重新启动ES即可。

PS：如果修改配置文件后，启动报错:

1、max file descriptors [4096] for elasticsearch process is too low, increase to at least [65536]

每个进程最大同时打开文件数太小

修改/etc/security/limits.conf文件，增加配置，用户退出后重新登录生效
* soft nofile 65536
* hard nofile 65536
2、max number of threads [3818] for user [hadoop] is too low, increase to at least [4096]

问题同上，最大线程个数太低。

修改/etc/security/limits.conf文件，增加配置，用户退出后重新登录生效
* soft nproc 4096 
* hard nproc 4096

给索引添加结构

   //给索引添加结构
    @Test
    public void mappingIndex() throws IOException {
        // 1.创建客户端对象，连接ES
        RestHighLevelClient client = new
                RestHighLevelClient(RestClient.builder(new
                HttpHost("192.168.66.113", 9200, "http")));
        // 2.创建请求对象
        PutMappingRequest request = new PutMappingRequest("student");
        request.source("{\n" +
                "  \"properties\": {\n" +
                "    \"id\":{\n" +
                "      \"type\":\"integer\"\n" +
                "    },\n" +
                "    \"name\": {\n" +
                "      \"type\": \"text\"\n" +
                "    },\n" +
                "    \"age\": {\n" +
                "      \"type\": \"integer\"\n" +
                "    }\n" +
                "  }\n" +
                "}", XContentType.JSON);
        // 3.发送请求
        AcknowledgedResponse response = client.indices().putMapping(request, RequestOptions.DEFAULT);
        // 4.操作响应结果
        System.out.println(response.isAcknowledged());
        // 5.关闭客户端
        client.close();
    }

删除索引

    // 删除索引
    @Test
    public void deleteIndex() throws IOException {
        // 1.创建客户端对象，连接ES
        RestHighLevelClient client = new
                RestHighLevelClient(RestClient.builder(new
                HttpHost("192.168.66.113", 9200, "http")));
        // 2.创建请求对象
        DeleteIndexRequest request = new DeleteIndexRequest("student");
        // 3.发送请求
        AcknowledgedResponse response = client.indices().delete(request, RequestOptions.DEFAULT);
        // 4.操作响应结果

        System.out.println(response.isAcknowledged(
        ));
        // 5.关闭客户端
        client.close();
    }

3 文档操作

新增&修改文档

    //新增&修改文档
    @Test
    public void addDocument() throws IOException {
        // 1.创建客户端对象，连接ES
        RestHighLevelClient client = new
                RestHighLevelClient(RestClient.builder(new
                HttpHost("192.168.66.113", 9200, "http")));
        // 2.创建请求对象
        IndexRequest request = new IndexRequest("student").id("1");

        request.source(XContentFactory.jsonBuilder()
                .startObject()
                .field("id", 1)
                .field("name", "i love lxx")
                .field("age", 20)
                .endObject());
        // 3.发送请求
        IndexResponse response = client.index(request, RequestOptions.DEFAULT);
        // 4.操作响应结果
        System.out.println(response.status());
        // 5.关闭客户端
        client.close();
    }

根据id查询文档

    // 根据id查询文档
    @Test
    public void findByIdDocument() throws IOException {
        // 1.创建客户端对象，连接ES
        RestHighLevelClient client = new
                RestHighLevelClient(RestClient.builder(new
                HttpHost("192.168.66.113", 9200, "http")));
        // 2.创建请求对象
        GetRequest request = new GetRequest("student", "1");
        // 3.发送请求
        GetResponse response = client.get(request, RequestOptions.DEFAULT);
        // 4.操作响应结果

        System.out.println(response.getSourceAsString());
        // 5.关闭客户端
        client.close();
    }

删除文档

    // 删除文档
    @Test
    public void DeleteDocument() throws
            IOException {
        // 1.创建客户端对象，连接ES
        RestHighLevelClient client = new
                RestHighLevelClient(RestClient.builder(new
                HttpHost("192.168.66.113", 9200, "http")));
        // 2.创建请求对象
        DeleteRequest request = new DeleteRequest("student", "1");
        // 3.发送请求
        DeleteResponse response = client.delete(request, RequestOptions.DEFAULT);
        // 4.操作响应结果
        System.out.println(response.status());
        // 5.关闭客户端
        client.close();
    }

3 搜索操作

搜索所有文档

    //搜索所有文档
    @Test
    public void queryAllDocument() throws IOException {
        // 1.创建客户端对象，连接ES
        RestHighLevelClient client = new
                RestHighLevelClient(RestClient.builder(new
                HttpHost("192.168.66.113", 9200, "http")));
        // 创建搜索条件
        SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
        searchSourceBuilder.query(QueryBuilders.matchAllQuery());
        // 创建请求对象
        SearchRequest request = new SearchRequest("student").source(searchSourceBuilder);
        // 发送请求
        SearchResponse response = client.search(request, RequestOptions.DEFAULT);
        // 输出返回结果
        for (SearchHit hit : response.getHits()) {
            System.out.println(hit.getSourceAsString());
        }
        // 关闭客户端
        client.close();
    }

根据关键词搜索文档

  //根据关键词搜索文档
    @Test
    public void queryTermDocument() throws
            IOException {
        // 创建客户端对象，链接ES
        RestHighLevelClient client = new
                RestHighLevelClient(
                RestClient.builder(new
                        HttpHost("192.168.66.113", 9200, "http")));
        // 创建请求条件
        SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
        searchSourceBuilder.query(QueryBuilders.termQuery("name", "lxx"));
        // 创建请求对象
        SearchRequest request = new SearchRequest("student").source(searchSourceBuilder);
        // 发送请求
        SearchResponse response = client.search(request, RequestOptions.DEFAULT);
        // 输出返回结果
        for (SearchHit hit : response.getHits()) {
            System.out.println(hit.getSourceAsString());
        }
        // 关闭客户端
        client.close();
    }

七 SpringDataES

1 入门案例

项目搭建

Spring Data ElasticSearch是Spring对原生JAVA操作Elasticsearch 封装之后的产物。它通过对原生API的封装，使得JAVA程序员可以简单的对Elasticsearch进行操作。

创建SpringBoot项目，加入Spring Data Elasticsearch起步依赖：

        <dependency>
            <groupId>org.springframework.bootgroupId>
            <artifactId>spring-boot-starter-data-elasticsearchartifactId>
        dependency>

编写配置文件：

spring:
  elasticsearch:
    uris: http://192.168.66.113:9200

此时Spring Data ElasticSearch项目已经搭建完成。

创建实体类

一个实体类的所有对象都会存入ES的一个索引中，所以我们在创建实体类时关联ES索引

@Data
@NoArgsConstructor
@AllArgsConstructor
@Document(indexName = "product", createIndex = true)
public class Product {
    @Id
    @Field(type = FieldType.Integer, store = true, index = true)
    private Integer id;

    @Field(type = FieldType.Text, store = true, index = true,
            analyzer = "ik_max_word", searchAnalyzer = "ik_max_word")
    private String productName;

    @Field(type = FieldType.Text, store = true, index = true,
            analyzer = "ik_max_word", searchAnalyzer = "ik_max_word")
    private String productDesc;

}

@Document：标记在类上，标记实体类为文档对象，一般有如下属性：

indexName：对应索引的名称

createIndex：是否自动创建索引

@Id：标记在成员变量上，标记一个字段为主键，该字段的值会同步到ES该文档的id值。

@Field：标记在成员变量上，标记为文档中的域，一般有如下属性：

type：域的类型

index：是否创建索引，默认是 true

store：是否单独存储，默认是 false

analyzer：分词器

searchAnalyzer：搜索时的分词器

创建Repository接口

创建Repository接口继承ElasticsearchRepository，该接口提供了文档的增删改查方法

public interface ProductRepository extends ElasticsearchRepository<Product, Integer> {
}

测试方法

编写测试类，注入Repository接口并测试Repository接口的增删改查方法

@SpringBootTest
public class ProductRepositoryTest {

    @Autowired
    private ProductRepository repository;

    @Test
    public void addDocument() {
        Product product = new Product(1, "iphone30", "iphone30是苹果最新手机");
        repository.save(product);
    }

    @Test
    public void updateDocument() {
        Product product = new Product(1, "iphone31", "iphone31是苹果最新手机");
        repository.save(product);
    }

    @Test
    public void findAllDocument() {
        Iterable<Product> all = repository.findAll();
        for (Product product : all) {
            System.out.println(product);
        }
    }

    @Test
    public void findDocumentById() {
        Optional<Product> product = repository.findById(1);
        System.out.println(product.get());
    }
}

2 查询方式

接下来我们讲解SpringDataES支持的查询方式，首先准备一些文档数据：

		// 添加一些数据
		repository.save(new Product(2, "三体1", "三体1 是优秀的科幻小说"));
        repository.save(new Product(3, "三体2", "三体2 是优秀的科幻小说"));
        repository.save(new Product(4, "三体3", "三体3 是优秀的科幻小说"));
        repository.save(new Product(5, "elasticsearch", "elasticsearch是基于lucene开发的优秀的搜索引擎"));

使用Repository继承的方法查询文档

该方式我们之前已经讲解过了

使用DSL语句查询文档

ES通过json类型的请求体查询文档，方法如下：

GET /索引/_search
{
    "query":{
        搜索方式:搜索参数
   }
}

query后的json对象称为DSL语句，我们可以在接口方法上使用 @Query注解自定义DSL语句查询

   @Query("{\n" +
            "    \"match\": {\n" +
            "      \"productDesc\": \"?0\"\n" +
            "    }\n" +
            "  }")
    List<Product> findByProductDescMatch(String keyword);

    @Query("{\n" +
            "    \"match\": {\n" +
            "      \"productDesc\": {\n" +
            "        \"query\": \"?0\",\n" +
            "        \"fuzziness\": 1\n" +
            "      }\n" +
            "    }\n" +
            "  }")
    List<Product> findByProductDescFuzzy(String keyword);

按照规则命名方法进行查询

只需在Repository接口中按照SpringDataES的规则命名方法，该方法就能完成相应的查询。
规则：查询方法以findBy开头，涉及查询条件时，条件的属性用条件关键字连接。

关键字	命名规则	解释	示例
and	findByField1AndField2	根据Field1和Field2 获得数据	findByTitleAndContent
or	findByField1OrField2 根	据Field1或Field2 获得数据	findByTitleOrContent
is	findByField	根据Field获得数据	findByTitle
not	findByFieldNot	根据Field获得补集数据	findByTitleNot
between	findByFieldBetween	获得指定范围的数据	findByPriceBetween

	List<Product> findByProductName(String productName);

    List<Product> findByProductNameOrProductDesc(String productName, String productDesc);

    List<Product> findByIdBetween(Integer startId, Integer endId);

3 分页查询

使用继承或自定义的方法时，在方法中添加Pageable类型的参数，返回值为Page类型即可进行分页查询。

   // 测试继承的方法：
    @Test
    public void testFindPage() {
        // 参数1：页数，参数2：每页条数
        Pageable pageable = PageRequest.of(1, 3);
        Page<Product> page = repository.findAll(pageable);
        System.out.println("总条数" + page.getTotalElements());
        System.out.println("总页数" + page.getTotalPages());
        System.out.println("数据" + page.getContent());
    }

	 // 自定义方法
    Page<Product> findByProductDesc(String productDesc, Pageable pageable);


	// 测试自定义方法
    @Test
    public void testFindPage2() {
        Pageable pageable = PageRequest.of(0, 2);
        Page<Product> page = repository.findByProductDesc("三体", pageable);
        System.out.println("总条数" + page.getTotalElements());
        System.out.println("总页数" + page.getTotalPages());
        System.out.println("数据" + page.getContent());
    }

4 结果排序

使用继承或自定义的方法时，在方法中添加Sort类型的参数即可进行结果排序。

   // 结果排序
    @Test
    public void testFindSort() {
        Sort sort = Sort.by(Sort.Direction.DESC, "id");
        Iterable<Product> all = repository.findAll(sort);
        for (Product product : all) {
            System.out.println(product);
        }
    }

    // 测试分页加排序
    @Test
    public void testFindPage3() {
        Sort sort = Sort.by(Sort.Direction.DESC, "id");
        Pageable pageable = PageRequest.of(0, 2, sort);
        Page<Product> page = repository.findByProductDesc("三体", pageable);
        System.out.println("总条数" + page.getTotalElements());
        System.out.println("总页数" + page.getTotalPages());
        System.out.println("数据" + page.getContent());
    }

5 template工具类

SpringDataElasticsearch提供了一个工具类

ElasticsearchRestTemplate，我们使用该类对象也能对ES进行操作。

操作索引

    @Autowired
    private ElasticsearchRestTemplate template;

    // 新增索引
    @Test
    public void addIndex() {
        // 获得索引操作对象
        IndexOperations indexOperations = template.indexOps(Product.class);
        // 创建索引,注：该方法无法设置索引结构，不推荐使用
        indexOperations.create();
    }

    // 删除索引
    @Test
    public void delIndex() {
        // 获得索引操作对象
        IndexOperations indexOperations = template.indexOps(Product.class);
        // 删除索引
        indexOperations.delete();
    }

增删改文档

template操作文档的常用方法：

save()：新增/修改文档
delete()：删除文档

   // 新增/修改文档
    @Test
    public void addDocument() {
        Product product = new Product(7, "es1", "es是一款优秀的搜索引擎");
        template.save(product);
    }

    // 删除文档
    @Test
    public void delDocument() {
        template.delete("7", Product.class);
    }

查询文档

template的search方法可以查询文档：

SearchHits<T> search(Query query, Class<T> clazz)：查询文档，query是查询条件对象，clazz是结果
类型。

用法如下：

   // 查询文档
    @Test
    public void searchDocument() {
        // 1.确定查询方式
        //  MatchAllQueryBuilder builder = QueryBuilders.matchAllQuery();
        //  TermQueryBuilder builder =QueryBuilders.termQuery("productDesc", "手机");
        MatchQueryBuilder builder =
                QueryBuilders.matchQuery("productDesc", "我喜欢看科幻小说");
        // 2.构建查询条件
        NativeSearchQuery query = new
                NativeSearchQueryBuilder().withQuery(builder).build();
        // 3.查询
        SearchHits<Product> result = template.search(query, Product.class);
        // 4.处理查询结果
        for (SearchHit<Product> productSearchHit : result) {
            Product product = productSearchHit.getContent();
            System.out.println(product);
        }
    }

复杂条件查询

    @Test
    public void searchDocument2() {
//      String productName ="三体";
//      String productDesc = "小说";
        String productName = null;
        String productDesc = null;
        // 1.确定查询方式
        BoolQueryBuilder builder = QueryBuilders.boolQuery();
        // 如果没有传入参数，查询所有
        if (productName == null && productDesc == null) {
            MatchAllQueryBuilder matchAllQueryBuilder = QueryBuilders.matchAllQuery();
            builder.must(matchAllQueryBuilder);
        } else {
            if (productName != null && productName.length() > 0) {
                MatchQueryBuilder queryBuilder1 =
                        QueryBuilders.matchQuery("productName", productName);
                builder.must(queryBuilder1);
            }
            if (productDesc != null && productDesc.length() > 0) {
                MatchQueryBuilder queryBuilder2
                        = QueryBuilders.matchQuery("productDesc", productDesc);
                builder.must(queryBuilder2);
            }
        }
        // 2.构建查询条件
        NativeSearchQuery query = new NativeSearchQueryBuilder().withQuery(builder).build();
        // 3.查询
        SearchHits<Product> result = template.search(query, Product.class);
        // 4.处理查询结果
        for (SearchHit<Product> productSearchHit : result) {
            Product product = productSearchHit.getContent();
            System.out.println(product);
        }
    }

分页查询

  // 分页查询文档
    @Test
    public void searchDocumentPage() {
        // 1.确定查询方式
        MatchAllQueryBuilder builder = QueryBuilders.matchAllQuery();
        // 2.构建查询条件
        // 分页条件
        Pageable pageable = PageRequest.of(0, 3);
        NativeSearchQuery query = new NativeSearchQueryBuilder()
                .withQuery(builder)
                .withPageable(pageable)
                .build();
        // 3.查询
        SearchHits<Product> result = template.search(query, Product.class);
        // 4.将查询结果封装为Page对象
        List<Product> content = new ArrayList();
        for (SearchHit<Product> productSearchHit : result) {
            Product product = productSearchHit.getContent();
            content.add(product);
        }
        /**
         * 封装Page对象，参数1：具体数据，参数2：分页条件对象，参数3：总条数
         */
        Page<Product> page = new PageImpl(content, pageable, result.getTotalHits());

        System.out.println(page.getTotalElements());
        System.out.println(page.getTotalPages());
        System.out.println(page.getContent());
    }

结果排序

    @Test
    public void searchDocumentSort() {
        // 1.确定查询方式
        MatchAllQueryBuilder builder = QueryBuilders.matchAllQuery();
        // 2.构建查询条件
        // 排序条件
        SortBuilder sortBuilder = SortBuilders.fieldSort("id").order(SortOrder.DESC);
        NativeSearchQuery query = new NativeSearchQueryBuilder()
                .withQuery(builder)
                .withSorts(sortBuilder)
                .build();
        // 3.查询
        SearchHits<Product> result = template.search(query, Product.class);
        // 4.处理查询结果
        for (SearchHit<Product> productSearchHit : result) {
            Product product = productSearchHit.getContent();
            System.out.println(product);
        }
    }

八 Elasticsearch集群

1 概念

在单台ES服务器上，随着一个索引内数据的增多，会产生存储、效率、安全等问题。

假设项目中有一个500G大小的索引，但我们只有几台200G硬盘的服务器，此时是不可能将索引放入其中某一台服务器中的。

此时我们需要将索引拆分成多份，分别放入不同的服务器中，此时这几台服务器维护了同一个索引，我们称这几台服务器为一个集群，其中的每一台服务器为一个节点，每一台服务器中的数据称为一个分片。

此时如果某个节点故障，则会造成集群崩溃，所以每个节点的分片往往还会创建副本，存放在其他节点中，此时一个节点的崩溃就不会影响整个集群的正常运行。

节点（node）：一个节点是集群中的一台服务器，是集群的一部分。它存储数据，参与集群的索引和搜索功能。集群中有一个为主节点，主节点通过ES内部选举产生。

集群（cluster）：一组节点组织在一起称为一个集群，它们共同持有整个的数据，并一起提供索引和搜索功能。

分片（shards）：ES可以把完整的索引分成多个分片，分别存储在不同的节点上。

副本（replicas）：ES可以为每个分片创建副本，提高查询效率，保证在分片数据丢失后的恢复。

注：

分片的数量只能在索引创建时指定，索引创建后不能再更改分片数量，但可以改变副本的数量。

为保证节点发生故障后集群的正常运行，ES不会将某个分片和它的副本存在同一台节点上。

2 搭建集群

安装第一个ES节点

安装

#解压：
tar -zxvf elasticsearch-7.17.0-linux-x86_64.tar.gz

#重命名：
mv elasticsearch-7.17.0 myes1

#移动文件夹：
mv myes1 /usr/local/

#安装ik分词器
unzip elasticsearch-analysis-ik-7.17.0.zip -d /usr/local/myes1/plugins/analysis-ik

#安装拼音分词器
unzip elasticsearch-analysis-pinyin-7.17.0.zip -d /usr/local/myes1/plugins/analysis-pinyin

#es用户取得该文件夹权限：
chown -R es:es /usr/local/myes1

修改配置文件

#打开节点一配置文件：
vim /usr/local/myes1/config/elasticsearch.yml

配置如下信息：

#集群名称，保证唯一
cluster.name: my_elasticsearch
#节点名称，必须不一样
node.name: node1
#可以访问该节点的ip地址
network.host: 0.0.0.0
#该节点服务端口号
http.port: 9200
#集群间通信端口号
transport.tcp.port: 9300
#候选主节点的设备地址
discovery.seed_hosts: ["127.0.0.1:9300","127.0.0.1:9301","127.0.0.1:9302"]
#候选主节点的节点名
cluster.initial_master_nodes: ["node1","node2","node3"]

启动

#切换为es用户：
su es
#后台启动第一个节点：
ES_JAVA_OPTS="-Xms512m -Xmx512m" /usr/local/myes1/bin/elasticsearch -d

安装第二个ES节点

安装

#解压：
tar -zxvf elasticsearch-7.17.0-linux-x86_64.tar.gz

#重命名：
mv elasticsearch-7.17.0 myes2

#移动文件夹：
mv myes2 /usr/local/

#安装ik分词器
unzip elasticsearch-analysis-ik-7.17.0.zip -d /usr/local/myes2/plugins/analysis-ik

#安装拼音分词器
unzip elasticsearch-analysis-pinyin-7.17.0.zip -d /usr/local/myes2/plugins/analysis-pinyin

#es用户取得该文件夹权限：
chown -R es:es /usr/local/myes2

修改配置文件

#打开节点二配置文件：
vim /usr/local/myes2/config/elasticsearch.yml

配置如下信息：

#集群名称，保证唯一
cluster.name: my_elasticsearch
#节点名称，必须不一样
node.name: node2
#可以访问该节点的ip地址
network.host: 0.0.0.0
#该节点服务端口号
http.port: 9201
#集群间通信端口号
transport.tcp.port: 9301
#候选主节点的设备地址
discovery.seed_hosts: ["127.0.0.1:9300","127.0.0.1:9301","127.0.0.1:9302"]
#候选主节点的节点名
cluster.initial_master_nodes: ["node1","node2","node3"]

启动

#切换为es用户：
su es

#后台启动第二个节点：
ES_JAVA_OPTS="-Xms512m -Xmx512m" /usr/local/myes2/bin/elasticsearch -d

安装第三个ES节点

安装

#解压：
tar -zxvf elasticsearch-7.17.0-linux-x86_64.tar.gz

#重命名：
mv elasticsearch-7.17.0 myes3

#移动文件夹：
mv myes3 /usr/local/

#安装ik分词器
unzip elasticsearch-analysis-ik-7.17.0.zip -d /usr/local/myes3/plugins/analysis-ik

#安装拼音分词器
unzip elasticsearch-analysis-pinyin-7.17.0.zip -d /usr/local/myes3/plugins/analysis-pinyin

#es用户取得该文件夹权限：
chown -R es:es /usr/local/myes3

修改配置文件

#打开节点三配置文件：
vim /usr/local/myes3/config/elasticsearch.yml

配置如下信息：

#集群名称，保证唯一
cluster.name: my_elasticsearch
#节点名称，必须不一样
node.name: node3
#可以访问该节点的ip地址
network.host: 0.0.0.0
#该节点服务端口号
http.port: 9202
#集群间通信端口号
transport.tcp.port: 9302
#候选主节点的设备地址
discovery.seed_hosts: ["127.0.0.1:9300","127.0.0.1:9301","127.0.0.1:9302"]
#候选主节点的节点名
cluster.initial_master_nodes: ["node1","node2","node3"]

启动

#切换为es用户：
su es

#后台启动第三个节点：
ES_JAVA_OPTS="-Xms512m -Xmx512m" /usr/local/myes3/bin/elasticsearch -d

测试集群

访问 http://虚拟机IP:9200/_cat/nodes 查看是否集群搭建成功。

kibana连接es集群

在kibana中访问集群

# 打开kibana配置文件
vim /usr/local/kibana-7.17.0-linux-x86_64/config/kibana.yml

添加如下配置

# 该集群的所有节点
elasticsearch.hosts: ["http://虚拟机IP:9200","http://虚拟机IP:9201","http://虚拟机IP:9202"]

启动kibana

#切换为es用户：
su es

#启动kibana：
/usr/local/kibana-7.17.0-linux-x86_64/bin/kibana

访问kibana： http://虚拟机IP:5601

3 测试集群状态

在集群中创建一个索引

PUT /product1
{
	"settings": {
		"number_of_shards": 5,// 分片数
		"number_of_replicas": 1// 每个分片的副本数

	},
	"mappings": {
		"properties": {
			"id": {
				"type": "integer",
				"store": true,
				"index": true
			},
			"productName": {
				"type": "text",
				"store": true,
				"index": true
			},
			"productDesc": {
				"type": "text",
				"store": true,
				"index": true
			}
		}
	}
}

查看集群状态

# 查看集群健康状态
GET /_cat/health?v

# 查看索引状态
GET /_cat/indices?v

# 查看分片状态
GET /_cat/shards?v

4 故障应对&水平扩容

关闭一个节点，可以发现ES集群可以自动进行故障应对。
重新打开该节点，可以发现ES集群可以自动进行水平扩容。
分片数不能改变，但是可以改变每个分片的副本数：

PUT /索引/_settings
{
    "number_of_replicas": 副本数
}

九 Elasticsearch优化

1 磁盘选择

ES的优化即通过调整参数使得读写性能更快

磁盘通常是服务器的瓶颈。Elasticsearch重度使用磁盘，磁盘的效率越高，Elasticsearch的执行效率就越高。这里有一些优化磁盘的技巧：

使用SSD（固态硬盘），它比机械磁盘优秀多了。
使用RAID0模式（将连续的数据分散到多个硬盘存储，这样可以并行进行IO操作）,代价是一块硬盘发生故障就会引发系统故障。
不要使用远程挂载的存储。

2 内存设置

ES默认占用内存是4GB，我们可以修改config/jvm.option设置ES的堆内存大小，Xms表示堆内存的初始大小，Xmx表示可分配的最大内存。

Xmx和Xms的大小设置为相同的，可以减轻伸缩堆大小带来的压力。
Xmx和Xms不要超过物理内存的50%，因为ES内部的Lucene也要占据一部分物理内存。
Xmx和Xms不要超过32GB，由于Java语言的特性，堆内存超过32G会浪费大量系统资源，所以在内存足够的情况下，最终我们都会采用设置为31G：

-Xms 31g
-Xmx 31g

例如：在一台128GB内存的机器中，我们可以创建两个节点，每个节点分配31GB内存。

3 分片策略

分片和副本数并不是越多越好。每个分片的底层都是一个Lucene索引，会消耗一定的系统资源。且搜索请求需要命中索引中的所有分片，分片数过多会降低搜索性能。索引的分片数需要架构师和技术人员对业务的增长有预先的判断，一般来说我们遵循以下原则：

每个分片占用的硬盘容量不超过ES的最大JVM的堆空间设置(一般设置不超过32G）。比如：如果索引的总容量在500G左右，那分片数量在16个左右即可。
分片数一般不超过节点数的3倍。比如：如果集群内有10个节点，则分片数不超过30个。
推迟分片分配：节点中断后集群会重新分配分片。但默认集群会等待一分钟来查看节点是否重新加入。我们可以设置等待的时长，减少重新分配的次数：

PUT  /索引/_settings
{
    "settings":{
      "index.unassianed.node_left.delayed_timeout":"5m"
   }
}

减少副本数量：进行写入操作时，需要把写入的数据都同步到副本，副本越多写入的效率就越慢。我们进行大批量进行写入操作时可以先设置副本数为0，写入完成后再修改回正常的状态。

十 Elasticsearch案例

1 需求说明

接下来我们使用ES模仿百度搜索，即自动补全+搜索引擎效果：

2 ES自动补全

es为我们提供了关键词的自动补全功能：

GET /索引/_search
{
    "suggest": {
        "prefix_suggestion": {// 自定义推荐名
            "prefix": "elastic",// 被补全的关键字
            "completion": {
                "field": "productName",// 查询的域
                "skip_duplicates": true, //忽略重复结果
                "size": 10 //最多查询到的结果数
           }
       }
   }
}

注：自动补全对性能要求极高，ES不是通过倒排索引来实现的，所以需要将对应的查询字段类型设置为completion。

PUT /product2
{
	"mappings": {
		"properties": {
			"id": {
				"type": "integer",
				"store": true,
				"index": true
			},
			"productName": {
				"type": "completion"
			},
			"productDesc": {
				"type": "text",
				"store": true,
				"index": true
			}
		}
	}
}

POST /product2/_doc
{
    "id":1,
    "productName":"elasticsearch1",
    "productDesc":"elasticsearch1 is a good search engine"
}
POST /product2/_doc
{
    "id":2,
    "productName":"elasticsearch2",
    "productDesc":"elasticsearch2 is a good search engine"
}
POST /product2/_doc
{
    "id":3,
    "productName":"elasticsearch3",
    "productDesc":"elasticsearch3 is a good search engine"
}

测试自动补全功能：

GET /product2/_search
{
  "suggest": {
    "prefix_suggestion": {
      "prefix": "elastic",
      "completion": {
        "field": "productName",
        "skip_duplicates": true,
        "size": 10
      }
    }
  }
}

3 创建索引

PUT /news
{
	"settings": {
		"analysis": {
			"analyzer": {
				"ik_pinyin": {
					"tokenizer": "ik_smart",
					"filter": "pinyin_filter"
				},
				"tag_pinyin": {
					"tokenizer": "keyword",
					"filter": "pinyin_filter"
				}
			},
			"filter": {
				"pinyin_filter": {
					"type": "pinyin",
					"keep_joined_full_pinyin": true,
					"keep_original": true,
					"remove_duplicated_term": true
				}
			}
		}
	},
	"mappings": {
		"properties": {
			"id": {
				"type": "integer",
				"index": true
			},
			"title": {
				"type": "text",
				"index": true,
				"analyzer": "ik_pinyin",
				"search_analyzer": "ik_smart"
			},
			"content": {
				"type": "text",
				"index": true,
				"analyzer": "ik_pinyin",
				"search_analyzer": "ik_smart"
			},
			"url": {
				"type": "keyword",
				"index": true
			},
			"tags": {
				"type": "completion",
				"analyzer": "tag_pinyin",
				"search_analyzer": "tag_pinyin"
			}
		}
	}
}

4 准备数据

将提前准备好的sql导入数据库：

/*
SQLyog Ultimate v12.09 (64 bit)
MySQL - 5.5.40-log : Database - news
*********************************************************************
*/


/*!40101 SET NAMES utf8 */;

/*!40101 SET SQL_MODE=''*/;

/*!40014 SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0 */;
/*!40014 SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0 */;
/*!40101 SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='NO_AUTO_VALUE_ON_ZERO' */;
/*!40111 SET @OLD_SQL_NOTES=@@SQL_NOTES, SQL_NOTES=0 */;
CREATE DATABASE /*!32312 IF NOT EXISTS*/`news` /*!40100 DEFAULT CHARACTER SET utf8 */;

USE `news`;

/*Table structure for table `news` */

DROP TABLE IF EXISTS `news`;

CREATE TABLE `news` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `title` varchar(255) NOT NULL,
  `url` varchar(255) DEFAULT NULL,
  `content` text,
  `tags` varchar(1000) DEFAULT NULL,
  PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=92 DEFAULT CHARSET=utf8 ROW_FORMAT=DYNAMIC;

/*Data for the table `news` */

insert  into `news`(`id`,`title`,`url`,`content`,`tags`) values (1,'略...','略...','略...','略...';

/*!40101 SET SQL_MODE=@OLD_SQL_MODE */;
/*!40014 SET FOREIGN_KEY_CHECKS=@OLD_FOREIGN_KEY_CHECKS */;
/*!40014 SET UNIQUE_CHECKS=@OLD_UNIQUE_CHECKS */;
/*!40111 SET SQL_NOTES=@OLD_SQL_NOTES */;

使用logstash工具可以将mysql数据同步到es中：

解压logstash-7.17.0-windows-x86_64.zip

logstash要和elastisearch版本一致

在解压路径下的/config中创建mysql.conf文件，文件写入以下脚本内容：

input {
   jdbc {
       jdbc_driver_library => "F:\001-after-end\笔记\14-全文检索与日志管理\Elasticsearch\软件\案例\mysql-connector-java-5.1.37-bin.jar"
       jdbc_driver_class => "com.mysql.jdbc.Driver"
       jdbc_connection_string => "jdbc:mysql:///news"
       jdbc_user => "root"
       jdbc_password => "123456"
       schedule => "* * * * *"
       jdbc_default_timezone => "Asia/Shanghai"
       statement => "SELECT * FROM news;"
   }
}

filter {
 mutate {
  split => {"tags" => ","}
 }
}

output {
   elasticsearch {
 	   hosts => ["192.168.66.113:9200"]
	   index => "news"
	   document_id => "%{id}"
   }
}

在解压路径下打开cmd黑窗口，运行命令：

bin\logstash -f config\mysql.conf

注意:

logstash解压路径不能有中文；

mysql.conf的编码必须为utf-8;

配置es可以远程访问（参照第六章配置）。

测试自动补齐

GET /news/_search
{
    "suggest": {
        "my_suggest": {
            "prefix": "li",
            "completion": {
                "field": "tags",
                "skip_duplicates": true,
                "size": 10
           }
       }
   }
}

5 项目搭建

创建Springboot项目，加入SpringDataElasticsearch和SpringMVC 的起步依赖

<dependency>
  	<groupId>org.springframework.bootgroupId>
    <artifactId>spring-boot-starter-data-elasticsearchartifactId>
dependency>

<dependency>  
	<groupId>org.springframework.bootgroupId>
    <artifactId>spring-boot-starter-webartifactId>
dependency>

<dependency>
    <groupId>org.projectlombokgroupId>
    <artifactId>lombokartifactId>
    <optional>trueoptional>
dependency>

写配置文件：

spring:
  elasticsearch:
    uris: 192.168.66.113:9200
 
logging:
  pattern:
    console: '%d{HH:mm:ss.SSS} %clr(%-5level) --- [%-15thread]%cyan(%-50logger{50}):%msg%n'

6 创建实体类

//索引已经提前创建好了，下面的实体类则不用添加那些和创建索引有关的属性了
@Document(indexName = "news")
@Data
public class News {
    @Id
    @Field
    private Integer id;
    @Field
    private String title;
    @Field
    private String content;
    @Field
    private String url;
    @CompletionField
    @Transient
    private Completion tags;
}

7 创建Repository接口

public interface NewsRepository extends ElasticsearchRepository<News, Integer> {
}

8 自动补全功能


@Service
public class NewsService {
    @Autowired
    private ElasticsearchRestTemplate template;

    // 自动补齐
    public List<String> autoSuggest(String keyword) {
        // 1.创建补全请求
        SuggestBuilder suggestBuilder = new SuggestBuilder();
        // 2.构建补全条件
        SuggestionBuilder suggestionBuilder = SuggestBuilders
                .completionSuggestion("tags")
                .prefix(keyword)
                .skipDuplicates(true)
                .size(10);
        suggestBuilder.addSuggestion("prefix_suggestion", suggestionBuilder);
        // 3.发送请求
        SearchResponse response = template.suggest(suggestBuilder, IndexCoordinates.of("news"));
        // 4.处理结果
        List<String> result = response.getSuggest()
                .getSuggestion("prefix_suggestion")
                .getEntries()
                .get(0)
                .getOptions()
                .stream()
                .map(Suggest.Suggestion.Entry.Option::getText)
                .map(Text::toString)
                .collect(Collectors.toList());
        return result;
    }
}

对应的原生es搜索为：

GET /news/_search
{
    "suggest": {
        "prefix_suggestion": {
            "prefix": "li",
            "completion": {
                "field": "tags",
                "skip_duplicates": true,
                "size": 10
           }
       }
   }
}

结果为：

{
  "took" : 33,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 0,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  },
  "suggest" : {
    "prefix_suggestion" : [
      {
        "text" : "li",
        "offset" : 0,
        "length" : 2,
        "options" : [
         	 {
            "text" : "利哈伊谷",
            "_index" : "news",
            "_type" : "_doc",
            "_id" : "18",
            "_score" : 1.0,
            "_source" : {
              "@timestamp" : "2023-05-06T08:39:01.668Z",
              "tags" : [
                "美国",
                "美国黑五",
                "利哈伊谷",
                "购物中心",
                "视频",
                "脸书",
                "保安",
                "塞缪尔·萨法迪",
                "海军陆战队",
                "现役海军陆战队员",
                "退役海军陆战队员",
                "礼品店",
                "礼品",
                "打斗",
                "安全人员",
                "安全"
              ],
              "content" : "海外网12月1日电 近日，一年一度的“黑色星期五”购物节拉开帷幕，热情的购物者涌向百货商店，都希望能买到打折商品。然而，美国各地也因此发生了几起暴力事件。美媒甚至感慨，“如果一年有一天会失去对人性的希望，那就是‘黑五’。”福克斯新闻网报道了本周内美国各个州因“黑五”引发的冲突事件，目击者拍下视频，画面在社交平台上疯传。当地时间11月29日晚上，在宾夕法尼亚州利哈伊谷购物中心的Forever 21商店外，发生了一场打斗事件。有网友将视频拍摄下来，略......",
              "id" : 18,
              "url" : "https://news.sina.com.cn/w/2019-12-01/doc-iihnzhfz2885717.shtml",
              "title" : """美国"黑五"冲突不断多地发生斗殴 有人鼻子被打断""",
              "@version" : "1"
            }
          },
          .......略
               
          
        ]
      }
    ]
  }
}

9 搜索关键字功能

在repository接口中添加高亮搜索关键字方法

// 高亮搜索关键字
@Highlight(fields = {@HighlightField(name = "title"), @HighlightField(name = "content")})
List<SearchHit<News>> findByTitleMatchesOrContentMatches(String title, String content);

service类中调用该方法

    @Autowired
    NewsRepository repository;

   // 查询关键字
    public List<News> highLightSearch(String keyword) {
        List<SearchHit<News>> result = repository.findByTitleMatchesOrContentMatches(keyword, keyword);
        // 处理结果，封装为News类型的集合
        List<News> newsList = new ArrayList();
        for (SearchHit<News> newsSearchHit : result) {
            News news = newsSearchHit.getContent();
            // 高亮字段
            Map<String, List<String>> highlightFields = newsSearchHit.getHighlightFields();
            if (highlightFields.get("title") != null) {
                news.setTitle(highlightFields.get("title").get(0));
            }
            if (highlightFields.get("content") != null) {
                news.setContent(highlightFields.get("content").get(0));
            }
            newsList.add(news);
        }
        return newsList;
    }

对应的原生es搜索为：

GET /news/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "match": {
            "title": "江西"
          }
        },
        {
          "match": {
            "content": "江西"
          }
        }
      ]
    }
  },
  "highlight": {
    "fields": [
      {
        "content": {
          "fragment_size": 20,
          "number_of_fragments": 5
        }
      },
      {
        "title": {
          "fragment_size": 20,
          "number_of_fragments": 5
        }
      }
    ],
    "pre_tags": [
      ""
    ],
    "post_tags": [
      ""
    ]
  }
}

结果为：

{
  "took" : 15,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 11.891368,
    "hits" : [
      {
        "_index" : "news",
        "_type" : "_doc",
        "_id" : "91",
        "_score" : 11.891368,
        "_source" : {
          "@timestamp" : "2023-05-06T08:39:01.686Z",
          "tags" : [
            "江西九江",
            "江西",
            "九江",
            "吴城",
            "吴城水上公路",
            "老鼠",
            "江西暴雨",
            "暴雨",
            "鄱阳湖",
            "洪水",
            "长江",
            "三峡"
          ],
          "content" : "7月4日，江西九江，吴城水上公路因暴雨被洪水淹没，有一辆车在水中熄火动弹不了，一市民和她老公去现场救援时发现公路旁有个亭子，发现里面竟有七八十只老鼠在亭内躲避洪水，并表示第一次看到这么多老鼠。该市民称，每年雨季这条公路都会被淹没，在此呼吁广大市民，雨季行车注意安全。江西省继续发布洪水预警，鄱阳湖防洪对长江流域相当重要今日10时，江西省继续发布洪水红色预警，鄱阳湖水位超警戒3.60米，形势严峻。鄱阳湖是江西的“集水盆”，江西境内五大河流经，略......",
          "id" : 91,
          "url" : "https://baijiahao.baidu.com/s?id=1672108752181366032&wfr=spider&for=pc",
          "title" : """江西暴雨近百只老鼠凉亭内躲洪水：密密麻麻紧贴石墩

江西暴雨近百只老鼠凉亭内躲洪水：密密麻麻紧贴石墩""",
          "@version" : "1"
        },
        "highlight" : {
          "title" : [
            "江西暴雨近百只老鼠凉亭内躲洪水：密密麻麻紧贴石墩",
            "江西暴雨近百只老鼠凉亭内躲洪水：密密麻麻紧贴石墩"
          ],
          "content" : [
            "7月4日，江西九江，吴城水上公路因暴雨被洪水淹没",
            "鄱阳湖是江西的“集水盆”，江西境内五大河流经鄱阳湖集纳后进入长江"
          ]
        }
      },
      略......
    ]
  }
}

10 创建Controller类

@RestController
public class NewsController {
    @Autowired
    private NewsService newsService;

    @GetMapping("/autoSuggest")
    public List<String> autoSuggest(String term) { // 前端使用jqueryUI，发送的参数默认名为term
        return newsService.autoSuggest(term);
    }

    @GetMapping("/highLightSearch")
    public List<News> highLightSearch(String term) {
        return newsService.highLightSearch(term);
    }
}

11 前端页面

我们使用jqueryUI中的autocomplete插件完成项目的前端实现

略。。。

你可能感兴趣的:(学习整理,elasticsearch)

Elasticsearch 介绍：分布式搜索与分析引擎吱屋猪_ elasticsearch
在如今大数据时代，企业和开发者面临着前所未有的数据量和实时性要求。为了能够高效地处理、存储和查询这些数据，Elasticsearch作为一种强大的分布式搜索引擎，已经成为了很多组织和开发者的首选解决方案。1.什么是Elasticsearch？Elasticsearch是一个开源的、基于ApacheLucene构建的全文搜索引擎。它提供了高效的搜索功能，并且非常适合处理大量数据，尤其是在需要快速搜索
《Linux运维总结：基于银河麒麟V10+ARM64架构部署多机elasticsearch7.17.21分布式集群+单机kibana7.17.21二进制版ssl集群》东城绝神《Linux运维实战总结》运维 linux elasticsearch ssl
总结：整理不易，如果对你有帮助，可否点赞关注一下？更多详细内容请参考：Linux运维实战总结一、背景elasticsearch是一个分布式、实时、高性能的搜索和分析引擎，它广泛应用于企业级搜索、日志分析、实时数据处理等领域。随着elasticsearch的广泛应用，安全性变得越来越重要。这里将从安全策略和访问控制两方面来部署elasticsearch集群安全策略涉及到数据安全、访问安全和操作安全等
Rocky Linux安装部署Elasticsearch（ELK日志服务器）_rockylinux elk 2401_83739411 程序员服务器 linux elasticsearch
一、Elasticsearch的简介Elasticsearch是一个强大的开源搜索和分析引擎，可用于实时处理和查询大量数据。它具有高性能、可扩展性和分布式特性，支持全文搜索、聚合分析、地理空间搜索等功能，是构建实时应用和大规模数据分析平台的首选工具。二、RockyLinux系统安装链接：VMwareWorkstation下载安装（含秘钥）链接：VMwareWorkstation创建虚拟机链接：Ro
Spring Boot 整合 Elasticsearch 实践：从入门到上手遇见伯灵说 mysql Spring elasticsearch jenkins springboot
引言Elasticsearch是一个开源的分布式搜索引擎，广泛用于日志分析、搜索引擎、数据分析等场景。本文将带你通过一步步的教程，在SpringBoot项目中整合Elasticsearch，轻松实现数据存储与查询。1.创建SpringBoot项目首先，你需要创建一个SpringBoot项目。如果你还没有创建，可以使用SpringInitializr快速生成一个项目。在生成项目时，确保选择了以下依赖
CentOS下安装ElasticSearch（日志分析）墨痕诉清风安全建设 elasticsearch 大数据日志分析
准备目录搞一个自己喜欢的目录mkdir/usr/local/app切换到该目录cd/usr/local/app下载wgethttps://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.9.2-linux-x86_64.tar.gz选择其他版本点击进入官网
docker 安装elasticsearch kibana，设置密码 biguojun docker elasticsearch kibana
安装elasticsearchdockerpulldocker.elastic.co/elasticsearch/elasticsearch:7.17.28dockerrun-d--namedocker-es-e"ES_JAVA_OPTS=-Xms512m-Xmx512m"-e"discovery.type=single-node"-vD:\docker\es\data:/usr/share/el
ElasticSearch-7.17.10集群升级至ElasticSearch-7.17.24 程序终结者 elasticsearch elasticsearch 大数据
文章目录集群概览主机名系统版本es01CentOS_7.6-aaarch64ElasticSearch-7.17.10es02CentOS_7.6-aaarch64ElasticSearch-7.17.10es03CentOS_7.6-aaarch64ElasticSearch-7.17.10需求1.将三台ES节点从ElasticSearch-7.17.10升级至ElasticSearch-7.1
ES中_cat/nodes返回结果参数的解释以及性能调优指南 Elastic开源社区 elasticsearch 运维调优 ES 全文检索 ES角色
文章目录1、Elasticsearch`_cat/nodes?v`字段详解2、常用字段说明3、`node.role`字段详解4、示例输出5、其他可选参数6、总结1、Elasticsearch_cat/nodes?v字段详解在Elasticsearch中，_cat/nodesAPI用于查看集群中所有节点的信息。通过添加?v参数，可以返回带有表头的详细输出，便于理解每个字段的含义。以下是_cat/no
ES 中时间日期类型 “yyyy-MM-dd HH:mm:ss” 的完全避坑指南 Elastic开源社区 elasticsearch es 分布式数据库
文章目录1、ES中的日期类型有何不同2、案例2.1案例介绍2.2原理揭秘3、路为何这么不平4、又一个坑5、总结6、ES的时间类型为什么这么难用，有没有什么办法可以解决？7、更优的生产解决方案1、ES中的日期类型有何不同时间和日期类型是我们作为开发每天都会遇到的一种常见数据类型。和Java中有所不同，Elasticsearch在索引创建之前并不是必须要创建索引的mapping。关系型数据库的思维就是
Search after解决ES深度分页问题 Elastic开源社区 elasticsearch 大数据 search after 深度分页 ES
文章目录1、search_after的作用和意义2、search_after的工作原理3、search_after的使用方法4、注意事项5、与传统分页的对比6、总结search_after是Elasticsearch中用于实现深度分页的一种机制。相比于传统的from和size分页方式，search_after更适合处理大数据集的分页查询，因为它避免了深度分页带来的性能问题。1、search_aft
[利用RAG和Elasticsearch打造智能检索系统：详解实现过程] afTFODguAKBF elasticsearch jenkins 大数据 python
引言在信息爆炸的时代，如何高效地从海量数据中提取有用信息成为了一个重要课题。通过结合RAG（Retrieval-AugmentedGeneration）和Elasticsearch，一种强大的信息检索和生成系统可以被实现。本文将详细介绍如何利用RAG和Elasticsearch打造一个智能检索系统。主要内容1.环境设置首先，我们需要设置必要的环境变量来访问Elasticsearch实例和OpenA
Elasticsearch：为推理端点配置分块设置 Elastic 中国社区官方博客 Elasticsearch AI Elastic elasticsearch 大数据搜索引擎人工智能全文检索数据库 ai
推理端点对一次可处理的文本量有限，具体取决于模型的输入容量。分块（Chunking）是指将输入文本拆分成符合这些限制的小块的过程，在将文档摄取到semantic_text字段时会进行分块。分块不仅有助于保持输入文本在可处理范围内，还能使内容更加易读。相比返回一整篇长文档，在搜索结果中提供最相关的文本片段更有价值。每个分块都会包含文本片段以及从中生成的对应嵌入。默认情况下，文档会被拆分为句子（sen
MySQL 与 Elasticsearch 联合查询墨瑾轩一起学学数据库【一】mysql elasticsearch adb
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣嘿，小伙伴们！今天我们要来聊聊MySQL与Elasticsearch如何携手合作，共同完成高效的联合查询和数据检索任务。MySQL是一款非常流行的数据库管理系统，而Elasticsearch则是一款基于Lucene的搜索引擎，擅长全文搜索和实时数据分析。两者结
Spring boot with ELK(Elasticsearch + Logstash + Kibana) netkiller-BG7NYT 多维度架构 spring boot elk elasticsearch
SpringbootwithELK(Elasticsearch+Logstash+Kibana)节选自《NetkillerSpringCloud手札》将Springboot日志写入ELK有多种实现方式，这里仅提供三种方案：Springboot->logback->Tcp/IP->logstash->elasticsearch这种方式实现非常方便不需要而外包或者软件Springboot->logba
Java面试系列-ElasticSearch面试题20道，文档，索引，搜索，聚合，分词器，集群管理，索引模版，数据备份和恢复，安全机制，集群扩展，实时搜索，索引生命周期，节点发现，批量操作，基本架构图苑 java 面试 elasticsearch
文章目录1.Elasticsearch的基本架构是什么？2.Elasticsearch中的Shard和Replica是如何工作的？3.Elasticsearch中的文档是如何存储的？4.Elasticsearch中的索引是如何创建的？5.Elasticsearch中的搜索是如何工作的？6.Elasticsearch中的聚合是如何工作的？7.Elasticsearch中的分词器是如何工作的？8.El
Spark任务读取hive表数据导入es 小小小小小小小小小小码农 hive elasticsearch spark java
使用elasticsearch-hadoop将hive表数据导入es，超级简单1.引入pomorg.elasticsearchelasticsearch-hadoop9.0.0-SNAPSHOT2.创建sparkconf//spark参数设置SparkConfsparkConf=newSparkConf();//要写入的索引sparkConf.set("es.resource","");//es集
windows安装es怎么在后台运行_Windows-ElasticSearch安装和启动 weixin_39531037
步骤二：安装ES服务Window版的ElasticSearch的安装很简单，类似Window版的Tomcat，解压开即安装完毕，解压后的ElasticSearch的目录结构如下：修改elasticsearch配置文件，config/elasticsearch.yml文件，增加文件内容如下：http.cors.enabled:truehttp.cors.allow-origin:"*"添加配置是为了
ES的预置分词器阿湯哥 elasticsearch 服务器 linux
Elasticsearch（简称ES）提供了多种预置的分词器（Analyzer），用于对文本进行分词处理。分词器通常由字符过滤器（CharacterFilters）、分词器（Tokenizer）和词元过滤器（TokenFilters）组成。以下是一些常用的预置分词器及其示例：1.StandardAnalyzer（标准分词器）默认分词器，适用于大多数语言。处理步骤：使用标准分词器（StandardT
IMX6ULL学习整理篇——UBoot的一些基础知识（1.编译流程） charlie114514191 从0开始的学习ARMv7a IMX6ULL芯片学习 UBoot 嵌入式软件编译
前言笔者整理了最近刷IMX6ULL的一些学习笔记，这里打算稍微整理一下东西发上来作为作为一个补充正文大部分而言，当我们拿到源码的时候，一般都是——先使用make来生成一份针对我们目标开发板的配置。举个例子，正点原子针对他们的开发板（EMMC作为类似于我们电脑的硬盘，DDR类似我们电脑的内存），使用的就是他们自己配置的mx6ull_14x14_ddr512_emmc_defconfig文件。也就是说
elasticsearch 备份恢复步骤 qq_35640866 elasticsearch chrome 大数据
1、查看仓库，GET_snapshot返回，仓库名是aliyun_auto_snapshot{"aliyun_auto_snapshot":{"type":"oss","settings":{"compress":"true","base_path":"fb632b-1241148226163200/xxx","endpoint":"http://oss-cn-shenzhen-internal.
elasticsearch 横向扩展-添加节点 yp2800 elasticsearch elasticsearch
ELKELK运维都会接触到，是一个分布式日志收集平台。logstash收集数据写到elasticsearch里，kibana从elasticsearch里读取数据。数据在elasticsearch里可以被检索，各种查询api,数据聚合等，功能很强大，不多说。environments目前现状：os:centos6.6elasticsearch:2.4cpu:8mem:48disk:8Tindex:4
使用Spring Boot和Elastic Stack构建实时日志分析系统微赚淘客系统开发者@聚娃科技 spring boot jenkins 后端
使用SpringBoot和ElasticStack构建实时日志分析系统大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！随着现代应用程序的复杂性增加，实时日志分析成为确保系统稳定性和性能的重要手段。本文将介绍如何利用SpringBoot和ElasticStack（Elasticsearch、Logstash、Kibana）构建一个高效的实时日志分析系统，实现日志的收集、
Elastic Stack 8.16.0 日志收集平台的搭建 JingAi_jia917 Elastisearch Logstash Filebeat Kibana Elastic stack ELK日志平台
简介1.1ELK介绍ELK是‌Elasticsearch‌、‌Logstash‌、‌Kibana‌三款开源工具的首字母缩写，构成了一套完整的日志管理解决方案，主要用于日志的采集、存储、分析与可视化‌。1）Logstash：数据管道工具，负责从多种来源（如文件、数据库、消息队列）采集日志，进行过滤、格式化后输出到目标（如Elasticsearch）‌；2）Elasticsearch：分布式实时搜索与
springboot2.2.x对接elasticsearch7.2.0，实现分页搜索情况下的高亮和摘要功能 lyc613 elasticsearch
springboot2.2.x对接elasticsearch7.2.0，实现分页搜索情况下的高亮和摘要功能相关依赖2.2.0.RELEASEorg.springframework.bootspring-boot-starter-data-elasticsearches配置spring:elasticsearch:rest:#es地址uris:http://192.168.125.12:9200功能
Java与Elasticsearch集成详解，以及使用指南 qzw1210 java elasticsearch jenkins
Java与Elasticsearch集成详解1.环境配置首先，你需要在Maven项目中添加ElasticsearchJava客户端依赖：co.elastic.clientselasticsearch-java8.10.0com.fasterxml.jackson.corejackson-databind2.15.2jakarta.jsonjakarta.json-api2.1.12.客户端初始化E
Elasticsearch大文件检索性能提升20倍实践（干货）_elasticsearch 查询优化 2401_84247505 2024年程序员学习 elasticsearch jenkins 大数据
3、问题排查与定位步骤1：限定返回记录条数。不提供直接访问末页的入口。baidu，360，搜狗等搜索引擎都不提供访问末页的请求方式。都是基于如下的请求方式：通过点击上一下、下一页逐页访问。这个从用户的角度也很好理解，搜索引擎返回的前面都是相关度最高的，也是用户最关心的信息。Elasticsearch的默认支持的数据条数是10000条，可以通过post请求修改。最终，本步骤将支持ES最大返回值100
elasticsearch analyzer 学习笔记 weixin_40455124 elasticsearch 代码分析及扩展 elasticsearch analyzer token
基本定义analyzer执行将输入字符流分解为token的过程使用场景在indexing的时候，也即在建立索引的时候在searching的时候，也即在搜索时，分析需要搜索的词语analysisCharacterfiltering(字符过滤器):使用字符过滤器转换字符Breakingtextintotokens(把文字转化为标记):将文本分成一组一个或多个标记Tokenfiltering：使用标记过
springboot 整合 elk （Elasticsearch+Logstash+Kibana）高大王竟然被注册 spring 运维
Elasticsearch是个开源分布式搜索引擎，它的特点有：分布式，零配置，自动发现，索引自动分片，索引副本机制，restful风格接口，多数据源，自动搜索负载等。Logstash是一个完全开源的工具，他可以对你的日志进行收集、过滤，并将其存储供以后使用（如，搜索）。Kibana也是一个开源和免费的工具，它Kibana可以为Logstash和ElasticSearch提供的日志分析友好的Web界
【Springboot知识】开发属于自己的中间件健康监测HealthIndicate 问道飞鱼微服务相关技术 spring boot 中间件后端 HealthIndicate
文章目录**一、技术栈****二、项目结构****三、依赖配置(pom.xml)****四、配置文件(application.yml)****五、自定义健康检查实现****1.Redis健康检查****2.Elasticsearch健康检查****3.Kafka健康检查****4.MySQL健康检查****六、自定义健康检查接口(可选)****七、测试与验证****八、高级功能扩展****九、部署
elk的相关的基础 weixin_43806846 elk
以下是关于ELK（Elasticsearch,Logstash,Kibana）的200个基础问题及其答案，涵盖了ELK的核心概念、组件、配置、使用场景、优化等方面。Elasticsearch基础**什么是Elasticsearch？**答：Elasticsearch是一个分布式、RESTful的搜索和分析引擎，基于ApacheLucene构建。**Elasticsearch的主要用途是什么？**答
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

18--Elasticsearch

一 Elasticsearch介绍

1 全文检索

2 倒排索引

3 Elasticsearch数据结构

二 Elasticsearch安装

1 安装ES服务

2 安装kibana

3 Docker安装

三 Elasticsearch常用操作

1 索引操作

2 文档操作

3 域的属性

四 分词器

1 默认分词器

2 IK分词器

3 拼音分词器

4 自定义分词器

五 Elasticsearch搜索文档

1 准备工作

2 搜索方式

3 复合搜索

4 结果排序

5 分页查询

6 高亮查询

7 SQL查询

六 原生JAVA操作ES

1 搭建项目

2 索引操作

3 文档操作

3 搜索操作

七 SpringDataES

1 入门案例

2 查询方式

3 分页查询

4 结果排序

5 template工具类

八 Elasticsearch集群

1 概念

2 搭建集群

3 测试集群状态

4 故障应对&水平扩容

九 Elasticsearch优化

1 磁盘选择

2 内存设置

3 分片策略

十 Elasticsearch案例

1 需求说明

2 ES自动补全

3 创建索引

4 准备数据

5 项目搭建

6 创建实体类

7 创建Repository接口

8 自动补全功能

9 搜索关键字功能

10 创建Controller类

11 前端页面

你可能感兴趣的:(学习整理,elasticsearch)

四分词器

六原生JAVA操作ES