阿昌喜欢吃黄桃

Day407&408&409.ES -谷粒商城

ES

一、基本概念

mysql用作持久化存储，ES用作检索

index索引

类比mysql的数据库概念

Type类型

类比mysql的表概念

Document文档

类比mysql的记录概念

index库>type表>document文档

为什么ES搜索快？倒排索引

检索：
1 红海特工行动？查出后计算相关性得分：3号记录命中了2次，且3号本身才有3个单词，2/3，所以3号最匹配
2 红海行动？

关系型数据库中两个数据表示是独立的，即使他们里面有相同名称的列也不影响使用，但ES中不是这样的。
elasticsearch是基于Lucene开发的搜索引擎，而ES中不同type下名称相同的filed最终在Lucene中的处理方式是一样的。

• 两个不同type下的两个user_name，在ES同一个索引下其实被认为是同一个filed，你必须在两个不同的type中定义相同的filed映射。
否则，不同type中的相同字段名称就会在处理中出现冲突的情况，导致Lucene处理效率下降。去掉type就是为了提高ES处理数据的效率。


Elasticsearch 7.x
URL中的type参数为可选。比如，索引一个文档不再要求提供文档类型。


Elasticsearch 8.x
不再支持URL中的type参数。


解决：
将索引从多类型迁移到单类型，每种类型文档一个独立索引

二、Docket安装ES

1、dokcer中安装elastic search

下载ealastic search（存储和检索）和kibana（可视化检索）

docker pull elasticsearch:7.4.2
docker pull kibana:7.4.2

注意版本要统一

2、配置

# 将docker里的目录挂载到linux的/usr/local/elasticsearch/data目录中，修改/mydata就可以改掉docker里的
mkdir -p /mydata/elasticsearch/config
mkdir -p /mydata/elasticsearch/data

# es可以被远程任何机器访问
echo "http.host: 0.0.0.0" >/mydata/elasticsearch/config/elasticsearch.yml

# 递归更改权限，es需要访问
chmod -R 777 /mydata/elasticsearch/

3、启动Elastic search

# 9200是用户交互端口 9300是集群心跳端口
# -e指定是单阶段运行
# -e指定占用的内存大小，生产时可以设置32G
sudo docker run --name elasticsearch -p 9200:9200 -p 9300:9300 \
-e  "discovery.type=single-node" \
-e ES_JAVA_OPTS="-Xms64m -Xmx512m" \
-v /mydata/elasticsearch/config/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml \
-v /mydata/elasticsearch/data:/usr/share/elasticsearch/data \
-v  /mydata/elasticsearch/plugins:/usr/share/elasticsearch/plugins \
-d elasticsearch:7.4.2

查看是否启动成功

docker ps

4、安装kibana

拉去kibana，注意版本对应

docker pull kibana:7.4.2

启动kibana

sudo docker run --name kibana -e ELASTICSEARCH_HOSTS=http://192.168.109.101:9200  -p 5601:5601 -d kibana:7.4.2

5、测试

查看elasticsearch版本信息：http://192.168.109.101:9200

显示elasticsearch节点信息：http://192.168.109.101:9200/_cat/nodes

127.0.0.1 14 92 29 0.48 0.96 0.60 dilm * 4fe4e202abf1
#    4fe4e202abf1代表上面的结点 *代表是主节点

访问Kibana：http://192.168.109.101:5601/app/kibana

6、初步检索

_CAT

GET /_cat/nodes     #查看所有节点

127.0.0.1 15 93 8 0.18 0.55 0.52 dilm * 4fe4e202abf1

GET /_cat/health    #查看es健康状况

1633079094 09:04:54 elasticsearch green 1 1 3 3 0 0 0 0 - 100.0%
# 注：green表示健康值正常

GET /_cat/master    #查看主节点

Y9zawKrWSQWvFBx0wVi94g 127.0.0.1 127.0.0.1 4fe4e202abf1
# 主节点唯一编号
# 虚拟机地址

GET /_cat/indicies  #查看所有索引,等价于mysql数据库的show databases

green  open .kibana_task_manager_1   DhtDmKrsRDOUHPJm1EFVqQ 1 0 2 3 40.8kb 40.8kb
green  open .apm-agent-configuration vxzRbo9sQ1SvMtGkx6aAHQ 1 0 0 0   230b   230b
green  open .kibana_1                rdJ5pejQSKWjKxRtx-EIkQ 1 0 5 1 18.2kb 18.2kb
#这3个索引是kibana创建的

PUT

必须携带id

#索引一个文档
#保存一个数据，保存在哪个索引的哪个类型下（哪张数据库哪张表下），保存时用唯一标识指定

put /achang/user/1  #这里的1是指定了id为1
{
     
  "name":"achang",
  "age":"18"
}


{
     
  "_index" : "achang", #表明该数据在哪个数据库下
  "_type" : "user",    #表明该数据在哪个类型下
  "_id" : "1",         #表明被保存数据的id
  "_version" : 1,      #被保存数据的版本
  "result" : "created",#这里是创建了一条数据，如果重新put一条数据，则该状态会变为updated，并且版本号也会发生变化。
  "_shards" : {
      #分片，集群的情况下
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 0,       #并发控制字段，每次更新都会+1，用来做乐观锁
  "_primary_term" : 1  #主分片重新分配，如重启，就会变化
}

GET

get /achang/user/1

{
     
  "_index" : "achang",
  "_type" : "user",
  "_id" : "1",
  "_version" : 2,
  "_seq_no" : 1,
  "_primary_term" : 1,
  "found" : true,
  "_source" : {
      #真正的数据
    "name" : "achang",
    "age" : "20"
  }
}

乐观锁

通过“if_seq_no=1&if_primary_term=1”，当序列号匹配的时候，才进行修改，否则不修改。

#如下两个请求并发发出
put /achang/user/1?if_seq_no=1&if_primary_term=1
{
     
  "name" : "achang1"
}

put /achang/user/1?if_seq_no=1&if_primary_term=1
{
     
  "name" : "achang2"
}

#再次查询，发现name被改成了achang1
get /achang/user/1
{
     
  "_index" : "achang",
  "_type" : "user",
  "_id" : "1",
  "_version" : 3,
  "_seq_no" : 2,
  "_primary_term" : 1,
  "found" : true,
  "_source" : {
     
    "name" : "achang1"
  }
}

_update

POST customer/externel/1/_update
{
     
    "doc":{
     
        "name":"111"
    }
}
#或者
POST customer/externel/1
{
     
    "doc":{
     
        "name":"222"
    }
}
#或者
PUT customer/externel/1
{
     
    "doc":{
     
        "name":"222"
    }
}

不同：

带有update情况下 POST操作会对比源文档数据，如果相同不会有什么操作，文档version不增加。

PUT操作总会重新保存并增加version版本

POST时带_update对比元数据如果一样就不进行任何操作。

看场景：

对于大并发更新，不带update

对于大并发查询偶尔更新，带update；对比更新，重新计算分配规则

POST更新文档，带有_update

删除文档或索引

DELETE customer/external/1
DELETE customer

#注：elasticsearch并没有提供删除类型的操作，只提供了删除索引和文档的操作。

#实例：删除整个costomer索引数据
#删除前，所有的索引
get /_cat/indices
green  open .kibana_task_manager_1   DhtDmKrsRDOUHPJm1EFVqQ 1 0 2 0 31.3kb 31.3kb
green  open .apm-agent-configuration vxzRbo9sQ1SvMtGkx6aAHQ 1 0 0 0   283b   283b
green  open .kibana_1                rdJ5pejQSKWjKxRtx-EIkQ 1 0 8 3 28.8kb 28.8kb
yellow open customer                 mG9XiCQISPmfBAmL1BPqIw 1 1 9 1  8.6kb  8.6kb

#删除 “customer”索引
DELTE /customer
#响应
{
     
    "acknowledged": true
}


#删除后，所有的索引/_cat/indices
green open .kibana_task_manager_1   DhtDmKrsRDOUHPJm1EFVqQ 1 0 2 0 31.3kb 31.3kb
green open .apm-agent-configuration vxzRbo9sQ1SvMtGkx6aAHQ 1 0 0 0   283b   283b
green open .kibana_1                rdJ5pejQSKWjKxRtx-EIkQ 1 0 8 3 28.8kb 28.8kb

ES的批量操作——bulk

#匹配导入数据
post /customer/external/_bulk
{
     "index":{
     "_id":"1"}}#两行为一个整体
{
     "name":"a"}#真正的数据
{
     "index":{
     "_id":"2"}}#两行为一个整体
{
     "name":"b"}#真正的数据

#语法格式：
post /xxxxx/xxxxx/_bulk
{
     action:{
     metadata}}\n
{
     request body  }\n
{
     action:{
     metadata}}\n
{
     request body  }\n

这里的批量操作，当发生某一条执行发生失败时，其他的数据仍然能够接着执行，也就是说彼此之间是独立的。

bulk api以此按顺序执行所有的action（动作）。如果一个单个的动作因任何原因失败，它将继续处理它后面剩余的动作。当bulk api返回时，它将提供每个动作的状态（与发送的顺序相同），所以您可以检查是否一个指定的动作是否失败了。

#实例1: 执行多条数据
POST /customer/external/_bulk
{
     "index":{
     "_id":"1"}}
{
     "name":"John Doe"}
{
     "index":{
     "_id":"2"}}
{
     "name":"John Doe"}
#保存操作，指定了索引、id，真正的数据未name：xxx

#执行结果
{
     
  "took" : 318,  #花费了多少ms
  "errors" : false, #没有发生任何错误
  "items" : [ #每个数据的结果
    {
     
      "index" : {
      #保存
        "_index" : "customer", #索引
        "_type" : "external", #类型
        "_id" : "1", #文档
        "_version" : 1, #版本
        "result" : "created", #创建
        "_shards" : {
     
          "total" : 2,
          "successful" : 1,
          "failed" : 0
        },
        "_seq_no" : 0,
        "_primary_term" : 1,
        "status" : 201 #新建完成
      }
    },
    {
     
      "index" : {
      #第二条记录
        "_index" : "customer",
        "_type" : "external",
        "_id" : "2",
        "_version" : 1,
        "result" : "created",
        "_shards" : {
     
          "total" : 2,
          "successful" : 1,
          "failed" : 0
        },
        "_seq_no" : 1,
        "_primary_term" : 1,
        "status" : 201
      }
    }
  ]
}

#实例2：对于整个索引执行批量操作
POST /_bulk
{
     "delete":{
     "_index":"website","_type":"blog","_id":"123"}}#删除操作

{
     "create":{
     "_index":"website","_type":"blog","_id":"123"}}#保存操作，下面是数据
{
     "title":"my first blog post"}

{
     "index":{
     "_index":"website","_type":"blog"}}#保存操作，下面的是数据
{
     "title":"my second blog post"}

{
     "update":{
     "_index":"website","_type":"blog","_id":"123"}}#更新操作
{
     "doc":{
     "title":"my updated blog post"}}
#指定操作，索引，类型，id


#运行结果：
{
     
  "took" : 414,
  "errors" : false,
  "items" : [
    {
     
      "delete" : {
     
        "_index" : "website",
        "_type" : "blog",
        "_id" : "123",
        "_version" : 1,
        "result" : "not_found",
        "_shards" : {
     
          "total" : 2,
          "successful" : 1,
          "failed" : 0
        },
        "_seq_no" : 0,
        "_primary_term" : 1,
        "status" : 404
      }
    },
    {
     
      "create" : {
     
        "_index" : "website",
        "_type" : "blog",
        "_id" : "123",
        "_version" : 2,
        "result" : "created",
        "_shards" : {
     
          "total" : 2,
          "successful" : 1,
          "failed" : 0
        },
        "_seq_no" : 1,
        "_primary_term" : 1,
        "status" : 201
      }
    },
    {
     
      "index" : {
     
        "_index" : "website",
        "_type" : "blog",
        "_id" : "AOpgO3wB3UIR4wi8SrO8",
        "_version" : 1,
        "result" : "created",
        "_shards" : {
     
          "total" : 2,
          "successful" : 1,
          "failed" : 0
        },
        "_seq_no" : 2,
        "_primary_term" : 1,
        "status" : 201
      }
    },
    {
     
      "update" : {
     
        "_index" : "website",
        "_type" : "blog",
        "_id" : "123",
        "_version" : 3,
        "result" : "updated",
        "_shards" : {
     
          "total" : 2,
          "successful" : 1,
          "failed" : 0
        },
        "_seq_no" : 3,
        "_primary_term" : 1,
        "status" : 200
      }
    }
  ]
}

样本测试数据

准备了一份顾客银行账户信息的虚构的JSON文档样本。每个文档都有下列的schema（模式）。

{
     
	"account_number": 1,
	"balance": 39225,
	"firstname": "Amber",
	"lastname": "Duke",
	"age": 32,
	"gender": "M",
	"address": "880 Holmes Lane",
	"employer": "Pyrami",
	"email": "[email protected]",
	"city": "Brogan",
	"state": "IL"
}

https://gitee.com/xlh_blog/common_content/blob/master/es%E6%B5%8B%E8%AF%95%E6%95%B0%E6%8D%AE.json;导入测试数据

POST bank/account/_bulk
#上面的数据

get /_cat/indices #刚导入了1000条

让Docker每次启动都自动启动ES

sudo docker update 【实例ID】 --restart=always

[root@s1 elasticsearch]# sudo docker ps -a
CONTAINER ID   IMAGE                 COMMAND                  CREATED       STATUS       PORTS                                                                                  NAMES
5c43fff82773   kibana:7.4.2          "/usr/local/bin/dumb…"   2 hours ago   Up 2 hours   0.0.0.0:5601->5601/tcp, :::5601->5601/tcp                                              kibana
4fe4e202abf1   elasticsearch:7.4.2   "/usr/local/bin/dock…"   2 hours ago   Up 2 hours   0.0.0.0:9200->9200/tcp, :::9200->9200/tcp, 0.0.0.0:9300->9300/tcp, :::9300->9300/tcp   elasticsearch
879b641ebe6c   redis                 "docker-entrypoint.s…"   11 days ago   Up 2 hours   0.0.0.0:6379->6379/tcp, :::6379->6379/tcp                                              redis
b2b889f90cd9   mysql:5.7             "docker-entrypoint.s…"   11 days ago   Up 2 hours   0.0.0.0:3306->3306/tcp, :::3306->3306/tcp, 33060/tcp                                   mysql
[root@s1 elasticsearch]# sudo docker update 5c4 --restart=always
5c4
[root@s1 elasticsearch]# sudo docker update 4fe --restart=always
4fe

三、进阶检索

官方API：

https://www.elastic.co/guide/en/elasticsearch/reference/7.x/search-your-data.html

1、search Api

通过REST request uri 发送搜索参数（uri +检索参数）；

通过REST request body 来发送它们（uri+请求体）；

请求参数方式检索

检索bank索引中查询全部，并按account_number升序排序;

检索了1000条数据，但是根据相关性算法，只返回10条

GET bank/_search?q=*&sort=account_number:asc

# q=* 查询所有
# sort 排序字段
# asc升序

检索bank下所有信息，包括type和docs

GET bank/_search

返回格式

took – 花费多少ms搜索
timed_out – 是否超时
_shards – 多少分片被搜索了，以及多少成功/失败的搜索分片
max_score –文档相关性最高得分
hits.total.value - 多少匹配文档被找到
hits.sort - 结果的排序key，没有的话按照score排序
hits._score - 相关得分 (not applicable when using match_all)

uri+请求体进行检索

GET /bank/_search
{
     
  "query": {
      "match_all": {
     } },
  "sort": [
    {
      "account_number": "asc" },
    {
     "balance":"desc"}
  ]
}

2、Query DSL

什么get的请求体叫query DSL

基本语法格式

Elasticsearch提供了一个可以执行查询的Json风格的DSL(domain-specific language领域特定语言)。这个被称为Query DSL，该查询语言非常全面。

典型结构

QUERY_NAME:{
       
   ARGUMENT:VALUE,
   ARGUMENT:VALUE,
    ...
}

如果针对于某个字段，那么它的结构如下：

{
       
  QUERY_NAME:{
       
     FIELD_NAME:{
       
       ARGUMENT:VALUE,
       ARGUMENT:VALUE,...
      }   
   }
}

示例

GET bank/_search
{
       
  "query": {
         #查询形式
    "match_all": {
       } #查询所有
  },
  "from": 0, #开始位置
  "size": 5, #显示数
  "_source":["balance"],#返回部分字段
  "sort": [ #排序
    {
       
      "account_number": {
       
        "order": "desc"
      }
    }
  ]
}

#   _source为要返回的字段

3、match匹配查询

基本类型（非字符串），精确控制

GET bank/_search
{
       
  "query": {
       
    "match": {
       
      "account_number": "999"
    }
  }
}

查询结果

{
     
  "took" : 8,
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "999",
        "_score" : 1.0,
        "_source" : {
     
          "account_number" : 999,
          "balance" : 6087,
          "firstname" : "Dorothy",
          "lastname" : "Barron",
          "age" : 22,
          "gender" : "F",
          "address" : "499 Laurel Avenue",
          "employer" : "Xurban",
          "email" : "[email protected]",
          "city" : "Belvoir",
          "state" : "CA"
        }
      }
    ]
  }
}

字符串，全文检索

GET bank/_search
{
     
  "query": {
     
    "match": {
     
      "address": "kings" #字符串
    }
  }
}

全文检索，最终会按照评分进行排序，会对检索条件进行分词匹配。

{
     
  "took" : 9,
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 5.9908285,
    "hits" : [
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "20",
        "_score" : 5.9908285,
        "_source" : {
     
          "account_number" : 20,
          "balance" : 16418,
          "firstname" : "Elinor",
          "lastname" : "Ratliff",
          "age" : 36,
          "gender" : "M",
          "address" : "282 Kings Place", #分词匹配
          "employer" : "Scentric",
          "email" : "[email protected]",
          "city" : "Ribera",
          "state" : "WA"
        }
      },
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "722",
        "_score" : 5.9908285,
        "_source" : {
     
          "account_number" : 722,
          "balance" : 27256,
          "firstname" : "Roberts",
          "lastname" : "Beasley",
          "age" : 34,
          "gender" : "F",
          "address" : "305 Kings Hwy",#分词匹配
          "employer" : "Quintity",
          "email" : "[email protected]",
          "city" : "Hayden",
          "state" : "PA"
        }
      }
    ]
  }
}

4、match_phrase 【短句匹配】

match_phrase

将需要匹配的值当成一整个单词（不分词）进行检索

前面的是包含mill或road就查出来，我们现在要都包含才查出

GET bank/_search
{
     
  "query": {
     
    "match_phrase": {
     
      "address": "mill road"
    }
  }
}

查处address中包含mill road的所有记录，并给出相关性得分

{
     
  "took" : 50,
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 8.926605,
    "hits" : [
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "970",
        "_score" : 8.926605,
        "_source" : {
     
          "account_number" : 970,
          "balance" : 19648,
          "firstname" : "Forbes",
          "lastname" : "Wallace",
          "age" : 28,
          "gender" : "M",
          "address" : "990 Mill Road",
          "employer" : "Pheast",
          "email" : "[email protected]",
          "city" : "Lopezo",
          "state" : "AK"
        }
      }
    ]
  }
}

match_phrase和match的区别，观察如下实例

GET bank/_search
{
     
  "query": {
     
    "match_phrase": {
     
      "address": "990 Mill"
    }
  }
}

结果

{
     
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 10.806405,
    "hits" : [
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "970",
        "_score" : 10.806405,
        "_source" : {
     
          "account_number" : 970,
          "balance" : 19648,
          "firstname" : "Forbes",
          "lastname" : "Wallace",
          "age" : 28,
          "gender" : "M",
          "address" : "990 Mill Road", #
          "employer" : "Pheast",
          "email" : "[email protected]",
          "city" : "Lopezo",
          "state" : "AK"
        }
      }
    ]
  }
}

使用match的keyword

GET bank/_search
{
     
  "query": {
     
    "match": {
     
      "address.keyword": "990 Mill"
    }
  }
}

查询结果，一条也未匹配到

{
     
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 0,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ] #
  }
}

修改匹配条件为“990 Mill Road”

GET bank/_search
{
     
  "query": {
     
    "match": {
     
      "address.keyword": "990 Mill Road"
    }
  }
}

修改匹配条件为“990 Mill Road”

{
     
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 6.5032897,
    "hits" : [
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "970",
        "_score" : 6.5032897,
        "_source" : {
     
          "account_number" : 970,
          "balance" : 19648,
          "firstname" : "Forbes",
          "lastname" : "Wallace",
          "age" : 28,
          "gender" : "M",
          "address" : "990 Mill Road", #
          "employer" : "Pheast",
          "email" : "[email protected]",
          "city" : "Lopezo",
          "state" : "AK"
        }
      }
    ]
  }
}

查询出一条数据

{
     
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 6.5032897,
    "hits" : [
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "970",
        "_score" : 6.5032897,
        "_source" : {
     
          "account_number" : 970,
          "balance" : 19648,
          "firstname" : "Forbes",
          "lastname" : "Wallace",
          "age" : 28,
          "gender" : "M",
          "address" : "990 Mill Road",
          "employer" : "Pheast",
          "email" : "[email protected]",
          "city" : "Lopezo",
          "state" : "AK"
        }
      }
    ]
  }
}

文本字段的匹配，使用keyword，匹配的条件就是要显示字段的全部值，要进行精确匹配的。

match_phrase是做短语匹配，只要文本中包含匹配条件，就能匹配到。

5、multi_math【多字段匹配】

字段中或关系，state或者address中包含mill，并且在查询过程中，会对于查询条件进行分词。

GET bank/_search
{
     
  "query": {
     
    "multi_match": {
     
      "query": "mill",
      "fields": [
        "state",
        "address"
      ]
    }
  }
}

查询结果：

{
     
  "took" : 28,
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 4,
      "relation" : "eq"
    },
    "max_score" : 5.4032025,
    "hits" : [
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "970",
        "_score" : 5.4032025,
        "_source" : {
     
          "account_number" : 970,
          "balance" : 19648,
          "firstname" : "Forbes",
          "lastname" : "Wallace",
          "age" : 28,
          "gender" : "M",
          "address" : "990 Mill Road",
          "employer" : "Pheast",
          "email" : "[email protected]",
          "city" : "Lopezo",
          "state" : "AK"
        }
      },
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "136",
        "_score" : 5.4032025,
        "_source" : {
     
          "account_number" : 136,
          "balance" : 45801,
          "firstname" : "Winnie",
          "lastname" : "Holland",
          "age" : 38,
          "gender" : "M",
          "address" : "198 Mill Lane",
          "employer" : "Neteria",
          "email" : "[email protected]",
          "city" : "Urie",
          "state" : "IL"
        }
      },
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "345",
        "_score" : 5.4032025,
        "_source" : {
     
          "account_number" : 345,
          "balance" : 9812,
          "firstname" : "Parker",
          "lastname" : "Hines",
          "age" : 38,
          "gender" : "M",
          "address" : "715 Mill Avenue",
          "employer" : "Baluba",
          "email" : "[email protected]",
          "city" : "Blackgum",
          "state" : "KY"
        }
      },
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "472",
        "_score" : 5.4032025,
        "_source" : {
     
          "account_number" : 472,
          "balance" : 25571,
          "firstname" : "Lee",
          "lastname" : "Long",
          "age" : 32,
          "gender" : "F",
          "address" : "288 Mill Street",
          "employer" : "Comverges",
          "email" : "[email protected]",
          "city" : "Movico",
          "state" : "MT"
        }
      }
    ]
  }
}

6、bool用来做复合查询

复合语句可以合并，任何其他查询语句，包括符合语句。

这也就意味着，复合语句之间可以互相嵌套，可以表达非常复杂的逻辑。

must：

必须达到must所列举的所有条件

must_not：

必须不匹配must_not所列举的所有条件。

should：

应该满足should所列举的条件。满足条件最好，不满足也可以，满足得分更高

must 必须是指定的情况

实例：查询gender=m，并且address=mill的数据

GET bank/_search
{
     
   "query":{
     
        "bool":{
     
             "must":[
              {
     "match":{
     "address":"mill"}},
              {
     "match":{
     "gender":"M"}}
             ]
         }
    }
}

结果

{
     
  "took" : 83,
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 3,
      "relation" : "eq"
    },
    "max_score" : 6.0824604,
    "hits" : [
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "970",
        "_score" : 6.0824604,
        "_source" : {
     
          "account_number" : 970,
          "balance" : 19648,
          "firstname" : "Forbes",
          "lastname" : "Wallace",
          "age" : 28,
          "gender" : "M",
          "address" : "990 Mill Road",
          "employer" : "Pheast",
          "email" : "[email protected]",
          "city" : "Lopezo",
          "state" : "AK"
        }
      },
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "136",
        "_score" : 6.0824604,
        "_source" : {
     
          "account_number" : 136,
          "balance" : 45801,
          "firstname" : "Winnie",
          "lastname" : "Holland",
          "age" : 38,
          "gender" : "M",#
          "address" : "198 Mill Lane",#
          "employer" : "Neteria",
          "email" : "[email protected]",
          "city" : "Urie",
          "state" : "IL"
        }
      },
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "345",
        "_score" : 6.0824604,
        "_source" : {
     
          "account_number" : 345,
          "balance" : 9812,
          "firstname" : "Parker",
          "lastname" : "Hines",
          "age" : 38,
          "gender" : "M",#
          "address" : "715 Mill Avenue",#
          "employer" : "Baluba",
          "email" : "[email protected]",
          "city" : "Blackgum",
          "state" : "KY"
        }
      }
    ]
  }
}

must_not 必须不是指定的情况

实例：查询gender=m，并且address=mill的数据，但是age不等于38的

GET bank/_search
{
     
  "query": {
     
    "bool": {
     
      "must": [
        {
      "match": {
      "gender": "M" }},
        {
      "match": {
     "address": "mill"}}
      ],
      "must_not": [
        {
      "match": {
      "age": "38" }}
      ]
   }
  }
}

结果

{
     
  "took" : 8,
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 6.0824604,
    "hits" : [
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "970",
        "_score" : 6.0824604,
        "_source" : {
     
          "account_number" : 970,
          "balance" : 19648,
          "firstname" : "Forbes",
          "lastname" : "Wallace",
          "age" : 28,#
          "gender" : "M", #
          "address" : "990 Mill Road", #
          "employer" : "Pheast",
          "email" : "[email protected]",
          "city" : "Lopezo",
          "state" : "AK"
        }
      }
    ]
  }
}

should

应该达到should列举的条件，如果到达会增加相关文档的评分，并不会改变查询的结果。

如果query中只有should且只有一种匹配规则，那么should的条件就会被作为默认匹配条件二区改变查询结果。

实例：匹配lastName应该等于Wallace的数据

GET bank/_search
{
     
  "query": {
     
    "bool": {
     
      "must": [
        {
     
          "match": {
     
            "gender": "M"
          }
        },
        {
     
          "match": {
     
            "address": "mill"
          }
        }
      ],
      "must_not": [
        {
     
          "match": {
     
            "age": "18"
          }
        }
      ],
      "should": [
        {
     
          "match": {
     
            "lastname": "Wallace"
          }
        }
      ]
    }
  }
}

查询结果：能够看到相关度越高，得分也越高。

{
     
  "took" : 7,
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 3,
      "relation" : "eq"
    },
    "max_score" : 12.585751,
    "hits" : [
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "970",
        "_score" : 12.585751,
        "_source" : {
     
          "account_number" : 970,
          "balance" : 19648,
          "firstname" : "Forbes",
          "lastname" : "Wallace",#
          "age" : 28,#
          "gender" : "M",#
          "address" : "990 Mill Road",#
          "employer" : "Pheast",
          "email" : "[email protected]",
          "city" : "Lopezo",
          "state" : "AK"
        }
      },
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "136",
        "_score" : 6.0824604,
        "_source" : {
     
          "account_number" : 136,
          "balance" : 45801,
          "firstname" : "Winnie",
          "lastname" : "Holland",#
          "age" : 38,#
          "gender" : "M",#
          "address" : "198 Mill Lane",#
          "employer" : "Neteria",
          "email" : "[email protected]",
          "city" : "Urie",
          "state" : "IL"
        }
      },
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "345",
        "_score" : 6.0824604,
        "_source" : {
     
          "account_number" : 345,
          "balance" : 9812,
          "firstname" : "Parker",
          "lastname" : "Hines",#
          "age" : 38,#
          "gender" : "M",#
          "address" : "715 Mill Avenue",#
          "employer" : "Baluba",
          "email" : "[email protected]",
          "city" : "Blackgum",
          "state" : "KY"
        }
      }
    ]
  }
}

7、Filter【结果过滤】

上面的must和should影响相关性得分，而must_not仅仅是一个filter ，不贡献得分 must改为filter就使must不贡献得分。

如果只有filter条件的话，我们会发现得分都是0。

一个key多个值可以用terms并不是所有的查询都需要产生分数，特别是哪些仅用于filtering过滤的文档。

为了不计算分数，elasticsearch会自动检查场景并且优化查询的执行。不参与评分更快

GET bank/_search
{
     
  "query": {
     
    
    "bool": {
     
      "must": [
        {
      "match": {
     "address": "mill" } }
      ],
      "filter": {
        #query.bool.filter
        "range": {
     
          "balance": {
     
            "gte": "10000",
            "lte": "20000"
          }
        }
      }
    }
    
  }
}

这里先是查询所有匹配address=mill的文档，然后再根据10000<=balance<=20000进行过滤查询结果

{
     
  "took" : 37,
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 5.4032025, #
    "hits" : [
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "970",
        "_score" : 5.4032025,
        "_source" : {
     
          "account_number" : 970,
          "balance" : 19648, #
          "firstname" : "Forbes",
          "lastname" : "Wallace",
          "age" : 28,
          "gender" : "M",
          "address" : "990 Mill Road", #
          "employer" : "Pheast",
          "email" : "[email protected]",
          "city" : "Lopezo",
          "state" : "AK"
        }
      }
    ]
  }
}

在boolean查询中，must, should 和must_not 元素都被称为查询子句 。

文档是否符合每个“must”或“should”子句中的标准，决定了文档的“相关性得分”。

得分越高，文档越符合您的搜索条件。

默认情况下，Elasticsearch返回根据这些相关性得分排序的文档。

“must_not”子句中的条件被视为“过滤器”。它影响文档是否包含在结果中，但不影响文档的评分方式。还可以显式地指定任意过滤器来包含或排除基于结构化数据的文档。

filter在使用过程中，并不会计算相关性得分：

GET bank/_search
{
     
  "query": {
     
    "bool": {
     
      "must": [
        {
     
          "match": {
     
            "address": "mill"
          }
        }
      ],
      "filter": {
     
        "range": {
     
          "balance": {
     
            "gte": "10000",
            "lte": "20000"
          }
        }
      }
    }
  }
}

#查询结果：
{
     
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 213,
      "relation" : "eq"
    },
    "max_score" : 0.0,
    "hits" : [
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "20",
        "_score" : 0.0,
        "_source" : {
     
          "account_number" : 20,
          "balance" : 16418,
          "firstname" : "Elinor",
          "lastname" : "Ratliff",
          "age" : 36,
          "gender" : "M",
          "address" : "282 Kings Place",
          "employer" : "Scentric",
          "email" : "[email protected]",
          "city" : "Ribera",
          "state" : "WA"
        }
      },
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "37",
        "_score" : 0.0,
        "_source" : {
     
          "account_number" : 37,
          "balance" : 18612,
          "firstname" : "Mcgee",
          "lastname" : "Mooney",
          "age" : 39,
          "gender" : "M",
          "address" : "826 Fillmore Place",
          "employer" : "Reversus",
          "email" : "[email protected]",
          "city" : "Tooleville",
          "state" : "OK"
        }
      },
        #省略。。。

能看到所有文档的“_score” : 0.0

8、term

和match一样。匹配某个属性的值。

全文检索字段（text字符串等）用match，其他非text字段匹配用term。

不要使用term来进行文本字段查询 es默认存储text值时用分词分析，所以要搜索text值，使用match

https://www.elastic.co/guide/en/elasticsearch/reference/7.6/query-dsl-term-query.html

字段.keyword：要一一匹配到 精确匹配

match_phrase：子串包含即可使用term匹配查询 短语匹配

GET bank/_search
{
     
  "query": {
     
    "term": {
     
      "address": "mill Road"
    }
  }
}

查询结果：

# 一条也没有匹配到
{
     
  "took" : 6,.
  
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 0,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  }
}

而更换为match匹配时，能够匹配到32个文档

GET bank/_search
{
     
  "query": {
     
    "match": {
     
      "address": "mill Road"
    }
  }
}

结果:

{
     
  "took" : 17,
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 32,
      "relation" : "eq"
    },
    "max_score" : 8.926605,
    "hits" : [
      {
     
        "_index" : "bank",
        "_type" : "account",
        "_id" : "970",
        "_score" : 8.926605,
        "_source" : {
     
          "account_number" : 970,
          "balance" : 19648,
          "firstname" : "Forbes",
          "lastname" : "Wallace",
          "age" : 28,
          "gender" : "M",
          "address" : "990 Mill Road",
          "employer" : "Pheast",
          "email" : "[email protected]",
          "city" : "Lopezo",
          "state" : "AK"
        }
      },
		#省略.....
      }
    ]
  }
}

9、Aggregation（聚合）

聚合提供了从数据中分组和提取数据的能力。最简单的聚合方法大致等于SQL Group by和SQL聚合函数。

在elasticsearch中，执行搜索返回this（命中结果），并且同时返回聚合结果，把以响应中的所有hits（命中结果）分隔开的能力。

这是非常强大且有效的，你可以执行查询和多个聚合，并且在一次使用中得到各自的（任何一个的）返回结果，使用一次简洁和简化的API啦避免网络往返。

aggs：执行聚合。聚合语法如下：

"aggs":{
      # 聚合
    "aggs_name这次聚合的名字，方便展示在结果集中":{
     
        "AGG_TYPE聚合的类型(avg,term,terms)":{
     }
     }
}

terms：看值的可能性分布

avg：看值的分布平均

例：搜索address中包含mill的所有人的年龄分布以及平均年龄，但不显示这些人的详情

# 分别为包含mill、，平均年龄、
GET bank/_search
{
     
  "query": {
      # 查询出包含mill的
    "match": {
     
      "address": "Mill"
    }
  },
  "aggs": {
      #基于查询聚合
    "ageAgg": {
       # 聚合的名字，随便起
      "terms": {
      # 看值的可能性分布
        "field": "age",
        "size": 10
      }
    },
    "ageAvg": {
      
      "avg": {
      # 看age值的平均
        "field": "age"
      }
    },
    "balanceAvg": {
     
      "avg": {
      # 看balance的平均
        "field": "balance"
      }
    }
  },
  "size": 0  # 不看详情，只看聚合结果
}

查询结果：

{
     
  "took" : 2,
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 4, // 命中4条
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  },
  "aggregations" : {
     
    "ageAgg" : {
      // 第一个聚合的结果
      "doc_count_error_upper_bound" : 0,
      "sum_other_doc_count" : 0,
      "buckets" : [
        {
     
          "key" : 38,
          "doc_count" : 2
        },
        {
     
          "key" : 28,
          "doc_count" : 1
        },
        {
     
          "key" : 32,
          "doc_count" : 1
        }
      ]
    },
    "ageAvg" : {
      // 第二个聚合的结果
      "value" : 34.0
    },
    "balanceAvg" : {
      // 第三个聚合的结果
      "value" : 25208.0
    }
  }
}

子聚合

按照年龄聚合，并且求这些年龄段的这些人的平均薪资

写到一个聚合里是基于上个聚合进行子聚合。

下面求每个age分布的平均balance

GET bank/_search
{
     
  "query": {
     
    "match_all": {
     } #查询所有
  },
  "aggs": {
     
    "ageAgg": {
     
      "terms": {
      # 看分布
        "field": "age", #字段
        "size": 100 #数量
      },
      "aggs": {
      # 与terms并列 【子聚合】
        "ageAvg": {
      #平均
          "avg": {
     
            "field": "balance"
          }
        }
      }
    }
  },
  "size": 0
}

输出结果

{
     
  "took" : 49,
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 1000,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  },
  "aggregations" : {
     
    "ageAgg" : {
     
      "doc_count_error_upper_bound" : 0,
      "sum_other_doc_count" : 0,
      "buckets" : [
        {
     
          "key" : 31,
          "doc_count" : 61,
          "ageAvg" : {
     
            "value" : 28312.918032786885
          }
        },
        {
     
          "key" : 39,
          "doc_count" : 60,
          "ageAvg" : {
     
            "value" : 25269.583333333332
          }
        },
        {
     
          "key" : 26,
          "doc_count" : 59,
          "ageAvg" : {
     
            "value" : 23194.813559322032
          }
        },
        {
     
          "key" : 32,
          "doc_count" : 52,
          "ageAvg" : {
     
            "value" : 23951.346153846152
          }
        },
        {
     
          "key" : 35,
          "doc_count" : 52,
          "ageAvg" : {
     
            "value" : 22136.69230769231
          }
        },
        {
     
          "key" : 36,
          "doc_count" : 52,
          "ageAvg" : {
     
            "value" : 22174.71153846154
          }
        },
        {
     
          "key" : 22,
          "doc_count" : 51,
          "ageAvg" : {
     
            "value" : 24731.07843137255
          }
        },
        {
     
          "key" : 28,
          "doc_count" : 51,
          "ageAvg" : {
     
            "value" : 28273.882352941175
          }
        },
        {
     
          "key" : 33,
          "doc_count" : 50,
          "ageAvg" : {
     
            "value" : 25093.94
          }
        },
        {
     
          "key" : 34,
          "doc_count" : 49,
          "ageAvg" : {
     
            "value" : 26809.95918367347
          }
        },
        {
     
          "key" : 30,
          "doc_count" : 47,
          "ageAvg" : {
     
            "value" : 22841.106382978724
          }
        },
        {
     
          "key" : 21,
          "doc_count" : 46,
          "ageAvg" : {
     
            "value" : 26981.434782608696
          }
        },
        {
     
          "key" : 40,
          "doc_count" : 45,
          "ageAvg" : {
     
            "value" : 27183.17777777778
          }
        },
        {
     
          "key" : 20,
          "doc_count" : 44,
          "ageAvg" : {
     
            "value" : 27741.227272727272
          }
        },
        {
     
          "key" : 23,
          "doc_count" : 42,
          "ageAvg" : {
     
            "value" : 27314.214285714286
          }
        },
        {
     
          "key" : 24,
          "doc_count" : 42,
          "ageAvg" : {
     
            "value" : 28519.04761904762
          }
        },
        {
     
          "key" : 25,
          "doc_count" : 42,
          "ageAvg" : {
     
            "value" : 27445.214285714286
          }
        },
        {
     
          "key" : 37,
          "doc_count" : 42,
          "ageAvg" : {
     
            "value" : 27022.261904761905
          }
        },
        {
     
          "key" : 27,
          "doc_count" : 39,
          "ageAvg" : {
     
            "value" : 21471.871794871793
          }
        },
        {
     
          "key" : 38,
          "doc_count" : 39,
          "ageAvg" : {
     
            "value" : 26187.17948717949
          }
        },
        {
     
          "key" : 29,
          "doc_count" : 35,
          "ageAvg" : {
     
            "value" : 29483.14285714286
          }
        }
      ]
    }
  }
}

复杂子聚合：

查出所有年龄分布，并且这些年龄段中M的平均薪资和F的平均薪资以及这个年龄段的总体平均薪资

GET bank/_search
{
     
  "query": {
     
    "match_all": {
     }
  },
  "aggs": {
     
    "ageAgg": {
     
      "terms": {
       #  看age分布
        "field": "age",
        "size": 100
      },
      "aggs": {
      # 子聚合
        "genderAgg": {
     
          "terms": {
      # 看gender分布
            "field": "gender.keyword" # 注意这里，文本字段应该用.keyword
          },
          "aggs": {
      # 子聚合
            "balanceAvg": {
     
              "avg": {
      # 性别的平均薪资
                "field": "balance"
              }
            }
          }
        },
        "ageBalanceAvg": {
     
          "avg": {
      #age分布的平均（男女）
            "field": "balance"
          }
        }
      }
    }
  },
  "size": 0
}

输出结果：

{
     
  "took" : 119,
  "timed_out" : false,
  "_shards" : {
     
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
     
    "total" : {
     
      "value" : 1000,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  },
  "aggregations" : {
     
    "ageAgg" : {
     
      "doc_count_error_upper_bound" : 0,
      "sum_other_doc_count" : 0,
      "buckets" : [
        {
     
          "key" : 31,
          "doc_count" : 61,
          "genderAgg" : {
     
            "doc_count_error_upper_bound" : 0,
            "sum_other_doc_count" : 0,
            "buckets" : [
              {
     
                "key" : "M",
                "doc_count" : 35,
                "balanceAvg" : {
     
                  "value" : 29565.628571428573
                }
              },
              {
     
                "key" : "F",
                "doc_count" : 26,
                "balanceAvg" : {
     
                  "value" : 26626.576923076922
                }
              }
            ]
          },
          "ageBalanceAvg" : {
     
            "value" : 28312.918032786885
          }
        }
      ]
        .......//省略其他
    }
  }
}

nested对象聚合

GET articles/_search
{
     
  "size": 0, 
  "aggs": {
     
    "nested": {
     
      "nested": {
     
        "path": "payment"
      },
      "aggs": {
     
        "amount_avg": {
     
          "avg": {
     
            "field": "payment.amount"
          }
        }
      }
    }
  }
}

10、Mapping

映射定义文档如何被存储检索的

字段类型

https://www.elastic.co/guide/en/elasticsearch/reference/7.x/mapping-types.html

映射

查看mapping信息(对应文档的类型)，类似mysql每个字段的类型

ES会自动猜测映射的类型

GET bank/_mapping

{
     
  "bank" : {
     
    "mappings" : {
     
      "properties" : {
     
        "account_number" : {
     
          "type" : "long" # long类型
        },
        "address" : {
     
          "type" : "text", # 文本类型，会进行全文检索，进行分词
          "fields" : {
     
            "keyword" : {
      # addrss.keyword
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "age" : {
     
          "type" : "long"
        },
        "balance" : {
     
          "type" : "long"
        },
        "city" : {
     
          "type" : "text",
          "fields" : {
     
            "keyword" : {
     
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "email" : {
     
          "type" : "text",
          "fields" : {
     
            "keyword" : {
     
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "employer" : {
     
          "type" : "text",
          "fields" : {
     
            "keyword" : {
     
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "firstname" : {
     
          "type" : "text",
          "fields" : {
     
            "keyword" : {
     
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "gender" : {
     
          "type" : "text",
          "fields" : {
     
            "keyword" : {
     
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "lastname" : {
     
          "type" : "text",
          "fields" : {
     
            "keyword" : {
     
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "state" : {
     
          "type" : "text",
          "fields" : {
     
            "keyword" : {
     
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        }
      }
    }
  }
}

新版本改变
- ElasticSearch7-去掉type概念
关系型数据库中两个数据表示是独立的，即使他们里面有相同名称的列也不影响使用，但ES中不是这样的。elasticsearch是基于Lucene开发的搜索引擎，而ES中不同type下名称相同的filed最终在Lucene中的处理方式是一样的。

两个不同type下的两个user_name，在ES同一个索引下其实被认为是同一个filed，你必须在两个不同的type中定义相同的filed映射。否则，不同type中的相同字段名称就会在处理中出现冲突的情况，导致Lucene处理效率下降。

去掉type就是为了提高ES处理数据的效率。
Elasticsearch 7.x URL中的type参数为可选。

比如，索引一个文档不再要求提供文档类型。
- Elasticsearch 8.x 不再支持URL中的type参数
将索引从多类型迁移到单类型，每种类型文档一个独立索引将已存在的索引下的类型数据，全部迁移到指定位置即可。详见数据迁移

Specifying types in requests is deprecated. For instance, indexing a document no longer requires a document type. The new index APIs are PUT {index}/_doc/{id} in case of explicit ids and POST {index}/_doc for auto-generated ids. Note that in 7.0, _doc is a permanent part of the path, and represents the endpoint name rather than the document type.
The include_type_name parameter in the index creation, index template, and mapping APIs will default to false. Setting the parameter at all will result in a deprecation warning.
The default mapping type is removed.
Elasticsearch 8.x

Specifying types in requests is no longer supported.
The include_type_name parameter is removed.
创建索引并指定映射

PUT /my_index
{
     
  "mappings": {
     
    "properties": {
     
      "age": {
     
        "type": "integer"
      },
      "email": {
     
        "type": "keyword" # 指定为keyword
      },
      "name": {
     
        "type": "text" # 全文检索。保存时候分词，检索时候进行分词匹配
      }
    }
  }
}

输出：

{
     
  "acknowledged" : true,
  "shards_acknowledged" : true,
  "index" : "my_index"
}

查看映射

get /my_index

输出

{
     
  "my_index" : {
     
    "aliases" : {
      },
    "mappings" : {
     
      "properties" : {
     
        "age" : {
     
          "type" : "integer"
        },
        "email" : {
     
          "type" : "keyword"
        },
        "name" : {
     
          "type" : "text"
        }
      }
    },
    "settings" : {
     
      "index" : {
     
        "creation_date" : "1633158082897",
        "number_of_shards" : "1",
        "number_of_replicas" : "1",
        "uuid" : "2luZR2cQQl2U0JIQ9P4z5A",
        "version" : {
     
          "created" : "7040299"
        },
        "provided_name" : "my_index"
      }
    }
  }
}

添加新的字段映射

PUT /my_index/_mapping
{
     
  "properties": {
     
    "employee-id": {
     
      "type": "keyword",
      "index": false # 字段不能被检索。检索
    }
  }
}
#这里的 “index”: false，表明新增的字段不能被检索，只是一个冗余字段。

不能更新映射

对于已经存在的字段映射，我们不能更新。更新必须创建新的索引，进行数据迁移。

数据迁移

先创建new_twitter的正确映射。

然后使用如下方式进行数据迁移。

6.0以后写法

POST reindex
{
       
  "source":{
       
      "index":"bank" #老索引
   },
  "dest":{
       
      "index":"new_bank" #新索引
   }
}

老版本写法

POST reindex
{
       
  "source":{
       
      "index":"bank",  #老索引
      "type":"account" #具体的类型：
   },
  "dest":{
       
      "index":"new_bank" #新索引
   }
}

四、分词

一个tokenizer（分词器）接收一个字符流，将之分割为独立的tokens（词元，通常是独立的单词），然后输出tokens流。
例如：whitespace tokenizer遇到空白字符时分割文本。它会将文本"Quick brown fox!"分割为[Quick,brown,fox!]
该tokenizer（分词器）还负责记录各个terms(词条)的顺序或position位置（用于phrase短语和word proximity词近邻查询），以及term（词条）所代表的原始word（单词）的start（起始）和end（结束）的character offsets（字符串偏移量）（用于高亮显示搜索的内容）。
elasticsearch提供了很多内置的分词器（标准分词器），可以用来构建custom analyzers（自定义分词器）。
关于分词器： https://www.elastic.co/guide/en/elasticsearch/reference/7.6/analysis.html

POST _analyze
{
     
  "analyzer": "standard", #使用标准分词器
  "text": "The 2 Brown-Foxes bone." #需要分析的文本
}

执行结果：

{
     
  "tokens" : [
    {
     
      "token" : "the",
      "start_offset" : 0,
      "end_offset" : 3,
      "type" : "",
      "position" : 0
    },
    {
     
      "token" : "2",
      "start_offset" : 4,
      "end_offset" : 5,
      "type" : "",
      "position" : 1
    },
    {
     
      "token" : "brown",
      "start_offset" : 6,
      "end_offset" : 11,
      "type" : "",
      "position" : 2
    },
    {
     
      "token" : "foxes",
      "start_offset" : 12,
      "end_offset" : 17,
      "type" : "",
      "position" : 3
    },
    {
     
      "token" : "bone",
      "start_offset" : 18,
      "end_offset" : 22,
      "type" : "",
      "position" : 4
    }
  ]
}

对于中文，我们需要安装额外的分词器

安装ik分词器
- github地址：https://github.com/medcl/elasticsearch-analysis-ik/releases，找到你对应的版本
- 所有的语言分词，默认使用的都是“Standard Analyzer”，但是这些分词器针对于中文的分词，并不友好。为此需要安装中文的分词器。
- 在前面安装的elasticsearch时，我们已经将elasticsearch容器的“/usr/share/elasticsearch/plugins”目录，映射到宿主机的“ /mydata/elasticsearch/plugins”目录下，所以比较方便的做法就是下载“/elasticsearch-analysis-ik-7.4.2.zip”文件，然后解压到目录ik下即可。安装完毕后，需要重启elasticsearch容器
- 确认是否安装好了分词器
  - 通过 docker ps 查看ES容器的id
  - 通过 docker exec -it ES容器id /bin/bash 进入容器内部
  - 通过插件，查看是否安装成功
  - 退出ES容器
```
exit;
```
  - 重启ES
```
docker restart elasticsearch
```

测试分词器

ik_smart 智能分词

GET _analyze
{
         
   "analyzer": "ik_smart", 
   "text":"我是阿昌"
}

{
         
  "tokens" : [
    {
         
      "token" : "我",
      "start_offset" : 0,
      "end_offset" : 1,
      "type" : "CN_CHAR",
      "position" : 0
    },
    {
         
      "token" : "是",
      "start_offset" : 1,
      "end_offset" : 2,
      "type" : "CN_CHAR",
      "position" : 1
    },
    {
         
      "token" : "阿昌",
      "start_offset" : 2,
      "end_offset" : 4,
      "type" : "CN_WORD",
      "position" : 2
    }
  ]
}

ik_max_word 最大组合

GET _analyze
{
         
   "analyzer": "ik_max_word", 
   "text":"我是温州人"
}

{
         
  "tokens" : [
    {
         
      "token" : "我",
      "start_offset" : 0,
      "end_offset" : 1,
      "type" : "CN_CHAR",
      "position" : 0
    },
    {
         
      "token" : "是",
      "start_offset" : 1,
      "end_offset" : 2,
      "type" : "CN_CHAR",
      "position" : 1
    },
    {
         
      "token" : "温州人",
      "start_offset" : 2,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 2
    },
    {
         
      "token" : "温州",
      "start_offset" : 2,
      "end_offset" : 4,
      "type" : "CN_WORD",
      "position" : 3
    },
    {
         
      "token" : "人",
      "start_offset" : 4,
      "end_offset" : 5,
      "type" : "CN_CHAR",
      "position" : 4
    }
  ]
}

自定义词库

修改/mydata/elasticsearch/plugins/ik/config中的IKAnalyzer.cfg.xml


DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
        <comment>IK Analyzer 扩展配置comment>
        
        <entry key="ext_dict">entry>
         
        <entry key="ext_stopwords">entry>
        
        
        
        
properties>

修改完成后，需要重启elasticsearch容器，否则修改不生效。

docker restart elasticsearch

更新完成后，es只会对于新增的数据用更新分词。历史数据是不会重新分词的。如果想要历史数据重新分词，需要执行：

POST my_index/_update_by_query?conflicts=proceed

五、安装Nginx

通过nginx来为es提供远程的自定义分词

随便启动一个nginx实例，只是为了复制出配置

docker run -p80:80 --name nginx -d nginx:1.10

将容器内的配置文件拷贝到/usr/local/nginx/conf/ 下

docker container cp nginx:/etc/nginx . #别忘了点，且前面有一个空格

停止nginx容器，并删除

docker stop nginx  #停止nginx容器
docker rm nginx    #删除nginx镜像

更改从nginx中复制的nginx文件夹，并改名为conf

在nginx文件夹中创建如下

mkdir -p /mydata/nginx/html
mkdir -p /mydata/nginx/logs

最后nginx文件夹中有的文件夹为

再次重启，nginx，并指定我们上面的三个目录做docker挂载

docker run -p 80:80 --name nginx \
 -v /mydata/nginx/html:/usr/share/nginx/html \
 -v /mydata/nginx/logs:/var/log/nginx \
 -v /mydata/nginx/conf/:/etc/nginx \
 -d nginx:1.10

创建“/mydata/nginx/html/index.html”文件，测试是否能够正常访问

touch index.html

访问：http://ngix所在主机的IP:80/index.html

安装好nginx,把Nginx当做tomcat来用

mkdir /mydata/nginx/html/es
cd /mydata/nginx/html/es/
vim fenci.txt

#在里面输入
阿昌
乔碧罗殿下
#保存操作

测试http://192.168.109.101/es/fenci.txt，乱码问题我们先不管

此时再配置上面的es，ik远程分词器的地址


<entry key="remote_ext_dict">http://192.168.109.101/es/fenci.txtentry>

重启es

docker restart elasticsearch

再次测试

设置nginx开机自动启动

docker update nginx --restart=always

六、elasticsearch-Rest-Client

1、9300: TCP

spring-data-elasticsearch:transport-api.jar;

springboot版本不同，ransport-api.jar不同，不能适配es版本
7.x已经不建议使用，8以后就要废弃

2、9200: HTTP

有诸多包

jestClient: 非官方，更新慢；
RestTemplate：模拟HTTP请求，ES很多操作需要自己封装，麻烦；
HttpClient：同上；
Elasticsearch-Rest-Client：官方RestClient，封装了ES操作，API层次分明，上手简单；
最终选择Elasticsearch-Rest-Client（elasticsearch-rest-high-level-client）

七、SpringBoot整合ElasticSearch

搭建elasticsearch模块

引入依赖，改变我们项目springboot版本2.2.1.RELEASE

<dependency>
    <groupId>org.elasticsearch.clientgroupId>
    <artifactId>elasticsearch-rest-high-level-clientartifactId>
    <version>7.4.2version>
dependency>
<dependency>
    <groupId>com.achang.achangmallgroupId>
    <artifactId>achangmall-commonartifactId>
    <version>0.0.1-SNAPSHOTversion>
dependency>

查询我们springboot版本里面，对应的es的版本控制为6.8.4

我们需要修改成我们es所对应的版本

<properties>
    <java.version>1.8java.version>
    <elasticsearch.version>7.4.2elasticsearch.version>
properties>

配置

spring:
  cloud:
    nacos:
      discovery:
        server-addr: localhost:8848
  application:
    name: achangmall-search
server:
  port: 12000

com.achang.achangmall.search.conf.ElasticsearchConfig配置类

官方建议把requestOptions创建成单实例

@Configuration
public class ElasticsearchConfig {
     
    @Bean
    public RestHighLevelClient restHighLevelClient(){
     
        RestClientBuilder builder = RestClient.builder(new HttpHost("192.168.109.101", 9200, "http"));
        RestHighLevelClient client = new RestHighLevelClient(builder);
        return client;
    }
}

因为引入的Common的依赖，所以我们需要排除掉数据源

@SpringBootApplication(exclude = DataSourceAutoConfiguration.class)

在测试类中测试RestHighLevelClient是否注入成功

package com.achang.achangmall;

import com.achang.achangmall.search.AchangmallSearchApplication;
import org.elasticsearch.client.RestHighLevelClient;
import org.junit.Test;
import org.junit.runner.RunWith;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.boot.test.context.SpringBootTest;
import org.springframework.test.context.junit4.SpringRunner;

@SpringBootTest(classes = AchangmallSearchApplication.class)
@RunWith(SpringRunner.class)
public class AchangmallSearchApplicationTests {
     

    @Autowired
    private RestHighLevelClient client;

    @Test
    public void contextLoads() {
     
        System.out.println(client);
    }

}

编写测试类

官方API文档：

https://www.elastic.co/guide/en/elasticsearch/client/java-rest/7.x/java-rest-high.html

保存方式分为同步和异步，异步方式多了个listener回调
设置索引

@Test
public void test1() throws Exception{
     
    IndexRequest indexRequest = new IndexRequest("users");//存储索引
    indexRequest.id("1");//id
    //        indexRequest.source("username","achang","age",18,"gender","男");

    User user = new User();
    user.setUsername("achang");
    user.setAge(18);
    user.setGender("男");
    String json = JSON.toJSONString(user);//转换成json字符串
    indexRequest.source(json, XContentType.JSON);

    //执行操作
    IndexResponse response = client.index(indexRequest, ElasticsearchConfig.COMMON_OPTIONS);

    
    //IndexResponse[index=users,type=_doc,id=1,version=1,result=created,seqNo=0,primaryTerm=1,shards={"total":2,"successful":1,"failed":0}]
    System.out.println(response);
}

基本的crud操作可以参考官方文档如上
这里测试一个复杂查询

官方文档：https://www.elastic.co/guide/en/elasticsearch/client/java-rest/current/java-rest-high-search.html

@Test
public void find() throws IOException {
     
    // 1 创建检索请求
    SearchRequest searchRequest = new SearchRequest();
    searchRequest.indices("bank");
    SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
    // 构造检索条件
    //        sourceBuilder.query();
    //        sourceBuilder.from();
    //        sourceBuilder.size();
    //        sourceBuilder.aggregation();
    sourceBuilder.query(QueryBuilders.matchQuery("address","mill"));
    System.out.println(sourceBuilder.toString());

    searchRequest.source(sourceBuilder);

    // 2 执行检索
    SearchResponse response = client.search(searchRequest, GuliESConfig.COMMON_OPTIONS);
    // 3 分析响应结果
    System.out.println(response.toString());
}

@Test
public void find() throws IOException {
     
    // 1 创建检索请求
    SearchRequest searchRequest = new SearchRequest();
    searchRequest.indices("bank");
    SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
    // 构造检索条件
    //        sourceBuilder.query();
    //        sourceBuilder.from();
    //        sourceBuilder.size();
    //        sourceBuilder.aggregation();
    sourceBuilder.query(QueryBuilders.matchQuery("address","mill"));
    //AggregationBuilders工具类构建AggregationBuilder
    // 构建第一个聚合条件:按照年龄的值分布
    TermsAggregationBuilder agg1 = AggregationBuilders.terms("agg1").field("age").size(10);// 聚合名称
    // 参数为AggregationBuilder
    sourceBuilder.aggregation(agg1);
    // 构建第二个聚合条件:平均薪资
    AvgAggregationBuilder agg2 = AggregationBuilders.avg("agg2").field("balance");
    sourceBuilder.aggregation(agg2);

    System.out.println("检索条件"+sourceBuilder.toString());

    searchRequest.source(sourceBuilder);

    // 2 执行检索
    SearchResponse response = client.search(searchRequest, GuliESConfig.COMMON_OPTIONS);
    // 3 分析响应结果
    System.out.println(response.toString());
    SearchHits hits = response.getHits();
    SearchHit[] hits1 = hits.getHits();
    for (SearchHit hit : hits1) {
     
        hit.getId();
        hit.getIndex();
        String sourceAsString = hit.getSourceAsString();
        Account account = JSON.parseObject(sourceAsString, Account.class);//将json转成对应bean对象
        System.out.println(account);

        //获取检索到聚合信息
        Aggregations aggregations = response.getAggregations();
        Terms agg21 = aggregations.get("agg2");
        for (Terms.Bucket bucket : agg21.getBuckets()) {
     
            String keyAsString = bucket.getKeyAsString();
            System.out.println(keyAsString);
        }
    }

你可能感兴趣的:(es,elasticsearch,docker,谷粒商城,nginx)

linux 安装docker并部署Dify Samale、随风 linux docker 运维
环境：腾讯云Centos9Stream1.安装dockeryuminstalldocker#yuminstalldocker失败Error:Errordownloadingpackages:netavark-2:1.15.1-1.el9.x86_64:Cannotdownload,allmirrorswerealreadytriedwithoutsuccess#UpdateandCleanYumC
构建你的AI应用开发平台：如何在Ubuntu上使用Docker部署Dify kaixin_啊啊商业合作 cpolar 人工智能 ubuntu docker
文章目录前言1.Docker部署Dify2.本地访问Dify3.Ubuntu安装Cpolar4.配置公网地址5.远程访问6.固定Cpolar公网地址7.固定地址访问前言本文主要介绍如何在LinuxUbuntu系统使用Docker快速部署大语言模型应用开发平台Dify,并结合cpolar内网穿透工具实现公网环境远程访问本地Dify服务！Dify是一款开源的大语言模型(LLM)应用开发平台。它融合了后
代码整洁之道：在 Vue 项目中使用 ESLint 的最佳实践乐闻x Vue 进阶笔记手册前端知识图谱 vue.js 前端 javascript
系列文章ESLint使用教程（一）：从零配置ESLintESLint使用教程（二）：一步步教你编写Eslint自定义规则ESLint使用教程（三）：12个ESLint配置项功能与使用方式详解ESLint使用教程（四）：ESLint有哪些执行时机？ESLint使用教程（五）：ESLint和Prettier的结合使用与冲突解决ESLint使用教程（六）：从输入eslint命令到最终代码被处理，ESLi
前端自动化测试最佳实践：Jest与Cypress详解
目录前言自动化测试概述Jest详解Jest基础配置单元测试实践组件测试Mock与Stub快照测试Cypress详解Cypress环境搭建端到端测试实践页面交互测试API模拟测试策略与最佳实践测试金字塔测试覆盖率持续集成常见问题与解决方案总结前言随着前端应用的复杂度不断提高，确保代码质量和稳定性变得越来越重要。自动化测试作为保障代码质量的重要手段，已成为现代前端开发流程中不可或缺的一环。本文将详细介
【目标检测】Yolov7 的 ELAN 和 E-ELAN 模块演进（涉及到分组卷积，cardinality，梯度路径） Jiangnan_Cai 深度学习目标检测 YOLO 人工智能
感觉从YOLOv6开始，YOLOv6系列感觉优化点都着重于推理速度上面，YOLOv6的RepBlock重参数化，给我的感觉就是算子融合进行加速。而YOLOv7，为了在各种架构的边缘设备上获得极致的推理速度。YOLOv7的工作：新的bagoffreebies（有效的训练技巧，不会增加推理的计算量）有规划的重参数化模型（不同边缘设备架构，不同的重参数化方法）新的动态标签分配方法为了更好的理解YOLOv
vue中如何关闭eslint
方案一:vue脚手架创建工程的时候，不要选择Linter/Formatter选项，（那如何选择启用，请参照方案二）方案二：如果已经选择了eslint，我们可以通过删包的方法来使他失效。在packge.json中，将devDependencies下的关于eslint的依赖包给删除掉。然后退出服务为，重新npmi，在重启服务即可。再次基础上，如果又想使用eslint了。就需要在重新将这几个包手动安装。
网络工程师组网必用，动态路由OSPF及MPLS静态LSP配置 wozuimang ICT网络工程师集训营路由交换网络工程师 MPLS
一、MPLSMPLS基于标签转发，在数据链路层及网络层之间增加MPLS头部，属于2.5层MPLS域中的相关MPLS名词1、LSR标签交换路由器，支持MPLS的路由器2、LER，MPLS边界连接其他网络的LSR设备3、区域内部LSR为核心LSR二、LSR分类1、入站（ingress）LSR：IP报文中压入MPLS头部2、中转（transit）LSR：用于MPLS标签交换，将报文继续MPLS域中转发3
python视频工具包 ffmpeg 使用示例 pythonffmpeg
1.简介FFMPEG堪称自由软件中最完备的一套多媒体支持库，它几乎实现了所有当下常见的数据封装格式、多媒体传输协议以及音视频编解码器，提供了录制、转换以及流化音视频的完整解决方案。2.ffmpeg的常用方法将某文件下所有ts文件按顺序合并，转换成MP4格式存储：importffmpegdeftest2():ts_folder='path/ts_files/ceshi/'output_mp4="pa
移动开发领域 MVP 模式的在线旅游应用开发与预订移动开发前沿旅游 ai
移动开发领域MVP模式的在线旅游应用开发与预订关键词：MVP模式、移动开发、在线旅游、预订系统、架构设计摘要：本文以在线旅游应用的预订功能开发为场景，深入解析MVP（Model-View-Presenter）模式在移动开发中的实践价值。通过“餐厅服务”的生活化类比、核心概念拆解、Kotlin代码实战以及旅游场景的具体应用，帮助开发者理解MVP如何解耦界面与业务逻辑，提升代码可维护性和可测试性。背景
网络安全-反弹shell详解（攻击，检测与防御）程序员鱼 web安全网络安全单片机服务器 linux uni-app
反弹Shell：详解、攻击、检测与防御反弹Shell（ReverseShell）是一种网络安全领域中常见的攻击技术，通常用于远程控制受害者的计算机。本文旨在从网络安全的角度详细介绍反弹Shell的工作原理，实施方法以及如何检测和防御这类攻击。一、Shell的简介与原理1.1什么是Shell？Shell在计算机系统中指的是一个用户界面，用于访问操作系统的服务。在网络安全中，攻击者常利用Shell来控
OpenWebUI(8)源码学习-后端utils/telemetry追踪遥测模块
目录目录结构说明`constants.py`核心作用：主要功能：示例代码片段：`exporters.py`核心作用：主要类：`LazyBatchSpanProcessor`特点：技术亮点：`instrumentors.py`核心作用：插桩对象包括：钩子函数（Hooks）：Instrumentor类：插桩流程：`setup.py`核心作用：主要功能：典型调用方式：✨总体架构与价值技术亮点总结✅开发建
构建安全密码存储策略：核心原则与最佳实践 weixin_47233946 信息安全安全
密码是用户身份认证的第一道防线，其存储安全性直接关系到用户隐私和企业信誉。近年来频发的数据泄露事件揭示了密码管理的关键性。本文将深入探讨从加密算法到系统性防护的完整密码存储方案，帮助开发者构建企业级安全防御体系。一、密码存储基本准则绝对禁止明文存储：即使采用数据库加密措施，直接存储用户原始密码仍存在不可逆泄露风险。运维人员权限滥用或备份文件泄露都可能成为突破口。加密≠安全：AES等对称加密存在密钥
python汇率_用Python抓取汇率
抓取的是中行的数据:网址代码#-*-coding:utf-8-*-importreimporturllib.requesturl='http://www.boc.cn/sourcedb/whpj/index.html'#网址req=urllib.request.Request(url)response=urllib.request.urlopen(req)the_page=response.rea
数据结构实验解析(C++版)——实验一复杂度分析拯救三金数据结构 c++算法
目录一、实验例题例题1例题2二、实验原理与背景知识1、实验原理2、背景知识三、解题思路与算法1、解题思路2、算法四、代码实现例题1代码例题2代码五、实验结果分析与总结1、实验结果分析2、该实验与数据结构的联系一、实验例题例题1时间空间限制时间限制：1SEC空间限制：128MB问题描述分析以下代码：for(i=1;iusingnamespacestd;intmain(){longlongn;//输入
使用FinancialDatasets工具包进行财务数据分析 Zbb159 数据分析数据挖掘
##技术背景介绍在现代金融分析中，获取准确且及时的财务数据是至关重要的。FinancialDatasets提供了一个强大的API，可以获取超过16,000个股票的财务数据，时间跨度超过30年。通过与OpenAI的集成，我们能够创建智能化的财务分析助手，为投资者提供深度的市场洞察。##核心原理解析FinancialDatasets工具包通过RESTAPI接口访问财务数据，为每个公开交易的公司提供详细
ResNet：深度卷积神经网络的里程碑心想事“程” 小知识点 cnn 人工智能神经网络
一、引言在深度学习的发展历程中，深度卷积神经网络（CNN）不断演进，旨在提升对图像等数据的特征提取与分类能力。然而，随着网络层数的增加，传统CNN面临着梯度消失、梯度爆炸以及退化等棘手问题，训练变得愈发困难。2015年，由微软研究院提出的ResNet（ResidualNetworks，残差网络）横空出世，它以独特的残差学习思想，成功攻克了这些难题，在ImageNet竞赛中大放异彩，开创了深度神经网
Go - 项目收藏
1、谷歌官方维护了一个基于go语言的开源项目列表：https://github.com/golang/go/wiki/Projects2、[知乎网]有哪些值得学习的Go语言开源项目？3、[知乎用户：hackstoic]看过awesome-go项目，汇总了很多go开源项目。但是awesome-go收集了太全了，而且每个项目没有描述。因此我自己根据go语言中文社区提供的资料，还有互联网企业架构设计中的
展锐平台(Android15)WLAN热点名称修改不生效问题分析
前言在展锐AndroidV项目开发中，需要修改softAp/P2P热点名称时，发现集成GMS后直接修改framework层代码无效。具体表现为：修改packages/modules/Wifi/WifiApConfigStore中的getDefaultApConfiguration方法编译烧录后修改不生效问题根源在于：Wi-Fi模块在AndroidS(12)及以上版本已纳入Mainline模块Mai
从零构建智能ai语音助手：ESP32s3+Python+大语言模型实战指南
从零构建智能ai语音助手：ESP32s3+Python+大语言模型实战指南一、项目概述大家好！今天给大家带来一个干货满满的实战项目——基于ESP32S3硬件和Python后端的智能语音助手系统。这个项目将物联网技术与AI技术完美结合，打造一个可以实时对话、意图识别的智能语音交互系统。相比传统的离线语音系统只能识别固定命令词，我们这套系统可以：实现自然语言理解，支持多种表达方式无需预设固定命令词，更
mac 安装docker,完美解决 Ai君臣 docker docker macos 运维
1、下载安装最可靠brewinstall不建议用，如果用brewinstall正常，那就不用看后面的2、现象docker.errors.DockerException:ErrorwhilefetchingserverAPIversion:(‘Connectionaborted.‘,File原因：就是docker没安装好macos版本：macosCatalina10.15到这个网站DockerDes
Docker容器技术：从入门到实践 CarlowZJ AI应用开发落地 docker 容器运维
目录摘要一、引言二、Docker的基本概念（一）容器与虚拟机（二）Docker的三大核心概念（三）Docker的优势三、Docker的安装与配置（一）安装Docker（二）配置Docker四、Docker镜像管理（一）拉取镜像（二）构建镜像（三）推送镜像五、Docker容器操作（一）启动容器（二）进入容器（三）停止和删除容器六、Docker网络配置（一）默认网络模式（二）自定义网络（三）主机模式（
Mac安装Docker YIXiu-xiaowu Docker
1.可以通过左上角的小图片查看系统版本，并可以通过”软件更新“来检查和更新MacOS系统。通过官网双击完Docker.dmg文件后，双击下载的.dmg文件，然后将Docker鲸鱼图标拖拽到Application文件夹即完成安装。（切记一定是Apple芯片）我们打开Docker应用程序后，会有一些选择配置，我们按照如下配置即可。这里我们选择Accept--》选择默认配置就行，Docker会自动设置
【GESP】C++二级真题 luogu-B4357 [GESP202506 二级] 幂和数 CoderCodingNo c++开发语言
GESPC++二级，2025年6月真题，多重循环，难度★✮☆☆☆。个人认为，对于低年级的2级考生来说，相对较难。题目题解详见：【GESP】C++二级真题luogu-B4357[GESP202506二级]幂和数|OneCoder【GESP】C++二级真题luogu-B4357[GESP202506二级]幂和数|OneCoderGESPC++二级，2025年6月真题，多重循环，难度★✮☆☆☆。个人认为
MacOS系统安装Docker（非常详细）从零基础入门到精通，看完这一篇就够了_mac安装docker 2501_90249219 docker eureka 容器
选择默认配置就行，Docker会自动设置一些大多数开发人员必要的配置。这里我们跳过就好。运行Docker在应用程序中找到Docker程序图标，点击以启动Docker，启动之后我们会发现右上角工具栏中多了一个小鲸鱼的图片，这个就是Docker啦~真的好可爱~Docker桌面应用程序打开后，就是首页的学习中心界面。通过小鲸鱼中的AboutDockerDesktop可以查看Docker的版本可以看到版本
Python 领域 pytest 的测试用例的可维护性设计
Python领域pytest的测试用例的可维护性设计关键词：pytest、测试用例、可维护性、测试框架、自动化测试、测试设计模式、重构摘要：本文深入探讨了如何在Python测试框架pytest中设计可维护的测试用例。我们将从测试用例可维护性的核心原则出发，分析pytest的特性和最佳实践，介绍多种提高测试代码可维护性的设计模式和技巧。文章包含实际代码示例、项目实战案例以及可维护性评估指标，帮助开发
mac安装docker 段帅星 PC使用问题 macos docker
1、下载docker-desktophttps://www.docker.com/products/docker-desktop/2、安装，双击安装3、优化docker配置默认配置cat~/Library/Group\Containers/group.com.docker/settings-store.json{"AutoStart":false,"DockerAppLaunchPath":"/A
如何设计可扩展的后端系统架构？破碎的天堂鸟学习教程系统架构
设计可扩展的后端系统架构需综合考虑核心原则、架构模式、扩展策略、数据存储、容错机制及监控体系。以下是基于行业实践的详细指南：一、可扩展架构的核心原则无状态性（Statelessness）服务不保存客户端状态，请求可被任意实例处理，便于水平扩展。实现：通过负载均衡器（如Nginx、HAProxy）分发请求至多个无状态实例。松散耦合（LooseCoupling）模块间通过API或消息队列通信，减少依赖
Three.js 实现导出模型文件（.glb,.gltf）功能 GLTFExporter
Three.js提供了导出（.glb,.gltf）文件的APIGLTFExporter用于实现场景内容导出模型文件的功能导出模型文件主要使用parse方法，该方法接收三个参数：1.scene：要导出的场景对象。2.onComplete：解析完成后的回调函数，接收一个参数result，表示解析后的glTF数据。3.options：可选参数，用于配置导出的选项。下面是options的一些常用参数选项：
ECR仓库CloudFormation模板完整指南 ivwdcwso 运维与云原生自动化 aws 运维 ECR CloudFormation 镜像容器
概述本文档详细介绍了一个通用的AmazonECR（ElasticContainerRegistry）仓库CloudFormation模板，该模板支持多业务组、参数化配置，并包含完整的安全策略、生命周期管理和监控功能。模板特性核心功能✅支持4个业务组：app、ai、mall、frontend✅灵活的服务名手动输入✅多环境支持（dev/test/staging/prod）✅自动镜像扫描和安全检查✅生命
[晕事]今天做了件晕事83: pen test mzhan017 英语学习笔记晕事英语学习
这个缩写，就不能顾名思义了，而且pen是一个独立的单词，从读音上来说还容易和pain混淆，所以导致初接触者有些困扰。所以这个pentest的缩写，有些失败。全写是penetrationtest：渗透测试。https://en.wikipedia.org/wiki/Penetration_test修改建议是改成penetest，至少可以和pen在书写上区分，在读音是也可以区分，就读“排你test”。
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开