Hi梅

Linux安装Elasticsearch(手把手入门教程及下载资源)

文章目录

一.安装Elasticsearch
- 1.下载Linux版本tar包
- 2.配置Elasticsearch
- 3.运行遇到的问题
- 4.浏览器访问Elasticsearch
二.ik分词器
- 1.上传并且解压
- 2.出现的问题
- 3.使用kibana控制台测试
- 4.解决Kibana运行命令提示安全验证
三.安装Kibana图形界面
- 1.Kibana用途
- 2.配置Kibana
- 3.运行Kibana
四.Elasticsearch常用操作
- 1基本概念
- 2.创建索引
- - 2.2查看索引设置
  - 2.3删除索引
  - 2.4映射配置
  - - 2.4.1创建映射字段
    - 2.4.2查看映射关系
    - 2.4.3字段属性详解
    - - 2.4.3.1.type
      - 2.4.3.2 index
      - 2.4.3.3 store
  - 2.5 新增数据
  - - 2.5.1随机生成id
    - 2.5.2通过id查询数据
    - 2.5.2自定义插入id
    - 2.5.4 智能判断识别
  - 2.6 修改数据
  - 2.7 删除数据
- 3.查询
- - 3.1基本查询
  - - 3.3.1 查询所有(match_all)
    - 3.3.2 匹配查询(match)
    - 3.3.3 多字段查询（multi_match）
    - 3.3.4 词条匹配(term)
    - 3.3.5 多词条精确匹配(terms)
  - 3.2查询结果过滤
  - - 3.2.1.直接指定字段
    - 3.2.2.指定includes和excludes
  - 3.3高级查询
  - - 3.3.1 布尔组合（bool)
    - 3.3.2 范围查找(range)
    - 3.3.3 模糊查询(fuzzy)
  - 3.4过滤(filter)
  - 3.4排序
  - - 3.4.1 单字段排序
    - 3.4.2聚合查询出现的问题
    - 3.4.3 多字段排序
- 4. 聚合aggregations
- - - 4.1 基本概念
    - 4.2 导入数据测试
    - 4. 3聚合为桶
    - 4.4 桶内度量
    - 4.5 桶内嵌套桶
    - 4.6.划分桶的其它方式
    - - 4.6.1.阶梯分桶Histogram
      - 4.5.2.范围分桶range

一.安装Elasticsearch

介绍Elasticsearch:

分布式，无需人工搭建集群（solr就需要人为配置，使用Zookeeper作为注册中心）
Restful风格，一切API都遵循Rest原则，容易上手
近实时搜索，数据更新在Elasticsearch中几乎是完全同步的

1.下载Linux版本tar包

官网地址
点击进入官网点击去体验

下拉找到该模块点击下载

选择系统类型,点击下载

下载好的安装包,也可以某度下载地址 提取码：9htf

上传文件到linux,需要注意的是root是没办法启用Elasticsearch的,所以我们需要创建一个用户youtwo

useradd 用户名
passwd 用户名 #设置用户名的密码

创建的用户名会在/home下创建一个目录

把我们的安装包上传到youtwo目录下
但是文件是属于root的我们需要更改一下组

通过chown修改

chown user[:group] file…
user 所属用户:group用户组 file需要修改的文件
chown youtwo:youtwo elasticsearch-7.16.1-linux-x86_64.tar.gz

修改文件的权限chmod 755 elasticsearch-7.16.1-linux-x86_64.tar.gz

解压文件tar -zxvf elasticsearch-7.16.1-linux-x86_64.tar.gz
注意:后面出现问题就是因为没有切换用户导致的解压前记得切换用户 su -youtwo

修改文件的名称:mv elasticsearch-7.16.1 elasticsearch

2.配置Elasticsearch

进入config目录

配置vi elasticsearch.yml文件需要把前面的#删除

/home/youtwo/elasticsearch/data #数据目录
/home/youtwo/elasticsearch/logs #日志目录

在往下一点还要把:network.host: 0.0.0.0 ip改成这个
#设置允许所有ip可以连接该elasticsearch

在添加下面参数让elasticsearch-head插件可以访问es
http.cors.enabled: true
http.cors.allow-origin: "*"

不然后面运行会报错:Network is unreachable
wq保存退出
记得创建data目录,因为logs已经有了不需要创建

需要保证linux已经安装好jdk1.8及以上版本

运行elasticsearch服务
进入 bin目录下运行./elasticsearch

运行报错了,由于使用root启动导致的

我们切换到另外一个用户:su - youtwo

又遇到问题提示没有jdk,就运行查看版本存在呀

后面排查我们解压什么的都在root用户下解压地址文件还是属于root,我们创建的用户不能使用

现在改下解压后的权限,切换会root 更改权限:chown -R youtwo:youtwo elasticsearch 使用到-R :把目录下的所有权限都跟着一起修改

切换用户并运行

报这个错误是由于文件

3.运行遇到的问题

切换Root用户解决问题
问题1:max file descriptors [4096] for elasticsearch process is too low, increase to at least [65535]我们用的是的用户，不是root，所以文件权限不足修改/etc/security/limits.conf添加下面内容

* soft nofile 65536

* hard nofile 131072

* soft nproc 4096

* hard nproc 4096

wq保存退出

问题2:max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]

vm.max_map_count：限制一个进程可以拥有的VMA(虚拟内存区域)的数量，继续修改配置文件，：vim /etc/sysctl.conf
添加:vm.max_map_count=655360

然后运行:sysctl -p

问题3:the default discovery settings are unsuitable for production use; at least one of [discovery.seed_hosts, discovery.seed_providers, cluster.initial_master_nodes] must be configured

修改elasticsearch.yml配置文件
添加cluster.initial_master_nodes: ["node-1"]
wq保存退出

在次重启,切换用户运行

问题4:出现UnknownHostException: geoip.elastic.co

修改elasticsearch.yml配置添加ingest.geoip.downloader.enabled: false

在运行就没有出现报错信息

4.浏览器访问Elasticsearch

通过Linux的ip:9200访问

二.ik分词器

1.上传并且解压

Elasticsearch和IK的版本使用

分词器点击下载提取码：feq4
把分词器插件上传到plugins下

解压插件
unzip elasticsearch-analysis-ik-7.16.2.zip -d ik-analyzer
解压完成后记得把压缩包删除

2.出现的问题

在运行elasticsearch出现该问题

原因是ik分词器版本不一致
进入分词器插件目录 vi plugin-descriptor.properties修改配置

elasticsearch.version=改成提示错误的版本号(我这是7.16.1)

wq保存退出
运行Elasticsearch可以看出日志已经输出加载ik分词器了,并且也没有运行报错

3.使用kibana控制台测试

POST _analyze
{
  "analyzer": "ik_max_word",
  "text":     "我是中国人,我很骄傲"
}

发送成功后我们得到以下结果(分词的结果)

{
  "tokens" : [
    {
      "token" : "我",
      "start_offset" : 0,
      "end_offset" : 1,
      "type" : "CN_CHAR",
      "position" : 0
    },
    {
      "token" : "是",
      "start_offset" : 1,
      "end_offset" : 2,
      "type" : "CN_CHAR",
      "position" : 1
    },
    {
      "token" : "中国人",
      "start_offset" : 2,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 2
    },
    {
      "token" : "中国",
      "start_offset" : 2,
      "end_offset" : 4,
      "type" : "CN_WORD",
      "position" : 3
    },
    {
      "token" : "国人",
      "start_offset" : 3,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 4
    },
    {
      "token" : "我",
      "start_offset" : 6,
      "end_offset" : 7,
      "type" : "CN_CHAR",
      "position" : 5
    },
    {
      "token" : "很",
      "start_offset" : 7,
      "end_offset" : 8,
      "type" : "CN_CHAR",
      "position" : 6
    },
    {
      "token" : "骄傲",
      "start_offset" : 8,
      "end_offset" : 10,
      "type" : "CN_WORD",
      "position" : 7
    }
  ]
}

但是提示了一个错误,大致意思是Elasticsearch内置的安全特性没有被启用,没有身份验证，任何人都可以访问您的集群,测试阶段不影响

4.解决Kibana运行命令提示安全验证

#! Elasticsearch built-in security features are not enabled. Without authentication, your cluster could be accessible to anyone. See
进入Elasticsearch的config包下的编辑vi elasticsearch.yml
在里面添加一行禁用安全选项xpack.security.enabled: false

wq保存,重启elasticsearch,先把本地运行的Kibana关闭掉等elasticsearch开启成功后在运行Kibana

三.安装Kibana图形界面

1.Kibana用途

Kibana是一个基于node.js的Elasticsearch索引数据统计工具,可以使用Elasticsearch的聚合功能,生成各种图标,还提供了索引数据控制台.

我这边下载windows版本的,直接去官网下载

2.配置Kibana

解压下载好的Kibana安装包在config下配置kibana.yml

修改elasticsearch.hosts

改成这个里面的ip是部署elasticsearch的服务,集群可以配置多个用逗号隔开

3.运行Kibana

不管是Linux或者windows都是需要node.js的依赖

通过浏览器访问http://安装Kibana访问的ip:5601/

找到这个界面

点进去就会进入Kibana的开发工具,我们可以通过这个来创建Elasticsearch的增上改查等操作

四.Elasticsearch常用操作

1基本概念

Elasticsearch也是基于Lucene的全文检索库，本质也是存储数据，很多概念与MySQL类似的。

对比关系：
索引（indices）--------------------------------Databases 数据库
类型（type）-------------------------Table 数据表(从7.x开始已经废弃)
文档（Document）----------------Row 行
字段（Field）-------------------Columns 列

详细说明:

概念	说明
索引库（indices)	indices是index的复数，代表许多的索引
类型（type）	类型是模拟mysql中的table概念(不过从7.x开始已经废弃)
文档（document）	存入索引库原始的数据。比如每一条商品信息，就是一个文档
字段（field）	文档中的属性
索引库（indices)	indices是index的复数，代表许多的索引
映射配置（mappings）	字段的数据类型、属性、是否索引、是否存储等特性

索引集（Indices，index的复数）：逻辑上的完整索引 collection1
分片（shard）：数据拆分后的各个部分
副本（replica）：每个分片的复制

注意：Elasticsearch本身就是分布式的，因此即便你只有一个节点，Elasticsearch默认也会对你的数据进行分片和副本操作，当你向集群添加新数据时，数据也会在新加入的节点中进行平衡。

2.创建索引

Elasticsearch采用Rest风格Api,因此可以使用工具发起http请求
创建索引请求的格式:

请求方式:PUT
请求路径:/索引名称
请求参数:Json格式

{
    "settings": {
        "number_of_shards": 1,
        "number_of_replicas": 0
      }
}

settings：索引库的设置

number_of_shards：分片数量(只有一台就填写1,创建索引后就不能更改了)
number_of_replicas：副本数量(只有一台就填写0,创建索引后也可以随时更改)

使用ApiPost发送http请求插入索引库

使用Kibana测试
kibana的控制台，可以对http请求进行简化

PUT /itmei
{
  "settings": {
    "number_of_shards": 1,
    "number_of_replicas": 0
  }
}

2.2查看索引设置

Get请求可以帮我们查看索引信息，格式

GET /索引库名

可以使用*来查询所有索引库配置

GET *

2.3删除索引

DELETE /索引库名

创建索引库2

访问索引库2的数据

删除索引库2

DELETE /itmei2

查看索引库2已经返回404找不到了

2.4映射配置

2.4.1创建映射字段

请求方式：PUT

PUT /索引库名/_mapping/类型名称
{
  "properties": {
    "字段名": {
      "type": "类型",
      "index": true，
      "store": true，
      "analyzer": "分词器"
    }
  }
}

type：类型，可以是text、long、short、date、integer、object等
index：是否索引，默认true
store:是否仓储，默认false
analyzer:分词器，参数这里使用ik_max_word即使用ik分词器

示例
如果Elasricsearch是7.x以下低版本的可以不需要拼接?include_type_name=true因为7.x之后不支持type导致的

PUT itmei/_mapping/goods?include_type_name=true
{
  "properties":{
    "title":{
      "type":"text",
      "analyzer":"ik_max_word"
    },
    "images":{
      "type":"keyword",
      "index":false
    },
    "price":{
      "type":"float"
    }
  }
}

响应结果：

{
  "acknowledged": true
}

2.4.2查看映射关系

语法
GET /索引库名称/_mapping

示例：

GET  /itmei/_mapping

响应代码

{
  "itmei" : {
    "mappings" : {
      "properties" : {
        "images" : {
          "type" : "keyword",
          "index" : false
        },
        "price" : {
          "type" : "float"
        },
        "title" : {
          "type" : "text",
          "analyzer" : "ik_max_word"
        }
      }
    }
  }
}

2.4.3字段属性详解

2.4.3.1.type

Elasticsearch支持的数据类型非常丰富,我们就拿常用的来介绍

String类型，又分两种：
- text：可分词，不可参与聚合
- keyword：不可分词，数据会作为完整字段进行匹配，可以参与聚合
Numerical：数值类型，分两类
- 基本数据类型：long、interger、short、byte、double、float、half_float
- 浮点数的高精度类型：scaled_float
  - 需要指定一个精度因子，比如10或100。elasticsearch会把真实值乘以这个因子后存储，取出时再还原。
Date：日期类型

elasticsearch可以对日期格式化为字符串存储，但是建议我们存储为毫秒值，存储为long，节省空间。

2.4.3.2 index

index影响字段的索引情况。

true：字段会被索引，则可以用来进行搜索。默认值就是true
false：字段不会被索引，不能用来搜索(有些字段我们需要手动设置,因为必须要参与检索,比如商品图片)

2.4.3.3 store

是否将数据进行额外存储。
如果设置store为true，就会在_source以外额外存储一份数据，多余，因此一般我们都会将store设置为false，事实上，store的默认值就是false。

2.5 新增数据

2.5.1随机生成id

通过POST请求，可以向一个已经存在的索引库中添加数据。

语法：

POST /索引库名/类型名
{
    "key":"value",
    "key2":"value2"
}

示例：

POST /itmei/goods
{
  "title":"红米手机",
  "price":"2999",
  "images":"https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg"
}

响应

{
  "_index" : "itmei",
  "_type" : "goods",
  "_id" : "NI5N5n0BFIP5QEoddtDO",
  "_version" : 1,
  "result" : "created",
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 0,
  "_primary_term" : 3
}

2.5.2通过id查询数据

语法：

GET /索引库名/映射类型名名称/插入的id

示例：

GET itmei/goods/NI5N5n0BFIP5QEoddtDO

响应数据

{
  "_index" : "itmei",
  "_type" : "goods",
  "_id" : "NI5N5n0BFIP5QEoddtDO",
  "_version" : 1,
  "_seq_no" : 0,
  "_primary_term" : 3,
  "found" : true,
  "_source" : {
    "title" : "红米手机",
    "price" : "2999",
    "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg"
  }
}

2.5.2自定义插入id

如果我们想要自己新增的时候指定id可以这样。

语法：

POST /索引库名/类型名/id值
{
    "key":"value",
    "key2":"value2"
}

示例：

POST /itmei/goods/1
{
  "title":"小米米手机",
  "price":"3999",
  "images":"https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg"
}

可以发现已经自定义id成功了

响应

{
  "_index" : "itmei",
  "_type" : "goods",
  "_id" : "NI5N5n0BFIP5QEoddtDO",
  "_version" : 1,
  "result" : "created",
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 0,
  "_primary_term" : 3
}

通过id查询数据

2.5.4 智能判断识别

Elasticsearch非常智能，你不需要给索引库设置任何mapping映射，它也可以根据你输入的数据来判断类型，动态添加数据映射

示例：

POST /itmei/goods/2

我们在用来的基础上多添加了2个映射名称,也成功插入

在查询id信息,可以正常显示

我们在查看下映射字关系

GET  /itmei/_mapping/

响应数据

{
  "itmei" : {
    "mappings" : {
      "properties" : {
        "images" : {
          "type" : "keyword",
          "index" : false
        },
        "price" : {
          "type" : "float"
        },
        "saleable" : {
          "type" : "boolean"
        },
        "stock" : {
          "type" : "long"
        },
        "title" : {
          "type" : "text",
          "analyzer" : "ik_max_word"
        }
      }
    }
  }
}

stock和saleable都被成功映射了。

2.6 修改数据

我们把刚刚的数据进行修改,修改需要指定id

请求方式:PUT
id如果不存在,则新增加
id如果存在,则修改

修改前面id为2的数据把OPPO手机改华为手机

PUT itmei/goods/2
{
  "title":"华为手机",
  "price":"999",
  "images":"https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg",
  "stock":10,
  "saleable":true
}

我们现在在插入id是3的数据手机名称把华为改成OPPO重点在与我们现在还没有创建id是3的数据所以运行后是新增操作

PUT itmei/goods/3
{
  "title":"OPPO手机",
  "price":"1999",
  "images":"https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg",
  "stock":10,
  "saleable":true
}

2.7 删除数据

我们把刚刚的数据进行删除,删除需要指定id

语法

DELETE /索引库名/类型名/id值

示例

DELETE itmei/goods/3

响应数据

{
  "_index" : "itmei",
  "_type" : "goods",
  "_id" : "3",
  "_version" : 8,
  "result" : "deleted",
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 14,
  "_primary_term" : 3
}

3.查询

我们把查询分为多个模块进行展示

基本查询
_source过滤
结果过滤
高级查询
排序

3.1基本查询

语法

GET /索引库名/_search
{
    "query":{
        "查询类型":{
            "查询条件":"查询条件值"
        }
    }
}

这里的query代表一个查询对象，里面可以有不同的查询属性

查询类型：
- 例如：match_all， match，term ， range 等等
查询条件：查询条件会根据类型的不同，写法也有差异，后面在测试

3.3.1 查询所有(match_all)

GET itmei/_search
{
  "query": {
    "match_all": {}
  }
}

query：代表查询对象
match_all：代表查询所有

响应数据

{
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 3,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "1",
        "_score" : 1.0,
        "_source" : {
          "title" : "红米手机",
          "price" : "2999",
          "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg"
        }
      },
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "2",
        "_score" : 1.0,
        "_source" : {
          "title" : "OPPO手机",
          "price" : "2999",
          "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg",
          "stock" : 20,
          "saleable" : true
        }
      },
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "3",
        "_score" : 1.0,
        "_source" : {
          "title" : "华为手机",
          "price" : "3999",
          "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg",
          "stock" : 20,
          "saleable" : false
        }
      }
    ]
  }
}

took：查询花费时间，单位是毫秒
time_out：是否超时
_shards：分片信息
hits：搜索结果总览对象
- total：搜索到的总条数
- max_score：所有结果中文档得分的最高分
- hits：搜索结果的文档对象数组，每个元素是一条搜索到的文档信息
  - _index：索引库
  - _type：文档类型
  - _id：文档id
  - _score：文档得分
  - _source：文档的源数据

3.3.2 匹配查询(match)

我们插入一条数据和手机区分开来

PUT /itmei/goods/4
{
    "title":"长虹电视",
    "images":"http://image.leyou.com/12479122.jpg",
    "price":3899.00
}

现在库里面有3个手机1个电视总共4条数据

or关系

match类型查询，会把查询条件进行分词，然后进行查询,多个词条之间是or的关系

GET itmei/_search
{
  "query": {
    "match": {
      "title": "小米手机"
    }
  }
}

响应数据

{
  "took" : 2,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 3,
      "relation" : "eq"
    },
    "max_score" : 1.8664205,
    "hits" : [
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "1",
        "_score" : 1.8664205,
        "_source" : {
          "title" : "红米手机",
          "price" : "2999",
          "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg"
        }
      },
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "2",
        "_score" : 0.77691567,
        "_source" : {
          "title" : "OPPO手机",
          "price" : "2999",
          "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg",
          "stock" : 20,
          "saleable" : true
        }
      },
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "3",
        "_score" : 0.69441146,
        "_source" : {
          "title" : "华为手机",
          "price" : "3999",
          "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg",
          "stock" : 20,
          "saleable" : false
        }
      }
    ]
  }
}

会把小米手机进行分词查询,由于出现的数据里面没有关于电视所以不会查询出来,多个词是之间是or关系

and关系
有些场景需要使用精准查询所以需要使用到and

GET itmei/_search
{
  "query": {
    "match": {
      "title": {
      "query":"长虹电视",
      "operator":"and"
      }  
    }
  }
}

响应数据

{
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 4.688036,
    "hits" : [
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "4",
        "_score" : 4.688036,
        "_source" : {
          "title" : "长虹电视",
          "images" : "http://image.leyou.com/12479122.jpg",
          "price" : 3899.0
        }
      }
    ]
  }
}

会把长虹和电视同时包含才会查询出来

or和and之间
如果使用多个词进行匹配operator 操作符参数设置成 and 只会将此文档排除,我们想要处于中间某种结果.
可以使用match查询支持 minimum_should_match 最小匹配参数，可以指定必须匹配的词项数用来表示一个文档是否相关通常使用百分比来表示分词之间的的匹配度

GET itmei/_search
{
  "query": {
    "match": {
      "title": {
      "query":"红米电视4A",
      "minimum_should_match":"50%"
      }   
    }
  }
}

这里我们使用了3个词50%就相当于3*50%等于1.5个字只要包含一个多词就可以被匹配到

3.3.3 多字段查询（multi_match）

multi_match与match类似，不同的是它可以在多个字段中查询
我们在创建一个数据并且在数据里面添加一个副标题

PUT /itmei/goods/5
{
  "title":"麒麟手机",
  "price":"4999",
  "subtitle":"华为旗下手机"
}

接着我们使用多字段查询

GET itmei/_search
{
  "query": {
    "multi_match": {
      "query":"华为",
      "fields": ["title","subtitle"]
      }
  }
}

fields 数组可以存放多个查询字段

响应结果

{
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 2.71415,
    "hits" : [
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "3",
        "_score" : 2.71415,
        "_source" : {
          "title" : "华为手机",
          "price" : "3999",
          "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg",
          "stock" : 20,
          "saleable" : false
        }
      },
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "5",
        "_score" : 0.5753642,
        "_source" : {
          "title" : "麒麟手机",
          "price" : "4999",
          "subtitle" : "华为旗下手机"
        }
      }
    ]
  }
}

由于查询的华为只要存在fields多字段里面,查询里面都可以被显示出来

3.3.4 词条匹配(term)

term 查询被用于精确值匹配，这些精确值可能是数字、时间、布尔或者那些未分词的字符串

GET itmei/_search
{
  "query": {
    "term": {
      "price": 4999
      }
  }
}

响应数据

{
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 1.3862942,
    "hits" : [
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "5",
        "_score" : 1.3862942,
        "_source" : {
          "title" : "麒麟手机",
          "price" : "4999",
          "subtitle" : "华为旗下手机"
        }
      }
    ]
  }
}

3.3.5 多词条精确匹配(terms)

terms 查询和 term 查询一样，但它允许你指定多个值进行匹配。如果这个字段包含了指定值中的任何一个值，那么这个文档满足条件就会被查询出来

GET itmei/_search
{
  "query": {
    "terms": {
      "price": [3999,4999,5999]
      }
  }
}

terms下查询的字段是用数组存放多个值进行匹配查询

响应数据

{
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "3",
        "_score" : 1.0,
        "_source" : {
          "title" : "华为手机",
          "price" : "3999",
          "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg",
          "stock" : 20,
          "saleable" : false
        }
      },
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "5",
        "_score" : 1.0,
        "_source" : {
          "title" : "麒麟手机",
          "price" : "4999",
          "subtitle" : "华为旗下手机"
        }
      }
    ]
  }
}

3.2查询结果过滤

默认情况下elasticsearch查询匹配到的数据会把_source的所有字段都进行返回,如果我们需要指定返回什么数据就要使用_source进行过滤

3.2.1.直接指定字段

GET itmei/_search
{
  "_source": ["title","price"], 
  "query": {
    "terms": {
      "price": [3999,4999,5999]
      }
  }
}

添加_source值是数组里面存放需要展示的字段

不通过_source指定字段如图:

3.2.2.指定includes和excludes

我们也可以通过：

includes：来指定想要显示的字段
excludes：来指定不想要显示的字段

二者都是可选的。

GET itmei/_search
{
  "_source": {
    "includes": "title"
  }, 
  "query": {
    "terms": {
      "price": [3999,4999,5999]
      }
  }
}

不显示某个字段

GET itmei/_search
{
  "_source": {
    "excludes": "title"
  }, 
  "query": {
    "terms": {
      "price": [3999,4999,5999]
      }
  }
}

3.3高级查询

3.3.1 布尔组合（bool)

我们在插入一条数据进行测试,在插入一条电视数据

PUT /itmei/goods/6
{
  "title":"红米电视",
  "price":4999
}

我们现在查询一下索引库的所有数据

GET /itmei/_search
{
  "query": {
    "match_all": {}
  }
}

响应数据

{
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 6,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "4",
        "_score" : 1.0,
        "_source" : {
          "title" : "长虹电视",
          "images" : "http://image.leyou.com/12479122.jpg",
          "price" : 3899.0
        }
      },
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "5",
        "_score" : 1.0,
        "_source" : {
          "title" : "麒麟手机",
          "price" : "4999",
          "subtitle" : "华为旗下手机"
        }
      },
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "3",
        "_score" : 1.0,
        "_source" : {
          "title" : "华为手机",
          "price" : "3999",
          "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg",
          "stock" : 20,
          "saleable" : false
        }
      },
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "1",
        "_score" : 1.0,
        "_source" : {
          "title" : "红米手机",
          "price" : "2999",
          "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg"
        }
      },
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "2",
        "_score" : 1.0,
        "_source" : {
          "title" : "OPPO手机",
          "price" : "1999",
          "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg",
          "stock" : 20,
          "saleable" : true
        }
      },
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "6",
        "_score" : 1.0,
        "_source" : {
          "title" : "红米电视",
          "price" : 4999
        }
      }
    ]
  }
}

bool把各种其它查询通过must（与）、must_not（非）、should（或）的方式进行组合

GET /itmei/_search
{
  "query": {
    "bool": {
      "must": [{"match":{"title":"华为"}}],
      "must_not": [{"match":{"title":"电视"}}],
      "should": [{"match":{"title": "手机"}}]
      
    }
  }
}

响应数据

{
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 2.2393317,
    "hits" : [
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "1",
        "_score" : 2.2393317,
        "_source" : {
          "title" : "红米手机",
          "price" : "2999",
          "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg"
        }
      }
    ]
  }
}

可以看出加了must_nottitle字段的值都会被排除,接着must会与上should的字段进行展他们都是数组格式意味着可以多个字段进行查询如在这里插入代码片

GET /itmei/_search
{
  "query": {
    "bool": {
      "must": [{"match":{"title":"红米"}}],
      "must_not": [{"match":{"title":"电视"}}],
      "should": [{"match":{"title": "手机"}},{"match":{"title": "华为"}}]
      
    }
  }
}

3.3.2 范围查找(range)

range查询找出某个字段指定区间内的数字或者时间

操作符	介绍
gt	大于
gte	大于等于
lt	小于
lte	小于等于

语法

GET  /索引库/_search
{
  "query": {
    "range": {
      "FIELD": {
        "gte": 10,
        "lte": 20
      }
    }
  }
}

FIELD表示查询的字段,这里标识查询字段的大于等于10小于等于20的范围数据

示例:查询price字段的范围区间

GET  /itmei/_search
{
  "query": {
    "range": {
      "price": {
        "gte": 3999,
        "lte": 4999
      }
    }
  }
}

响应数据

{
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 3,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "5",
        "_score" : 1.0,
        "_source" : {
          "title" : "麒麟手机",
          "price" : "4999",
          "subtitle" : "华为旗下手机"
        }
      },
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "3",
        "_score" : 1.0,
        "_source" : {
          "title" : "华为手机",
          "price" : "3999",
          "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg",
          "stock" : 20,
          "saleable" : false
        }
      },
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "6",
        "_score" : 1.0,
        "_source" : {
          "title" : "红米电视",
          "price" : 4999
        }
      }
    ]
  }
}

3.3.3 模糊查询(fuzzy)

fuzzy等价于term的模糊查询,但是查询的词条和索引库里面的词条可以允许偏差,但是偏差不能超过2位

示例

GET  /itmei/_search
{
  "query": {
    "fuzzy": {
      "title": "麒麟"
    }
  }
}

响应数据

{
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 1.6360589,
    "hits" : [
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "5",
        "_score" : 1.6360589,
        "_source" : {
          "title" : "麒麟手机",
          "price" : "4999",
          "subtitle" : "华为旗下手机"
        }
      }
    ]
  }
}

可以通过fuzziness属性设置编辑偏差的距离

GET  /itmei/_search
{
  "query": {
    "fuzzy": {
      "title":{
        "value": "麒麟",
        "fuzziness": 1
      }
    }
  }
}

3.4过滤(filter)

条件查询中进行过滤,有查询都会有影响到文档的评分和排名,如果查询结果中进行了过滤,标签不希望影响到过滤的评分结果,那么就不要把过滤条件作为查询条件使用,而是使用filter方式:
对标题进行模糊查询,并且对价格进行做过滤,这样就可以避免查询出来的数据结果是大于等于2000并且小于等于3000的数据
注意：filter中还可以再次进行bool组合条件过滤。

查询语句


GET itmei/_search
{
  "query": {
    "bool": {
      "must": 
        {
          "match": {
            "title": "小米手机"
          }
        },
      "filter": [
        {
          "range": {
            "price": {
              "gte": 2000,
              "lte": 3000
            }
          }
        }
      ]
    }
  }
}

查询结果

{
  "took" : 2,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 1.920312,
    "hits" : [
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "1",
        "_score" : 1.920312,
        "_source" : {
          "title" : "红米手机",
          "price" : "2999",
          "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg"
        }
      },
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "2",
        "_score" : 0.62958694,
        "_source" : {
          "title" : "OPPO手机",
          "price" : "2999",
          "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg",
          "stock" : 20,
          "saleable" : true
        }
      }
    ]
  }
}

无查询条件，直接过滤
如果一次查询只有过滤，没有查询条件，不希望进行评分，我们可以使用constant_score取代只有 filter 语句的 bool 查询。在性能上是完全相同的，但对于提高查询简洁性和清晰度有很大帮助。

查询条件

GET itmei/_search
{
  "query": {
    
    "constant_score": {
      "filter": {
        "range": {
          "price": {
            "gt": 2000,
            "lt": 3000
          }
        }
      }
    }
  }
}

查询结果

{
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "1",
        "_score" : 1.0,
        "_source" : {
          "title" : "红米手机",
          "price" : "2999",
          "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg"
        }
      },
      {
        "_index" : "itmei",
        "_type" : "goods",
        "_id" : "2",
        "_score" : 1.0,
        "_source" : {
          "title" : "OPPO手机",
          "price" : "2999",
          "images" : "https://cdn.cnbj1.fds.api.mi-img.com/product-images/redmik40ultra-k40pro/specs_header.jpg",
          "stock" : 20,
          "saleable" : true
        }
      }
    ]
  }
}

3.4排序

3.4.1 单字段排序

sort 可以让我们按照不同的字段进行排序，并且通过order指定排序的方式

3.4.2聚合查询出现的问题

注意:文本字段没有针对需要每个文档字段数据的操作(如聚合和排序)进行优化，因此这些操作在默认情况下是禁用的,因为这样可能会作用大量的内存所以会提示错误,需要把排序的字段进行添加索引
解决办法
可以看出提示错误的字段是price价格字段添加

PUT /itmei/_mapping?pretty
{
  "properties": {
    "price": { 
      "type": "text",
      "fielddata": true
    }
  }
}

在运行上面的语句就可以正常展示数据了

3.4.3 多字段排序

假定我们想要结合使用 price和 _score（得分）进行查询，并且匹配的结果首先按照价格排序，然后按照相关性得分排序

查询语句

GET itmei/_search
{
  "query": {
    "bool": {
      "must":{"match":{"title":"小米手机"}},
      "filter": [
        {
          "range": {
            "price": {
              "gt": 2000,
              "lt": 3000
            }
          }
        }
      ]
    }
  },
  "sort":
    {
      "price": {
        "order": "desc"
      },
      "_score":{
        "order":"desc"
        
      }
    }
}

查询结果

4. 聚合aggregations

聚合可以让我们极其方便的实现对数据的统计、分析

什么手机最多人买?
手机每个月的销售情况?
手机的价格平均多少,最高又是多少?

4.1 基本概念

Elasticsearch中的聚合，包含多种类型，最常用的两种，一个叫桶，一个叫度量：
桶的作用:

按照某种方式对数据进行分组，每一组数据在ES中称为一个桶，例如我们根据车品牌划分，可以得到大众桶、本田桶，奥迪桶……或者我们按照年龄段对人进行划分：0-10,10-20,20-30,30-40等

Elasticsearch中提供的划分桶的方式有很多：

Date Histogram Aggregation：根据日期阶梯分组，例如给定阶梯为周，会自动每周分为一组
Histogram Aggregation：根据数值阶梯分组，与日期类似
Terms Aggregation：根据词条内容分组，词条内容完全匹配的为一组
Range Aggregation：数值和日期的范围分组，指定开始和结束，然后按段分组
. . . . .

度量（metrics）

分组完成以后，我们一般会对组中的数据进行聚合运算，例如求平均值、最大、最小、求和等，这些在ES中称为度量

比较常用的一些度量聚合方式：

Avg Aggregation：求平均值
Max Aggregation：求最大值
Min Aggregation：求最小值
Percentiles Aggregation：求百分比
Stats Aggregation：同时返回avg、max、min、sum、count等
Sum Aggregation：求和
Top hits Aggregation：求前几
Value Count Aggregation：求总数
……

4.2 导入数据测试

创建索引:

PUT /cars
{
  "settings": {
    "number_of_shards": 1,
    "number_of_replicas": 0
  },
  "mappings": {
    "properties": {
      "color": {
        "type": "keyword"
      },
      "make": {
        "type": "keyword"
      }
    }
  }
}

注意：在ES中，需要进行聚合、排序、过滤的字段其处理方式比较特殊，因此不能被分词。这里我们将color和make这两个文字类型的字段设置为keyword类型，这个类型不会被分词，将来就可以参与聚合

导入数据

POST /cars/_bulk
{ "index": {}}
{ "price" : 10000, "color" : "red", "make" : "honda", "sold" : "2014-10-28" }
{ "index": {}}
{ "price" : 20000, "color" : "red", "make" : "honda", "sold" : "2014-11-05" }
{ "index": {}}
{ "price" : 30000, "color" : "green", "make" : "ford", "sold" : "2014-05-18" }
{ "index": {}}
{ "price" : 15000, "color" : "blue", "make" : "toyota", "sold" : "2014-07-02" }
{ "index": {}}
{ "price" : 12000, "color" : "green", "make" : "toyota", "sold" : "2014-08-19" }
{ "index": {}}
{ "price" : 20000, "color" : "red", "make" : "honda", "sold" : "2014-11-05" }
{ "index": {}}
{ "price" : 80000, "color" : "red", "make" : "bmw", "sold" : "2014-01-01" }
{ "index": {}}
{ "price" : 25000, "color" : "blue", "make" : "ford", "sold" : "2014-02-12" }

4. 3聚合为桶

首先，我们按照汽车的颜色color来划分桶

查询请求

GET /cars/_search
{
  "size": 0,
  "aggs": {
    "popular_colors": {
      "terms": {
        "field": "color"
      }
    }
  }
}

解析:

size：查询条数，这里设置为0，因为我们不关心搜索到的数据，只关心聚合结果，提高效率
aggs：声明这是一个聚合查询，是aggregations的缩写
- popular_colors：给这次聚合起一个名字，任意。
  - terms：划分桶的方式，这里是根据词条划分
    - field：划分桶的字段

查询结果

{
  "took" : 896,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 8,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  },
  "aggregations" : {
    "popular_colors" : {
      "doc_count_error_upper_bound" : 0,
      "sum_other_doc_count" : 0,
      "buckets" : [
        {
          "key" : "red",
          "doc_count" : 4
        },
        {
          "key" : "blue",
          "doc_count" : 2
        },
        {
          "key" : "green",
          "doc_count" : 2
        }
      ]
    }
  }
}

hits：查询结果为空，因为我们设置了size为0
aggregations：聚合的结果
popular_colors：我们定义的聚合名称
buckets：查找到的桶，每个不同的color字段值都会形成一个桶
- key：这个桶对应的color字段的值
- doc_count：这个桶中的文档数量

可以通过这次聚合查询得出卖红色颜色的车销量高!

4.4 桶内度量

前面的例子告诉我们每个桶里面的文档数量，这很有用。但通常，我们的应用需要提供更复杂的文档度量。例如，每种颜色汽车的平均价格是多少？

因此，我们需要告诉Elasticsearch使用哪个字段，使用何种度量方式进行运算，这些信息要嵌套在桶内，度量的运算会基于桶内的文档进行

现在，我们为刚刚的聚合结果添加求价格平均值的度量

查询请求

GET /cars/_search
{
  "size": 0,
  "aggs": {
    "popular_colors": {
      "terms": {
        "field": "color"
      },
      "aggs": {
        "agg_price": {
          "avg": {
            "field": "price"
          }
        }
      }
    }
  }
}

aggs：我们在上一个aggs(popular_colors)中添加新的aggs。可见度量也是一个聚合
avg_price：聚合的名称
avg：度量的类型，这里是求平均值
field：度量运算的字段

查询结果

{
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 8,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  },
  "aggregations" : {
    "popular_colors" : {
      "doc_count_error_upper_bound" : 0,
      "sum_other_doc_count" : 0,
      "buckets" : [
        {
          "key" : "red",
          "doc_count" : 4,
          "agg_price" : {
            "value" : 32500.0
          }
        },
        {
          "key" : "blue",
          "doc_count" : 2,
          "agg_price" : {
            "value" : 20000.0
          }
        },
        {
          "key" : "green",
          "doc_count" : 2,
          "agg_price" : {
            "value" : 21000.0
          }
        }
      ]
    }
  }
}

可以看出agg_price 每种颜色车的平均价格

4.5 桶内嵌套桶

刚刚的案例中，我们在桶内嵌套度量运算。事实上桶不仅可以嵌套运算， 还可以再嵌套其它桶。也就是说在每个分组中，再分更多组。

比如：我们想统计每种颜色的汽车中，分别属于哪个制造商，按照make字段再进行分桶

查询请求

GET /cars/_search
{
  "size": 0,
  "aggs": {
    "popular_colors": {
      "terms": {
        "field": "color"
      },
      "aggs": {
        "agg_price": {
          "avg": {
            "field": "price"
          }
        },
        "maker":{
          "terms": {
            "field": "make"
            
          }
        }
      }
    }
  }
}

原来的color桶和avg计算我们不变
maker：在嵌套的aggs下新添一个桶，叫做maker
terms：桶的划分类型依然是词条
filed：这里根据make字段进行划分

查询结果

{
  "took" : 3,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 8,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  },
  "aggregations" : {
    "popular_colors" : {
      "doc_count_error_upper_bound" : 0,
      "sum_other_doc_count" : 0,
      "buckets" : [
        {
          "key" : "red",
          "doc_count" : 4,
          "maker" : {
            "doc_count_error_upper_bound" : 0,
            "sum_other_doc_count" : 0,
            "buckets" : [
              {
                "key" : "honda",
                "doc_count" : 3
              },
              {
                "key" : "bmw",
                "doc_count" : 1
              }
            ]
          },
          "agg_price" : {
            "value" : 32500.0
          }
        },
        {
          "key" : "blue",
          "doc_count" : 2,
          "maker" : {
            "doc_count_error_upper_bound" : 0,
            "sum_other_doc_count" : 0,
            "buckets" : [
              {
                "key" : "ford",
                "doc_count" : 1
              },
              {
                "key" : "toyota",
                "doc_count" : 1
              }
            ]
          },
          "agg_price" : {
            "value" : 20000.0
          }
        },
        {
          "key" : "green",
          "doc_count" : 2,
          "maker" : {
            "doc_count_error_upper_bound" : 0,
            "sum_other_doc_count" : 0,
            "buckets" : [
              {
                "key" : "ford",
                "doc_count" : 1
              },
              {
                "key" : "toyota",
                "doc_count" : 1
              }
            ]
          },
          "agg_price" : {
            "value" : 21000.0
          }
        }
      ]
    }
  }
}

我们可以看到，新的聚合maker被嵌套在原来每一个color的桶中。
每个颜色下面都根据 make字段进行了分组
我们能读取到的信息：
- 红色车共有4辆
- 红色车的平均售价是 $32，500 美元。
- 其中3辆是 Honda 本田制造，1辆是 BMW 宝马制造。

4.6.划分桶的其它方式

前面讲了，划分桶的方式有很多，例如：

Date Histogram Aggregation：根据日期阶梯分组，例如给定阶梯为周，会自动每周分为一组
Histogram Aggregation：根据数值阶梯分组，与日期类似
Terms Aggregation：根据词条内容分组，词条内容完全匹配的为一组
Range Aggregation：数值和日期的范围分组，指定开始和结束，然后按段分组

刚刚的案例中，我们采用的是Terms Aggregation，即根据词条划分桶。

接下来，我们再学习几个比较实用的：

4.6.1.阶梯分桶Histogram

原理：

histogram是把数值类型的字段，按照一定的阶梯大小进行分组。你需要指定一个阶梯值（interval）来划分阶梯大小。

比如:

价格字段做了阶梯分组,那么就需要设置interal的值为500,那么阶梯就是 0,500,1000,1500,…

上面列出的是每个阶梯的key，也是区间的启点(0-500,500-1000)。

阶梯公式
bucket_key = Math.floor((value - offset) / interval) * interval + offset

value：就是当前数据的值，本例中是450
offset：起始偏移量，默认为0
interval：阶梯间隔，比如500

对汽车价格进行阶梯分组,设置interval为5000:

查询请求

GET /cars/_search
{
  "size": 0,
  "aggs": {
    "price":{
      "histogram": {
        "field": "price",
        "interval": 5000
      }
    }
  }
}

查询结果

{
  "took" : 16,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 8,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  },
  "aggregations" : {
    "price" : {
      "buckets" : [
        {
          "key" : 10000.0,
          "doc_count" : 2
        },
        {
          "key" : 15000.0,
          "doc_count" : 1
        },
        {
          "key" : 20000.0,
          "doc_count" : 2
        },
        {
          "key" : 25000.0,
          "doc_count" : 1
        },
        {
          "key" : 30000.0,
          "doc_count" : 1
        },
        {
          "key" : 35000.0,
          "doc_count" : 0
        },
        {
          "key" : 40000.0,
          "doc_count" : 0
        },
        {
          "key" : 45000.0,
          "doc_count" : 0
        },
        {
          "key" : 50000.0,
          "doc_count" : 0
        },
        {
          "key" : 55000.0,
          "doc_count" : 0
        },
        {
          "key" : 60000.0,
          "doc_count" : 0
        },
        {
          "key" : 65000.0,
          "doc_count" : 0
        },
        {
          "key" : 70000.0,
          "doc_count" : 0
        },
        {
          "key" : 75000.0,
          "doc_count" : 0
        },
        {
          "key" : 80000.0,
          "doc_count" : 1
        }
      ]
    }
  }
}

你会发现doc_count有很多结果都是为0那么就,显得很多数据是无用的,那么要怎么避免呢?
需要用到参数min_doc_count为1，来约束最少文档数量为1，这样文档数量为0的桶会被过滤

请求参数

GET /cars/_search
{
  "size": 0,
  "aggs": {
    "price":{
      "histogram": {
        "field": "price",
        "interval": 5000,
        "min_doc_count": 1
      }
    }
  }
}

请求结果

4.5.2.范围分桶range

范围分桶与阶梯分桶类似，也是把数字按照阶段进行分组，只不过range方式需要你自己指定每一组的起始和结束大小。

查询请求


GET /cars/_search
{
  "size": 0,
  "aggs": {
    "price_range":{
      "range": {
        "field": "price",
        "ranges": [
          {
            "from": 5000,
            "to": 50000
          }
        ]
      }
     
    }
  }
}

查询结果

{
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 8,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  },
  "aggregations" : {
    "price_range" : {
      "buckets" : [
        {
          "key" : "5000.0-50000.0",
          "from" : 5000.0,
          "to" : 50000.0,
          "doc_count" : 7
        }
      ]
    }
  }
}

你可能感兴趣的:(linux开发,java开发知识,中间件,elasticsearch,linux,搜索引擎)

kafka--基础知识点--0 Chasing__Dreams kafka kafka 分布式
kafka架构https://cloud.tencent.com/developer/article/230789219张图生产者架构消息的磁盘存储文件结构https://cloud.tencent.com/developer/article/230789219张图produce消息分区策略kafka–基础知识点–5–生产者分区策略ISR、OSR、AR是什么？ISR：ISR，全称in-syncre
GEO + SEO+SMO：AI时代全域组合营销智***O 人工智能 GEO优化大数据 GEO AI搜索
在信息爆炸的时代，用户每一次搜索的背后，都是一次决策的起点。当AI工具逐渐成为人们获取答案的首选，如何让你的品牌在AI生成的回答中占据核心位置？如何让用户在不同平台搜索时，始终选择你？智火营销SEO+GEO+SMO组合营销策略，让品牌成为用户与“搜索”之间的桥梁。智火营销GEO服务一、SEO：巩固搜索生态的信任基石在AI工具与社交平台崛起的当下，传统搜索引擎仍是用户验证信息的重要场景。SEO（搜索
linux安装Node.js 环境，Docker 环境，Ruby 环境，MongoDB 环境，PostgreSQL 数据库，Go 开发环境，Python 虚拟环境 2401_87017622 数据库 linux node.js
在Linux上安装其他常见的开发环境可以根据具体需求而定，以下是一些常见的安装步骤：1.Node.js环境Node.js是一个基于ChromeV8引擎的JavaScript运行环境，适用于服务器端开发。安装Node.js：通过包管理器安装：sudoyuminstall-ygcc-c++makecurl-sLhttps://rpm.nodesource.com/setup_14.x|sudo-Eba
详解NIO Channel类沧澜sincerely Java 高并发 nio
目录什么是NIOChannel？为什么要学习NIOChannel？FileChannelSocketChannelDatagramChannel本篇文章内容的前置知识为NIOBuffer类，如果不了解，可点击链接学习详解NIOBuffer类及其属性和方法-CSDN博客什么是NIOChannel？在JavaNIO中，Channel（通道）是一种广义的I/O抽象，用于表示与数据源或数据目的地之间的连接
2021-03-22 夫记
清晨自问我今天的目标是什么？今天最重要的一件事是什么？我今天要学哪些新知识？我今天要有怎样的心情？作息今日起床：0558昨日就寝：2305年度目标及关键点：项目本月重要成果：今日青蛙/番茄钟rplistreply昨日步数：8753昨日好习惯打卡：早起早睡阅读无氧
AI大模型开发工程师之路：从零到一的进阶指南
当前最热门的技术无疑是AI大模型。虽然它的应用前景广阔，但真正精通大模型技术的人还不多。然而，市场对大模型的需求却在不断增长，吸引了不少开发者想要转行进入这个领域。然而，面对新技术，许多人心中充满疑虑，担心自己无法掌握。笔者也是充满疑虑，然后直到我看到这本书籍，感觉受益匪浅，给与了很多指导和引路，先分享给大家，也希望可以帮助更多的小伙伴。一起开启大模型之路。加油加油加油！！！目录1.大模型开发知识
WIFI7新特性浅析及Linux内核对其的支持 winter91 Linux NetWork linux WIFI
WIFI7新特性浅析及Linux内核对其的支持|DD'NotesWIFI7新特性浅析及Linux内核对其的支持wifi7新特性Wi-Fi7（IEEE802.11be）作为下一代无线网络标准，在速度、延迟、容量和稳定性等方面实现了显著提升。以下是其核心新特性：1.更高带宽与速率320MHz信道带宽支持连续320MHz或非连续160+160MHz带宽（6GHz频段），相比WiFi6的160MHz实现速
Java多线程、锁、线程池详解
Java多线程、锁、线程池详解在现代软件开发中，多线程编程是提高程序性能和响应能力的重要手段。Java提供了丰富的多线程支持，包括线程的创建、同步、通信以及线程池管理等。本文将深入探讨Java中的多线程、锁机制、线程池的原理和应用，并涵盖成员方法、并行、调度、同步、死锁、睡眠、唤醒以及线程状态等知识。一、多线程基础1.多线程的概念多线程允许程序同时执行多个任务，从而提高程序的执行效率。2.多线程的
C++-linux 7.文件IO（二）文件描述符、阻塞与非阻塞 HHRL-yx C++-linux系统编程 linux c++服务器
文件IO进阶：文件描述符、阻塞与非阻塞在前文我们介绍了文件IO的核心系统调用，本章将深入探讨Linux文件IO的底层机制，包括文件描述符的本质、阻塞与非阻塞IO模型、文件偏移量控制（lseek）以及系统调用中的参数传递规则，帮助你构建更完整的系统编程知识体系。一、文件描述符：进程与文件的桥梁在Linux系统中，当我们打开或创建一个文件（或套接字）时，操作系统会提供一个文件描述符（FileDescr
信息系统监理师·信息系统监理基础软考和人工智能学堂信息系统监理师数据库
目录一、考试定位与命题脉搏二、知识框架：一张思维导图三、四星考点速记口诀四、典型题型与秒杀套路五、2024-2025命题风向预测六、5分钟速查清单----------------------------------------------------------------一、考试定位与命题脉搏1.角色定位：国家强制监理制度下的“第三方守门人”，核心任务是“四控三管一协调”。2.命题规律：•近3年
互联网大厂Java求职面试：基于Spring AI与云原生架构的RAG系统设计与实现在未来等你 Java场景面试宝典 Java SpringAi RAG系统云原生
互联网大厂Java求职面试：基于SpringAI与云原生架构的RAG系统设计与实现场景背景郑薪苦，一位自称“代码界的段子手”的程序员，正在参加某互联网大厂的技术总监面试。面试官是技术总监李总，拥有丰富的架构设计经验，尤其擅长AI与大模型技术、云原生架构等领域。今天的面试主题围绕企业知识库与AI大模型的深度融合架构展开，重点探讨如何设计一个高性能、可扩展的RAG（Retrieval-Augmente
如何增强LLM（大语言模型）的“置信度”和“自信心” ：LLM的“自信”不是“什么都能答”，而是“该答的答得准，不该答的敢说不”。 ZhangJiQun&MXP 教学 2021 AI python 2024大模型以及算力语言模型人工智能自然语言处理深度学习 transformer 机器学习
如何增强LLM（大语言模型）的“置信度”和“自信心”Pleaseprovideafirmanswer,andforthosewhodon’tknow,pleasereply‘unknown’LLM（大语言模型）的“置信度”（对输出内容的准确性判断）和“自信心”（稳定输出可靠信息的能力），核心逻辑与传统模型相通——让模型在“已知且可靠的知识范围内输出”，同时避免“强行回答陌生问题”。但LLM因生成式
六爻基础-腾蛇的基本知识天机六爻
螣蛇临不同六亲组合而成的信息之象：1.螣蛇临官爻占官司灾凶，若发动克世爻用神，主有牢狱之灾；占梦主有恶梦、怪梦，令人惊恐、怪异之梦；占宅，主有怪异之事发生，有妖、仙、鬼、神怍祟，有异常声音、动静；占病，为虚病、怪痫，医院盘不出之病症，神经之类症症；女占婚，官爻临螣蛇，为命中注定之丈夫，很难离婚。2.螣蛇临父爻克世主受文书，契约所束缚，受合同所牵制；测父母，主父母有怪病怪事或神经不正常，有虚病，思虑
2022-06-02 你的常识，是别人的知识 Sarah写着玩
你的常识，是别人的知识Day87S解读论语之Day71【原文】7.34子曰：“若圣与仁，则吾岂敢！抑为之不厌，诲人不倦，则可谓云尔已矣。''公西华曰：“正唯弟子不能学也。”【翻译】孔子说：“如果说到圣和仁，那我怎么敢当！不过是朝着圣与仁的方向去努力做而不厌倦，教导别人不知疲倦，那是可以这样说的。”公西华说：“这正是我们弟子学不到的。”【解读】1，有时，你的追求只是别人的起点。孔子并没有刻意追求所谓
Redis 深度解析：从核心原理到生产实践 Pasregret 缓存 redis 数据库缓存
Redis深度解析：从核心原理到生产实践一、Redis核心定位与数据结构1.核心能力矩阵深度解析Redis作为高性能内存数据库，核心能力覆盖缓存、数据存储、消息中间件等场景，其设计哲学围绕速度优先、内存高效、功能丰富展开：内存存储特性纯内存操作：基于内存寻址的O(1)复杂度数据操作，单节点QPS可达10万+持久化方案：RDB（快照）与AOF（日志）双模式，支持数据持久化与故障恢复单线程模型：基于事
IntelliJ IDEA高效开发指南：技巧、插件与快捷键懒羊羊敲代码丫 ide
IntelliJIDEA作为Java开发者首选的集成开发环境，其强大的功能和灵活的扩展性能够显著提升编码效率。本文将从常用技巧、必备插件和快捷键大全三部分展开，助你解锁IDEA的“神器”属性。一、IDEA高效开发技巧138快捷键为王导航类：Ctrl+N：快速查找类；Ctrl+Shift+N：查找文件311。Ctrl+B：跳转到声明；Ctrl+Alt+B：跳转到实现3。编辑类：Ctrl+D：复制当前
网络爬虫：技术原理、应用场景与合法使用全攻略程序小武 python爬虫入门爬虫网络
爬虫是什么？网络爬虫（WebScraping或WebCrawling）是一种通过自动化方式从网站上抓取公开数据的程序。它通过模拟用户在浏览器中浏览网页的过程，访问网页、提取信息，并将数据保存到本地系统中。爬虫技术广泛应用于搜索引擎、数据收集、市场分析、信息聚合等多个领域。爬虫能做什么？数据收集爬虫可以高效地从互联网上的大量网站收集信息。比如，抓取新闻网站上的文章内容、商品电商平台的价格与库存数据、
mac OS上docker安装zookeeper
拉取镜像：$dockerpullzookeeper:3.5.73.5.7:Pullingfromlibrary/zookeeper3.5.7:Pullingfromlibrary/zookeeper3.5.7:Pullingfromlibrary/zookeepernomatchingmanifestforlinux/arm64/v8inthemanifestlistentries报错：由于时M3
斗鱼大数据面试题及参考答案大模型大数据攻城狮大数据大数据面试 hadoop面试 spark面试 flink面试手撕SQL 手撕代码
GC（垃圾回收）相关知识一、常见的GC收集器SerialGCSerialGC是最基本的垃圾收集器，它是单线程的。在进行垃圾收集时，会暂停所有的用户线程，直到垃圾收集完成。它的工作过程比较简单，首先标记出所有的垃圾对象，然后将它们清除。例如，在一个小型的、对响应时间要求不高的Java应用程序中，如简单的命令行工具，SerialGC可以满足垃圾收集的需求。因为这种应用程序通常没有很高的并发要求，暂停用
AI产品经理面试宝典第30天：AI+教育个性化学习与知识图谱相关面试题的解答指导 TGITCIC AI产品经理一线大厂面试题人工智能产品经理 AI产品经理面试大模型产品经理面试 AI面试大模型面试
自适应学习系统如何实现千人千面？面试官：请用产品视角解释AI自适应学习系统的核心逻辑你的回答：自适应学习系统本质是构建"数据-模型-决策"的闭环。以沪江Hitalk为例，其通过12级能力评估体系采集学员的听、说、读、写数据，利用知识图谱建立知识点关联网络。当学员完成"实景演练-诊断反馈-学习包推送"的完整链路时，系统会动态调整知识图谱权重，形成个性化学习路径。面试官追问：如何验证个性化效果？回答：
Linux 定时器应用示例
1.运行结果2.程序#include#include#includeintcount=0;structitimervalt;voidtimer_handler(intsig){printf("timer_handler:signal=%d,count=%d\n",sig,++count);if(count>=8){printf("canceltimer\n");t.it_value.tv_sec=
2018-04-08 viper44
科技就是将复杂的事情简单化，所以智能手机的出现显著降低了我们学习的难度，只要善于使用搜索引擎，几乎能够获得所有的知识，而我们利用这些工具的姿势，会反过来决定我们未来的走向，所以一定不能做伸手党，能查到东西尽量自己去搜索，网上有很多现成的成功，我们要善于搜索，把节约的时间拿去干别的事生活中会面临很多突发状况，要如何才能从容面对呢，培养急智的最简单的方法就是列举出所有可能出现的问题，并对它们制定一些相
自学java到什么程度才能就业？ Python编程社区
多年Java开发从业者：首先，这个问题主要问：自学Java编程技术，如果才能找到一份Java编程的工作。按照现在的招聘标准来看，无论你去哪个公司面试，你只需要满足他们公司的需求就可以。找到一份Java编程工作需要掌握的内容如下：首先是Javase作为Java最基本的学习内容，不在多说。然后是掌握JavaScript的基本原理，因为做Java编程开发必须学会JavaScript，用到JavaScri
IntelliJ IDEA 与 Java 开发的自动化部署方案 Java技术栈实战 java intellij-idea 自动化 ai
IntelliJIDEA与Java开发的自动化部署方案关键词：IntelliJIDEA、Java开发、自动化部署、CI/CD、Docker、Jenkins、Maven/Gradle摘要：本文深入探讨了如何利用IntelliJIDEA这一强大的JavaIDE与现代化工具链实现Java应用的自动化部署。我们将从开发环境配置开始，逐步介绍构建工具集成、持续集成/持续部署(CI/CD)流程搭建、容器化部署
【Java开发日记】我们来说说如何使用 Lambda 表达式实现排序功能
目录基于Comparator排序使用Lambda表达式替换Comparator匿名内部类通过静态方法抽取公共的Lambda表达式借助Comparator的comparing方法多条件排序在Stream中进行排序倒序排列调转排序判断在Comparator.comparing中定义排序反转在Stream中定义排序反转null值的判断元素是null的笨拙实现使用Comparator.nullsLast和
4D习书之旅 Day4 Jennie夏
第四章4D使用法则小标题：（1）团队评估引发行为改变（2）4D团队发展评估八项被评估的行为、用八项行为测评是否足够了？评估报告究竟什么样、团队会有什么进步（3）个人发展评估个人会有什么进步、基准尺度A我关注的内容：（1）关注点在哪里，能量就流向哪里。注意力和心态的改变促成行为的改变。理性知识不足以促使行为发生改变。（2）共通的社交语言，进行不可能的交谈。（3）四个维度八项行为同时全面发展，创造高绩
【无标题】 Aczone28 单片机嵌入式硬件
学习记录：初识Linux操作系统与基本命令今天我正式开始学习Linux操作系统，并对Ubuntu有了初步的了解。Ubuntu是基于GNU工程发布的Linux发行版之一，具有开源、自由、安全和高效的特点，是目前主流的Linux系统之一，广泛应用于服务器、开发环境以及日常桌面使用。在实践中，我接触并掌握了一些常用的Linux命令，包括但不限于以下几个方面：文件和目录操作：-ls：查看当前目录下的文件和
禁止拖动视频进度条来保障视频安全？菜包eo 教育视频 polyv 视频安全音视频安全
文章目录前言一、何为禁止拖动视频进度条？二、禁止拖动视频进度条的实现原理三、如何实现禁止拖动视频进度条总结前言在知识付费与企业培训场景中，视频内容安全是核心诉求。学员随意拖动进度条可能导致关键知识点遗漏，甚至助长盗录行为。本文深入解析HTML5播放器禁止拖拽进度条的技术方案，通过精准控制播放行为保障学习效果与内容安全。以企业培训、在线教育为例，探讨如何借助技术手段平衡用户体验与内容防护，为开发者提
LocalSend：比 AirDrop 更自由！这款神器让文件传输不再受限开源项目精选 https
LocalSend是一款免费、开源的跨平台文件传输工具，支持Windows、macOS、Linux、Android和iOS等主流操作系统。它通过HTTPS实现端到端加密传输，无需互联网或外部服务器，即可在局域网内高速、安全地传输文件和文本。其核心优势在于打破平台壁垒，提供高效安全的本地文件共享方案，让您的多设备互联互通变得前所未有的简单。Stars数64,423Forks数3,437主要特点跨平台
系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc