醉鱼！

Elasticsearch创建一个索引怎么也这么复杂

ES(8.1)认证考题大纲参考如下

https://mp.weixin.qq.com/s/x7lMmMAo2563JysMJ8vgRQ

今天是我们学习ES8.1官方搜索工程师的第一课，首先第一个问题就是根据给定的需求创建一个索引，本篇文章将采用如下（总分总）的形式分析该题目，第一部分先进行考题的分析，猜测要考的知识点大概有什么，然后第二部分对该题目涉及的知识点进行分析讲解，每一个考点后都跟着简单的解读，最后模拟汇总该考题，最终实现熟练掌握该题目。后续本类型文章如不特殊说明均使用该种方式进行讲解，如果有好的建议欢迎留在评论区讨论

本文结构如下：

1、题目分析（总）

2、题目拆解知识点（分）

3、总结（模拟出题考试，总）

下面进入第一部分，题目分析阶段

一、题目分析

题目：根据给定的需求创建一个索引

解读：首先我在看到这个题目的第一感觉就是这个题目很简单，不就是创建个索引吗，最多就是设置几个主分片，几个副本分片，稍微再深点就是字段类型、自定义分词器、索引别名，看着好像很简单，其实实际操作起来还是有一定难度的，不过考试过程中能够查阅官网，所以我们只要熟记考点官网位置即可，下面我就该题目涉及到的（索引设置，字段映射类型，文本分析）这三点进行分析

通过阅读本文，你可以获得什么？

1、定义一个索引常用的配置项有哪些

2、自定义字段映射与动态字段映射

3、如何设置字段的数据类型

4、文本分析中 Tokenizer、Token filter、Character filters各自发挥什么作用以及如何设置

5、定义一个指定分片数量的索引，包含自定义分词器，自定义字段映射

二、题目拆解

2.1、索引设置

2.1.1、静态索引设置

静态索引设置是只能在索引创建时或者索引关闭时使用的

index.number_of_shards

索引主分片数量设置，默认1，只能在索引创建时设置，索引关闭时不能修改此选项
index.number_of_routing_shards

与index.number_of_shards一起使用的整数值，文档路由到主分片的分片数
index.codec

压缩存储数据策略选择，默认LZ4
index.routing_partition_size

路由可以到达的分片数，默认1，只能在索引创建时设置，这个值必须小于index.number_of_shards，除非index.number_of_shards的值也是1
index.soft_deletes.enabled

索引软删除开关，只能在创建索引时进行配置，默认true
index.soft_deletes.retention_lease.period

软删除记录保留最长期限策略，默认值12h
index.load_fixed_bitset_filters_eagerly

嵌套查询预加载缓存过滤器，默认true
index.shard.check_on_startup

分片打开时是否对分片进行检查的开关。默认false，还有true,checksum，除非特别精通各配置项含义，否则不建议更改

2.1.2、动态索引设置

动态索引设置是可以使用update-index-settings API在激活的索引上来动态设置

更改关闭掉的静态或者动态索引设置可能导致不正确的设置，如果不删除或者重建索引，则无法更正这些错误设置

index.number_of_replicas

副本分片数量设置，默认为1
index.auto_expand_replicas

根据集群中数据节点的数量自动展开的副本数量，默认false关闭
index.search.idle.after

分片多久没有请求或搜索会被认为是空闲的分片,默认30s
index.refresh_interval

执行refresh的间隔，默认1s,可以设置-1来禁用
index.max_result_window

es搜索结果返回的最大记录数量(from+size)，默认10000
index.max_inner_result_window

es搜索结果中聚合桶返回的最大数量，默认100
index.max_rescore_window

Rescore 请求的返回记录最大值，默认10000
index.max_docvalue_fields_search

查询请求中对docvalue_fields数量的限制，默认100
Index.max_script_fields

查询请求中允许的script_fields的数量最大值，默认32
Index.max_ngram_diff

NGramTokenizer 和NGramTokenFilter 之间min_gram与max_gram之间的最大差异值，默认1
index.max_shingle_diff

shingle token filter 中max_shingle_size与min_shingle_size最大差值，默认3
index.max_refresh_listeners

索引分片上最大的监听器数量，实现了refresh=wait_for的监听器
index.analyze.max_token_count

使用analyze api 获取最大的token数量，默认10000
index.highlight.max_analyzed_offset

高亮显示时设置的最大字符数，默认1000000
index.max_terms_count

Term 查询中term的最大的数量，默认65536
index.max_regex_length

正则查询中表达式的最大长度，默认1000
index.query.default_field

查询语句中查询的字段设置，默认*,查询除了元数据之外的所有字段
index.routing.allocation.enable

控制索引分片分配
- all 允许所有分片分配(默认)
- primaries 只允许主分片分配
- new_primaries 只允许新创建的主分片分配
- none 不允许分片分配
index.routing.rebalance.enable

控制索引分片重新平衡
- all 允许所有分片重新平衡（默认）
- primaries 允许主分片重新平衡
- replicas 运行副本分片重新平衡
- none 不允许分片重新平衡
index.gc_deletes

已删除文档的历史版本号可被用于版本化操作的间隔，默认60s
index.default_pipeline

设置索引默认的ingest pipeline
index.final_pipeline

索引最终的final ingest pipeline，所有的请求都会走，如果该管道不存在，请求将会失败

不能使用final ingest pipeline 修改_index字段，如果使用final ingest pipeline 修改_index字段，该请求将失败
index.hidden

索引是否隐藏，默认不返回隐藏的索引，请求时也可以使用参数expand_wildcards 控制，默认false

2.2、映射

映射在我们的使用中有动态映射、动态映射模版、显式设置映射三块。动态映射也就是我们不需要使用显式的设置字段类型，由Elasticsearch来进行推测类型生成映射；动态映射模版就是介于中间的一种，意思是我们提前设置好映射关系，并定一个模版名称、匹配规则，在进行索引插入数据的时候，根据匹配规则找到符合条件的动态模版，根据模版中的显式设置来生成索引；显式设置映射关系就是对索引中的每个字段都固定类型，无需进行类型推测。下面我们就以这三个方面深入的看下字段映射关系如何设置，在看字段映射如何设置之前先来了解一下Elasticsearch中的数据类型都支持哪些？

2.2.1、支持的数据类型

本文数据类型只介绍下工作中经常使用的，个别的数据类型参考《根据给定需求创建索引进阶篇》，后续推出都会有的，全都会有的

聚合字段类型

类型设置为aggregate_metric_double作为一个对象，子字段可以有min,max,sum,value_count,当我们对字段设置为aggregate_metric_double字段做聚合时，它能够直接使用子字段的值进行聚合，比如最大值就可以直接去子对象中max的值比较，详情可参考如下文章

https://mp.weixin.qq.com/s/erLmbgMA9mMrytSAQ9Bt3Q
字段别名类型

举例一个实用的例子，我们在做es中数据汇总的时候有这么一个统计,统计log.level为info级别的日志，但是因为数据源来自各个渠道，无法都满足ECS(Elastic Common Schema),所以我们可以使用字段别名，比如索引1中对应的统计字段是log.level.keyword,索引2对应的是level.keyword,但是mapping又无法进行修改来完成，所以我们创建一个字段别名log.level对应log.level.keyword,索引二中对应level.keyword,我们统计时只需要对lov.level统计即可了

我们知道索引可以起一个别名，字段也可以起一个别名，做搜索、聚合、排序的时候直接使用字段别名进行查询、聚合和排序，下面是本人对字段别名的一个深度学习，参考如下：

https://mp.weixin.qq.com/s/YMm-CedHtPnY6MIvGE1X9g
数组字段

数组字段没有固定的类型，但是数组中的所有元素类型必须一致，数组里可以包含零个或多个元素，如果为空，则是代表这个数组是没有值的字段
binary

二进制类型，默认该类型字段不可以被搜索，也不存储
Boolean

接收true和false或者可以解析为true和false的字符串”true“和"false"和空字符串""
Date

时间类型，可以是2022-08-01或者2022-08-01 12:00:00,也可以是一个秒数或者毫秒数，时间格式可以自定义格式，如果不添加使用默认格式"strict_date_optional_time||epoch_millis"，使用时间类型字段排序时会自动转换为时间戳毫秒数进行排序
Date nano

Date类型的补充字段，纳秒存储
Geo

描述地理位置信息的字段数据类型，因为知识点较多，详细信息可参考另一篇文章，通俗解读了geo_point与geo_shape两种类型的数据，如果查询，聚合，排序等

https://mp.weixin.qq.com/s/nw2_M8icS3v94w4sfrbqaw
Ip

保存网络地址信息，支持ipv4和ipv6类型的存储与检索，详细可查看官网
Join

对于Join类型，不是很常用，但是也有使用，常用的我单独摘出来写了一篇文章，不常用或者比较简单常见的就简单一句话概括了，这个Join就在下面大概说说吧，首先还是先创建一个索引
```
PUT my-index-000001
{
  "mappings": {
    "properties": {
      "my_id": {
        "type": "keyword"
      },
      "my_join_field": { 
        "type": "join",
        "relations": {
          "user": "hobby" 
        }
      }
    }
  }
}
```

如上索引，父子文档，指定一个人的爱好，一个人可以有多个爱好，所以创建索引时指定父子关系字段类型，指定user的子类为hobby，每条文档都有一个名称（父文档或子文档），以上图创建的索引为例，每个文档都要指定这是个user还是个hobby，如下，文档1是父文档张三用户，文档2是父文档李四用户，文档3，4是张三的爱好，文档5，6是李四的爱好

  PUT my-index-000001/_doc/1?refresh
  {
    "my_id": "1",
    "text": "张三",
    "my_join_field": {
      "name": "user" 
    }
  }

  PUT my-index-000001/_doc/2?refresh
  {
    "my_id": "2",
    "text": "李四",
    "my_join_field": {
      "name": "user"
    }
  }

  PUT my-index-000001/_doc/3?routing=1&refresh 
  {
    "my_id": "3",
    "text": "乒乓球",
    "my_join_field": {
      "name": "hobby", 
      "parent": "1" 
    }
  }

  PUT my-index-000001/_doc/4?routing=1&refresh
  {
    "my_id": "4",
    "text": "篮球",
    "my_join_field": {
      "name": "hobby",
      "parent": "1"
    }
  }
  PUT my-index-000001/_doc/5?routing=1&refresh 
  {
    "my_id": "5",
    "text": "读书",
    "my_join_field": {
      "name": "hobby", 
      "parent": "2" 
    }
  }

  PUT my-index-000001/_doc/6?routing=1&refresh
  {
    "my_id": "6",
    "text": "下棋",
    "my_join_field": {
      "name": "hobby",
      "parent": "2"
    }
  }

需要注意的是 写入数据时必须指定路由值，因为父子文档必须保证数据存储在同一个分片

一个父文档可以有多个子文档,如下,user是hobby和girlfriend的父类，grielfriend是fans的父类



  PUT my-index-000001
  {
    "mappings": {
      "properties": {
        "my_join_field": {
          "type": "join",
          "relations": {
            "user": ["hobby", "girlfriend"],  
            "girlfriend": "fans" 
          }
        }
      }
    }
  }

Keyword
- 关键字类型，单一的内容，比如身份证，姓名，Ip 等这种数据使用
- 常量类型字段，一个索引中该字段的值是固定不变的，创建索引时指定，如果与指定的值不同，文档拒绝写入
- 模糊查询类型，模糊查询可在keyword类型时使用，通配符类型在文本内容基数较大时候的做了优化
关键字类型数据可以用于聚合，排序，查询(term)
Nested

嵌套对象类型，作为一个单独的lucene文档索引，支持查询，排序，聚合，聚合父文档等功能，详细可参考博主的另一篇Nested详解，点击标签即可访问
Numeric

数字类型，支持long、integer、short、byte、double、float、half_float、scaled_float、unsigned_long

对于整数类型，使用long、integer、short、byte就可以，浮点数可以使用scaled_float，如果scaled_float不能满足，那可以选取精读更高的double、float、half_float
Object

在学习Nested嵌套对象类型的时候我们已经提到了一点，如果我们不知道对象类型，默认的就是Object类型的数据，在Elasticsearch内部，这个文档会被索引成一个简单扁平化的键值对形式
Range

表示一个范围内的数据，使用gt或者gte定义下界，使用lt、lte定义上界，不过支持的聚合的类型有限，支持histogram或者cardinality

支持的类型有integer_range、float_range、long_range、double_range、date_range、ip_range
Text

文本类型、为了text和match_only_text，text传统的全文检索字段类型；match_only_text一种优化占用空间的文本类型，关闭打分，对需要执行查看进行较慢的操作，适合用作日志索引

一般情况下使用text文件类型的字段还会使用一个keyword的字段，进行聚合、排序、关键字匹配等操作

2.2.2、字段动态映射

何为Dynamic mapping，我们知道在使用关系型数据库mysql的时候，我们创建一个表之后需要创建字段，比如字符串ID，字符串NAME，时间类型CREATE_TIME等字段来使用，而Elasticsearch强大的就在于我们不在像关系型数据库那样提前设置好字段以及每个字段的类型，我们只需要保存一个文档，ES会自动的推断出数据类型并创建好索引，类型，字段映射关系等

当Elasticsearch检测到新字段时，默认情况下Elasticsearch会自动的识别字段数据类型，并将字段添加到mapping映射中，但是我们可以通过参数dynamic来指定是否自动添加字段映射，可选值有true和runtime，如果为true默认使用以下规则生成字段映射关系

JSON data type	"dynamic":"true"	"dynamic":"runtime"
null
true or false	boolean	boolean
double	float	double
long	long	long
object	object
array	根据数组中第一个非空的值判断	根据数组中第一个非空的值判断
日期类型的字符串	date	date
数字类型的字符串	float or long	double or long
不是日期也不是数字的字符串	`text`类型以及`.keyword`的字类型	keyword

也可以设置dynamic为false，这样在遇到新的字段时会抛出异常

2.2.3、字段动态映射模版

上面我们看到Elasticsearch会自动的推断数据类型，生成字段映射，那么Dynamic template动态模版就是自定义映射，提前内置好映射关系，在使用时通过一定的规则匹配上即可

如下：如果字段名称是ip开头的字符串，映射为ip类型的运行时字段

PUT my-index-000001/
{
  "mappings": {
    "dynamic_templates": [
      {
        "strings_as_ip": {
          "match_mapping_type": "string",
          "match": "ip*",
          "runtime": {
            "type": "ip"
          }
        }
      }
    ]
  }
}

如果想加到mapping中只需替换runtime为mapping即可

PUT my-index-000001/
{
  "mappings": {
    "dynamic_templates": [
      {
        "strings_as_ip": {
          "match_mapping_type": "string",
          "match": "ip*",
          "mapping": {
            "type": "ip"
          }
        }
      }
    ]
  }
}

2.2.4、自定义字段映射

自定义字段映射，其实就是关系数据库中创建表时的字段设置，顾名思义就是提前设置好索引需要的字段以及字段类型，在添加文档时如遇到新字段报错（可配置），一般在规范索引字段时使用，比如日志索引，根据日期每天定时生成一个新的索引，这个索引我们就可以提前设置好模版，生成索引时直接使用模版生成，而模版中，直接定义好字段的类型，也就是说，自定义字段映射关系可以在映射模版的基础上使用的（关于索引模版的使用查看后文）如下是自定义字段映射的一个小例子

我们创建一个索引my-index-000001，其中age时integer类型，email是keyword类型，name是text类型

PUT /my-index-000001
{
  "mappings": {
    "properties": {
      "age":    { "type": "integer" },  
      "email":  { "type": "keyword"  }, 
      "name":   { "type": "text"  }     
    }
  }
}

后续如果我们想修改这个已经创建的索引，比如增加个字段，那可以使用如下语句

PUT /my-index-000001/_mapping
{
  "properties": {
    "employee-id": {
      "type": "keyword",
      "index": false
    }
  }
}

查看索引mapping语句如下

# 查看所有的字段映射
GET my-index-000001/_mapping
# 查看某一个字段的映射关系，此处以age举例
GET my-index-000001/_mapping/field/age

2.3、文本分析

2.3.1、什么是文本分析

文本分析是Elasticsearch实现全文检索的前提，通过全文检索可以实现返回结果不仅包含精确完全匹配的结果，还包含相近的结果。比如我们有个数据中华人民共和国，其中我们搜索中华或者人民或者共和国或者其他组合词语的时候都可以搜索出来，不仅限于中华人民共和国

Tokenization: 当我们进行全文检索时，分词可以让我们把一个词语拆分成更小的词语，默认情况下，这些小的词语也是有单独的词语语义
Normalization: 其中Tokenization可以解决单个关键词的匹配查询，但是还是精确匹配，不能解决以下这种情况的查询
- Quick与quick的大小写
- fox与foxes的词根
- jumps与leaps的近义词
为了解决这些问题，文本分析可以将这些token分词规范化为标准格式，这样就可以实现大小写，词根匹配，近义词匹配。

为了确保搜索时搜索词与预期的词匹配，尽量要使用相同的tokenization和normalization规则

2.3.2、配置文本分析器

默认情况下，Elasticsearch使用standard analyzer，如果不能满足我们的需求，我们可以使用其他的内置分析器，或者自定义分词器，分析器的组成有三部分，character filter、tokenizer、token filter其中这三部分都可以根据我们的需求来进行选择设置

Character filter

翻译一下就是字符过滤器，用在分词之前，常用的有html符号移除，正则替换、映射字符替换
Tokenizer

核心分词器，将一组字符流拆成单个词语，具体的分词策略在此实现，默认的标准分词器，常用的中文分词器，英文分词器、拼音分词器等
Token filter

分词之后的词语过滤，比如英文中的停用词移除(a,an,the)、转换大小写等

2.3.4、自定义分词器

需求

实现中文分词
实现拼音分词（词语全拼，词语首字母简拼）
实现:) => _happy_,:( => _sad_
使用pattern_replace替换我为机智如我

解决方案

使用中文IK分词器加拼音分词器组合实现上述需求1，2
使用char_filter实现上述需求3
使用filter实现上述需求4

过程分析

首先自定义分词器ik_smart_pinyin与ik_max_pinyin

ik_smart_pinyin：简单分词，分的比较粗，词语少
ik_max_pinyin：最大粒度分词，分的比较细，词语多

其中ik_smart_pinyin加入pinyin_first_letter_and_full_pinyin_filter实现拼音分词

ik_max_pinyin也加入pinyin_first_letter_and_full_pinyin_filter实现拼音分词，但是为了对比，此处ik_max_pinyin分词器再加入自定义的pattern_replace_filter实现上述的需求4，加入my_mappings_char_filter实现上述需求3

settings全部内容

完整的创建索引settings内容如下

PUT ik_index
{
  "settings": {
    "analysis": {
      "analyzer": {
        "ik_smart_pinyin": {
          "tokenizer": "ik_smart",
          "filter": [
            "pinyin_first_letter_and_full_pinyin_filter"
          ]
        },
        "ik_max_pinyin": {
          "tokenizer": "ik_max_word",
          "filter": [
            "pinyin_first_letter_and_full_pinyin_filter",
            "pattern_replace_filter"
          ],
          "char_filter": "my_mappings_char_filter"
        }
      },
      "filter": {
        "pinyin_first_letter_and_full_pinyin_filter": {
          "type": "pinyin",
          "keep_separate_first_letter": false,
          "keep_full_pinyin": true,
          "keep_original": true,
          "limit_first_letter_length": 16,
          "lowercase": true,
          "remove_duplicated_term": true
        },
        "pattern_replace_filter": {
          "type": "pattern_replace",
          "pattern": "(我)",
          "replacement": "机智如$1"
        }
      },
      "char_filter": {
        "my_mappings_char_filter": {
          "type": "mapping",
          "mappings": [
            ":) => _happy_",
            ":( => _sad_"
          ]
        }
      }
    }
  }
}

2.4、小结

在上面创建的自定义分词器的基础上，我们在创建mapping字段关系映射时就可以直接指定ik_smart_pinyin或者ik_max_pinyin分词器即可实现分词啦，如下示例所示：

PUT ik_index/_mapping/
{
  "properties": {
    "content": {
      "type": "text",
      "analyzer": "ik_smart_pinyin"
    }
  }
}

三、总结

假总结，真心理总结

通过上面的学习，我们知道了设置索引时的常用参数、常见的字段类型以及建立字段映射关系时的参数设置，可以看得出来，创建索引就这三块，只要这三块使用熟练了，哪怕不查看官网也可以直接创建出一个满足自己需求的索引，鉴于考试时也都是可以参考官网的，所以上面的内容也不用死记硬背，只需要理解，多操作，记住常见的配置项即可了。好了该篇文章已经进入尾声了，一直想早点结束，但是写着写着就发现，知识点太多，假设都写到这篇文章里，那就长的过分了，所以文中就分了几篇小的，比如字段类型那块，Geo、Nested等单独输出了一篇文章，想参考学习的可以关注公众号【醉鱼JAVA】直接去获取。后面的话，也是尽快吧，尽量赶点进度，把工作中常用的知识点整理起来，结合考点输出汇总，如果大家有好的意见或者建议欢迎评论区留言，下篇文章见喽！！！

本文由博客一文多发平台 OpenWrite 发布！

你可能感兴趣的:(elasticsearch,elasticsearch,Join)

ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
ElasticSearch查询超过10000条（1000页）时出现Result window is too large的问题王月亮17
问题当ES数据量较大，使用分页查询超过10000条（1000页）时，出现如下错误：Cannotexecutejestaction,responsecode:500,error:{"root_cause":[{"type":"query_phase_execution_exception","reason":"Resultwindowistoolarge,from+sizemustbelesstha
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
Fork/Join框架与ForkJoinPool 浪白条
1.Fork/Join框架fork操作的作用是把一个大的问题划分成若干个较小的问题。在这个划分过程一般是递归进行的。直到可以直接进行计算。需要恰当地选取子问题的大小。太大的子问题不利于通过并行方式来提高性能，而太小的子问题则会带来较大的额外开销。每个子问题计算完成后，可以得到关于整个问题的部分解。join操作的作用是把这些分解手机组织起来，得到完整解。简单的说，ForkJoin其核心思想就是分治。
多表查询_关联查询活跃家族 sql
innerjoin:通常关联项on后面的是主外键，两个表都有的才显示leftjoin:左连，select*fromSleftjoinBons.字段=B.字段，一定会将左边表的数据全部查询出来rightjoin:select*fromSrightjoinBons.字段=B.字段一定会将右边表的数据全部查询出来索引：增加查询效率，数据量很大的时候，提高查询速度，当给表加索引之后，重新插入数据，就会让索
pthread_create/join函数学习 Miqiuha java jvm 开发语言
转自：https://blog.csdn.net/wushuomin/article/details/80051295，chatgpt1.pthread_createintpthread_create(pthread_t*thread,constpthread_attr_t*attr,void*(*start_routine)(void*),void*arg);它的功能是创建线程（实际上就是确定调
【十一】【SQL】外连接（左外连接，右外连接）妖精七七_ 数据库SQL 数据库 sql
数据库中的外连接（OuterJoin）用于连接两个表，并包括两个表中的匹配行以及左表（LEFTJOIN）或右表（RIGHTJOIN）中未匹配的行。外连接分为两种主要类型：左外连接（LEFTOUTERJOIN）：返回左表（FROM子句中第一个表）的所有行，即使在右表中没有匹配的行。如果右表中没有匹配的行，则结果集中右表的部分将包含NULL值。右外连接（RIGHTOUTERJOIN）：返回右表（JOI
SQL server CROSS JOIN 的用法潇锐killer 数据库 sql
SELECT@DateThresholdasdt,t3.ck_id,t3.ck_name,t3.title_id,t3.title,casewhent4.numisnullthen0elset4.numendnum,casewhent4.moneyisnullthen0elset4.moneyendmoney,t3.startDay,t3.endDayfrom(SELECTt1.ck_id,t1.
C#的linq语句木生火18624 C#开发
/查询表达式必须以form子句开头，以select或者group子句结束，在这两个子句之间，可以使用///where、orderby、join、let和其他的from子句本章要点用列表在对象上执行传统查询扩展方法LINQ查询操作符平行LNQ表达式树本章源代码下载地址(wrox.com)打开网页www.wrox.com/go/procsharp,单击DownloadCode选项卡即可下载本章源代码。
Python中的os.path.join() 小小小花儿
Python中的os.path.join()用于拼接路径名组件。路径组件之间会自动添加‘\’，也可以自己在组件的末尾加上‘\’。1、如果各路径组件名首字母均不包含‘\’，则函数会自动加上。importosa=os.path.join('save','test','1.jpg')print(a)输出：save\test\1.jpg注意：在windows系统中默认添加的是‘\’；在linux系统中，是
ros2使用python包，通过launch文件加载yaml文件，无法覆盖默认参数的解决办法 SuJunV python 开发语言 ubuntu
首先确保已经创建config、launch文件夹，文件夹下有对应的文件，创建的节点能够通过launch文件正常启动。解决办法：在setup.py文件中，仿照添加launch文件步骤，添加config文件夹#addlaunchfile(os.path.join('share',package_name),glob('launch/*launch.[pxy][yma]*')),#addconfigfi
Elasticsearch7.7.0 配置用户名和密码 i0208 Elasticsearch
配置用户和密码需要在配置文件中开启x-pack验证,修改config目录下面的elasticsearch.yml文件，在里面添加如下内容,并重启ES[root@localhostesuser]#vim/opt/es/elasticsearch-7.7.0/config/elasticsearch.ymlxpack.security.enabled:truexpack.license.self_ge
elasticsearch数据迁移之elasticdump 迷茫运维路 elasticsearch 中间件 elasticsearch linux 运维
系列文章目录第一章es集群搭建第二章es集群基本操作命令第三章es基于search-guard插件实现加密认证第四章es常用插件文章目录系列文章目录前言一、elasticdump是什么？二、安装elasticdump工具1.离线安装2.在线安装三、elasticdump相关参数四、使用elasticdump进行数据备份五、使用elasticdump进行数据恢复前言在企业实际生产环境中,避免不了要对
在生产环境中部署Elasticsearch：最佳实践和故障排除技巧——聚合与搜索（三）不会编程的小孩子 elasticsearch 大数据搜索引擎
#在生产环境中部署Elasticsearch：最佳实践和故障排除技巧——聚合与搜索（三）前言文章目录前言-聚合和分析-执行聚合操作-1.使用JavaAPI执行聚合操作-2.使用CURL命令执行聚合操作-1.使用JavaAPI执行度量操作-2.使用CURL命令执行度量操作-使用缓存-调整分片大小和数量-使用搜索建议-结论-节点发现-负载均衡-故障转移-结论-访问控制-加密-身份验证-结论-RESTA
Elasticsearch Java API 的使用（22）—实现桶聚合迷途码界 Elasticsearch Java API 桶聚合
分组聚合使用terms实现分组集合publicclassEsTermsAggthrowsUnknownHostException{publicvoidTermsAgg(TransportClientclient){AggregationBuilderagg=AggregationBuilders.terms("terms").field("agg");SearchResponseresponse=
Elasticsearch之bool查询 cyt涛 java elasticsearch 大数据搜索引擎 bool 布尔查询全文检索
bool查询是Elasticsearch中最常用的复合查询类型，允许将多个查询组合在一起。它通过逻辑操作符（如must、should、must_not和filter）来构建复杂的查询条件，从而满足多条件匹配、逻辑与（AND）、或（OR）、非（NOT）的查询需求。bool查询主要由四个部分组成：must：必须满足的条件（类似于SQL中的AND）。should：应该匹配的条件（类似于SQL中的OR）。
golang文件相对路径问题 jzpfbpx golang 开发语言后端
目录结构2.具体代码：constdataFile="../data/data.json"_,fileName,_,_:=runtime.Caller(1)dataPath:=path.Join(path.Dir(fileName),dataFile)fmt.Println(dataPath)//openfilefile,err:=os.Open(dataPath)iferr!=nil{log.Fa
golang文件相对路径问题 jzpfbpx golang 开发语言后端
1.目录结构2.具体代码：constdataFile="../data/data.json"_,fileName,_,_:=runtime.Caller(1)dataPath:=path.Join(path.Dir(fileName),dataFile)fmt.Println(dataPath)//openfilefile,err:=os.Open(dataPath)iferr!=nil{log.
C++线程、多线程教程详解（全网最全、示例最多、最详细）（第一篇） shuai_258 c++c++全套攻略 c++多线程 c++
目录A、线程/多线程基础一、C++11创建线程的几种方式1.1使用函数指针1.2使用lambda表达式1.3使用成员函数1.4使用可调用对象(Functor)二、定义一个线程类三、join()与detach()的详细用法及区别3.1join()的用法3.2detach()的用法3.3join()与detach()的区别总结四、std::this_thread4.1、主要功能std::this_th
人大金仓数据库，导出数据表的结构星空下夜猫子人大金仓kingbase 数据库字段查询数据类型必填 SQL
SELECTa."COLUMN_NAME"字段名称,a."COMMENTS"中文名称描述,c."DATA_TYPE"数据类型,IF(c."IS_NULLABLE"='YES','是','否')AS是否必填FROMINFORMATION_SCHEMA.COLUMNScRIGHTJOINall_col_commentsaONc."table_name"=a."table_name"ANDc."COLU
只会SQL语句，可以做什么工作？ King.624 sql 大数据人工智能 mysql 数据库数据分析开发语言
1、SQL是什么首先简单介绍一下SQL（StructuredQueryLanguage），是一种可以进行数据提取、聚合、分析，并对数据库进行构建和修改的编程语言。相对来说，SQL上手非常容易，因为语法结构比较固定，新手初学几天就可以轻松上手，懂得最基本的select,from,where,groupby等语法的使用，完成一个基本的SQL程序。当然，初学之后，就要面临一些进阶的挑战，比如利用join
HTML5（六）canvas 矩形、路径、画板功能祝名
一.绘制矩形1.什么是canvascanvas标签相当于一个画板；canvas的宽高不要用css去定义，直接在标签中用属性写；2.obj=c.getContext('2d');获得2d绘画环境（相当于铺了一层画布）绘画图像的操作都会在obj这个绘画环境中存储；3.绘画方法及样式x,y为坐标样例：二.canvas路径1.方法2.样例cv.lineJoin='round';//边界类型为弧形三.画板功
Elasticsearch 安装哒哒-blog Elasticsearch elasticsearch jenkins 大数据
下载安装elasticsearch下载链接运行：bin\elasticsearch.bat设置密码：.\bin\elasticsearch-setup-passwordsinteractive这边设置密码遇到一个坑PSG:\elasticsearch-8.8.1>.\bin\elasticsearch-setup-passwordsinteractiveFailedtoauthenticateus
二进制方式部署K8s高可用集群麻辣头马头 kubernetes 容器云原生运维服务器 docker 网络
1二进制方式部署K8s高可用集群1.1kubeadm和二进制安装k8s适用场景分析kubeadm是官方提供的开源工具，是一个开源项目，用于快速搭建kubernetes集群，目前是比较方便和推荐使用的。kubeadminit以及kubeadmjoin这两个命令可以快速创建kubernetes集群。Kubeadm初始化k8s，所有的组件都是以pod形式运行的，具备故障自恢复能力。kubeadm是工具，
Docker启动Elasticsearch(挂载数据、配置文件、插件) 程序员迪迦项目实战 Java elasticsearch docker
Docker启动Elasticsearch拉取镜像dockerpullelasticsearch:7.4.2修改配置文件mkdir-p/mydata/elasticsearch/configmkdir-p/mydata/elasticsearch/data/mkdir-p/mydata/elasticsearch/pluginsecho"http.host:0.0.0.0">>/mydata/el
docker部署elasticsearch 大大陈· elasticsearch docker 大数据
docker部署es1.简单启动2.配置文件3.安装es步骤1.简单启动#"discovery.type=single-node"标识单机启动dockerrun-d--nameelasticsearch-p9200:9200-p9300:9300-e"discovery.type=single-node"elasticsearch:tag#如果没有上面的标识，是集群启动，不这样做会报错#但是这样启
Docker安装elasticsearch和kibana viego1999 elasticsearch docker 大数据
1、首先拉取elasticsearch镜像dockerpullelasticsearch:7.9.12、创建docker挂载的目录我这里将docker环境下挂在的目录统一放在了/dockerdata目录下mkdir-p/dockerdata/elasticsearch/configmkdir-p/dockerdata/elasticsearch/datamkdir-p/dockerdata/ela
Docker部署单点es Javaismymorning ES学习笔记 docker elasticsearch
前言该笔记是根据B站上黑马SpringCloud学习总结的一、ES是什么？Elasticsearch是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。充分利用Elasticsearch的水平伸缩性，能使数据在生产环境变得更有价值二、Docker部署ES步骤1.创建网络因为还要部署Kibana，实现es和Kibana关联，创建一个网络Kibana是为
leetcode 1651 Hopper公司查询3(postgresql) 奋斗哼哼 leetcode postgresql 算法数据库 sql
需求Table:Drivers±------------±--------+|ColumnName|Type|±------------±--------+|driver_id|int||join_date|date|±------------±--------+driver_id是该表的主键。该表的每一行均包含驾驶员的ID以及他们加入Hopper公司的日期。Table:Rides±-------
ROS：机器人描述--URDF和XACRO 通哈膨胀哈哈哈 ROS urdf
1URDF文件1.1link和joint图中机器人的描述方式以上描述只能够描述机器人的大致样子，不能够确定link的位置关系和具体形状。1.2位置在定义好了机器人的骨架后,进一步我们可以使用origin子标签进行定义link所应该在的位置.但是有一点应该注意到,link和link之间是使用joint进行连接,那么link的位置,就由连接他的joint确定.所以,该子标签是定义在joint内.在三维
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在