程序员一灯

Elasticsearch 高级查询

本文简要

同学们好！本篇文章主要是介绍Elasticsearch的各种查询操作以及写了好多小demo。

博主：程序员一灯，一个老菜鸟，哈哈哈哈

一个人可以走的很快，一群人可以走的很远

点赞➕评论➕收藏 ➕关注== 养成习惯（一键四连）

欢迎关注一起学习一起讨论⭐️一起进步

作者水平有限，欢迎各位大佬指点，相互学习进步！

一、term查询

1.1、term与terms

1.2、range

1.3、Constant Score

二、全文查询

2.1、match

2.2、match_phrase

2.3、multi_match

2.4、match_all

2.5、query_string

2.6、simple_query_string

三、模糊搜索

四、多条件查询

五、Mapping 映射

5.1、数据类型

5.2、Mapping的定义

5.3、常见参数

5.3.1、index

5.3.2、null_value

6、聚合查询

6.1、聚合查询的应用案例

6.2、数据准备

6.3、单值的输出

6.4、航班信息数据准备

6.5、多值的输出

一、term查询

term是表达语义的最小单位，在搜索的时候基本都要使用到term。

term查询的种类有：Term Query、Range Query等。

在ES中，Term查询不会对输入进行分词处理，将输入作为一个整体，在倒排索引中查找准确的词项。我们也可以使用 Constant Score 将查询转换为一个filter,避免算分，利用缓存，提高查询的效率。

1.1、term与terms

查询电影名字中包含有 beautiful 这个单词的所有的电影，用于查询的单词不会进行分词的处理

GET movies/_search
{
  "query": {
    "term": {
      "title": {
        "value": "beautiful"
      }
    }
  }
}

查询电影名字中包含有 beautiful 或者 mind 这两个单词的所有的电影，用于查询的单词不会进行分词的处理

GET movies/_search
{
  "query": {
    "terms": {
      "title": [
        "beautiful",
        "mind"
      ]
    }
  }
}

1.2、range

查询上映在2016到2018年的所有的电影，再根据上映时间的倒序进行排序

GET movies/_search
{
  "query": {
    "range": {
      "year": {
        "gte": 2016,
        "lte": 2018
      }
    }
  },
  "sort": [
    {
      "year": {
        "order": "desc"
      }
    }
  ]
}

1.3、Constant Score

查询title中包含有beautiful的所有的电影，不进行相关性算分，查询的数据进行缓存，提高效率

GET movies/_search
{
  "query": {
    "constant_score": {
      "filter": {
        "term": {
          "title": "beautiful"
        }
      }
    }
  }
}

二、全文查询

全文查询的种类有: Match Query、Match Phrase Query、Query String Query等

索引和搜索的时候都会进行分词，在查询的时候，会对输入进行分词，然后每个词项会逐个到底层进行查询，将最终的结果进行合并

2.1、match

查询电影名字中包含有beautiful的所有电影，每页十条，取第二页的数据

GET movies/_search
{
  "query": {
    "match": {
      "title": "beautiful"
    }
  },
  "from": 10,
  "size": 10
}

查询电影名字中包含有 beautiful 或者 mind 的所有的数据，但是只查询title和id两个属性

GET movies/_search
{
  "_source": [
    "title",
    "id"
  ],
  "query": {
    "match": {
      "title": "beautiful mind"
    }
  }
}

2.2、match_phrase

查询电影名字中包含有 "beautiful mind" 这个短语的所有的数据

GET movies/_search
{
  "query": {
    "match_phrase": {
      "title": "beautiful mind"
    }
  }
}

2.3、multi_match

查询 title 或 genre 中包含有 beautiful 或者 Adventure 的所有的数据

GET movies/_search
{
  "query": {
    "multi_match": {
      "query": "beautiful Adventure",
      "fields": [
        "title",
        "genre"
      ]
    }
  }
}

2.4、match_all

查询所有的数据

GET movies/_search
{
  "query": {
    "match_all": {}
  }
}

2.5、query_string

查询 title 中包含有 beautiful 和 mind 的所有的电影

GET movies/_search
{
  "query": {
    "query_string": {
      "default_field": "title",
      "query": "mind AND beautiful"
    }
  }
}

GET movies/_search
{
  "query": {
    "query_string": {
      "default_field": "title",
      "query": "mind beautiful",
      "default_operator": "AND"
    }
  }
}

2.6、simple_query_string

simple_query_string 覆盖了很多其他查询的用法

查询 title 中包含有 beautiful 和 mind 的所有的电影

GET movies/_search
{
  "query": {
    "simple_query_string": {
      "query": "beautiful + mind",
      "fields": [
        "title"
      ]
    }
  }
}

GET movies/_search
{
  "query": {
    "simple_query_string": {
      "query": "beautiful mind",
      "fields": [
        "title"
      ],
      "default_operator": "AND"
    }
  }
}

查询title中包含 "beautiful mind" 这个短语的所有的电影 (用法和match_phrase类似)

GET movies/_search
{
  "query": {
    "simple_query_string": {
      "query": "\"beautiful mind\"",
      "fields": [
        "title"
      ]
    }
  }
}

查询title或genre中包含有 beautiful mind romance 这个三个单词的所有的电影（与multi_match类似）

GET movies/_search
{
  "query": {
    "simple_query_string": {
      "query": "beautiful mind Romance",
      "fields": [
        "title",
        "genre"
      ]
    }
  }
}

查询title中包含 “beautiful mind” 或者 "Modern Romance" 这两个短语的所有的电影

GET movies/_search
{
  "query": {
    "simple_query_string": {
      "query": "\"beautiful mind\" | \"Modern Romance\"",
      "fields": [
        "title"
      ]
    }
  }
}

查询title或者genre中包含有 beautiful + mind 这个两个词，或者Comedy + Romance + Musical + Drama + Children 这个五个词的所有的数据

GET movies/_search
{
  "query": {
    "simple_query_string": {
      "query": "(beautiful + mind) | (Comedy + Romance + Musical + Drama + Children)",
      "fields": [
        "title",
        "genre"
      ]
    }
  }
}

查询 title 中包含 beautiful 和 people 但是不包含 Animals 的所有的数据

GET movies/_search
{
  "query": {
    "simple_query_string": {
      "query": "beautiful + people + -Animals",
      "fields": [
        "title"
      ]
    }
  }
}

三、模糊搜索

查询title中从第6个字母开始只要最多纠正一次，就与 neverendign 匹配的所有的数据

GET movies/_search
{
  "query": {
    "fuzzy": {
      "title": {
        "value": "neverendign",
        "fuzziness": 1,
        "prefix_length": 5
      }
    }
  }
}

四、多条件查询

查询title中包含有beautiful或者mind单词，并且上映时间在2016~1018年的所有的电影

GET movies/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "simple_query_string": {
            "query": "beautiful mind",
            "fields": [
              "title"
            ]
          }
        },
        {
          "range": {
            "year": {
              "gte": 2016,
              "lte": 2018
            }
          }
        }
      ]
    }
  }
}

查询 title 中包含有 beautiful 这个单词，并且上映年份在2016~2018年间的所有电影，但是不进行相关性的算分。filter不会进行相关性的算分，并且会将查出来的结果进行缓存，效率上比 query 高

GET movies/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "title": "beautiful"
          }
        },
        {
          "range": {
            "year": {
              "gte": 2016,
              "lte": 2018
            }
          }
        }
      ]
    }
  }
}

五、Mapping 映射

mapping类似于数据库中的schema，作用如下:

定义索引中的字段类型；
定义字段的数据类型，例如：布尔、字符串、数字、日期.....
字段倒排索引的设置

5.1、数据类型

类型名	描述
Text/Keyword	字符串， Keyword的意思是字符串的内容不会被分词处理，输入是什么内容，存储在ES中就是什么内容。Text类型ES会自动的添加一个Keyword类型的子字段
Date	日期类型
Integer/Float/Long	数字类型
Boolean	布尔类型

ES中还有 "对象类型/嵌套类型"、"特殊类型（geo_point/geo_shape）"。

5.2、Mapping的定义

语法格式如下：

PUT users
{
  "mappings": {
    // define your mappings here
  }
}

定义mapping的建议方式: 写入一个样本文档到临时索引中，ES会自动生成mapping信息，通过访问mapping信息的api查询mapping的定义，修改自动生成的mapping成为我们需要方式，创建索引，删除临时索引，简而言之就是 “卸磨杀驴” 。

5.3、常见参数

5.3.1、index

可以给属性添加一个布尔类型的index属性，标识该属性是否能被倒排索引，也就是说是否能通过该字段进行搜索。

5.3.2、null_value

在数据索引进ES的时候，当某些数据为 null 的时候，该数据是不能被搜索的，可以使用null_value 属性指定一个值，当属性的值为 null 的时候，转换为一个通过 null_value 指定的值。 null_value属性只能用于Keyword类型的属性

6、聚合查询

6.1、聚合查询的应用案例

聚合搜索的语法格式如下：

GET indexName/_search
{
  "aggs": {
    "aggs_name": { #聚合分析的名字是由用户自定义的
      "aggs_type": {
        // aggregation body
      }
    }
  }
}

6.2、数据准备

给users索引创建mapping信息

PUT employee
{
  "mappings": {
    "properties": {
      "id": {
        "type": "integer"
      },
      "name": {
        "type": "keyword"
      },
      "job": {
        "type": "keyword"
      },
      "age": {
        "type": "integer"
      },
      "gender": {
        "type": "keyword"
      }
    }
  }
}

往 users 索引中写入数据

PUT employee/_bulk
{"index":{"_id":1}}
{"id":1,"name":"Bob","job":"java","age":21,"sal":8000,"gender":"female"}
{"index":{"_id":2}}
{"id":2,"name":"Rod","job":"html","age":31,"sal":18000,"gender":"female"}
{"index":{"_id":3}}
{"id":3,"name":"Gaving","job":"java","age":24,"sal":12000,"gender":"male"}
{"index":{"_id":4}}
{"id":4,"name":"King","job":"dba","age":26,"sal":15000,"gender":"female"}
{"index":{"_id":5}}
{"id":5,"name":"Jonhson","job":"dba","age":29,"sal":16000,"gender":"male"}
{"index":{"_id":6}}
{"id":6,"name":"Douge","job":"java","age":41,"sal":20000,"gender":"female"}
{"index":{"_id":7}}
{"id":7,"name":"cutting","job":"dba","age":27,"sal":7000,"gender":"male"}
{"index":{"_id":8}}
{"id":8,"name":"Bona","job":"html","age":22,"sal":14000,"gender":"female"}
{"index":{"_id":9}}
{"id":9,"name":"Shyon","job":"dba","age":20,"sal":19000,"gender":"female"}
{"index":{"_id":10}}
{"id":10,"name":"James","job":"html","age":18,"sal":22000,"gender":"male"}
{"index":{"_id":11}}
{"id":11,"name":"Golsling","job":"java","age":32,"sal":23000,"gender":"female"}
{"index":{"_id":12}}
{"id":12,"name":"Lily","job":"java","age":24,"sal":2000,"gender":"male"}
{"index":{"_id":13}}
{"id":13,"name":"Jack","job":"html","age":23,"sal":3000,"gender":"female"}
{"index":{"_id":14}}
{"id":14,"name":"Rose","job":"java","age":36,"sal":6000,"gender":"female"}
{"index":{"_id":15}}
{"id":15,"name":"Will","job":"dba","age":38,"sal":4500,"gender":"male"}
{"index":{"_id":16}}
{"id":16,"name":"smith","job":"java","age":32,"sal":23000,"gender":"male"}

6.3、单值的输出

ES中大多数的数学计算只输出一个值，如：min、max、sum、avg、cardinality

查询工资的总和

GET employee/_search
{
  "size": 0,
  "aggs": {
    "other_info": {
      "sum": {
        "field": "sal"
      }
    }
  }
}

查询员工的平均工资

GET employee/_search
{
  "size": 0,
  "aggs": {
    "other_aggs_info": {
      "avg": {
        "field": "sal"
      }
    }
  }
}

查询总共有多少个岗位, cardinality的值类似于sql中的 count distinct,即去重统计总数

GET employee/_search
{
  "size": 0,
  "aggs": {
    "job_count": {
      "cardinality": {
        "field": "job"
      }
    }
  }
}

6.4、航班信息数据准备

查询航班票价的最高值、平均值、最低值

GET kibana_sample_data_flights/_search
{
  "size": 0,
  "aggs": {
    "max_price": {
      "max": {
        "field": "AvgTicketPrice"
      }
    },
    "min_price": {
      "min": {
        "field": "AvgTicketPrice"
      }
    },
    "avg_price": {
      "avg": {
        "field": "AvgTicketPrice"
      }
    }
  }
}

6.5、多值的输出

ES还有些函数，可以一次性输出很多个统计的数据: terms、stats

查询工资的信息

GET employee/_search
{
  "size": 0,
  "aggs": {
    "sal_info": {
      "stats": {
        "field": "sal"
      }
    }
  }
}

查询到达不同城市的航班数量

GET kibana_sample_data_flights/_search
{
  "size": 0,
  "aggs": {
    "flight_dest": {
      "terms": {
        "field": "DestCountry"
      }
    }
  }
}

查询每个岗位有多少人

GET employee/_search
{
  "size": 0,
  "aggs": {
    "job_count": {
      "terms": {
        "field": "job"
      }
    }
  }
}

查询目标地的航班次数以及天气信息

GET kibana_sample_data_flights/_search
{
  "size": 0,
  "aggs": {
    "dest_city": {
      "terms": {
        "field": "DestCityName"
      },
      "aggs": {
        "whether_info": {
          "terms": {
            "field": "DestWeather"
          }
        }
      }
    }
  }
}

查询每个岗位下工资的信息(平均工资、最高工资、最少工资等)

GET employee/_search
{
  "size": 0,
  "aggs": {
    "job_inf": {
      "terms": {
        "field": "job"
      },
      "aggs": {
        "sal_info": {
          "stats": {
            "field": "sal"
          }
        }
      }
    }
  }
}

查询不同工种的男女员工数量、然后统计不同工种下男女员工的工资信息

GET employee/_search
{
  "size": 0,
  "aggs": {
    "job_info": {
      "terms": {
        "field": "job"
      },
      "aggs": {
        "gender_info": {
          "terms": {
            "field": "gender"
          },
          "aggs": {
            "sal_info": {
              "stats": {
                "field": "sal"
              }
            }
          }
        }
      }
    }
  }
}

查询年龄最大的两位员工的信息

GET employee/_search
{
  "size": 0,
  "aggs": {
    "top_age_2": {
      "top_hits": {
        "size": 2,
        "sort": [
          {
            "age": {
              "order": "desc"
            }
          }
        ]
      }
    }
  }
}

查询不同区间员工工资的统计信息

GET employee/_search
{
  "size": 0,
  "aggs": {
    "sal_info": {
      "range": {
        "field": "sal",
        "ranges": [
          {
            "key": "0 <= sal <= 5000",
            "from": 0,
            "to": 5000
          },
          {
            "key": "5001 <= sal <= 10000",
            "from": 5001,
            "to": 10000
          },
          {
            "key": "10001 <= sal <= 15000",
            "from": 10001,
            "to": 15000
          }
        ]
      }
    }
  }
}

以直方图的方式以每5000元为一个区间查看工资信息

GET employee/_search
{
  "size": 0,
  "aggs": {
    "sal_info": {
      "histogram": {
        "field": "sal",
        "interval": 5000,
        "extended_bounds": {
          "min": 0,
          "max": 30000
        }
      }
    }
  }
}

interval: 以指定的值为一个区间。

extended_bounds: 可以指定区间的范围，如果超出了区间范围以实际为准，如果没有超出其他区间的数据依然显示

查询平均工资大最低的工种

GET employee/_search
{
  "size": 0,
  "aggs": {
    "job_info": {
      "terms": {
        "field": "job"
      },
      "aggs": {
        "job_avg_sal": {
          "avg": {
            "field": "sal"
          }
        }
      }
    },
    "min_sal_job": {
      "min_bucket": {
        "buckets_path": "job_info>job_avg_sal"
      }
    }
  }
}

求工资和工种的信息

GET employee/_search
{
  "size": 0,
  "aggs": {
    "job_inf": {
      "terms": {
        "field": "job"
      }
    },
    "sal_info": {
      "stats": {
        "field": "sal"
      }
    }
  }
}

查询年龄大于30岁的员工的平均工资

GET employee/_search
{
  "size": 0,
  "query": {
    "range": {
      "age": {
        "gte": 30
      }
    }
  },
  "aggs": {
    "avg_sal": {
      "avg": {
        "field": "sal"
      }
    }
  }
}

查询Java员工的平均工资

GET employee/_search
{
  "size": 0,
  "query": {
    "constant_score": {
      "filter": {
        "term": {
          "job": "java"
        }
      },
      "boost": 1.2
    }
  },
  "aggs": {
    "avg_sal": {
      "avg": {
        "field": "sal"
      }
    }
  }
}

求30岁以上的员工的平均工资和所有员工的平均工资

GET employee/_search
{
  "size": 0,
  "aggs": {
    "older_emp": {
      "filter": {
        "range": {
          "age": {
            "gte": 30
          }
        }
      },
      "aggs": {
        "avg_sal": {
          "avg": {
            "field": "sal"
          }
        }
      }
    },
    "job_info": {
      "terms": {
        "field": "job"
      }
    }
  }
}

从“建议者”到“执行者”：Manus如何重新定义AI代理的边界——基于GAIA基准测试的深度技术解析与行业启示 ByteForge 人工智能人工智能机器人 github chatgpt
引言：AIAgent的“GPT时刻”2025年3月6日，中国团队Monica.im推出的全球首款通用型AIAgent产品Manus正式开启内测，一夜之间引爆科技圈。不同于传统AI的“建议生成”模式，Manus实现了从任务分解、工具调用到成果交付的全流程自动化，被用户称为“数字世界中的全能实习生”本文将从技术架构、任务闭环能力、行业影响三个维度，对比Manus与现有AI产品的代际差异。一、技术架构革
DeepSeek开源周：面向大模型训练的三个工具包花生糖@ AIGC学习资料库 DeepSeek 实用集 DualPipe EPLB Profile-data Deepseek
在2025年的开源周中，DeepSeek推出了一系列旨在优化大规模模型训练效率的工具。这些工具包括DualPipe、EPLB以及Profile-data，它们分别从不同的角度解决了万亿参数模型训练中的算力瓶颈问题，为行业带来了前所未有的加速和效率提升。DualPipe：双向流水线架构的创新DualPipe通过其首创的双向流水线架构，极大地提高了计算与通信的重叠率至92%，相比NVIDIAMegat
神经网络探秘：原理、架构与实战案例二川bro 智能AI 神经网络人工智能深度学习
神经网络探秘：原理、架构与实战案例前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，可以分享一下给大家。点击跳转到网站。https://www.captainbed.cn/ccc在人工智能的浪潮中，神经网络作为核心驱动力之一，正引领着技术革新与产业变革。本文旨在深入剖析神经网络的原理、常见架构，并通过一个实际的代码案例，带领读者亲手实践神经网络的构建与训练过程。无论你是机器学习初学者，还
搞懂 Manus 技术原理，用开源的 Proxy Lite 你也可以构建自己的智能助理程序猿李巡天人工智能 neo4j 知识图谱机器人学习
Manus的技术并没有多么高大上，技术原理主要基于其创新的“多代理架构”（MultipleAgentArchitecture），这一架构通过将复杂任务分解为规划、执行和验证三个阶段，并由多个独立的AI代理协同完成，从而实现高效、可靠的任务处理。多代理架构：Manus的核心技术是其多代理架构，该架构模仿人类的“Plan-Do-Check-Act”（计划-执行-检查-行动）工作流程。具体来说，任务被拆
李彦宏“程序员将不再存在”言论被周鸿祎驳斥，网友怒怼：先把百度程序员都开除了... 互联网架构百度
因公众号更改推送规则，请点“在看”并加“星标”第一时间获取精彩技术分享点击关注#互联网架构师公众号，领取架构师全套资料都在这里0、2T架构师学习资料干货分上一篇：2T架构师学习资料干货分享大家好，我是互联网架构师！整理|凌敏、核子可乐网友热评：先把百度的程序员都开除了吧。李彦宏：未来将不再存在“程序员”这一职业在3月9日央视的《对话》·开年说节目上，百度创始人、董事长兼CEO李彦宏表示，基本上以后
MindSearch: 革新人工智能搜索引擎的未来 2401_87189860 人工智能搜索引擎
MindSearch:革新人工智能搜索引擎的未来在人工智能和大语言模型快速发展的今天,搜索引擎领域正迎来新的变革。由上海人工智能实验室开发的MindSearch项目,正是这场变革中的佼佼者。MindSearch是一个开源的AI搜索引擎框架,它通过模仿人类思维过程,为用户提供深度的AI搜索能力。本文将深入探讨MindSearch的特点、工作原理以及它对未来搜索技术的影响。MindSearch的核心特
初识开源云原生数仓Databend 开源项目精选云原生
Databend是一款开源的数据仓库产品，主要定位于OLAP场景，采用云原生架构理念（可对比snowflake），有非常好的扩展性、同时具备低成本、高性能的优势，兼容MySQL协议。Stars数8,245Forks数765主要特点针对对象存储平台进行优化的云原生架构。符合SQL:2011标准，支持复杂查询和数据版本回溯（时间旅行）功能。与流行的商业智能（BI）、提取、转换和加载（ETL）以及数据科
Scira：极简AI驱动搜索引擎开源项目精选人工智能
Scira（原名MiniPerplx）是一款极简的AI驱动搜索引擎，可帮助您在互联网上查找信息。它由VercelAISDK提供支持，并可使用Grok2.0等模型进行搜索。Stars数7,186Forks数845主要特点AI驱动的智能搜索：借助Anthropic的模型，快速获取问题的答案，让搜索变得更加智能化。网页搜索：使用Tavily的API来进行高效的网页搜索，无需额外的插件即可快速得到网页内容
面试基础---微服务架构深度解析：服务拆分、数据一致性与服务调用 WeiLai1112 后端架构面试微服务职场和发展 java 后端分布式
微服务架构深度解析：服务拆分、数据一致性与服务调用引言：从抖音日活7亿看微服务架构的重要性在2023年，抖音日活用户突破7亿，其核心系统通过微服务架构实现了高并发、高可用的业务支撑。本文将深入探讨微服务架构的设计与实现，结合工业级实践与源码解析，揭示高并发场景下的微服务之道。一、微服务拆分原则1.1拆分策略业务能力：按业务领域划分数据边界：确保数据独立性团队结构：匹配团队职责1.2拆分流程单体应用
Google Chrome 60版本的全新特性与优势 xinwuji312
本文还有配套的精品资源，点击获取简介：Chrome60是GoogleChrome浏览器的一个重大更新，它在2017年推出，为用户和开发者提供了多项改进。新版浏览器通过升级V8JavaScript引擎，增强WebAssembly支持，改进CSSGrid布局，更新ServiceWorker，增强安全性，改进开发者工具，增加新的WebAPI，优化性能，增强隐私控制以及支持64位架构，从而提升浏览体验和开
AI浪潮下程序员的生存指南：7 条转型路径程序员
一、AI编程时代的职业危机与机遇·数据警示：Gartner预测到2026年，30%的代码将由AI生成·能力重构：传统"代码搬运工"岗位需求下降42%（Indeed招聘数据）·破局关键：从"重复劳动"转向"创造性价值输出"二、程序员转型的7大黄金赛道转型方向核心能力要求市场需求增长典型岗位示例智能架构师系统设计+AI协同开发+300%AI系统架构师技术管理者团队赋能+技术战略+180%研发效能总监数
DeepSeek一键生成可视化看板 CodeJourney. 数据库算法人工智能能源
在当今数据驱动的时代，数据可视化已成为企业决策和分析的关键工具。然而，传统的数据可视化过程往往需要专业的技术知识和大量的时间成本，这对于许多非技术人员来说是一个巨大的挑战。不过，现在有了DeepSeek，这一切都变得轻松简单。本文将深入探讨DeepSeek一键生成可视化看板的强大功能，以及它如何改变我们处理数据的方式。一、数据可视化的重要性在大数据时代，数据的价值不言而喻。但原始数据往往是繁杂无序
使用Java开发工具包会遇到哪些问题 ios
哈喽，大家好呀，淼淼又来和大家见面啦，Java作为一门广泛应用于企业级应用、安卓开发、大数据处理等领域的编程语言，其强大的跨平台能力和丰富的类库支持吸引了无数开发者。然而，在使用Java开发工具包(JavaDevelopmentKit,简称JDK)的过程中，开发者往往会遇到各种问题。本文旨在探讨这些常见问题，并提供相应的解决策略，帮助开发者更高效地利用Java进行项目开发。环境配置问题问题描述：初
Spring Boot在java领域中有哪些优势 ios
哈喽，大家好呀，淼淼又来和大家见面啦，随着云计算、微服务架构的兴起，Java开发领域迫切需要一套高效、灵活且易于上手的框架来应对日益复杂的业务需求。正是在这样的背景下，SpringBoot应运而生，以其独特的魅力迅速成为了Java开发者手中的利器。这一期淼淼将深入剖析SpringBoot在Java领域中的十大显著优势，揭示它为何成为现代软件开发不可或缺的一部分。1.零配置起航：约定优于配置Spri
鸿蒙HarmonyOS 实战：加载状态管理、观察者模式—LoadState 不停留的码牛鸿蒙 HarmonyOS 前端 harmonyos 华为前端鸿蒙开发观察者模式鸿蒙 android
背景1、在ArkTS的架构中，没有明确的可管理的加载请求状态的脚手架，在进行网络请求过程中，无法简单的进行交互响应。2、参考Android中的LoadState写了一个简单的脚手架，以便在日常开发过程中，管理加载请求状态和UI交互。脚手架说明与源码1、状态机LoadState使用一个状态机，分别对应网络请求过程中的Loading（发起请求）、Loaded(请求成功)、LoadError(请求失败)
Hive实用小文件合并方案 500佰 Hive线上问题处理方案 hive hadoop 数据仓库大数据
#Hive常见故障#大数据#生产环境真实案例#Hive#离线数据库#整理#经验总结说明：此篇总结hive常见故障案例处理方案结合自身经历总结不易+关注+收藏欢迎留言Hive实用小文件合并方案请往下翻！！！更多Hive案例汇总方案(点击跳转)：Hive常见故障多案例维护宝典--项目总结(宝典一)Hive常见故障多案例维护宝典--项目总结(宝典二)目录内容如下：架构概述【1】参数及配置类常见故障执行s
崖山YashanDB：下一代国产分布式数据库的架构革新与行业实践 Lethehong 热点时事数据库架构分布式
嗨，我是Lethehong！立志在坚不欲说，成功在久不在速欢迎关注：点赞⬆️留言收藏欢迎使用：小智初学计算机网页IT深度知识智能体欢迎使用：深探助手deepGuide网页deepseek智能体目录第一章：YashanDB的崛起背景与战略定位1.1国产数据库的破局时刻1.2YashanDB的差异化定位第二章：核心技术架构解析2.1存储引擎：LSM-Tree的革新设计2.2分布式事务引擎：YTSI协议
大数据面试之路 (二) hive小文件合并优化方法愿与狸花过一生大数据大数据 hive hadoop
大量小文件容易在文件存储端造成瓶颈，影响处理效率。对此，您可以通过合并Map和Reduce的结果文件来处理。一、合并小文件的常见场景写入时产生小文件：Reduce任务过多或数据量过小，导致每个任务输出一个小文件。动态分区插入：分区字段基数高，每个分区生成少量数据，形成大量小文件。频繁追加数据：通过INSERTINTO多次追加数据，导致文件碎片化。二、合并小文件的核心方法方法1：调整Reduce任务
Phi-4-multimodal：图、文、音频统一的多模态大模型架构、训练方法、数据细节余俊晖大语言模型多模态 LLM 多模态
Phi-4-Multimodal是一种参数高效的多模态模型，通过LoRA适配器和模式特定路由器实现文本、视觉和语音/音频的无缝集成。训练过程包括多阶段优化，确保在不同模式和任务上的性能，数据来源多样，覆盖高质量网络和合成数据。它的设计体现了小型语言模型在多模态任务上的潜力模型架构Phi-4-Multimodal的基础是Phi-4-Mini语言模型，这是一个3.8亿参数的模型，设计为高效处理文本任务
在整个大模型LoRA微调中，哪些方法可以提升和优化模型训练后推理效果？玩人工智能的辣条哥人工智能人工智能 LoRA 微调
环境：LoRA微调问题描述：在整个大模型LoRA微调中，哪些方法可以提升和优化模型训练后推理效果？解决方案：在LoRA（Low-RankAdaptation）微调大模型后，提升和优化推理效果可以从以下多维度策略入手，涵盖数据、模型架构、训练策略和后处理技术等方面：1.数据优化数据质量与多样性确保微调数据覆盖目标场景的多样性，避免分布偏差。加入领域相关的高质量数据，清洗噪声数据（如重复、矛盾样本）。
Transformer 的原理是什么？玩人工智能的辣条哥人工智能 transformer 深度学习人工智能
环境：Transformer问题描述：Transformer的原理是什么？通俗易懂一点。解决方案：Transformer是一种基于注意力机制（AttentionMechanism）的深度学习架构，最初由Vaswani等人在2017年的论文《AttentionisAllYouNeed》中提出。它在自然语言处理（NLP）领域取得了巨大成功，并逐渐扩展到计算机视觉（CV）和其他领域。Transforme
Docker从入门到实战欧阳今朝 Docker docker 容器运维
文章目录一、概述1.1基本概念1.2优势1.3与传统VM特性对比：1.4基础架构1.5Docker技术的基础：二、安装部署2.1准备条件2.2安装Docker2.3基本命令2.4命令整理2.5简单实践操作2.6Dockerfile详解FROM（指定基础image）RUN（安装软件用）CMD（设置container启动时执行的操作）ENTRYPOINT（设置container启动时执行的操作）USE
3.1 Spring Boot性能优化：从线程池调优到JVM参数配置 Sendingab Spring boot 从入门到精通零基础7天精通Spring Boot spring boot 性能优化 jvm
markdown#SpringBoot性能优化：从线程池调优到JVM参数配置![性能优化](https://img-blog.csdnimg.cn/direct/0a3e3d2e4d4b4f7f9c3d4a5b0e8d4e4c.png)##引言在微服务架构中，SpringBoot作为主流开发框架，其性能直接影响系统的吞吐量和响应速度。本文将深入探讨从**线程池调优**到**JVM参数配置**的全链
Kafka 深入解析：架构原理、基本使用及丢数据场景分析唐唐爱吃糖111 kafka 架构分布式云原生云计算 k8s
Kafka是一个高吞吐、分布式的消息队列系统，被广泛应用于日志处理、流式数据处理和事件驱动架构。本篇文章将详细介绍Kafka的架构原理、基本使用方法，并分析Kafka可能的丢数据场景及其解决方案。一、Kafka介绍1.什么是Kafka？Kafka是Apache基金会开源的分布式流处理平台，主要用于：消息队列（MessageQueue）：解耦生产者（Producer）和消费者（Consumer）。日
第八课：Scrapy框架入门：工业级爬虫开发 deming_su Python scrapy 爬虫 python
在当今大数据时代，数据抓取已成为信息获取的重要手段。Scrapy作为一个基于Python的开源网络爬虫框架，凭借其高效、灵活的特性，在工业级爬虫开发中占据重要地位。本文将详细介绍Scrapy框架的基本架构、工作流程、关键组件（如Spider类与ItemPipeline）以及中间件机制，并通过一个电商产品爬虫案例，展示如何使用Scrapy框架进行数据抓取。1.Scrapy架构与工作流程Scrapy架
flink（十一）：Table&Sql实现窗口水印计算羽落风起大数据 flink flink
文章目录分享说明实现讲解代码总结分享大数据博客列表说明本博客每周五更新一次。本文属于实战，讲解Flink1.12版本java代码使用时间窗口加水印实现，具体需求为5秒内用户订单总数、订单最大金额、最小金额实现讲解代码结构分为5部分，准备环境env数据输入source模拟数据生成数据处理transformation创建水印、窗口执行任务基于sql和table风格实现对应功能数据输出sink启动任务e
9.3 智谱AI大模型生态爆发！中文准确率89.2%+代码生成67.3%，全面碾压GPT-4！少林码僧掌握先机！从 0 起步实战 AI 大模型微调打造核心竞争力人工智能语言模型 gpt
智谱AI大模型生态爆发！中文准确率89.2%+代码生成67.3%，全面碾压GPT-4！1.WebGLM：联网检索增强大模型智谱AI于2022年推出的WebGLM是基于GLM-10B打造的检索增强生成（RAG）模型，其创新性地将大语言模型与搜索引擎深度整合，构建了独特的四阶段处理架构：
应广单片机adc_台湾应广单片机单片机PMC131 带12位ADC、采用FPPATM技术晁好刚应广单片机adc
PMC131台湾应广一级代理现货批发长期供应带12位ADC、采用FPPATM技术、单核心8位单片机PMC131替代松翰SN8P2711芯片PIN对PIN，引脚功能及脚位完全兼容，仅需更换code，不改PCB，直接替换即可。功能一样的前提下，价格更低廉。单片机特点1.1高性能RISCCPU架构〓工作模式：单一处理单元运作模式〓1.5Kx16bitsOTP程序存储器〓88Bytes数据存储器〓提供86
JSON-RPC-CXX深度解析：C++中的远程调用利器极地星光软件功能原理架构 json rpc c++
一、引言1.JSON-RPC简介及其在C++开发中的重要性JSON-RPC（JavaScriptObjectNotation-RemoteProcedureCall）是一种基于JSON格式的远程过程调用协议。在C++开发中，它扮演着至关重要的角色。随着软件系统的日益复杂和分布式架构的广泛应用，高效的远程过程调用成为构建强大应用程序的关键。JSON-RPC以其简洁的JSON数据格式，使得不同的系统之
Oracle数据库深度优化实战指南：从SQL到架构的全维度调优 AAEllisonPang jvm
目录性能优化方法论1.1性能优化黄金三角（SQL/实例/架构）1.2常用诊断工具全景图（AWR/ASH/SQLMonitor）SQL语句调优实战2.1执行计划深度解析2.2全表扫描灾难案例2.3绑定变量陷阱解决方案索引优化策略3.1索引失效七大场景3.2函数索引实战应用实例参数优化4.1内存管理核心参数4.2连接风暴抑制方案架构设计优化5.1分区表设计陷阱5.2物化视图加速案例统计信息管理6.1统
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

Elasticsearch 高级查询

本文简要

博主：程序员一灯，一个老菜鸟，哈哈哈哈

一个人可以走的很快，一群人可以走的很远

一、term查询

1.1、term与terms

1.2、range

1.3、Constant Score

二、全文查询

2.1、match

2.2、match_phrase

2.3、multi_match

2.4、match_all

2.5、query_string

2.6、simple_query_string

三、模糊搜索

四、多条件查询

五、Mapping 映射

5.1、数据类型

5.2、Mapping的定义

5.3、常见参数

5.3.1、index

5.3.2、null_value

6、聚合查询

6.1、聚合查询的应用案例

6.2、数据准备

6.3、单值的输出

6.4、航班信息数据准备

6.5、多值的输出

你可能感兴趣的:(ElasticSearch,架构,elasticsearch,搜索引擎,lucene,大数据)