li644872790

ES核心干货学习（原理及数据结构）

本文主要为帮助大家理解ES原理，了解它为啥快，简化部分内容便于理解。

1. ES用途

1.1 ES是什么？

ES是建立在Lucene基础之上的分布式准实时搜索引擎。

核心：分布式和Lucene全文搜索。

1.2 什么场景需要用ES

1. 业务需要进行大量数据实时检索时，传统关系型数据库无法支撑。

2. 需要进行分词检索，语义检索

3. 需要大数据分析

符合上面特征都可以考虑，如日志收集、订单数据链查询，文章检索等。

1.3 为啥选ES

1. 能支持千万级亿级的实时检索。

2. 支持restful API接口，使用门槛低。

3. 分布式，可扩展。

4. 在OLAP场景下与市面上现有竞品（不包括ClickHouse）相比有明显性能优势。

5. 与ClickHouse相比主要是运维优势和用户基础，云服务平台支持较好，减低个人或公司的运维成本。

2. ES安装

后续补上

3. ES基础概念

3.1 数据结构

类型	说明	举例	与Mysql逻辑对应
index	索引（自定义）	test	表名
doc	行		行
field	具体字段名，又称域（自定义）	name	字段名称
type	字段类型（ES定义）	text、keyword、integer	字段类型

1.索引

在ES中用户的数据新增、搜索和更新等操作的对象全部对应索引。但是ES中的索引和Lucene中的索引不是一一对应的。ES中的一个索引对应一个或多个Lucene索引，这是由其分布式的设计方案决定的，在使用上类似Mysql表的概念。

2.文档

文档对应关系型数据库中行的概念，ES的文档中可以有一个或多个字段，每个字段可以是各种类型。用户对数据操作的最细粒度对象就是文档。ES文档操作使用了版本的概念，即文档的初始版本为1，每次的写操作会把文档的版本加1，每次使用文档时，ES返回给用户的是最新版本的文档。另外，为了减轻集群负载和提升效率，ES提供了文档的批量索引、更新和删除功能。

3.字段

一个文档可以包含一个或多个字段，每个字段都有一个类型与其对应。除了常用的数据类型（如字符串型、文本型和数值型）外，ES还提供了多种数据类型，如数组类型、经纬度类型和IP地址类型等。ES对不同类型的字段可以支持不同的搜索功能。例如，当使用文本类型的数据时，可以按照某种分词方式对数据进行搜索，并且可以设定搜索后的打分因子来影响最终的排序。再如，使用经纬度的数据时，ES可以搜索某个地点附近的文档，也可以查询地理围栏内的文档。在排序函数的使用上，ES也可以基于某个地点按照衰减函数进行排序。

3.2 存储结构

1.集群和节点

在分布式系统中，为了完成海量数据的存储、计算并提升系统的高可用性，需要多台计算机集成在一起协作，这种形式被称为集群，这些集群中的每台计算机叫作节点。ES集群的节点个数不受限制，用户可以根据需求增加计算机对搜索服务进行扩展。

要检查群集运行状况，我们可以在 Kibana 控制台中运行以下命令 GET /_cluster/health，得到如下信息：

{  
  "cluster_name" : "cluster",   //集群名称
  "status" : "yellow",          //集群状态
  "timed_out" : false,  
  "number_of_nodes" : 1,        //节点个数
  "number_of_data_nodes" : 1,   //数据节点个数（数据节点：存放数据的节点）
  "active_primary_shards" : 9,   //所有主分片数
  "active_shards" : 9,          //所有副本分片数
  "relocating_shards" : 0,      //正在迁移分片数量
  "initializing_shards" : 0,    //正在创建的分片数量
  "unassigned_shards" : 5,      // 未分配副本分片
  "delayed_unassigned_shards" : 0,  
  "number_of_pending_tasks" : 0,  
  "number_of_in_flight_fetch" : 0,  
  "task_max_waiting_in_queue_millis" : 0,  
  "active_shards_percent_as_number" : 64.28571428571429  
}

集群状态通过绿，黄，红来标识：

绿色：集群健康完好，一切功能齐全正常，所有分片和副本都可以正常工作。

黄色：预警状态，所有主分片功能正常，但至少有一个副本是不能正常工作的。此时集群是可以正常工作的，但是高可用性在某种程度上会受影响。

红色：集群不可正常使用。某个或某些分片及其副本异常不可用，这时集群的查询操作还能执行，但是返回的结果会不准确。对于分配到这个分片的写入请求将会报错，最终会导致数据的丢失。当集群状态为红色时，它将会继续从可用的分片提供搜索请求服务，但是你需要尽快修复那些未分配的分片。

2.分片

在分布式系统中，为了能存储和计算海量的数据，会先对数据进行切分，然后再将它们存储到多台计算机中，每个切片就是分片，这样不仅能分担集群的存储和计算压力，而且在该架构基础上进一步优化，还可以提升系统中数据的高可用性。在ES中，一个分片对应的就是一个Lucene索引，每个分片可以设置多个副分片，这样当主分片所在的计算机因为发生故障而离线时，副分片会充当主分片继续服务。索引的分片个数只能设置一次，之后不能更改。在默认情况下，ES的每个索引设置为1个分片。

3.副本（副分片）

为了提升系统索引数据的高可用性并减轻集群搜索的负载，可以启用分片的副本，该副本叫作副分片，而原有分片叫作主分片。在一个索引中，主分片的副分片个数是没有限制的，用户可以按需设定。在默认情况下，ES不会为索引的分片开启副分片，用户需要手动设置。副分片的个数设定后，也可以进行更改。一个分片的主分片和副分片分别存储在不同的计算机上。

3.2 ES RestFul API接口

RestFul API 主要分两个部分：请求url 和请求方式。

请求方式包括：get、post、delete、put等，其中put请求要求是幂等操作，非幂等操作会报错。

在这就不细说了。

4. ES索引

4.1 索引属性

创建索引：

PUT my_index   
{  
   "settings" : {  
      "number_of_shards" : 5,  // 分片数（静态配置，不可变）
      "number_of_replicas" : 1,  // 副本数 （动态配置，可改）
      "refresh_interval": "2s"    // 索引刷新到文件缓存的时间
   }  
  "mappings": {  
    "_doc": {   
      "properties": {   
        "title":    { "type": "text"  },   
        "name":     { "type": "keyword"  },   
        "age":      { "type": "integer" },    
        "created":  {  
          "type":   "date",   
          "format": "strict_date_optional_time||epoch_millis"  
        }  
      }  
    }  
  }  
}

4.2 字段（域）说明

（1）. 字符串类型： text, keyword

text类型（可以用分词器）：

a. 支持分词，全文检索,支持模糊、精确查询,不支持聚合,排序操作;

b. text类型最大支持的字符长度无限制,适合大字段存储；

使用场景：

存储全文搜索数据, 例如: 邮箱内容、地址、代码块、文章内容等。

默认结合standard analyzer(标准解析器)对文本进行分词、倒排索引。

默认结合标准分析器进行词命中、词频相关度打分。

keyword类型：

a.不进行分词，直接索引，支持模糊、支持精确匹配，支持聚合、排序操作。

b.keyword类型的最大支持的长度为32766个UTF-8类型的字符,可以通过设置ignore_above指定自持字符长度，超过给定长度后的数据将不被索引。

使用场景：

存储邮箱号码、url、name、title，手机号码、主机名、状态码、邮政编码、标签、年龄、性别等数据。

用于筛选数据、排序、聚合(统计)。

直接将完整的文本保存到倒排索引中。

（2）数字类型：long, integer, short, byte, double, float, half_float, scaled_float

（3）日期：date

（4）日期纳秒：date_nanos

（5）布尔型：boolean

（6）Binary：binary

（7）Range: integer_range, float_range, long_range, double_range, date_rang

5. 交互流程说明

5.1 写入流程

核心步骤说明：

写入请求流转流程

1. 调用者发起写入请求后会发给集群中的某个node节点，该节点被称为协调节点。

2. 协调节点会根据数据中的Routing（可指定参数，默认用_id）值进行Hash运算决定数据存放哪个分片，计算方式比较简单：计算Routing的hash值然后和分片数进行取模运算，得到的值就是主分片编号，具体如下：

shard = hash(routing) % number_of_primary_shards

随后写入请求会转给主分片所在节点处理。

3. 主分片收到请求后会将数据写入内存并同时生成日志文件Translog(用来防止突发情况下的内存丢失，分同步或异步写入两种方式)，并且将数据转发到其他副本分片，等所有写入完成（可配置是否需要副本同步写入），返回写入成功响应。

Translog刷盘配置项：

index.translog.durability：

request：同步刷盘（默认）

async：异步刷盘

index.translog.sync_interval：5s //translog异步刷盘间隔时间；默认5s一次

数据写入文件系统缓存

4. 数据写入内存后会refresh到文件系统缓存中（可配置，默认每秒执行），并生成segment段，构建索引，此时用户即可查询到数据。

refresh配置项：

index.refresh_interval：10s //refresh刷新频率，默认1s一次，可以设置为-1为禁用

5. 索引的构建主要分为2个大步骤，生成正排索引和生成倒排索引。

正排索引：生成文档ID和文档数据的对应关系,建立存储索引；

倒排索引：文档数据关键字与文档id建立索引。

6. 当translog达到一定大小（参数：index.translog.flush_threshold_size，默认：512M）或者到设置的flush时间（参数：index.translog.flush_threshold_period，默认：30分钟）会进行一次flush操作，具体流程：

1.内存中数据写入新的segment放入缓存（清空内存区）

2.生成一个提交点（commit point）并写入磁盘，表示哪些segment已写入磁盘

3.将缓存的segement写入磁盘（fsync命令）

4.清空旧的translog日志

额外细节：

1. 段合并（整个写入过程中也伴随着段合并）：

由于端是不可变的，每次refresh会创建一个新的段，这样会导致短时间内的段数量暴增。每一个段都会消耗文件句柄、内存和 cpu 运行周期。更重要的是，每个搜索请求都必须轮流检查每个段；所以段越多，搜索也就越慢。Elasticsearch 通过在后台进行段合并来解决这个问题。小的段被合并到大的段，然后这些大的段再被合并到更大的段。段合并的时候会将那些旧的已删除文档从文件系统中清除。被删除的文档（或被更新文档的旧版本）不会被拷贝到新的大段中。

5.2 查询流程

查询阶段步骤（我们以普通参数查询为例）:

1. 客户端发送一个search请求到Node1，Node1会创建一个查询数据量大小的空优先队列，该节点就会变成协调节点。

2. Node1将查询请求转发到索引的每个主分片或它对应某个副本分片中。每个分片在本地执行查询并添加结果到本地有序优先队列中。

3. 每个分片返回各自优先队列中所有文档的 ID 和排序值给协调节点，也就是Node1，它合并这些值到自己的优先队列中来产生一个全局排序后的结果列表。

汇总一下：

首先查询请求发送会发给集群的某一个节点，某个节点把最终的结果返回给客户端，当一个搜索请求被发送到某个节点时，这个节点就变成了协调节点。这个节点的任务是广播查询请求到所有相关分片并将它们的响应整合成全局排序后的结果集合，这个结果集合会返回给客户端。

查询请求可以被某个主分片或某个副本分片处理，这就是为什么更多的副本（当结合更多的硬件）能够增加搜索吞吐率。协调节点将在之后的请求中轮询所有的分片拷贝来分摊负载。

每个分片在本地执行查询请求并且创建一个长度为from + size的优先队列，也就是说，每个分片创建的结果集足够大，均可以满足全局的搜索请求。分片返回一个轻量级的结果列表到协调节点，它仅包含文档 ID 集合以及任何排序需要用到的值，例如 _score 。

协调节点将这些分片级的结果合并到自己的有序优先队列里，它代表了全局排序结果集合。至此查询过程结束。

注：a. 每次查询过程中我们都是将请求分发给主分片或者副本（二选一）。

b. 按_id查询是会直接计算hash去对应分片查询，不用分发后在合并。

5.3 删除流程

由于segment不可变，ES的删除操作是进行逻辑删除的，先生成标记删除文件（.del）记录那些被删除，在查询的时候做过滤，然后在合并segment 时物理删除。

6. 索引建立流程

整体流程图如下：

（只说明主流程，以下讲解中所有数据结构不代表实际结构，只是便于理解的简化版）

说明：

1. 索引建立会分为正排索引和倒排索引

2. 正排索引通过文档id定位文档数据位置。

3. 倒排索引通过建立词条和id的对应关系定位文档id，通过正派索引定位文档。

注：说文档id只是便于理解，只是个对应关系的标记id，并不一定是文档的id。

这个很好理解，正排索引和倒排索引都需要，只有倒排索引是没办法定位到具体数据的，毕竟巨量数据的检索也是个问题。

6.1. 建立正排索引

说明：

1. 正排索引的目的是在于建立快捷的文档信息快速查找的机制，核心在于快速定位文档位置（存储偏移量），所以为了记录文档位置，我们建立了域索引信息表。

2. 域索引信息表中的每个元素会记录当前域数据对应的文档信息位置（偏移量），但查询域数据本身也是个问题，所以我们提前给域数据（分词数据）进行顺序编号，域索引信息表会按照编号和定长64位的块顺序排列。

3. 当我们知道域数据编号可以计算域索引的偏移量（size(公共数据长度)+ 64*N），从而获取对于数据在文档信息表中的位置信息，获取具体数据。

4. 为降低存储冗余和便于维护，我们提前给域（字段）进行编号并建立对应关系，生成域信息表。

举个例子（10(id), name（field）,zhansan（value））：

生成name的域索引表，给“zhansan”编号为5，分配在size+5*64 到size+6*64 这段区域存储id:10对应数据的在文档信息表中的位置。

6.2. 建立倒排索引

流程如下：

1. 数据项会先进行分词拆分（非text类型域跳过），建立词典，这块会用到FST算法进行索引，通过前缀进行匹配，词典会进行排序，并放在内存中。

2. 建立词典和文档的对应关系，也就是建立倒排表，这里的倒排表写的比较简单，实际上倒排表下有两个字表：词频倒排和位置倒排。

终极问题1：ES为什么亿级大数据全文检索领域那么快？

1. 倒排索引

倒排的数据结构在全文搜索上有着天然的优势，在建立索引的情况下，单分片查询复杂度接近O(1)。

2. 词典压缩

ES中有大量数据压缩算法的应用，对词典的压缩保证这部分数据可以放在内存中进行检索，大大提升查询效率。

3. 分布式架构

分布式架构下保证了ES的可拓展性，多分片副本进行分段存储，使得在查询过程中可进行负载查询，降低单节点查询压力，提升并发，进而提高查询效率。

终极问题2：那些因素会影响ES性能？

1. 硬盘！！，硬盘性能对ES影响很大，很多操作是频繁读写硬盘，所以SSD非常必要。

2. CPU和内存，这就不说了，大点好，需要注意合理设置jvm内存，不要影响文件系统缓存的使用

3. 分片和副本的设置需要注意，分片数最好大于等于数据节点数小于等于3倍数据节点数。

4. refresh主要是生成segment放文件缓存可供实时查询，但是过多小segment会影响效率，查询实时性没那么高时建议调大一些。

3. flush是一个刷盘操作，写密集的情况下建议调大flush时间间隔，来减低IO。

4. translog 日志文件，默认会同步写盘，接受部分风险，建议改成异步。

5. 写入时如无特需要求，文档ID不要自定义！会影响写入效率，因为es需要重新计算排序，最重要的时它会进行验重，占用系统资源。

暗链威胁与检测方法之Screaming Frog SEO Spider qq_39541626 黑帽研究 windows
尖叫青蛙，网站暗链检测方法网站暗链是指那些隐藏在网页上，对普通用户不可见或难以察觉的超链接。这些链接可能被故意设置为与背景颜色相同、使用极小的字体、或通过CSS技巧使其隐藏，从而在视觉上对用户隐藏。暗链通常用于不良的SEO实践，如操纵搜索引擎排名，或链接到恶意网站。这种做法可能导致网站在搜索引擎中被降级或罚款，损害网站的可信度和用户体验为了解决网站暗链，一次性筛选所有暗链买了一个软件Screami
2.2[frontEnd]ESLint CQU_JIAKE 前端 java
ESLint是一个开源的JavaScript和TypeScript代码质量和代码风格检查工具。它可以帮助开发者检测代码中的问题（如语法错误、潜在的错误、不一致的代码风格等），从而提高代码质量和可维护性。主要功能检测语法错误：ESLint可以检测代码中的语法错误，例如未关闭的括号、缺少分号等。代码风格检查：ESLint可以强制代码风格的一致性，例如：缩进风格（2空格或4空格）。引号类型（单引号或双引
3月TIOBE编程语言排行：Python稳居榜首，C++和Java市场份额稳步上升朱公子的Note 编程语言 python c++java TIOBE编程语言排行
TIOBE编程语言排行榜是一个基于全球程序员数量、课程数量和第三方供应商数量的指标，旨在反映编程语言的流行度。根据TIOBEIndex，它每月更新一次，计算方法基于搜索引擎（如Google、Bing、Wikipedia等）的查询结果，涵盖专业开发者的兴趣和需求。需要注意的是，TIOBE指数不代表“最佳”编程语言或代码量最多的语言，而是反映语言在开发者社区中的热度。2025年3月的排行榜特别提到Py
《Java八股文の文艺复兴》第四篇：ThreadLocal的平行宇宙——弱引用是通往OOM的时空虫洞？程序猿chen 面霸の自我修养（面试篇）「Java八股文の文艺复兴」java 开发语言后端面试跳槽职场和发展安全
楔子：量子泡沫中的幽灵代码"当你在ThreadLocal中写入秘密时，整个宇宙的线程都在窥视它。"上一场战役我们封印了ConcurrentHashMap的熵增奇点，但新的危机正在量子泡沫中酝酿。在某个平行宇宙里，一行看似无害的threadLocal.set(user)正在撕裂JVM的内存维度，而弱引用竟成为打开OOM虫洞的钥匙。此刻，让我们戴上RASP打造的因果律护目镜，穿越ThreadLocal
巨人学术搜索官网入口，免费参考文献论文及学术搜索引擎黄豆匿zlib 学习方法
巨人学术搜索自2024年上线以来，迅速成为学术界不可或缺的重要工具，尤其受到研究人员、教师及学生的青睐。这款专注于学术领域的专业搜索引擎，覆盖了自然科学、人文科学、社会科学等多个学科领域，整合了国内外众多主流数据库，包括维普、万方、Elsevier、WebofScience等，为用户提供了期刊论文、学位论文、专利、图书、预印本等多种类型资源的精准检索服务。与普通搜索引擎相比，巨人学术搜索的优势在于
前端性能优化之SSR优化 xiangzhihong8 前端前端
我们常说的SSR是指Server-SideRendering，即服务端渲染，属于首屏直出渲染的一种方案。SSR也是前端性能优化中最常用的技术方案了，能有效地缩短页面的可见时间，给用户带来很好的体验。SSR渲染方案一般来说，我们页面加载会分为好几个步骤：请求域名，服务器返回HTML资源。浏览器加载HTML片段，识别到有CSS/JavaScript资源时，获取资源并加载。现在大多数前端页面都是单页面应
JAVA泛型 TraceChen JAVA java
JAVA泛型Java泛型（generic）是在JDK1.5版本引用的一种新的特性，泛型提供编译时安全检查机制，该机制允许程序员在编译时检查非安全的类型。一、泛型本质泛型本质是数据化类型，即先给类型指定一个参数，然后使用时再指定参数具体的值，那么这个类型可以在使用时候决定，这种参数类型可以用在类、接口、方法中，分别被称为泛型类、泛型接口、泛型方法。 Listlist=newArrayListl
JDK8 Stream 数据流效率分析，Java开发你需要了解的那些事气质大叔程序员后端面试 java
此外还有一系列特化流，如IntStream，LongStream，DoubleStream等），Java8引入的的Stream主要用于取代部分Collection的操作，每个流代表一个值序列，流提供一系列常用的聚集操作，可以便捷的在它上面进行各种运算。集合类库也提供了便捷的方式使我们可以以操作流的方式使用集合、数组以及其它数据结构；作为阅读福利，小编也整理了一些Java学习笔记（包含面试真题+脑图
基础篇：ArkTS基础语法介绍言程序plus 鸿蒙Next开发 javascript arkts 鸿蒙
前言：目前流行的编程语言TypeScript是在JavaScript基础上通过添加类型定义扩展而来的，而ArkTS则是TypeScript的进一步扩展。TypeScript深受开发者的喜爱，因为它提供了一种更结构化的JavaScript编码方法。ArkTS旨在保持TypeScript的大部分语法，为现有的TypeScript开发者实现无缝过渡，让移动开发者快速上手ArkTS。ArkTS比typeS
【万字总结】前端全方位性能优化指南（四）——虚拟DOM批处理、文档碎片池、重排规避庸俗今天不摸鱼 Web性能优化合集前端性能优化
前言在浏览器宇宙中，DOM操作如同「时空裂缝」——一次不当的节点更新可能引发连锁重排，吞噬整条渲染流水线的性能。本章直面这一核心矛盾，以原子级操作合并、节点记忆重组、排版禁忌破解为三重武器，重构DOM更新的物理法则。通过虚拟DOM的批处理引擎将千次操作坍缩为单次提交，借助文档碎片池实现90%节点的跨时空复用，再以transform替代top等20项反重排铁律，我们将彻底终结「JavaScript线
Java泛型 lgily-1225 日常积累 java 开发语言后端
Java泛型是Java5引入的一项重要特性，旨在增强类型安全、减少代码冗余，并支持更灵活的代码设计。以下是对泛型的详细介绍及使用指南：一、泛型核心概念泛型允许在类、接口、方法中使用类型参数（如），使得代码可以处理多种数据类型，而无需重复编写逻辑。解决的问题类型安全：避免运行时ClassCastException。消除强制类型转换：编译器自动处理类型转换。代码复用：同一逻辑可处理不同类型的数据。二、
实现高德地图自定义点标记跳动，点标记随缩放大小显示和隐藏时光请留微笑 javascript 前端 vue.js
高德地图的自定义标记（Marker）添加一个循环动画效果，比如让图标上下跳动，你可以利用CSS动画或JavaScript动画库（如GSAP）。使用GSAP来创建动画，下面我将展示两种GSAP和CSS类来为Marker的内容添加循环动画。方法一：通过CSS动画实现图标上下跳动首先自定义点标记，在点标记显示内容content中自定义一个图标，这里我用的是element中的图标，给标签一个类名，如i-i
Java IDEA中Gutter Icons图标的含义路宇 java笔记 java intellij-idea 开发语言 gutter-icons 图标 Java开发工具
前些天发现了一个蛮有意思的人工智能学习网站,8个字形容一下"通俗易懂，风趣幽默"，感觉非常有意思,忍不住分享一下给大家。点击跳转到教程前言：很多人刚开始用IDEA来学习编程，会发现下面这些图标。但是我们有时候并不知道它的含义和设置显示与隐藏，下面给大家讲解一下装订线图标位于左侧编辑器中。它们调用一些基本操作以及其他特定于框架和技术的功能。设置步骤File->Setting进到idea的设置页面。接
常用的pdf技术有哪些？--笔记我不是彭于晏灬 pdf 笔记
常用的pdf技术有哪些？1.iTextPDF：iText是著名的开放项目，是用于生成PDF文档的一个java类库。通过iText不仅可以生成PDF或rtf的文档，而且可以将XML、Html文件转化为PDF文件。Openoffice：openoffice是开源软件且能在windows和linux平台下运行，可以灵活的将word或者Excel转化为PDF文档。JasperReport：是一个强大、灵活
【科大讯飞笔试题汇总】2024-04-21-科大讯飞春招笔试题-三语言题解(CPP/Python/Java) 春秋招笔试突围最新互联网春秋招试题合集 python java 开发语言春招笔试互联网大厂笔试题
大家好这里是KK爱Coding，一枚热爱算法的程序员✨本系列打算持续跟新科大讯飞近期的春秋招笔试题汇总～ACM银牌|多次AK大厂笔试｜编程一对一辅导感谢大家的订阅➕和喜欢KK这边最近正在收集近一年互联网各厂的笔试题汇总，如果有需要的小伙伴可以关注后私信一下KK领取，会在飞书进行同步的跟新，5月1日之前限时免费领取哦，后续会由ACM银牌团队持续维护~。文章目录01.硬币最少组合问题问题描述输入格式输
vite中使用Web Worker 脚本
MDN对WebWorker的说明WebWorker为Web内容在后台线程中运行脚本提供了一种简单的方法。线程可以执行任务而不干扰用户界面。此外，它们可以使用XMLHttpRequest（尽管responseXML和channel属性总是为空）或fetch（没有这些限制）执行I/O。一旦创建，一个worker可以将消息发送到创建它的JavaScript代码，通过将消息发布到该代码指定的事件处理器（反
【java】注解 6<7 java 开发语言
注解什么是注解Annotation（注解）是从JDK5.0开始引入的新技术。Annotation的作用：不是程序本身必需的，但是可以对程序做出解释。可以被其他程序（比如编译器等）读取。Annotation的格式：注解是以“@注释名”在代码中存在的，还可以添加一些参数值，例如：@SuppressWarnings(value=“unchecked”)。Annotation在哪里可以使用?可以附加在pa
【java】反射 6<7 java python 开发语言
反射反射机制可以读取注解。反射的概念在Java中，通常情况下，我们在编译时就知道要使用的类和方法。但反射机制打破了这种常规，它允许程序在运行时动态地分析类、调用方法、操作字段等。也就是说，在运行时，程序可以根据需要来决定要使用哪个类、调用哪个方法、访问哪个字段，而不是在编译时就确定下来。反射的核心类Java反射机制主要涉及以下几个核心类：1、Class类Class类是反射机制的基础，它代表一个类或
深度解析Java中的代码分支策略规划：掌握GitFlow与GitHub Flow的艺术墨夶 Java学习资料2 java github 开发语言
在这个技术日新月异的时代，每一个开发者都在寻找提高效率、减少错误并优化团队协作的方法。而当涉及到代码管理时，选择正确的分支策略至关重要。今天，我们将深入探讨如何在Java项目中应用两种流行的分支策略——GitFlow和GitHubFlow，并通过详尽的示例代码来展示它们的实际运用。1.分支管理策略概览分支管理策略不仅帮助团队成员之间进行有效的沟通，还确保了代码库的健康状态。无论是小型创业公司还是大
Elasticsearch 介绍：分布式搜索与分析引擎吱屋猪_ elasticsearch
在如今大数据时代，企业和开发者面临着前所未有的数据量和实时性要求。为了能够高效地处理、存储和查询这些数据，Elasticsearch作为一种强大的分布式搜索引擎，已经成为了很多组织和开发者的首选解决方案。1.什么是Elasticsearch？Elasticsearch是一个开源的、基于ApacheLucene构建的全文搜索引擎。它提供了高效的搜索功能，并且非常适合处理大量数据，尤其是在需要快速搜索
https证书获取的方法及好处
获取HTTPS证书的多种方法及其优势✨在现代互联网环境中，HTTPS已成为保障网站安全的基本标准。获取HTTPS证书不仅能提升网站的安全性，还能增强用户信任度和提升搜索引擎排名。本文将详细介绍获取HTTPS证书的几种常见方法及其各自的优势，并通过图表和流程图帮助理解其工作原理。获取HTTPS证书的方法️1.购买商业证书购买商业证书是获取HTTPS证书的传统方式，适用于需要高信任度和额外保障的企业和
【VSCode】VSCode常用插件 Ctrl Z. vscode ide 编辑器
Chinese(Simplified)(简体中文)LanguagePackforVisualStudioCode：简体中文支持插件HTML/CSS/JavaScriptSnippets：支持HTML/CSS/JavaScript快速匹配输入HTMLSnippets：这个插件提供了一系列HTML代码片段，通过简单的缩写就可以快速生成常用的HTML结构。例如，输入!并按下Tab键，就可以快速生成一个完
java 实现数据库备份李逍遙️ mysql 数据库 java mysql
importcom.guangyi.project.model.system.DataBaseInFo;importjava.io.BufferedReader;importjava.io.File;importjava.io.FileOutputStream;importjava.io.IOException;importjava.io.InputStream;importjava.io.Inp
linux 安装jdk1.8 李逍遙️ linux 运维服务器
通过终端，使用wget命令下载JDK：wgethttps://download.java.net/openjdk/jdk8u41/ri/openjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz解压下载的文件。你可以使用tar命令解压：tar-xzfopenjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz将解压后的JDK移动到/op
实现一个完整的计算器（Java）李逍遙️
直接上代码importjava.awt.BorderLayout;importjava.awt.Color;importjava.awt.GridLayout;importjava.awt.event.ActionEvent;importjava.awt.event.ActionListener;importjavax.swing.JButton;importjavax.swing.JFrame;
java word转pdf三种方法（附有需要的jar）李逍遙️ word转pdf java
一.jacob1.jar下载jacob.jar和jacob-1.17-x64.dll下载提取码：01212.在jdk/bin目录下引入.dll文件（64位：jacob-1.17-x64.dll32位：jacob-1.17-x86.dll）3.转换代码importcom.jacob.activeX.ActiveXComponent;importcom.jacob.com.Dispatch;impor
LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人南七小僧人工智能网站开发 AI技术产品经理服务器数据库 windows
前言LangChain是一个用于开发由大型语言模型（LargeLanguageModels，简称LLMs）驱动的应用程序的框架。它提供了一个灵活的框架，使得开发者可以构建具有上下文感知能力和推理能力的应用程序，这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库：Python和JavaScript库。包含了各种组件的接口和集成，一个基本的运行时，用于将这些组件组合
泛型擦除和TypeToken liudachu java
泛型可以让代码更加通用，但同时也可能会导致一些类型信息在运行时丢失，这就是所谓的类型擦除。Guava的TypeToken帮咱们巧妙地解决了这个问题。第1章：泛型编程的挑战先来说说泛型。在Java中，泛型是一种在编译时进行类型检查的机制。它让咱们能在类、接口、方法中使用类型参数，比如List或者Map。这样的好处是代码更安全，更易读，同时还能重用。但是，泛型也有个大问题——类型擦除。听起来有点高深，
2025美团最新面试题—Java程序减少GC的设计程序员共鸣 java jvm 开发语言
1.对象复用与池化线程局部变量：通过ThreadLocal缓存线程私有对象，避免竞争。可变对象：优先使用可修改对象（如StringBuilder代替String拼接）。2.减少对象创建避免隐式装箱：使用基本类型（int而非Integer）。优化循环：避免在循环内创建临时对象。静态不可变对象：将常量声明为staticfinal（如配置参数）。3.数据结构优化预分配容量：初始化集合时指定合理大小（如A
探索 LangChain、Hugging Face、LM Studio 等 AI 应用工具 Alex程 langchain 人工智能
目录1.LangChainv0.2简介安装概念指南简单试用(1)模型选择(2)基础操作(3)更多操作Runnable调用链的连接Runnable并行自定义函数RunnableLambda额外assign参数(4)langchain.js2.HuggingFace简介如何调用API3.LMStudio简介LMStudio服务器JavaScript/TypeScriptSDK4.Dify.AI简介安装
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出