小小工匠

ElasticSearch - 海量数据索引拆分的一些思考

文章目录

困难
解决方案
- 初始方案及存在的问题
- - segment merge
  - 引入预排序
- 拆分方案设计
- - 考量点
  - 如何去除冗余数据
  - 按什么维度拆分，拆多少个
  - 最终的索引拆分模型演进历程
  - 整体迁移流程
  - 全量迁移流程
  - 流量回放
  - 比对验证
  - 异步转同步
  - 多索引联查
  - 优化效果
总结与思考
参考

困难

索引数据量亿+，查询请求耗时高，大量查询耗时超过 1s 的请求
数据的快速膨胀，带来了很大的资源消耗和稳定性问题, 比如如查询抖动等等
数据存在冗余，大量的冗余数据，带来了不必要的资源消耗
索引所在集群资源已接近瓶颈，但是扩容的话机器成本较高

解决方案

一开始从索引参数调整， forcemerge 任务引入等多个手段来缓解问题，但是伴随数据的快速膨胀还是遇到类似高命中查询等难以优化的问题，从而引出了索引拆分方案的探索与实施。

初始方案及存在的问题

我们先看看参数调整这些局限性的方案

segment merge

调大 merge 线程数，调大 floor_segment 值。通过更多的 merge 来降低，大量写入带来的 Segment 数增长引发的查询速率下降问题。

	"merge": {
          "scheduler": {
            "max_thread_count": "2",
            "max_merge_count": "4"
          },
          "policy": {
            "floor_segment": "5mb"
          }
        }

segment merge 操作对系统 CPU 和 IO 占用都比较高，从 es 2.0 开始，merge 行为不再由 ES 控制，而是转由 lucene 控制，因此以下配置已被删除：

indices.store.throttle.type
indices.store.throttle.max_bytes_per_sec
index.store.throttle.type
index.store.throttle.max_bytes_per_sec

改为以下调整开关：

index.merge.scheduler.max_thread_count
index.merge.policy.*

最大线程数的默认值为：

Math.max(1, Math.min(4, Runtime.getRuntime().availableProcessors() / 2))

是一个比较理想的值，如果你只有一块硬盘并且非 SSD，应该把他设置为1，因为在旋转存储介质上并发写，由于寻址的原因，不会提升，只会降低写入速度。

merge 策略有三种:

tiered
log_byete_size
log_doc

默认情况下：index.merge.polcy.type: tiered

索引创建时合并策略就已确定，不能更改，但是可以动态更新策略参数，一般情况下，不需要调整。如果堆栈经常有很多merge，可以尝试调整以下配置：

index.merge.policy.floor_segment: 该属性用于阻止 segment 的频繁 flush，小于此值将考虑优先合并，默认为2M，可考虑适当降低此值。
index.merge.policy.segments_per_tier：该属性指定了每层分段的数量，取值越小最终 segment 越少，因此需要 merge 的操作更多，可以考虑适当增加此值。默认为10，他应该大于等index.merge.policy.max_merge_at_once。
index.merge.policy.max_merged_segment: 指定了单个segment 的最大容量,默认为5GB，可以考虑适当降低此值。

引入预排序

索引预排序的引入，实测排序条件和预排序一致时，亿级索引有3倍左右的提升。但是由于业务多样性，导致命中预排序的场景只占一小部分。

	"sort": {
          "field": [
            "id",
            "gmtModified",
            "gmtApplied"
          ],
          "order": [
            "asc",
            "desc",
            "desc"
          ]
        }

优化索引字段类型，将精确匹配修改为 keyword ，范围匹配修改为数值类型。( ES 针对不同的字段类型，会采用不同的查询策略。keyword 使用 FST 的倒排索引方案，数值类型采用 BKD 方案。前者更适合精确匹配，后者对范围查询更优）。
增加索引的分片。当集群资源相对充足是有一定效果，但是如果没有新的数据节点加入，新增分片并不会有明显的性能提升。"number_of_shards": "5"
每天跑 forcemerge 任务，降低 Segment 数量，提升白天的查询性能。但是伴随索引体积越来越大， forcemerge 的时间越来越长，有时候整个晚上可能都无法结束。而且 forcemerge 期间，会造成一定的集群抖动，影响一些对请求耗时比较敏感的业务。
难以解决的高命中字段查询。在实践中发现，在大表中，如果某个查询字段命中了大量文档，在缓存失效的情况下，大量时间会消耗在在这个字段上。

拆分方案设计

由于目前常规的操作都已经做过，到目前阶段提升相对较小，所以只能从拆索引的方案去入手。在方案的设计中，我们主要有下面的一些考虑。

考量点

要实现不停机迁移。
要做到用户无感的底层数据表切换，支持流量逐步切换，用来观察集群压力，支持快速的回滚，用来应对可能出现的突发问题
能否去除全量xx索引，降低数据冗余，降低集群资源占用
按照何种维度去拆分，拆分后的索引是否会有数据倾斜问题
能否支持后续的二次拆分，伴随业务后续的发展，第一次拆分后的索引，在过了一两年后可能需要，进行二次拆分操作
能否在查询时，尽可能的要降低扫描的数据行数，从而来规避可能遇到的高命中字段影响。

如何去除冗余数据

重新划定的索引数据范围，将之前的全量xx索引数据，分散成三份索引数据。假设因为索引数据有交叉重复的部分，可以对这部分重复数据打上特殊标识，当三类型索引联查时，过滤掉该部分数据，解决数据重复问题。

按什么维度拆分，拆多少个

一个索引怎么拆，主要看使用的具体场景。

比如常见的日志索引，就是按日期滚动拆分。
对应我们目前场景，大约77%的请求会带上店铺ID ，就基础商品查询而言，有93%的查询都会带上店铺ID 。因此索引拆分最终是按照店铺维度去拆分。

最后就是拆多少个索引，每个索引多少分片。拆多少个索引，主要是看数据的分布，拆多个索引，可以保证每个索引上的数据大致相同，不会有严重的数据倾斜问题。每个索引有多少个分片，主要是评估拆完后每个索引有多少个数据，以及未来一段时间的增量。

最终的索引拆分模型演进历程

【原始索引模型】

保留基础索引和交易商品索引。把全量商品索引拆分，拆分后的整体全貌如下

拆分后需要进行【多索引联查】

整体迁移流程

整体迁移在设计中主要，分为流量收集，全量写入，增量写入，数据验证，写入方式的异步转同步等阶段。通过完整的迁移流程设计，来保证最终迁移的数据正确性。

全量迁移流程

该过程主要为历史数据的迁移，并填充历史全量索引的部分数据，重组后的商品数据，分散写入到拆分后的新索引中。

全量迁移需要做到两点，其中一个是数据不丢失，第二就是较快的迁移速率。对于第一点，主要解决手段，就是在全量迁移任务开启前，通过消息队列，收集所有迁移过程中的数据。

【数据拉取慢的问题】

在迁移过程中，我们遇到的第一个问题，就是全量数据拉取过慢问题。

就迁移速度而言，因为本次和一般的索引拆分不同，不是单纯的将一个索引的数据，按店铺拆分到多个索引上，而需要额外填充字段，所以 Reindex 并不满足。即使是通过先将一部分数据 Redinex 数据迁移到新集群上，再二次填充也不太满足，因为 ES 跨集群 Reindex 会限制并发数为1，同时需要将两个集群添加白名单，这个需要将集群进行重启，操作成本也相对较高。之所以不在原集群进行拆分的原因，是原集群的资源已经到达瓶颈，没有足够的磁盘和内存空间，承接新索引。

如何在不使用 Reindex 的情况下，保证迁移速率呢。首先我们尝试了 Scroll 方案，但是后续发现，对一个亿级索引做全表 Scroll 查询，单次拉取时间，保持在500-600ms左右，这个拉取时间严重不满足我们的需求。因为在全量数据迁移期间，增量数据要保持收集的，而商品每天平均有千万级别的更新请求，同时在晚上会有大量的数仓回流任务。如果整个迁移要持续好几天，会对在 MQ 中，积压大量的写入消息，不光会导致到时候流量回流时间过长，也可能导致 MQ 集群磁盘被打满。

【优化方案】

那么如何提升拉取的效率呢，要提升查询速率，可以通过降低单次扫描数据量，来单次降低查询耗时的方案。提升了单次查询耗时后，就需要将大任务进行拆分，多节点并行的方案，来提升整体的拉取效率。最终我们选择按商品创建时间来作为任务拆分的方案，一个是该字段不可变，第二个是每天商品创建量相对比较恒定，任务相对均匀。任务首先按应用节点拆分为节点级大任务，节点内再按天拆分为更小的任务。这样可以做到多任务并行，并可以根据 ES 集群的压力，通过扩充节点的方案来加快数据迁移。

任务执行总共分为两步即数据拉取和写入阶段，首先是数据拉取，该阶段主要负责从原索引获取数据，并填充上全量商品索引的部分字段，这一个阶段的拉取是通过 SearchAfter 方案进行拉取，因为整个迁移流程持续时间较长，部分任务有可能因为网络抖动等问题执行失败，利用 SearchAfter 可以做到任务断点续跑。

数据写入阶段，组装完的数据就需要按店铺 ID，选择索引，并写到新集群了。将读写任务进行拆分，可以提升整体的资源利用率，并方便进行拉取或写入的限流。过程中只需要做好失败任务的从事，并监控系统资源即可。

通过上述优化，迁移完所有全量数据，总计用时 5 个小时左右。

流量回放

在全量任务开始之前，我们将老索引的流量拷贝了一份，放入到了消息队列中，流量回放即是将这部分流量在全量任务结束后，进行回放到新索引上。

回放没有什么特别，但是有一定要注意。在我们的数据写入场景中，有一种一对多更新的任务，比如店铺名称更新等，如果这种增量流量和普通的商品主表流量一起回放，可能会造成，部分商品店铺信息未修改成功的问题。因为商品主表更新，和店铺信息不处在同一个任务源。如果在商品主表流量未追平之前，就开始进行店铺信息的修改，就会导致部分商品漏改的情况。因此整个回放流程是，商品主表增量流量追平后，再开始回放一对多更新流量。

比对验证

在迁移完成后要进行比对验证，验证数据和查询逻辑改造的正确性后，才能开启。

【文档比对】

文档对比，主要是新老索引文档内容进行比较，比对分两次，一个是正向比对，即通过新索引的 Query 到的数据，去和老索引进行比对。这次主要确认新索引上的字段与老索引保持一致。一个是反向比对，即通过老索引 Query 到的数据，去和新索引进行比对。这次主要解决比如类似新索引数据没有删除，部分商品可能缺失的问题。由于整个商品数量级比较大，且数据在频繁更新。比对主要采用的是抽样 DSL 语句比对。

【查询流量比对】

因为本次不光涉及到索引的拆分，还涉及索引的合并。合并必然会带来查询逻辑的变更。因为三类索引上存在对同一个商品属性不同的索引字段名的情况，比如商品的ID，有的索引叫 ID ，有的叫 ItemId 。此外还有查询时路由选择问题，这些查询侧的改动，需要对查询流量进行比对。

异步转同步

在迁移过程中，为了保障服务的稳定性，采用的是 MQ 异步写入新索引的方案。这样可以在灰度开放过程中，限制新索引的写入流量，同时不影响老索引的写入性能。在完全切换到新索引后，需要由异步写入切换回同步写入。考虑切换回去主要有两点考虑，一个是写入流程中，增加了一个可能的不稳定性因素。一个是可能发生由于某个业务域推送大量变更消息，引发的消息积压。比如大店铺的店铺名称变更操作等，这些大任务可能会阻塞用户正常的商品发布，下架等核心链路流程。

因为数据要求最终一致性，核心问题就是如何保证从 MQ 消费写入，更改为直接请求 ES 写入过程中，消息没有乱序。

这里主要就是用 Redis 的分布式锁达到一种节点间的分布式共识。这中间主要分为预备阶段，共识磋商阶段

【预备阶段】

首先在 Redis 中创建一把值为0成功锁，和一把值为0失败锁。

然后，当观察 MQ 中消费堆积的阈值比较低时，这时即可开启预备阶段。这样消费线程在投递到 MQ 队列之前，会先检测一下当前消息堆积值，当小于设定值时，进入共识磋商阶段。

【共识磋商阶段】

应用节点的消费者线程，进入该阶段后，会进行一定次数的自旋，并不投递消息，而是每隔 1s 去 Check 一下当前 MQ 队列的堆积值，如果连续两次 Check 到堆积值为 0，就在 Redis 中把成功锁的值加一。后续执行过程中，如果发现成功锁的值等于参加的节点数，直接将数据写入到 ES 。

期间如果有一个节点发现，自己超过设定的自旋次数，就会将失败锁加一，同时将消息投递到 MQ 中，其他节点发现失败锁大于0后，也会结束自旋，将数据投递到 MQ 中。后续可以再通过调整自旋次数等参数，直到所有节点全部达成一致。

这样就通过秒级的消费暂停，达到了 MQ 队列下线的效果。

多索引联查

解决了数据迁移的问题后，关键的问题就是要提升查询的效率，降低查询 RT ，提升请求 QPS 。一般来讲当查询遇到瓶颈，我们往往都会通过建索引，分库分表，历史归档等操作。这些操作之所以能提升查询性能，就在于能降低要扫描的数据规模。越早地降低数据规模，就代表更低的 CPU，磁盘， IO，内存，网络等开销。因此在设计拆分后的索引查询时，也要尽可能地降低要扫描的数据规模。在本次设计中，我们引入了请求改写、索引选择、返回体修改三个功能模块。

【请求改写】

当接收到用户请求后，首先要进行一次请求改写。

这一步主要有两个目的，一个是要将 DSL 语句改写为3种索引都兼容的格式，因为后续这个语句可能要扫描所有类型的索引。

还有一个是解决基础商品索引和交易商品索引中重合的那一部分数据。目前的解决方案是在基础商品索引中做上标识，在出现基础商品索引和交易商品索引联合扫描时，排除掉基础商品索引中的数据。

【索引选择】

整体上有两次降低数据规模的机会，在查询进来时，尝试判断用户要看哪一类的商品，基础商品还是交易商品等，这一路如果成功，可以减低 50% 左右的数据规模。在下一步判断供应商所在的具体索引，这一步可以进一步降低要扫描的数据规模。通过两次索引推荐可以降低绝大部分查询要扫描的数据量。后续可以再对全表扫描的请求做针对性优化和限流控制，即可保障整体的稳定性。

优化效果

在索引拆分完成后，我们达到了如下效果。

总结与思考

本次主要通过索引的拆分与合并，来提升查询性能，同时降低整体集群的资源使用量。过程中我们探索了在线数据的跨集群迁移，多索引联合查询的应用，数据写入的同步异步切换等，希望能够为大家提供解决 ES 大规模数据检索的瓶颈，提供参考。

虽然本次相对比较平滑的完成了索引的拆分，但是需要耗费大量的开发和测试资源。伴随业务的快速发展，遇到数据瓶颈的业务线，可能有会逐渐增多，如果届时每个业务域要独自开发和测试，成本还是相对较高的。

后续可能考虑将 ES 的索引层和存储层进行分离，通过引入类似 TiKv 或 HBase 等可以无限扩充的 KV 存储来替代 ES 的存储层。通过 KV 存储，来重建 ES 索引。这样可以做到业务方配置化的索引拆分，分片扩容等，无需任何的开发，进一步的降本增效。

参考

ES亿级商品索引拆分实战

JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
【前端】jQuery数组合并去重方法总结
在jQuery中合并多个数组并去重，推荐使用原生JavaScript的Set对象（高效简单）或$.unique()（仅适用于DOM元素，不适用于普通数组）。以下是完整解决方案：方法1：使用ES6Set（推荐）//定义多个数组constarr1=[1,2,3];constarr2=[2,3,4];constarr3=[3,4,5];//合并数组并用Set去重constmergedArray=[...
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
日历插件-FullCalendar的详细使用老马聊技术 JavaScript 前端 javascript
一、介绍FullCalendar是一个功能强大、高度可定制的JavaScript日历组件，用于在网页中显示和管理日历事件。它支持多种视图（月、周、日等），可以轻松集成各种框架，并提供丰富的事件处理功能。二、实操案例具体代码如下：FullCalendar日期选择body{font-family:Arial,sans-serif;margin:20px;}#calendar{max-width:900
react-native android 环境搭建
环境：macjava版本：Java11最重要：一定要一定要一定要react涉及到很多的依赖下载，gradle和react相关的，第一次安装环境时有外网环境会快速很多。安装nodejs安装react-nativenpminstallreact-native-clinpminstallreact-native创建一个新项目react-nativeinitfirstReact替换gradle下载源rep
Java 调用 HTTP 接口的 7 种方式：全网最全指南
Java调用HTTP接口的7种方式：全网最全指南在开发过程中，调用HTTP接口是最常见的需求之一。本文将详细介绍Java中7种主流的调用HTTP接口的方式，包括每种工具的优缺点和完整代码实现。1.使用RestTemplateRestTemplate是Spring提供的同步HTTP客户端，适用于传统项目。尽管从Spring5开始被标记为过时，它仍然是许多开发者的首选。示例代码importorg.sp
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
javascript高级程序设计第3版——第12章 DOM2与DOM3 weixin_30687587 javascript 数据结构与算法 ViewUI
12章——DOM2与DOM3为了增强D0M1，DOM级规范定义了一些模块。DOM2核心：为不同的DOM类型引入了一些与XML命名空间有关的方法，还定义了以编程方式创建Document实例的方法；DOM2级样式：针对操作元素的样式而开发；其特性总结：1.每个元素都有一个关联的style对象，可用来确定和修改行内样式；2.要确定某个元素的计算样式，可使用getComgetComputedStyle（）
Java设计模式实战：高频场景解析与避坑指南 mckim_ 笔记学习 java 设计模式
引言设计模式是软件开发的基石，但许多开发者面对23种模式时容易陷入“学完就忘”或“滥用模式”的困境。本文从工业级项目视角出发，精选10种高频设计模式，结合真实代码案例与主流框架应用，帮你建立模式思维，拒绝纸上谈兵。一、创建型模式：告别new的暴力美学1.工厂方法模式（FactoryMethod）核心痛点：对象创建逻辑散落各处，难以统一管理。场景案例：电商平台需要支持多种支付方式（支付宝、微信、银联
JavaScript 基础09：Web APIs——日期对象、DOM节点梦想当全栈 JavaScript javascript 前端开发语言
JavaScript基础09：WebAPIs——日期对象、DOM节点进一步学习DOM相关知识，实现可交互的网页特效能够插入、删除和替换元素节点。能够依据元素节点关系查找节点。一、日期对象掌握Date日期对象的使用，动态获取当前计算机的时间。ECMAScript中内置了获取系统时间的对象Date，使用Date时与之前学习的内置对象console和Math不同，它需要借助new关键字才能使用。1.实例
《Java前端开发全栈指南：从Servlet到现代框架实战》
前言在当今Web开发领域，Java依然是后端开发的主力语言，而随着前后端分离架构的普及，Java开发者也需要掌握前端技术栈。本文将全面介绍JavaWeb前端开发的核心技术，包括传统Servlet/JSP体系、现代前端框架集成方案，以及全栈开发的最佳实践。通过本文，您将了解如何构建现代化的JavaWeb应用前端界面。一、JavaWeb前端技术演进1.1传统技术栈Servlet：JavaWeb基础，处
javaSE面试题---语法基础、面向对象、常用类、集合、多线程、文件和IO yang_xiao_wu_ java 面试开发语言 javase java基础多线程文件和IO
目录语法基础1.jdkjrejvm区别2.基本数据类型3.引用数据类型4.自动类型转换、强制类型转换5.常见的运算符6.&和&&区别7.++--在前和在后的区别8.+=有什么作用9.switch..case中switch支持哪些数据类型10.break和continue区别11.while和dowhile区别12.如何生成一个取值范围在[min,max]之间的随机数13.数组的长度如何获取？数组下
JAVA 高频八股文 Day03 Conqueror675 java 开发语言
12.TCP和Http的区别是什么TCP是传输层协议，负责建立可靠的点对点连接，确保数据有序、完整地传输（如铁路轨道）；HTTP是应用层协议，基于TCP构建，定义了Web服务交互的报文格式和规则（如货运订单）。TCP关注数据如何可靠送达，通过三次握手建立连接、流量控制等机制保证传输；HTTP关注传输内容的意义，提供请求/响应语义（GET/POST等）和无状态通信。补充：说一下什么是三次握手四次挥手
JVM字节码加载与存储中的细节
问题引出：为什么Java定义int型变量为32767时使用的是bipush32767，而定义int型变量为32768时使用的是ldc#4？在Java中，如果这样定义int型变量：publicclassTest{publicstaticvoidmain(String[]args){inti=0;intj=5;intk=6;intm=32768;intn=32767;}}变量对应的字节码文件内容是这样
JVM与Spring Boot核心解析 AIHacksCash Java场景面试宝典 Java JVM Spring Boot
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
HashMap的Get(),Put()源码解析 Ttang23 哈希算法散列表算法
1、什么是HashMap？HashMap是Java中用于存储键值对（Key-Value）的集合类，它实现了Map接口。其核心特点是：无序性：不保证元素的存储顺序，也不保证顺序恒定不变。唯一性：键（Key）不能重复，若插入重复键会覆盖原有值。允许null：允许一个null键和任意数量的null值。非线程安全：相比HashTable，HashMap不支持同步，性能更高。2.核心数据结构：哈希表（Has
Java中的Tomcat，开启Web应用腾飞【基础版】
目录一、Tomcat初登场：揭开神秘面纱（一）啥是Tomcat（二）为啥要有Tomcat二、Tomcat的安装与启动：开启第一步（一）下载Tomcat（二）启动Tomcat三、Tomcat的目录结构：探秘内部布局（一）核心目录介绍（二）目录间的协同工作四、部署JavaWeb应用到Tomcat：让应用上线（一）打包Web应用为WAR文件（二）部署WAR文件到Tomcat五、Tomcat的配置优化：让
Java Web 之 Session 详解艾伦~耶格尔 java 开发语言后端前端 session
在JavaWeb开发中，Session就像网站的专属记忆管家，为每个用户保管着重要的信息和状态，确保用户在网站的旅程顺畅无阻。场景一：想象你去一家大型超市购物，推着购物车挑选商品。这个购物车就如同Session，它记录了你的购物信息，方便你在结账时一次性结算。场景二：你在玩一个在线游戏，登录账号后，你的游戏进度、等级、装备等信息都会被保存在Session中，即使你中途关闭游戏，下次登录时依然可以继
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
JavaScript之DOM操作与事件处理详解 AA-代码批发V哥 JavaScript javascript
JavaScript之DOM操作与事件处理详解一、DOM基础：理解文档对象模型二、DOM元素的获取与访问2.1基础获取方法2.2集合的区别与注意事项三、DOM元素的创建与修改3.1创建与插入元素3.2修改元素属性与样式3.2.1属性操作3.2.2样式操作3.3元素内容的修改四、DOM元素的删除与替换4.1删除元素4.2替换元素五、事件处理：实现页面交互5.1事件绑定的三种方式5.1.1HTML属性
V少JS基础班之第五弹 V少在逆向 JS基础班 javascript 开发语言 ecmascript
文章目录一、前言二、本节涉及知识点三、重点内容1-函数的定义2-函数的构成1.函数参数详解1）参数个数不固定2）默认参数3）arguments对象（类数组）4）剩余参数（Rest参数）5）函数参数是按值传递的6）解构参数传递7）参数校验技巧（JavaScript没有类型限制，需要手动校验）2.函数返回值详解3-函数的分类1-函数声明式：2-函数表达式：3-箭头函数：4-构造函数：5-IIFE：6-
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj