字节跳动云原生计算

数据库顶会 VLDB 2023 论文解读 - Krypton: 字节跳动实时服务分析 SQL 引擎设计

“Krypton 源于 DC 宇宙中的氪星，它是超人的故乡，以氪元素命名”。

引言

近些年，在复杂的分析需求之外，字节内部的业务对于实时数据的在线服务能力也提出了更高的要求。大部分业务不得不采用多套系统来应对不同的 Workload，虽然能满足需求，但也带来了不同系统数据一致性的问题，多个系统之间的 ETL 也浪费了大量的资源，同时对于研发人员来讲，也不得不学习维护多套系统。为了解决这个问题，我们开启了 Krypton 项目，这是字节跳动基础架构计算-实时引擎，创新应用中心，存储-HDFS & NoSQL 团队共同合作研发的新一代面向复杂业务的实时服务分析系统（HSAP: Hybrid Serving and Analytical Processing），希望能在应对大数据复杂分析场景的同时，也能满足业务对于实时数据在线服务的需求。

论文链接： https://www.vldb.org/pvldb/vol16/p3528-chen.pdf

背景与介绍

上图是字节典型的广告后端架构，数据通过 Kafka 流入不同的系统。对于离线链路，数据通常流入到 Spark/Hive 中进行计算，结果通过 ETL 导入到 HBase/ES/ClickHouse 等系统提供在线的查询服务。对于实时链路，数据会直接进入到 HBase/ES 提供高并发低时延的在线查询服务，另一方面数据会流入到 ClickHouse/Druid 提供在线的查询聚合服务。这带来的问题就像引言中所说，数据被冗余存储了多份，导致了很多一致性问题，也造成了大量的资源浪费。为了解决这个问题，我们设计了 Krypton（HSAP），系统的设计目标主要有几个点：

可伸缩。我们希望设计一款能够应对各种 Workload 的系统，对于不同的 Workload，系统的各个组件都可以自由的进行伸缩。
高并发低时延。为了应对线上 Serving 场景的需求，系统需要能够满足百万级别的并发和毫秒级别的时延需求。
数据强一致。我们的客户希望数据能够实现原子性导入，并能够支持 Snapshot Read。
高时效性。大部分用户都需要数据亚秒级别可见，部分 Serving 场景下，用户需要数据毫秒级别的可见。
高吞吐导入。大数据场景下，导入性能十分关键。
标准 SQL 支持。用户很多都是从 MySQL 这样的系统迁移过来，所以 ANSI SQL 的支持对于用户的迁移十分关键。

系统概览

数据模型

如图所示，Krypton 支持两层分区，第一层叫做 Partition，第二层我们称为 Tablet，每一层都支持 Range/Hash/List 的分区策略。每个 Tablet 都包含一组 Rowsets，每个 Rowset 内部数据按照 Schema 中定义的 Sort Key 排好序。 Rowset 有版本号的概念，同一个 Primary Key 对应的行可能在不同的 Rowset 中存在多份，读的时候多个版本的数据会按照不同的 Merge 算法合并为一份。Tablet 的 Commit Version 为该 Tablet 下 Rowset 的最大版本号，比如上图中 Tablet 2 的 Commit Version 为 Rowset 5 的版本号 21。每个 Query 都会带上数据的版本号从而实现 Snapshot Read。

根据不同的合并算法，Krypton 支持了三种表模型：

Duplicate Table：相同的行存在多份。
Unique Table：系统需要定义 Primary Key（PK），相同的 PK 只会存在一份，高版本覆盖低版本。
Aggregate Table：和 Unique Table 类似，需要定义 PK，但是相同 PK 多行的合并算法不同列可以自定义。

架构

如上图所示，Krypton 的架构有如下几个特点：

存算分离
1. Krypton 的数据存放在了 Cloud Store 上，例如：HDFS、标准对象存储接口 S3 等；元数据也放在了外部的存储系统中，例如：ZK 及分布式 KV 等系统。
读写分离
1. Ingestion Server 负责数据的导入，Compaction Server 负责将数据定期 Merge。数据导入后，Ingestion Server 会写 WAL，同时数据进入内存 Buffer，Buffer 满了 Flush 成列存文件到 Cloud Store 上，并向 Meta Server 注册新的数据，更新相关的 Tablet 的 Commit Version。
2. Coordinator 和 Data Server 组成了读链路，Coordinator 会访问 Meta Server 得到 Schema 和数据的最新版本号，生成分布式执行 Plan 下发给 Data Server，Data Server 负责 Query Plan 的执行。Krypton 的 Query Processor 采用了 MPP 的执行模式。
3. 为了提供更好的数据可见性，我们支持了 Dirty Read 的功能，也就是 Data Server 可以直接访问 Ingestion Server 内存中的数据，提供毫秒级别的数据可见性。
Cache
1. 为了支持在线 Serving 低时延的需求，我们在 Cooridinator 支持了Metadata Cache, Plan Cache 和 Result Cache。在 Data Server 内部支持了数据的多级 Cache，包括 DRAM、PMEM 和 SSD 多种介质。为了减小毛刺，我们还支持 Cache 的预热功能，新的数据在注册到 Meta Server 之前会通知 Data Server 先行加载。

物化视图

Materialized View（MV）无论在 Serving 场景还是在 AP 场景下都扮演了一个十分重要的角色。 Krypton 基于自己的架构特点，实现了一套单表实时强一致的 MV 策略，并且 MV 无需与 Base Table 保持相同的分区策略。

MV Maintainance

在 Ingestion Server 内部，当 Base 表内存里的数据需要 Flush 的时候，会执行 MV Query 将这部分内存的数据转换成 MV 的数据，MV 的数据与 Base 表的数据会执行原子性的 Flush，都 Flush 成功后，会向 Meta Server 注册，原子性的更新 Base 表与 MV 的版本号，保证了 MV 与 Base 表的数据一致性。

Query Rewrite

这里介绍了一种比较特殊的改写场景，这个场景也是来自于字节内部业务。原始 Query 是对一个时间窗口内的数据做聚合，比如如下的 SQL：

由于需要聚合的数据量比较大，线上对于这样的 Query Latency 要求比较高，所以我们采用了 MV 来加速这个 Query 的执行，具体做法如下：

为原始表创建两个 MV，一个按照天聚合，一个按照小时进行聚合。
将 Query 中的时间窗口拆分成三部分：
1. 2022- 05-01 00:00:00 - 2022-05-09 00:00:00
2. 2022-05-09 00:00:00 - 2022-05-09 14:00:00
3. 2022-05-09 14:00:00 - 2022-05-09 14:12:15
对于 2.a 的时间窗直接查询天级别的 MV，2.b 的时间窗查询小时级别的 MV，2.c 的时间窗查询明细表，最后将三部分的结果 Merge 到一起。

整个 Query 的改写由 Optimizer 自动完成，用户无需感知。

Automatic Data Model Derivation

另外，MV 作为一种特殊的表，也可以选择使用不同的表模型，Krypton 基于 Base 表的表模型和 MV Query 可以自动推导出 MV 的表模型，减轻用户的负担。

Query Processor

Krytpon 实现了 Push-based 的向量化引擎，并采用了基于 Coroutine 的异步调度执行框架。以上图为例，展示了一个 Query 的执行流程。Coordinator 会把优化过的 Query 生成 Fragments 并下发给一组 Data Servers 来执行。比如上图的 Query 生成了两组 Fragments：Fragment 0 和 Fragment 1。Fragment 1 负责执行两表的 Scan 并进行 Colocate Join，生成的结果 Shuffle 给 Fragment 0 所在的 Data Server，Fragment 0 负责将数据聚合在一起后被 Coordinator 定期的取走。其中 Fragment 1 内部还会被切分成多个 Pipe，每个 Pipe 都由一组 Operators 组成，这些 Pipe 的执行逻辑上不会阻塞。不同的 Pipe 之间通过一个 Local Exchanger 的算子连接起来，不同的 Pipe 可以设置不同的并发度。

统计信息与 Query Cache

Query Cache
1. Cache Maintainance: 为了防止使用过期的数据，在 Cache Key 中加入了版本号的信息，并且后台有个线程定期的与 Meta Server 中的数据版本进行对比，并移除掉过期的 Cache Entry。
2. Plan/Stats/Result Cache: Coordinator中会把Query plan cache住，对于一些Query Fragment的selectivity估算信息也会cache下来，最后Query 执行的结果也会被Cache 住，这种通常使用在数据不经常更新，相同 Queries 比较多的场景下。另外，Krypton 也会 Cache Query 执行的一些中间结果，可以更有效的被其他的 Query 使用。
Statistics
1. Incremental Stats: Krypton 动态的维护了 Table Row Count 和 Column 的 NDV。NDV 使用了 HLL 来进行增量的计算。Ingestion Server Flush 数据的时候，会把内存中数据的 Row Count 与 HLL NDV 计算出来提交给 Meta Server。
2. Dynamic Sampling: 对于 Filter Selectivity 的预估，Krypton 在 Plan 阶段会直接发一个 Sample Query Plan Fragment 来收集统计信息，TPCH-1T 的测试集上，Sample 数据的统计预估和支持数据的统计值只相差 1%，Sample Query 执行的 Overhead 不超过执行时长的 2%。另外我们的 Query 在执行完毕后，会收集一些轻量的统计信息和结果一起返回给 Coordinator 帮助优化器更新统计信息。

并发控制

Krypton 使用了静态和动态相结合的方式来决定 Query 执行的并发度。

在 Plan 阶段，Optimizer 会根据 Data Server 的数目，来决定 Fragment 级别和 Pipe 级别的并发度，这么做可以避免动态修改 Plan 带来的额外开销，并且可以尽可能的去掉 Local Exchanger 避免数据的 Shuffle。
在执行阶段，每个 Pipe 对应一个 Execution Task，Task 会交给一个相应的 Coro Thread 来执行，具体执行的并发度以及执行的顺序，是由底层 Coro-scheduler 根据当前系统的情况动态的决定的。我们可以给不同 Task 设置不同的 Priority，当碰到优先级更高的task时，Coro-scheduler会动态的减少在途的task对应的coro-threads数目。另外 Coro-thread 相比 pthread 而言，Context Switch 的开销要小很多，并且 IO 操作可以异步化，这样做能够更充分的利用 CPU。

资源隔离

Serving 与 AP 的 Workload 相差较大，因此资源隔离对于混合 Workload 的场景十分重要，Krypton 实现了两级的资源隔离策略。

1.DS Instance 粒度的资源隔离

由于 Krypton 采用了云原生部署的模式，每个 DS Instance 对应一个容器，因此我们完全可以把 DS Instance 划分成多个 Resource Group，不同的 Workload 通过 Resource Group 实现隔离。由于 Krypton 存算分离的特点，多个 Resource Group 可以共享一份数据。对于一些临时的 ETL Queries，Krypton 可以快速拉起一些资源进行处理，处理完后再将资源释放。

2.DS 内部基于 Coro 的资源隔离

在同一个 Resource Group 内部，不同的 Query 也需要进行隔离，Krypton 提供了一个基于 Coroutine 的公平调度策略。如图 6 所示，每一个 Core 都绑定了一个 Task Group，它管理了所有分配给它的 Tasks，这里每个 Task 对应一个 Coro-thread，在执行期间，Task 被提交到 Local Task Queue 中等待执行，在一段时间 t 之后，没有完成的 Local Task 会被放进 Global 的 Time-slicing Queue 中。当 Local Task Queue 空了的时候，对应的 Task Group 会到 Global Queue 里面取 Tasks，其中 Global Queue 的优先级是基于每个 Task 已经消耗得 CPU Time。这便是公平调度算法的基本原理。

Serving 场景下特有的优化

1.Lightweight API

在 Serving 场景下，通常每个 Query 都不是很复杂，返回的结果数量也不多。因此 Coordinator 当发现生成的是一个 Single Node Plan 的时候，便会直接调用相应 DS 的 Lightweight API 来获取结果。Lightweight API 避免了大 Query 下多次 RPC 通信的问题，也避免了大量的线程切换。

2.Dirty Read

对于时效性要求比较高的场景，我们提供了 Dirty Read 的功能。Coordinator 带着 Commited Version 将 Query 下发给 DS 后，DS 去 Ingestion Server 内存里获取 Uncommited 的那部分数据，返回后和 Committed 的数据进行合并。Ingestion Server 在把内存中的数据 Flush 到 HDFS 后，还会把这部分数据多 Cache 一段时间，保证 Dirty Read 的 Request 一定能拿到 Committed Version 之后的那部分数据，不会出现数据空洞。

多级 Cache

为了满足性能的需求，Krypton 在 Data Server 内部实现了一个多级 Cache，可以使用 DRAM、PMEM 和 SSD 来作为 Cache 的存储介质。如下图所示，Cache 模块包含了三个部分：Cache Index、Replacement Policy 和 Cache Storage Engine。

Replacement Policy

AP 经常需要扫描大量的数据，但是 Serving 具有明显的数据访问局部性。因为我们的 Cache 的替换策略为了保证 Serving 的性能，需要具有“抗扫描”的特性。

我们选择了 SLRU 作为我们的 Cache 替换策略。除了具有“抗扫描”的特性之外，这个策略对于访问已经在 Cache 中的数据无需再次加锁，并且相对于 MemCached 的 SLRU，我们使用了无锁 Hash Table 来存储 Cache Index，进一步减少了锁带来的开销。与 FIFO 策略相比，在 Serving 场景下，我们的策略在 P99 Latency 上有 28%的提升。

NUMA-Aware Async PMem Write

PMem 在读的 Latency 和吞吐上具有优势，但是写的带宽是性能瓶颈。 PMem 写带宽仅为 DRAM 写带宽的六分之一，低于读带宽的并发访问水平，并且在跨 NUMA 节点访问时性能还会剧烈下降。

Krypton 实现了一套基于 NUMA 的异步写策略来提高 PMem 写入的性能。如上图所示，每一个 PMem 设备都有一个写线程池对应，并且绑定在了一个 NUMA 节点上，负责所有对这个 PMem 设备的写入。异步的写任务会被分配给对应的线程池处理。经过测试，在每个 Thread Pool 有 3 个 Thread 的情况下，PMem 的写入性能提高了 23%。

ZonedStore Based SSD Cache

SSD Cache 可以让 Krypton 尽可能多的把数据 Cache 在本地，并且当系统重启的时候可以快速的 Warm Up。在字节内部，大部分的 SSD Cache 都是使用了类似于 Rocksdb 这种 LSM Tree 架构的 KV 存储，但是 LSM Tree 并非为 SSD Cache 所设计，他造成了大量的空间浪费和读写放大。为了解决这个问题，我们设计了 ZonedStore。

ZonedStore 把 SSD 切分成了多个相等大小的 Zones，其中只有一个 Zone 是可写的，新写入的数据会顺序的追加写在当前可写 Zone 中，这可以减少 SSD 内部的写放大。因为在 ZonedStore 中，大部分的 Cache Item 都大于 4kb，这让我们可以把所有 Items 的索引放在内存中来加速查询，减少读放大。为了在重启的时候提高 Index Recovery 的速度，我们会将一个 Summary Segment 写入到 Zone 的最后。

ZonedStore 是按照 Zone 的粒度来回收空间。每个 Zone 的垃圾比率和访问频率会在内存中的 Zone Metadata 中记录，GC 的策略会选择垃圾比例高访问率低的 Zone 来回收。对于淘汰的 Cache Item，我们会标记为 Soft-deleted，因为 Krypton 中 Cache 的数据是 Immutable 的，所以这些 Cache Items 在被回收之前仍然是可以用来提供在线服务。 ZoneStore 为了控制 GC 带来的写放大，会直接把回收的 Zone 的有效数据也直接丢弃掉。

从上图中可以看到，无论在哪种 Workload 下，不管是 Latency 还是 Throughput，ZonedStore 相比 RocksDB 都有比较大的提升。

存储格式

为了同时应对 Serving 和 AP 两种 Workload，Krypton 设计了自己的存储文件格式。Data Page （1MB）是数据读写的基本单元，整个文件分成了 Data、Index、Meta 三部分，每一部分都是按照 Column 进行分区。处理 Query 时，先利用 Index 来过滤出需要读的 Data Page，然后再访问 Data Page。

Encoding and Index Algorithms

Krypton 使用了多种 Data Encoding 和 Index 来加速 Scan 与点查。为了快速定位数据的物理位置，用户可以在 DDL 中选择合适的 Index，Krypton 支持的 Index 如下：

Ordinal Index：根据行号快速查找目标的 Data Page。
Sparse Index：Min/Max、Bloom Filter 以及 Ribbon Filter，可以快速过滤掉无效的 Data Page。
Short-key Index：使用 Sorted Key 的前 36 个字节作为 Index Key 构建索引，是一种特殊的稀疏索引。
BitMap Index：可以根据等值的 Predicates 快速过滤出行号。
Skip Index：可以在一个 Data Page 内部快速定位数据的位置。

Nested Type Handling

在复合数据类型的处理上，Krypton 与 Dremel 不同，Dremel 只会存储叶子结点，Krypton 则会把所有的字段按照 B-tree 的方式组织，并把所有字段的数据顺序存储且独立分开。在非叶子结点中，存储了孩子节点的出现次数（Occurrence）和有效性（Validity）的信息；在叶子结点中，存储了数据。出现次数（Occurrence）表示子字段出现次数的前缀和，从而可以在获取重复数据的偏移量和长度时实现 O（1）的时间复杂度。因此，即使在嵌套和重复数据的情况下，我们仍然可以实现 O（m）的查找效率，其中 m 是 Schema Tree 的深度。有效性（Validity）用来区分这个 Field 是空还是 NULL。对于 NULL Field 我们不会存储任何的数据，对于存储稀疏数据提高了效率。相比 Dremel，我们的算法有两个优势：

稀疏字段具有更高的存储效率。
对于复合重复类型具有更好的 Seek 效率。

Query Engine Integration

Krypton 的存储格式设计与 Query Execution 深度绑定，为了尽可能的减少 IO，延迟物化和谓词下推被大量的使用。谓词过滤（Predicate Filtering）和列剪枝（Column Pruning）与推送下来的运行时过滤谓词（Push-down Runtime Filter Predicates）和文件索引一起在格式层进行处理。在读取过程中，首先使用能够匹配上索引的谓词来过滤出一组被选中的行号（Selection Vector）。接着，我们使用表达式框架来执行那些不能匹配上索引的谓词，进一步减少所选中的行号，并进行列裁剪。最后，我们根据 Selection Vector 中的行号来物化数据。另外 Krypton 还支持直接在编码的数据上直接进行计算，此时 Format 会把编码的数据直接返回给 QE。

我们与 Parquet 格式在 TPC-H 和 Magnus 数据集上做了一个对比测试，Magnus 是字节内部在 ML 场景上的一个数据集，大量使用了复合数据类型。从上面的表格中可见，Krypton Format 相比 Parquet，读性能在 TPCH 上提高了 21%，在 Magnus 上提升了 40%；在数据大小上，TPC-H 上，Krypton 增长了 13%，主要是因为 Krypton 内部的索引，但在 Magnus 上，Krypton 减少了 8%，这主要受益于在复合类型的高效存储。

实验

环境

实验环境：YCSB Workload C + TPC-H 1T
生产环境： 住小帮（注：字节跳动一站式家装家居服务平台）场景，这是一个典型的特征服务场景，需要对给定用户的任意特征做任意时间窗口内的聚合预算。数据持续导入，实时查询，查询 QPS 10K/s
集群配置： 8 台物理机（2.4GHz、48 Cores、96 vCPUs、128G DRAM、512G PMEM、2TB NVME、25G NICs）

Coordinators：2 台
Data Servers：3 台
Compaction Server：1 台
Ingestion Server：1 台
Metadata Server：1 台

Hybrid Performance

Resource Group Isolation

我们创建了两个 Resource Group 分别来承载 YCSB 和 TPCH 的 Workload，从表格 4 和图 9 可见，与分别运行 YCSB 和 TPCH-1T 相比，使用了 Resource Group 做隔离后，性能没有明显损耗。

Fair Scheduling

为了验证 Fair Scheduling 解决同一个 Resource Group 内部资源竞争的效果，我们在同一个 Resource Group 下运行了 TPCH-Q6 和 Q21，分别代表了短 Query 和长 Query。

所有的 Query 都从 1 个 Client 开始，然后 Q6 的 Client 数目按照 1、2、4、8 递增。

从图 10 中，我们可以看到：

在没有 Fair Scheduling 的情况下，随着 Q6 并发的增加，Q21 的性能回退明显；
在有了 Fair Scheduling 之后，我们给 Q21 和 Q6 分配的资源分别为 20%和 80%，Q21 的 Latency 随着客户端的数目只有轻微增长。

在图 11 中可以看到，当开始运行 Q6 的时候，Q6 并没有完全用完自己的资源（80%），只用了大概 53%，Fair Scheduling 可以自适应的将剩余的 27%的资源分配给 Q21 运行。随着 Q6 客户端数目的增加，Q6 和 Q21 都用满了自己所拥有的资源。

Adaptive Parallelism Control

为了验证我们自适应并发控制的效果，我们使用了 4 个客户端（G0 - G3），每一个客户端会按照最大的并发度重复的发送 Q6。从图 12 中可见，只有 G0 的时候，在充足的 CPU 资源下，完全可以按照最大的并发度来执行。随着我们启动 G1 - G3，CPU 资源出现竞争，最后每个 Client 所运行的 Coro-threads 也动态的发生了改变。

Production Performance

Effects of Optimizing Time Range Queries

为了测试使用 MV 改写 Time Range 查询的效果，我们使用了线上住小帮的真实 Workload。Query 如下：

我们固定了结束时间，然后动态的改变起始时间，整个 Time Range 从 10 分钟到 10 个小时。

Effects of Lightweight API

我们对比测试了线上 10K QPS 下的 Latency，在打开 Lightweight API 后，Query P99 Latency 下降了 45%。

Data Freshness of Streaming Ingestion

Data Freshness 定义为一条数据导入后到能查询到的时间间隔。图 15 可以看到，Data Freshness P99 的 Latency 一直保持在 15ms 左右，并且不会随着导入速率的升高而变化。

Read/Write Scenario in Production

住小帮是典型的读写混合场景，每天 18:00-22:00 是高峰期，期间导入速率提高 460%，查询 QPS 提高 300%，由于 Krypton 采用了读写分离的架构，图 16 可见，Query P99 的 Latency 在高峰期并没有很大变化，并一直保持在 60ms 以内。

总结

在整个 Krypton 的设计研发和上线过程中，我们学到了很多很有用的经验：

Krypton 大部分的业务方之前使用的 Doris，Doris 周边的生态工具建设的也比较完善。因此我们一开始就决定接口层面，数据模型全面兼容 Doris。得益于此，后续用户在从 Doris 迁移时并没有碰到特别大的阻力，之前的一些生态也可以继续使用。
在用户场景中寻找机会进行优化。比如我们发现有的用户 QPS 很高，但是查询模式基本固定，只是一些过滤条件不一样，这时候 Result / Plan Cache 就发挥了很大的作用。还有一些技术，比如支持压缩的 WAL，全异步的写链路对于在高速写入场景中起了巨大的作用。
通过在线的流量进行测试。Krypton 是一个非常复杂的系统，并且用户对于新系统的稳定性通常持怀疑态度。因此我们开发了一套线上流量的双读双写框架，灰度线上流量到 Krypton，待系统稳定运行后再进行流量切换。

你可能感兴趣的:(sql,大数据,云原生)

java 同步redis到mysql_Yii2 redis同步数据到mysql 兰艳知己 java 同步redis到mysql
将redis数据写入mysql中：本次案例讲解将如何将商城中商品浏览次数通过缓存记录并写入mysql中具体的redis安装过程暂且就省略了.....一、安装redis插件|配置rediscomposerrequireyiisoft/yii2-redis找到common的config文件，在components下加入redis配置参数'redis'=>['class'=>'yii\redis\Con
时序数据库 TDengine × SSRS：专为工业、能源场景打造的报表解决方案
每当听到“做报表”三个字，是不是内心都会先叹口气？尤其在工业、能源、制造等场景，面对那些结构固定、字段繁多、格式要求严苛的报表任务，用Excel手动拼，真的是既费时又容易出错。现在解决方案来了——时序数据库TDengine与SQLServerReportingServices（SSRS）已经完成无缝集成！高性能时序数据库+企业级报表平台，帮你用更少的操作、更高的效率，制作出更稳定、更规范的专业报表
Hutool TreeUtil快速构建树形数据结构 yifanghub 工具类 java
在管理菜单、部门结构等场景时，我们经常需要将数据库中的层级数据转换为树形结构。本文将通过Hutool的TreeUtil工具类，实现零递归快速构建树形结构。一、环境准备JDK1.8+SpringBoot2.xHutool5.8.16MySQL8.0二、数据准备--创建部门表CREATETABLE`sys_dept`(`id`intNOTNULLAUTO_INCREMENT,`dept_name`va
从0到1：SQL注入与XSS攻防实战——数据库安全加固全攻略小张在编程 sql xss 数据库
引言2023年某电商平台用户数据泄露事件中，黑客仅用一行username='OR'1'='1的登录输入，就拖走了百万用户信息；另一家社交网站更离谱，用户在评论区输入alert('xss')，竟让千万级用户的浏览器成了“提线木偶”。这些看似简单的攻击，为何能撕开企业安全防线？今天我们就来拆解SQL注入与XSS的“作案手法”，并给出一套可落地的数据库安全加固方案——毕竟，防住这两类攻击，能解决80%的
使用 p6spy，拦截到持久层执行的sql及参数 Peter-OK 一些问题 p6spy sql
声明：文章内容是自己使用后整理，大部分工具代码出自大牛，但因无法确认出处，故仅在此处由衷的对无私分享源代码的作者表示感谢与致敬！本人在拦截到sql的基础上加了分析功能和异常告警功能1、导入p6spy的jar包，如果是maven项目引入pomp6spyp6spy3.9.12、修改datasource数据源的driverClassName驱动和url地址为com.p6spy.engine.spy.P6
SpringBoot3+JPA+MySQL实现多数据源的读写分离(基于EntityManagerFactory) 没刮胡子 java 软件开发技术实战专栏 SpringBoot3 JPA MySQL 多数据源读写分离
1、简介在SpringBoot中配置多个数据源并实现自动切换EntityManager，这里我编写了一个RoutingEntityManagerFactory和AOP（面向切面编程）的方式来实现。这里我配置了两个数据源：primary和secondary，其中primary主数据源用来写入数据，secondary从数据源用来读取数据。注意1：使用Springboot3的读写分离，首先要保证主库和从
Go内存压力测试：模拟与应对高负载 Go高并发架构_王工 golang 压力测试后端
一、引言在当今微服务架构和云原生应用盛行的时代，Go语言凭借其出色的并发处理能力和较低的资源消耗，成为构建高性能后端服务的首选语言之一。然而，随着业务规模的扩大和用户量的增长，我们的服务经常会面临突如其来的流量高峰和持续的高负载挑战。就像一辆汽车需要在极端条件下测试其性能极限一样，我们的Go应用也需要在上线前经受住内存压力测试的洗礼。这不仅能帮助我们发现潜在的内存泄漏和性能瓶颈，还能确保系统在高负
全栈运维的“诅咒”与“荣光”：为什么“万金油”工程师是项目成功的隐藏MVP？云原生水神职业发展系统运维运维
大家好，今天，我们来聊一个特殊且至关重要的群体：运维工程师。特别是那些在项目制中，以一己之力扛起一个或多个产品生死的“全能战士”。你是否就是其中一员？你的技能树上点亮了：操作系统、网络协议、mysql与Redis中间件、Docker与K8s容器化、Ansible与Terraform自动化、Go/Python工具开发、Prometheus监控体系、opentelemetry可视化，甚至要负责信息安全
MaxCompute数据迁移至OSS完全指南大模型大数据攻城狮 odps 大数据阿里云 maxcompute dataworks tunnel sdk oss
目录1.为什么要把MaxCompute的数据搬到OSS？2.工具与环境准备：别急，先把家伙事儿备齐3.迁移方式总览：选对路子事半功倍4.用DataWorks实现数据迁移：点几下鼠标就搞定4.1配置数据源4.2创建同步任务4.3调度与运行5.用INSERT语句写入OSS外部表：SQL爱好者的最爱5.1创建OSS外部表5.2插入数据6.用Tunnel命令行实现数据迁移：硬核玩家的选择6.1Tunnel
板凳-------Mysql cookbook学习（十一--------4)
唐宇迪机器学习实战课程笔记https://blog.csdn.net/weixin_54338498/article/details/128818007?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7ECtr-1-12881
麒麟V10安装部署达梦数据库（单机版）熊娜丽莎的微笑数据库运维开发 linux
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言1.单机部署过程1.1部署规划1.2数据库软件安装及环境配置1.2.1操作系统配置1.2.2数据库软件安装1.3使用dminit工具初始化实例1.4注册服务并启动实例1.5登录数据库1.6归档配置1.7定制备份策略1.8数据库参数优化1.9配置sql日志1.10迁移信息统计查询总结前言麒麟V10安装部署达梦数据库单机安装的
CentOS 7系统设置MYSQL每天定时备份 AMING20220827 MySQL mysql 数据库 centos
目录一、MySQL定时备份数据设置定时定时任务脚本如果出现问题："mysqldump:commandnotfound"备份MySQL数据库步骤二、连接MySQL一、MySQL定时备份数据设置定时定时任务脚本1.修改/etc/my.cnf文件#vim/etc/my.cnf增加本机、用户名、密码vim/etc/my.cnf[client]host=localhostuser=你的数据库用户passwo
有关慢查询SQL优化的思路 Yilena 业务场景方案分析以及优化方案 sql 数据库学习 MySQL 优化
目录一、什么是慢查询？二、如何定位？（一）通过命令行临时开启（二）通过配置文件永久开启(三）测试日志是否正常工作（四）分析日志三、慢查询常见原因四、优化思路（一）索引1.原因其一：未设置索引2.原因其二：索引失效3.原因其三：索引覆盖不全（二）SQL语句1.原因其一：返回结果存在冗余字段2.原因其二：子查询3.原因其三：多表JOIN过多4.原因其四：避免排序5.原因其五：避免使用NOTIN和!=（
【Flask】问题RuntimeError: A ‘SQLAlchemy’ instance has already been registered on this Flask app的处理方法 Tzq@2018 #flask flask
【Flask】RuntimeError:A‘SQLAlchemy’instancehasalreadybeenregisteredonthisFlaskapp.Importandusethatinstanceinstead.一、解决方案1.1、单例模式管理SQLAlchemy实例1.2、正确初始化应用1.3、模型文件中使用全局实例二、错误原因分析三、完整正确代码示例四、关键注意事项五、替代方案：延
Java程序设计（二十七）：基于SSM框架的OA办公自动化管理平台的设计与实现人工智能_SYBH 2025年java程序设计 java 数据挖掘开发语言 vue.js 后端人工智能 spring boot
1.项目概述办公自动化（OA，OfficeAutomation）管理平台是企业实现内部管理信息化的重要工具。本文提出并实现了一个基于Java的OA办公自动化管理平台。该平台基于SSM架构（Spring+SpringMVC+MyBatis），数据库采用MySQL，并通过HTML、CSS、JavaScript等技术实现用户界面。1.1平台功能简介平台提供了管理员、普通用户和部门三类角色，分别具有不同的
vivo Pulsar 万亿级消息处理实践（3）-KoP指标异常修复
作者：vivo互联网大数据团队-ChenJianbo本文是《vivoPulsar万亿级消息处理实践》系列文章第3篇。Pulsar是Apache基金会的开源分布式流处理平台和消息中间件，它实现了Kafka的协议，可以让使用KafkaAPI的应用直接迁移至Pulsar，这使得Pulsar在Kafka生态系统中更加容易被接受和使用。KoP提供了从Kafka到Pulsar的无缝转换，用户可以使用Kafka
【人工智能】Spring AI Alibaba，一个面向 Java 开发者的开源框架，它旨在简化将人工智能（AI）功能集成到应用程序中的过程。本本本添哥 A -AIGC 人工智能大模型人工智能 java spring
一、SpringAIAlibaba介绍SpringAIAlibaba是一个面向Java开发者的开源框架，它旨在简化将人工智能（AI）功能集成到应用程序中的过程。该项目基于SpringAI构建，并且是阿里云通义系列模型及服务在JavaAI应用开发领域的最佳实践。SpringAIAlibaba的目标是为开发者提供一套高层次的AIAPI抽象以及与云原生基础设施的深度集成方案，从而帮助他们快速构建智能应用
SpringBoot+Mybatis+MySQL+Vue+ElementUI前后端分离版：整体布局、架构调整（二）喜欢敲代码的程序员前后端分离 SpringBoot Spring spring boot mybatis mysql vue.js elementui
目录一、前言二、后端调整1.实体类调整2.菜单相关接口3.用户相关接口4.新增工具类5.新增菜单树返回类6.配置类、拦截器三、前端调整1.请求调整2.页面布局、样式调整1.user.vue2.index.vue3.请求拦截四、开发过程中的问题五、附：源码1.源码下载地址六、结语一、前言此文章在上次的基础上进行了部分调整，并根据用户体验（我自己）确认了页面整体布局和数据呈现，暂定就先这样，后续有需要
web后端框架MyBatis 猿力觉醒 java 后端 mybatis
目录前言1.xml配置方式开发步骤2.注解方式开发步骤前言mybatis是一个优秀的基于java的持久层框架，它内部封装了jdbc，使开发者只需要关注sql语句本身，而不需要花费精力去处理加载驱动、创建连接、创建statement等繁杂的过程。mybatis通过xml或注解的方式将要执行的各种statement配置起来，并通过java对象和statement中sql的动态参数进行映射生成最终执行的
MySQL存储结构深度解析：Buffer Pool与Page管理 hdzw20 mysql复习 mysql 数据库
MySQL存储结构解析：BufferPool与Page管理在MySQL的InnoDB存储引擎中，BufferPool是其核心组件之一，它极大地提升了数据库的性能。理解BufferPool的内部结构和工作机制，对于优化MySQL数据库至关重要。本文将讨论BufferPool的结构、三大链表、改进型LRU算法以及ChangeBuffer机制。1.BufferPool结构：控制块与缓存页BufferPo
广州曼顿2P数字微断：保护电力设备的安全守护者 mdkk678 安全
在现代社会，电力设备的安全运行对各行各业至关重要。然而，电力系统中存在各种电压波动、过载和短路等问题，可能对设备造成损害。为了保护电力设备免受这些问题的影响，广州曼顿推出了2P数字微断器。本文将介绍这一创新产品的特点和优势，以及它对电力设备的保护作用。广州曼顿科技有限公司专注用户侧智慧数字电气产品研制，以及智慧电能服务大数据云平台建设。基于人工智能技术，大幅提升人触电时的生命安全保障，以及电气火灾
Python爬虫在社交平台数据挖掘中的应用：深入探索用户互动程序员威哥 python 爬虫数据挖掘
引言社交媒体已经成为全球用户互动的主要平台，每天都有大量的信息生成，用户之间的互动行为如点赞、评论、分享、转发等构成了宝贵的数据资源。如何利用这些互动数据为商业决策、用户行为分析以及产品优化提供支持，已经成为数据科学与大数据分析领域的一个重要课题。Python作为一款强大的编程语言，凭借其丰富的爬虫库和数据分析工具，已经成为挖掘社交平台数据的重要工具。在本文中，我们将通过Python爬虫技术，深入
突破性能瓶颈，几个高性能Python网络框架，高效实现网络应用
引言随着互联网和大数据时代的到来，高性能网络应用的需求日益增加。Python作为一种流行的编程语言，在高性能网络编程领域也具有广泛的应用。本文将深入探讨基于Python的几种高性能网络框架，分析它们各自的优势和适用场景，帮助开发者选择最适合自己需求的网络框架这里插播一条粉丝福利，如果你正在学习Python或者有计划学习Python，想要突破自我，对未来十分迷茫的，可以点击这里获取最新的Python
Navicat导出数据库表结构 qq_42676307 数据库 mysql
每一份完善的文档都是为后期维护铺平的道路：针对MySQL导出表结构文档，工具：navicat第一步：navicat新建查询SELECTCOLUMN_NAME列名,COLUMN_COMMENT名称,COLUMN_TYPE数据类型,DATA_TYPE字段类型,CHARACTER_MAXIMUM_LENGTH长度,IS_NULLABLE是否必填,COLUMN_DEFAULT描述FROMINFORMATI
navicat premium导出数据库表结构到Excel（Oracle、MYSQL、SQLServer） Amy_Victoria 数据库数据库 oracle mysql sqlserver
这里使用的navicatpremium是12.0.24版1.Oracle的语句SELECTA.cloumn列名,datatype数据类型,datalength长度,nullable是否为空,b.comments注释FROM(SELECTCOLUMN_NAMEcloumn,DATA_TYPEdatatype,DATA_LENGTHdatalength,NULLABLEnullableFROMALL_
AI人工智能与机器学习的大数据融合应用 AI智能探索者人工智能机器学习大数据 ai
AI人工智能与机器学习的大数据融合应用关键词：AI人工智能、机器学习、大数据、融合应用、数据挖掘摘要：本文深入探讨了AI人工智能与机器学习在大数据融合应用方面的相关内容。首先介绍了研究的背景、目的、预期读者和文档结构，对核心术语进行了清晰定义。接着阐述了AI、机器学习和大数据的核心概念及相互联系，给出了形象的文本示意图和Mermaid流程图。详细讲解了核心算法原理，并通过Python源代码进行说明
百度地图迁徙大数据深度解析与实战指南
百度地图迁徙大数据深度解析与实战指南在数字化时代，人口流动数据已成为洞察社会经济活动的关键指标。百度地图依托海量位置数据和AI算法打造的"迁徙大数据"平台，为城市规划、交通管理、商业选址等领域提供了重要决策支持。本文将系统性解析百度地图迁徙大数据的查看方法、核心功能及实战应用场景，帮助读者快速掌握这一数据驱动的决策工具。一、迁徙大数据的核心价值迁徙大数据通过聚合手机用户的定位信息，构建全国范围的人
为什么MySQL怕排序，Redis ZSet却秒杀？跳表+亿级数据的架构暴力美学
某证券交易所实时股价排序系统突发故障：处理10万支股票的排序请求从毫秒级飙升到12秒。事后发现ZSet元素数量突破阈值后，底层结构未能从listpack切换到跳表，导致性能断崖式下跌。这个千万级损失的案例揭示了ZSet底层实现的关键性。一、ZSet双引擎架构：自适应存储的艺术1.小数据高效存储：listpack（Redis7.0+）//listpack内存结构示例[总字节数][元素数量][元素1]
MySQL 统计信息详解：从原理到实践我科绝伦（Huanhuan Zhou） mysql mysql android 数据库
MySQL统计信息是数据库优化器生成查询执行计划的关键依据，记录了表和索引的基本特性，辅助优化器估算查询成本、选择最优执行路径。一、统计信息主要内容分为表级、索引级和列级三类。1.1表级统计信息描述表基本属性，如行数（TABLE_ROWS）、平均行长度（AVG_ROW_LENGTH）、数据大小（DATA_LENGTH）、索引大小（INDEX_LENGTH）、空闲空间（DATA_FREE）。获取方式
MySQL如何查看某个表所占空间大小？（表空间大小查看方法） lwb_0118 面试学习路线阿里巴巴 mysql android 数据库
文章目录一、使用SQL查询查看表空间1.1查询所有表的大小（包括数据和索引）1.2查询特定数据库的表大小1.3查询单个表的详细空间信息二、使用命令行工具查看表空间2.1使用`mysql`客户端查询2.2查看物理文件大小（适用于MyISAM/InnoDB）三、查看InnoDB表的空间使用详情3.1查看InnoDB表空间状态3.2查看InnoDB引擎状态（包含缓冲池等信息）3.3查询InnoDB表空间
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo