阿里技术

Khronos: 面向万亿规模时间线的性能监控引擎建设实践

作者：余文清

阿里巴巴智能引擎事业部自研的 Khronos 系统是阿里内部接入规模最大的性能数据存储引擎。Khronos 支持动态生命周期的存储计算分离架构，采用 schemaless 的 data model 设计，在万亿数据规模下为业务提供易用、高效、经济的服务，团队近期的优化工作也被国际学术会议 CIKM2023 收录。本⽂总结了 Khronos 在性能监控领域遇到的技术挑战，以及在这个场景下的一些价值判断。

一、背景

时序数据管理系统（Time series DBMS）近年来受到较多的关注，这是受到多方面因素推动的结果，包括：云原生可观测性的要求逐渐标准化，DevOps/AIOps 的发展，IoT 技术、车联网、智能⾦融等技术趋势对时序数据的存储需求。从图 1 左侧 DB-Engines 网站[1]的趋势可以看出，从 2013 年开始，Time series DBMS 受到的关注就在逐渐上升。

另一方面，时序数据库产品形态也呈现出多元化趋势。图中右侧列出的是 DB-Engines 根据时序数据库产品热度的 top10 排名。在这个榜单中，有的是为业务场景设计的专业时序数据库产品（例如 InfluxDB、Prometheus、Graphite），有的是基于关系型数据库的架构，针对业务场景进行了专门的设计（例如 Kdb+，TimescaleDB), 也有的面向更通用的大数据分析场景，时序分析是它能满⾜的⼀个子场景（例如 Druid）。

在我们对业内产品的调研过程中发现，⽬前没有产品能够很好的满⾜大规模性能监控中台对时序数据库的要求。因此在 2019 年，阿里智能引擎团队就基于 AIOS 技术栈体系[2]和 Havenask 开源搜索引擎[3]，自研了⼀款面向大规模性能监控场景的时序存储引擎 Khronos。

经过几年的持续建设，它已经成为阿里内部两大性能监控平台 Kmonitor 和 Sunfire 的底层时序数据存储引擎。2023 年是 Khronos 上线生产系统的第 4 年，从数据接入量上看，它俨然已成长为阿里巴巴内部规模最大的性能数据存储引擎。

二、技术挑战

在性能监控场景，TSDB 的主要的使用场景有大盘展示、系统问题调查、根因分析、异常检测和报警等。随着内部业务逐渐向云上环境迁移，基于云上的性能监控，面临以下几大挑战：

2.1 写入规模巨大

随着 DevOps 概念、云原生概念、系统可观测性概念的普及，集团内部应用大量使用指标、日志等手段实时反馈系统的性能状态和业务状态。

以 Kmonitor 业务平台为例，指标接入量从 2019 年的每秒写入 46Million/second 增长到 2022 年的 255 Million/second，每年都有 1 倍左右的写入量增长。这些数据需要被 Khronos 实时消费、索引并且存储起来，这对数据的接入 pipeline 是⼀个巨大的压力。另⼀方面，业务层面对指标数据的保留时间限制(time-to-live) 存在需求，大部分的指标数据保留 1-3 个月，但是也有⼀定比例的指标要求永久保留。

2.2 维度诅咒

我们用时间线的基数（cardinality）来衡量性能监控场景的规模。这里先简单介绍⼀下时间线的概念。性能监控数据通常被建模为多维时间序列（multi-dimensional time series）, 每⼀个 time series 包含⼀个 metric、⼀组 tags（其中，每个 tag 由 tag key 和 tag value 构成）和⼀组带时间戳的样本值（timestamped samples）。⼀条时间线可以由 SeriesKey 进行唯⼀标识，SeriesKey = metric + tags。

以下表为例，包含了 4 个 series（红、绿、蓝、黄）：

（表 1）

在 Kmonitor 业务场景中，我们在多个租户都观察到时间线的基数逐渐膨胀。图 2 给出了 4 个典型租户时间线基数的变化趋势。可以看出，他们的时间线规模都在持续增长，个别租户(HI) 的时间线规模甚至超过万亿级别（1e12）。另一个值得注意的统计特征是 60%以上的时间线生命周期并不长，在⼀个小时以内。

（图 2）

时间线基数膨胀的主要原因是时间线存在⼀定的流动率（churn rate）：active 的时间线停⽌接受指标样本，变为 inactive 状态。同时，又不断有新的 active 时间线进入系统。

在具体业务中，series churn 的来源是多方面的，例如：

在线系统会在电商大促活动期间进行弹性扩缩容操作，扩容操作发生时，新启动的业务进程就会产生大量新的时间线；而缩容操作发生时，大量的进程消亡，对应的时间线变成 inactive 状态。

随着大规模混布技术和容器技术的应用，云上部署的服务进程会在物理机之间进行迁移。如果某些指标以物理机 IP 作为 tag key，那么每当进程迁移到新的物理机时，就会产生⼀批新的 active 的时间线集合（IP 的 tag value 发生更新）。

表 2 对来自不同租户的 30 分钟区间的汇报指标进行了统计。可以看出时间线基数（#series）就达到百万级别（1e7）。例如 ASI 租户，时间线基数到了 4100 万+。主要原因是 tags 的平均维度（#tags）超过 31 个，tag values 的基数（tag values 列）超过 446 万。我们把 tags 维度太多导致的时间线基数膨胀问题，称作时序场景的“维度诅咒”。

（表 2 ）

2.3 及时可见性

线上业务对于监控数据的时效性要求越来越高。我们把可见性延迟（Visible-Delay）定义为时序数据产生的时间（event-time）到它可以被检索到的时间（visible-time）的 gap。部分时效性敏感的业务要求可见性延迟在维持在几秒之内。举个例子，弹性扩缩容服务可能会基于某个应用最近 5 分钟的聚合 QPS 指标进行弹性扩缩决策，如果 QPS 指标的 visible-delay 达到分钟级别，那么弹性扩缩容服务就⽆法做出及时的决策，甚至可能基于部分聚合结果，产生错误的决策。

指标数据从产生到被存储，大致上要经历 SDK 收集、agent 采集、引擎消费这么几个阶段。其中前两个步骤运行在端上（容器、物理机），第三步通过中心化的时序引擎进行处理。因此 visible-delay 可以细分为端延迟和引擎构建延迟。

上述的三个挑战对 TSDB 意味着什么呢？

首先，高写入压力要求引擎提供极高吞吐的写入 pipeline，同时业务场景要求数据能够被长期保留下来，意味着引擎需要提供高可靠、低成本和低访问延迟的存储方案；第二，秒级的及时可见性要求系统具备实时索引（realtime-indexing）的能力；

最后，高维度高基数的数据特点对实时索引性能带来巨大的挑战，TSDB 在设计上需要能控制时间线规模，且提供高吞吐的索引方案。

三、系统架构介绍

3.1 整体架构设计

指标数据采集的入口是部署在各个物理机上的指标采集模块 kmon-agent。kmon-agent 会将本地采集的原始指标降精度（down-sample）为 4 个精度：20 秒、1 分钟、10 分钟、60 分钟，并将降精度后的数据，写入该租户对应的 4 个消息队列（MessageQueue）中。

Khronos 会直接消费消息队列中的数据。如图 3 所示，Khronos 整体架构采用了类似 lambda 架构的设计，分为在线和离线两个模块：

在线模块：使用 Havenask 引擎（以下简称 Ha3）作为在线模块，提供实时数据的消费和查询服务。Ha3 分为 QRS 和 Searcher 两种角色。QRS 模块接受用户的查询请求，进行 SQL 解析、生成查询计划、将查询计划转发给 searcher 并对 searcher 返回的结果进行全局聚合和排序。Searcher 是查询计划的执行者，在时序场景，它召回符合查询条件（Metric, Tags, TimeRange）的所有时间线，并根据 group by 条件进行数据的本地聚合。为了提供高时效性的服务， searcher 会在内存中构建时序索引，并将内存中的索引定期刷写到本地磁盘上。查询时，searcher 会从内存、本地磁盘和分布式⽂件系统盘古这三种存储介质中进行数据召回。其中本地磁盘和离线盘古中的数据，会通过 BlockCache 的方式缓存（LRU）在内存中。

离线模块：使用 BuildService 引擎作为离线模块，提供离线数据的产出和整理服务。BuildService 会周期性启动分布式构建进程，消费 MessageQueue 中的数据，将时序索引产出到盘古系统上。BuildService 还会周期性调度分布式的索引整理进程，对时序索引进行整理、优化。优化后的索引版本信息会被推送到在线模块，用于替换 Ha3 searcher 本地内存中和本地磁盘上的时序索引。

（图 3）

采用 lambda 架构的好处在于，在线模块通过直接消费消息队列, 能够保障时序数据的时效性。而消耗 CPU 计算资源的索引整理优化逻辑可以放在离线模块进行，避免了在线服务的 CPU 抖动。但是目前的架构版本中，存在在线模块和离线模块消费两遍消息队列的构建 CPU 成本浪费，后续考虑将 Ha3 Searcher 产出的实时索引直接刷写到盘古上来节省这部分资源。

3.2 基于数据动态生命周期的存储计算分离架构

在存储结构设计上，Khronos ⽀持了在线直接访问离线盘古的存储计算分离架构：BsWorker 将离线优化后的索引直接产出到盘古（HDD) 上，在线 searcher 通过网络直接访问，省去了分发巨量索引到 searcher 本地的过程。⼀方面离线盘古提供了数据的可靠存储保障和理论上⽆限制的存储空间，另⼀方面 searcher 本地状态很小，利于其弹性扩缩容。

在业务场景中，时序场景的数据有明显的冷热特征，但这种冷热变化并不是静态的。比如：场景 A 建⽴了数据大盘，希望能快速召回最近 3 天的数据查询；场景 B 希望能进行 2021、2022 年大促期间的性能对比和业务数据聚合分析；场景 C 希望将基于 blink 流式聚合报警任务下线，有 30 万条报警规则需要直接从 khronos 实时聚合进行计算，要求最近 1 分钟的数据能够提供秒级的构建时效性和毫秒级的查询延迟。

（图 4）

我们通过为引擎增加“动态生命周期管理” 能力来解决这部分需求。

具体而⾔，Khronos ⽀持将⼀张表内的数据分为 N 个冷热层级。我们可以为每一层定义多个时间窗口和一个存储介质。以图 4 为例配置了 3 阶段的生命周期：Hot Layer 配置为最近 12 小时，访问介质配置为内存（Ram）；Warm Layer 配置了两个时间窗口：一个是最近 3 天至最近 12 小时，另一个是去年双十一当天（用于业务上支持同期数据对比）；访问介质配置为本地 SSD 磁盘；Cold Layer 的时间窗口配置为最近一年至最近 3 天，介质配置为 DFS。在这种配置下，时序数据进入引擎的 12 小时内。它会被加载到全内存中提供高速访问；当数据的 eventTime 和当前时间差值在 3 天到 12 小时之间时，或者命中去年双十一当天的时间区间，这部分时序数据会被迁移至本地磁盘介质（SSD），以更经济的方式提供访问。

当数据的 eventTime 和当前时间的差值超过 3 天时，它就被存放在分布式文件系统上，通过网络 IO 的形式提供访问。

四、Data-Model 设计

data-model 被认为是时序数据管理系统的核心“世界观”，它代表了数据库是如何对数据进行建模的。按照建模方式是否需要预定义 schema, 可以将 TSDB 的建模方案大致分类为 schematized 和 schemaless 两类。

4.1 Schematized Data Model

基本上采用类似关系数据库建模时序数据的产品中普遍需要预先定义 schema。

例如 TimescaleDB、QuestDB、Druid、TDEngine，我们称这类设计为 schematized data model。在数据写入引擎前，定义 schema 可以带来⼀些明确的好处，包括利于查询引擎实现，尤其是提供 SQL 标准（或类似 SQL 语义）的查询引擎；其次它强制用户在写入数据前对数据建模进行仔细地设计，写入流程中可以根据 schema 对数据进行校验，从而避免异常数据进入引擎；另外，这也限制用户随意增加维度列，从⼀定程度上避免上文提到的“维度诅咒”。

以 TimescaleDB [4] 的数据写入为例。用户需要：

Step1. 定义⼀个表并关联到⼀个超表 (hyper table)

CREATE TABLE stocks_real_time (  time TIMESTAMPTZ NOT NULL,  symbol TEXT NOT NULL,  price DOUBLE PRECISION NULL,  day_volume DOUBLE PRECISION NULL);SELECT create_hypertable('stocks_real_time','time');

Step2. 定义索引

CREATE INDEX ix_symbol_time ON stocks_real_time (symbol, time DESC);

Step3. 写入数据

INSERT INTO stocks_real_time(time, symbol, price, day_volumn)  VALUES (NOW(), 'product', 22.2, 3300.0);

Step4. 如果需要增加⼀个维度列的话，需要显式修改表结构

ALTER TABLE stocks_real_time ADD COLUMN week_volumn DOUBLE PRECISION NULL;

4.2 Khronos 的选择：Schemaless Data Model

从上述的过程中可以看出， schematized data model 的缺点就是使用体验上不够灵活。Khronos 对接的业务指标的数量超过百万规模，为每个指标都定义⼀个 schema 将会带来巨量的表管理成本，且同⼀个业务存在多个代码版本，对同⼀个指标的建模也不尽相同。增减 metrics、tags 和 fields 都是相对高频的操作。例如代码版本升级、开发人员临时的问题调查等场景都可能更新 metrics、 tags 和 fields。总之如果用户需要在汇报指标前先定义 schema，并显式地为某些 tag 列建⽴索引的话，恐怕产品就要收到很多吐槽投诉了。

考虑到业务上灵活多变的指标数据建模需求，Khronos 采用了完全 schemaless 的 data model。上述流程中的 Step1、Step2 都可以省略，用户只需描述数据本⾝，并推送到系统的消息队列中就行了。这是⼀个 Khronos 的消息示例：

{Metric=stocks_real_time, time=1668417257, tags={symbol=product}, fields={day_volumn=3300.0, price=22.2}}{Metric=stocks_real_time, time=1668417258, tags={symbol=product}, fields={day_volumn=3300.0, price=23.2}}{Metric=stocks_real_time, time=1668417259, tags={symbol=pre}, fields={day_volumn=3300.0, price=24.2}}

Khronos 会自动为所有 tags 建⽴合适的索引。当用户想要修改数据建模时，也不需要上面 Step4、Step2 的 AlterTable/CreateIndex 过程，仍然只需要描述新数据本⾝的变化就可以。例如用户想为指标新增一个 tag: "market" 和一个 field: "week_volumn"，直接推送下面的消息即可：

{Metric=stocks_real_time, time=1668417259, tags={symbol=product,market=shanghai}, fields={day_volumn=3300.0, price=22.1,week_volumn=26400.0}}{Metric=stocks_real_time, time=1668417260, tags={symbol=product,market=shanghai}, fields={day_volumn=3300.0, price=23.2,week_volumn=26401.0}}

Khronos 采用了 schema-on-read 的设计理念，这种数据建模的变化是即刻生效的。当执行查询{Metric=stocks_real_time, symbol=product, field=week_volumn}时, 将召回以下数据：

而执行查询{Metric=stocks_real_time, market=shanghai, field=price} 时，只有第⼆批数据被召回：

Khronos 的 data model 可以服务于两种主流的指标数据建模方式：

Model by Metric

按照指标建模的方式下，tags 是用来描述指标的属性的，fields 用来存储指标对应的⼀个或多个值，知名的开源时序监控引擎 Prometheus[5] 也是采用这种方式。表 3 给了⼀个具体的例子，metric 列标识了指标的名称，tags 则表明对应的指标的属性。例如 http_requests_total 包含 method 和 handler 两个维度的属性，而 api_http_requests_client 则包含 method、url、ip 3 个维度的属性。

（表 3）

Model by Data Source

这种建模方案下，Data Source 代表产生数据的⼀类任务或者进程。metric 标识 data source 的名称，tags 用于描述数据源的属性，field names 用于存储指标名称，field values 用于存储指标数值。集团⼴泛使用的 sunfire 平台[9] 可以认为采用了按照 data source 建模的方案。表 4 给了⼀个具体的例子:

（表 4）

这两种建模方式各有千秋，但对于 Khronos 来说没有差别，即每个 sample 包含⼀个 metric 字段、⼀个 timestamp、多个 tags 和多个 fields。相比于其它时序产品，Khronos 在设计上不需要预先定义的 schema，它相信每个 sample 都可以自解释，且允许模型发生变化。

五、索引方案设计

5.1 Sample-Oriented vs. Series-Oriented

时序数据的索引策略按照索引对象来划分，可以被分类为 Sample-Oriented 方案和 Series-Oriented 方案。Druid、TimescaleDB 是采用 Sample-Oriented 策略的典型数据库。以 Druid 为例，它为每⼀列的每个 distinct value 建⽴⼀个倒排索引。倒排链表指向了包含这个 token 的所有 samples 所在的行号。

下图给了⼀个具体的例子：Justin Bieber 的倒排链指向了 row 0 和 row 1。

（图 5）

但在性能监控场景，sample-oriented 策略的⼀个大问题就是 sample 的数量太大，索引每个 samples 会带来巨大的计算和存储成本。通常，点数量和时间线数量的比值大约是 30 ~ 100 倍，意味着为时间线建⽴索引就比为 sample 建⽴索引要轻的多。

因此 series-oriented 索引策略也越来越成为监控领域的主流，InfluxDB、Prometheus、Google Monarch 等都采用了这样的方案。扩展来说，在⽇志分析领域， ElasticSearch 可以被认为采用了 sample-oriented 方案，而 Loki 采用了 series-oriented 方案。

5.2 时间线索引的构建性能瓶颈分析

时间线索引的构建过程可以被抽象成下面的算法过程，简单描述⼀下：当时间线进入引擎时，先判断⼀下是否已经被索引过。如果没有索引过，那么进入索引构建流程。如果已经被索引过，即只需把它的点数据插入对应的 sample buffer 中。

（图 6)

⽬前，倒排索引和基于树的索引被⼴泛应用在 TSDB 系统中。下图展示了⼀个具体的索引构建流程: 时间线的 SeriesKey ⾸先被分配⼀个 seriesId 作为它的标识符，然后它被分词为 metric-token 和⼀组 tagk-tagv token。seriesId 会被插入到这些 token 对应的倒排链表中，Metric 和 tagk-tagv token 也会被插入到前缀树中用来⽀持时间线的模糊匹配和 meta 查询。

(图 7)

在超高基数的时间线写入负载下，该算法的容易出现以下两个方面的问题：

时间线索引构建性能达到瓶颈：主流的时间线索引方案包括倒排索引、前缀树索引等，构建开销正比于时间线基数（#series）和每个时间线包含的 tags 个数（#tags)，从表 2 可以看出，两个数字都不是小数⽬。

冷启动问题：这指的是时间线索引刚创建时，索引构建吞吐会剧烈下降，索引构建延迟会迅速上升，索引构建性能要经历较长的时间才能恢复平稳的现象。这是由于时间线索引的内存不能能⽆限制增长，需要周期性地序列化到磁盘上，并重新创建空索引。空索引创建时，进入系统的大部分的时间线会进入开销昂贵的索引构建分⽀。图 8(b) 画出了⼀个 Khronos 老版本下的周期性冷启动现象。可以看出，⽆论是数据写入吞吐还是索引构建延迟，都会发生周期性的抖动，这对前面章节提到的“及时可见性”造成严重影响。

(图 8)

图 8(a)中，我们对比了两种索引方案在 igraph 性能监控数据集下的峰值写入吞吐能力对比，InfluxDB(series-oriented) 的峰值吞吐能力是 TimescaleDB(sample-oriented) 的 3 倍左右，但是冷启动问题发生时，性能就会严重下降。

5.3 构建性能优化

今年，Khronos 针对上述的索引构建性能瓶颈问题进行了专门的优化。设计了⼀个新的“补集索引构建算法” 。这部分⼯作的细节我们总结为了⼀篇 paper 发表在 CIKM2023[6] 上："Khronos: A Real-time Indexing Framework for Time Series Databases on Large-Scale Performance Monitoring Systems" [7]。在高基数时间序列负载下，该算法表现要显著优于 InfluxDB。

下图对比了 Khronos、InfluxDB、TimescaleDB 在不同基数的数据集下的单实例峰值写入吞吐能力。

(图 9)

随着数据集的时间线基数从 0.6Million 增长到 9 Million，InfluxDB 的写入性能下降了约 66%。而 Khronos 的构建性能⼀直稳定保持在 1Million samples/second 以上，是 InfluxDB 的 18 倍以上。在和 TimescaleDB 对比时，我们进行两种配置: TimeSNon 表示不对 tag 列配置索引，TimeSInd 表示对所有 tag 列都配置索引。显而易见，即使对比 TimeSNon 方案，Khronos 仍然有很高的性能表现（x4.5）。

在优化构建延迟方面，Khronos 新版本解决了周期性的冷启动问题，下图给出了新老两个版本在 ASI 数据集下的单实例构建性能和构建延迟对比。可以看出，新版本在均值 250K 的写入压力下，索引构建延迟仍稳定在 2s 以内。

(图 10)

六、总结和展望

以上是 Khronos 团队在应对超大规模性能监控场景的⼀些实践经验。后续引擎会在完善可观测数据模型体系上持续发力，例如接入⽇志、trace、event、profiling、用户行为序列数据等。⽬前行业内还没有⼀款产品称得上是可观测性领域的“六边形”战⼠，还有很多机会可以挖掘。

参考资料

[01] DB-engiens ranking

https://db-engines.com/en/ranking

[02] AIOS 技术栈

https://developer.aliyun.com/article/674167

[03] Havenask 搜索引擎

https://github.com/alibaba/havenask

[04] TimescaleDB Docs

https://docs.timescale.com/

[05] Prometheus data model

https://prometheus.io/docs/concepts/data_model/

[06] CIKM2023 Accepted Papers

https://uobevents.eventsair.com/cikm2023/accepted-papers

[07] Khronos 论文原文

https://dl.acm.org/doi/10.1145/3583780.3614944#

你可能感兴趣的:(其他,实践,大规模,Khronos)

Node.js 中的 Event 模块详解小灰灰学编程 Node.js node.js 前端
Node.js中的Event模块是实现事件驱动编程的核心模块。它基于观察者模式，允许对象（称为“事件发射器”）发布事件，而其他对象（称为“事件监听器”）可以订阅并响应这些事件。这种模式非常适合处理异步操作和事件驱动的场景。1.概念1.1事件驱动编程事件驱动编程是一种编程范式，程序的执行流程由事件（如用户输入、文件读取完成、网络请求响应等）决定。Node.js的核心设计理念就是基于事件驱动的非阻塞I
[附源码]计算机毕业设计基于SpringBoot的小说阅读系统计算机毕设程序设计 spring boot java 后端
项目运行环境配置：Jdk1.8+Tomcat7.0+Mysql+HBuilderX（Webstorm也行）+Eclispe（IntelliJIDEA,Eclispe,MyEclispe,Sts都支持）。项目技术：SSM+mybatis+Maven+Vue等等组成，B/S模式+Maven管理等等。环境需要1.运行环境：最好是javajdk1.8，我们在这个平台上运行的。其他版本理论上也可以。2.ID
基于 Spring Boot 的社区居民健康管理系统部署说明书小星袁毕业设计原文 spring boot 后端 java
目录1系统概述2准备资料3系统安装与部署3.1数据库部署3.1.1MySQL的部署3.1.2Navicat的部署3.2服务器部署3.3客户端部署4系统配置与优化5其他基于SpringBoot的社区居民健康管理系统部署说明书1系统概述本系统主要运用了SpringBoot框架，前端页面的设计主要依托Vue框架来构建，实现丰富且交互性强的用户界面，后台管理功能则采用SpringBoot框架与MySQL数
远程桌面的端口号是多少? 阿7_QuQ 网络 windows 服务器
远程桌面（RemoteDesktop）是一种用于远程访问和控制计算机的技术，它允许用户通过网络连接到远程计算机并以图形化界面进行操作。远程桌面使用的端口号通常是3389。在Windows操作系统中，远程桌面协议（RemoteDesktopProtocol，简称RDP）默认使用3389端口。当您启用远程桌面功能并允许其他计算机通过网络连接时，远程桌面会监听3389端口，等待远程连接的请求。需要注意的
蓝队基础：企业网络安全架构与防御策略重生之物联网转网安网络安全安全
声明学习视频来自B站up主**泷羽sec**有兴趣的师傅可以关注一下，如涉及侵权马上删除文章，笔记只是方便各位师傅的学习和探讨，此文章为对视频内容稍加整理发布，文章所提到的网站以及内容，只做学习交流，其他均与本人以及泷羽sec团队无关，切勿触碰法律底线，否则后果自负！！！！有兴趣的小伙伴可以点击下面连接进入b站主页[B站泷羽sec](https://space.bilibili.com/35032
2025年全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽安全-黑客4148 安全 web安全网络网络安全 CTF
目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15天）4.3、后期五、CTF学习资源5.1、CTF赛题复现平台5.
2025年全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽安全-黑客4148 网络安全 web安全 linux 密码学 CTF
目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15天）4.3、后期五、CTF学习资源5.1、CTF赛题复现平台5.
基于python深度学习遥感影像地物分类与目标识别、分割实践技术应用 xiao5kou4chang6kai4 深度学习遥感勘测 python 深度学习分类
专题一：深度学习发展与机器学习深度学习的历史发展过程机器学习，深度学习等任务的基本处理流程梯度下降算法讲解不同初始化，学习率对梯度下降算法的实例分析从机器学习到深度学习算法专题二深度卷积网络、卷积神经网络、卷积运算的基本原理池化操作，全连接层，以及分类器的作用BP反向传播算法的理解一个简单CNN模型代码理解特征图，卷积核可视化分析专题三TensorFlow与keras介绍与入门TensorFlow
redis的主从复制配置 zhaikaiyun redis
通过持久化功能，redis保证了即使在服务器重启的情况下也不会丢失或少量丢失数据，但是由于数据存储在一台服务器上，如果这台服务器出现故障，比如磁盘坏了，也会导致数据丢失。为了避免这个单点故障，可以使用主从复制的方式，将主更新的数据，自动更新同步到其他服务器上。主从节点配置[root@k8smasterconfig]#moreredis6380.confinclude/data/redis/redi
如何备战软考网络工程师？互联网之路. 知识点网络
互联网各领域资料分享专区(不定期更新)：Sheet前言软考网络工程师属于中级资格考试，通过这个考试来获得职称或者提升自己的专业技能。软考网络工程师的考试内容和结构。考试分为上午的综合知识和下午的案例分析，可能涉及计算机网络的基础知识、网络设备配置、网络安全、网络管理等方面。实践操作对下午的案例题很重要，可能需要配置模拟器来练习。但一般没有实际设备，所以模拟器是必要的。同时，真题的重要性不可忽视，需
深入理解Spring Boot中的事件驱动架构省赚客APP开发者@聚娃科技 spring boot 架构 java
深入理解SpringBoot中的事件驱动架构大家好，我是微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！1.引言事件驱动架构在现代软件开发中越来越受欢迎，它能够提高系统的松耦合性和可扩展性。SpringBoot作为一个流行的Java框架，提供了强大的事件驱动支持。本文将深入探讨SpringBoot中事件驱动架构的实现原理和最佳实践。2.SpringFramework中的事件模型在
Android Gradle使用总结 Wei_Leng Android studio android gradle 脚本
其他Groovy入门学习http://blog.csdn.net/zhaoyanjun6/article/details/70313790AndroidGradleAndroid项目使用Gradle作为构建框架，Gradle又是以Groovy为脚本语言。所以学习Gradle之前需要先熟悉Groovy脚本语言。Groovy是基于Java语言的脚本语言，所以它的语法和Java非常相似，但是具有比jav
EDA事件驱动架构领域事件 Event Sourcing talentluke 架构设计
摘自http://www.jdon.com/eda.htmlEDA(Event-drivenarchitecture)是以事件为核心，与SOA以服务为核心有本质区别，是状态模式的延伸到架构上，事件是触发状态变化的根源，事件是介于业务和技术两者之间的概念，用户界面是事件主要发生来源，事件也可以来源其他系统或模块，通过事件可以实现系统或组件之间松耦合。EDA可以实现SOA服务之间的调用，事件也可以用于
网页中加载 SVG 的七大方式前端熊猫 Svg javascript html svg vue
一、直接使用标签加载外部SVG文件优点：简单易用：与加载其他图片格式（如PNG、JPEG）相同。浏览器支持良好：现代浏览器普遍支持。可缓存：SVG文件可以被浏览器缓存，减少重复请求。缺点：无法直接操作SVG内部元素：如果需要对SVG内部的元素进行交互或样式修改，这种方法不适用。适用场景：静态图像展示：仅需要展示SVG图像，不需要与之交互。二、将SVG作为CSS背景图片.icon{width:100
SAT-3D饮食行为训练系统在营养教学中的应用心得体会上海GR 经验分享
在营养学领域的探索之旅中，我有幸深入接触并实践了SAT-3D膳食诊断和饮食行为训练系统（以下简称SAT-3D系统，研制单位：上海共荣医学科技有限公司），这一经历不仅极大地拓宽了我的专业视野，也让我在营养实训教学上获得了前所未有的启示与感悟。SAT-3D系统，作为一个集科学性与实用性于一体的膳食评估与行为干预工具，其在营养实训教学中的应用，无疑为传统的教学模式注入了一股新鲜血液，让我深刻体会到科技赋
网页制作03-html,css,javascript初认识のhtml的图像设置 Ama_tor 网页制作专栏 html css 前端
一、图像格式网页中图像的格式有三种，Gif，Jpeg，PngGif：Graphicinterchangeformat图像交换格式，文件最多可使用256种颜色，最适合显示色调不连续或具有大面积单一颜色的图像，例如导航条、按钮、图标、徽标或其他具有统一色彩和色调的图像；还可以制作动态图像Jpeg：Giantphotographicexpectgroup，它是一种图像压缩格式，可包含数百万种颜色，不支持
java进阶篇--生产环境如何排查bug和优化 JVM？爱分享的淘金达人 Java源码剖析(30讲)jvm优化 jvm调优优化jvm 生产环境优化jvm 生产环境jvm优化
通过前面几个课时的学习，相信你对JVM的理论及实践等相关知识有了一个大体的印象。而本课时将重点讲解JVM的排查与优化，这样就会对JVM的知识点有一个完整的认识，从而可以更好地应用于实际工作或者面试了。我们本课时的面试题是，生产环境如何排查问题？回答：如果是在生产环境中直接排查JVM的话，最简单的做法就是使用JDK自带的6个非常实用的命令行工具来排查。它们分别是：jps、jstat、jinfo、jm
Android 10 创建不了文件夹燕满天
Android10改变了文件的存储方式可以在Androidmainfest里面的application添加android:requestLegacyExternalStorage="true"使用原来的存储方式或者，不要自己创文件夹了AndroidQ为每个应用程序提供了一个独立的在外部存储设备的存储沙箱，没有其他应用可以直接访问您应用的沙盒文件。由于文件是私有的，因此访问这些文件不再需要任何权限。
Sublime4 最新4126注册（2022.6 亲测可用）一条晓鱼 exe编辑指令替换二进制修改程序逆向 Sublime Text
方法如下1打开sublimetext4安装目录选择文件sublime_text.exe（UltraEdit或其他工具）2搜索807805000f94c1更改为c64005014885c93保存exe
使用BLIP模型生成图像描述的可查询索引 dgay_hua python 计算机视觉开发语言
在本篇文章中，我们将介绍如何使用预训练的SalesforceBLIP图像描述模型，生成一个可查询的图像描述索引。我们将使用ImageCaptionLoader来加载图像，并通过一系列步骤生成查询索引。使用示例代码进行演示，帮助读者理解和实践。技术背景介绍随着计算机视觉技术的发展，图像描述生成成为了重要的研究领域。通过对图像内容自动生成文字描述，可以大大提高对图像信息的检索和管理效率。Salesfo
为什么编程语言不能无误差的表示十进制数编程
在编程中，尤其是涉及到数值计算时，十进制数的表示问题是一个常见的技术挑战。虽然我们日常生活中使用的是十进制数，但计算机内部却使用二进制来存储和处理数据。由于十进制和二进制之间存在根本性的差异，编程语言无法无误差地表示十进制数。这一问题不仅涉及到计算机的基本存储方式，还与浮点数的表示精度和计算机的内存管理机制密切相关。在实践中，这种表示误差会影响许多领域的计算，包括财务、科学计算和工程应用。本文将深
使用Python获取在线股票交易网站的实时交易数据嵌入式开发项目 2025年爬虫精通专栏 python 开发语言爬虫
目录步骤1：选择股票交易网站步骤2：使用requests库发送HTTP请求步骤3：解析HTML内容步骤4：提取实时交易数据步骤5：存储和使用数据在金融市场中，实时交易数据对于投资者来说具有重要的价值。实时的股票价格、交易量和其他市场指标可以帮助投资者做出更准确的决策，同时也是进行金融分析和建模的重要数据源。在本篇博客中，我们将学习如何使用Python获取在线股票交易网站的实时交易数据。在开始之前，
【python】连接Jira获取token以及jira对象唐古乌梁海 python jira
此脚本可以连接Jira，通过Jira的token，Jira对象可以实现与Jira的交互，从而完成jira与pytest的交互，或者其他自动化测试框架也行，例如：将pytest运行结果推送jira；将jira用例与自动化测试用例建立映射关系，将功能用例对应的自动化测试用例脚本路径推送到功能用例的描述栏，或者自动化栏里面#!/usr/bin/envpython#-*-coding:utf-8-*-#@
vue-router 中滚动行为设置的妙用代码搬运媛 vue.js javascript 前端
在vue-router里，滚动行为设置能够对路由切换时的页面滚动位置进行控制，这在单页面应用（SPA）里十分有用，能够为用户带来更流畅、更符合预期的浏览体验。下面为你详细介绍滚动行为设置的作用和使用方法。作用恢复滚动位置当用户在某个页面滚动到特定位置后，再导航到其他页面，之后又返回到该页面时，滚动行为设置可以让页面恢复到之前的滚动位置。这在浏览长页面或者列表页时非常实用，用户无需重新滚动到之前查看
Python性能优化：懒加载与其他高级技巧车载testing pytest数据驱动框架开发 python python 数据库开发语言
Python性能优化：懒加载与其他高级技巧在软件开发中，我们经常会遇到一些需要大量资源或时间来初始化的对象。如果这些对象在程序的整个生命周期中只被使用一次或很少使用，那么在程序启动时就立即初始化它们将是一种资源浪费。什么是懒加载？懒加载是一种设计模式，它推迟了对象的初始化直到其被实际需要的时候。这种方式可以提高程序的启动速度，减少内存消耗，并在某些情况下提高性能。实现懒加载的步骤定义类和属性：首先
STMicroelectronics 系列：STM32F1 系列_（8）.STM32F1系列的USART接口及编程 kkchenkx 单片机开发 stm32 嵌入式硬件单片机
STM32F1系列的USART接口及编程1.USART接口概述USART（UniversalSynchronousAsynchronousReceiverTransmitter）是一种串行通信接口，可以支持异步和同步通信模式。在STM32F1系列单片机中，USART接口用于实现与外部设备的串行数据通信，例如与其他单片机、计算机、传感器等设备进行数据交换。USART接口可以配置为多种通信模式，包括U
DeepSeek 助力 Vue 开发：打造丝滑的导航栏（Navbar）宝码香车 #DeepSeek vue.js 前端 javascript ecmascript DeepSeek
前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏+关注哦目录DeepSeek助力Vue开发：打造丝滑的导航栏（Navbar）前言页面效果指令输入属性定义1.导航栏样式相关2.导航项相关3.响应式相关4.对齐方式相关事件定义1.导航项点击事件2.菜单折叠切换事件其他建议1.可访问性2.动画效果3.图标支
高德地图驾车导航内存优化原理与实战数据库技术分享者 android ios
背景根据Apple官方WWDC的回答，减少内存可以让用户体验到更快的启动速度，不会因为内存过大而导致Crash，可以让APP存活的更久。对于高德地图来说，根据线上数据的分析，内存过高会导致导航过程中系统强杀OOM。尤其区别于其他APP的地方是，一般APP只需要关注前台内存过高的系统强杀FOOM，高德地图有不少用户使用后台导航，所以也需要关注后台的内存过高导致的系统强杀BOOM，且后台强杀较前台强杀
解决Mac MongoDB连接问题：无法连接到服务器127.0.0.1:27017的错误星际编程喵数据科学与存储领域 mongodb 数据库 macos 服务器运维
MongoDB是一种流行的开源数据库系统，广泛用于开发和维护现代应用程序。在使用MongoDB的过程中，有时您可能会遇到连接问题，其中一个常见的问题是在Mac上无法连接到本地MongoDB服务器（127.0.0.1:27017）。这种错误可能会导致应用程序无法正常运行，因此需要尽快解决。在本文中，我们将深入探讨在Mac上遇到MongoDB连接问题的可能原因，并提供一些最佳实践和解决方案，以帮助您成
C#的序列化[Serializable()] CoderIsArt C#c#开发语言
[Serializable]是.NET框架中的一个特性（Attribute），用于标记一个类、结构体、枚举或委托可以被序列化。序列化是将对象的状态转换为可以存储或传输的格式（如二进制、XML或JSON）的过程，以便在需要时可以重新创建该对象。主要用途：持久化存储：将对象的状态保存到文件或数据库中，以便后续恢复。跨进程或跨机器传输：在分布式系统中，将对象通过网络传输到其他进程或机器。深拷贝对象：通过
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite