佛系爱学习

容错机制（检查点 Checkpoint）

容错机制

检查点 Checkpoint

1.检查点的保存

1.1 周期性的触发保存

1.2 保存的时间点

1.3 保存的具体流程

2.从检查点恢复状态

（1）重启应用

（2）读取检查点，重置状态

（3）重放数据

（4）继续处理数据

3.检查点算法

3.1 检查点分界线（Barrier）

3.2 分布式快照算法

4.保存点（Savepoint）

容错机制

检查点 Checkpoint

在发生故障后，最简单的恢复方法是重启机器或重启应用。然而，对于流处理应用，由于任务是有状态的，重启后需要继续之前的处理计算。为了实现这一点，需要对内存中的状态进行持久化存盘。

持久化存盘的过程类似于编写文档或玩RPG游戏时的存档操作。通过将某个时间点的所有状态保存下来，形成一个“检查点”（checkpoint）。检查点是Flink容错机制的核心，用于在故障恢复后从检查点中恢复之前的状态，从而继续数据处理。

检查点用于确保故障恢复后处理结果的一致性。因此，检查点有时也被称为“一致性检查点”。通过使用检查点，可以确保即使在发生故障时，流处理应用也能从一致的状态中恢复，并继续正确地处理数据。这对于确保数据的完整性和可靠性至关重要。

在Flink中，可以通过配置检查点的时间间隔、存储位置以及数据同步机制等参数来优化故障恢复的效果。合理地配置这些参数可以帮助提高系统稳定性并降低故障恢复的代价。此外，为了进一步提高系统的可靠性，还可以考虑使用其他容错机制，如备份和恢复策略等。

1.检查点的保存

在理想情况下，检查点的保存应该是“随时”进行的，即每处理完一个数据就保存当前的状态。这种即时保存的方式可以确保在处理数据时发生故障时，系统能够迅速恢复到上一个完整状态，然后重新处理那条数据。

然而，这种即时保存的方式可能会对系统性能产生一定的影响，因为每次保存检查点都需要进行磁盘I/O操作，并且检查点的存储也需要占用一定的空间。因此，在实际应用中，通常会根据系统的负载和可用资源来平衡检查点的频率。

一种常见的策略是设置一个固定的时间间隔来保存检查点。在这种策略下，系统会在每个时间间隔结束时保存当前状态的检查点。如果在这个时间间隔内发生了故障，系统可以从最后一个检查点中恢复状态，然后重新处理那些在检查点之后到达的数据。

另外，为了进一步优化性能和降低存储成本，还可以采用增量式检查点的策略。在这种策略下，系统只会保存那些在上次检查点之后发生变化的状态数据。这种方式可以减少检查点的大小和存储需求，同时也可以减少恢复时间，因为只需要恢复最新的状态数据而不是整个系统的状态。

1.1 周期性的触发保存

为了平衡数据处理的性能和故障恢复的需求，通常采用周期性触发检查点的方式。在Flink中，检查点的保存是周期性触发的，间隔时间可以进行设置。这样可以确保系统在正常处理数据的同时，不会因为频繁的存档操作而影响性能。

检查点作为应用状态的一份“存档”，实际上是所有任务状态在同一时间点的一个“快照”（snapshot）。当每隔一段时间检查点保存操作被触发时，系统会将每个任务当前的状态复制一份，并按照一定的逻辑结构放在一起进行持久化保存。这种方式可以确保在故障发生时，系统能够从最后一个检查点中恢复状态，并继续正确地处理数据。

通过合理配置检查点的触发间隔，可以平衡系统性能和故障恢复的需求。较短的触发间隔可以减少故障恢复的延迟，但会增加存储和IO的开销。较长的触发间隔可以降低存储和IO的开销，但会增加故障恢复的延迟。因此，需要根据实际的应用场景和需求进行权衡，选择合适的检查点触发间隔。

1.2 保存的时间点

在Flink流处理应用中，我们采用了一种特定的状态保存策略：当所有任务都恰好处理完一个相同的输入数据时，将它们的状态保存下来。这种策略有几个重要的优点。

首先，它避免了除状态之外其他额外信息的存储，从而提高了检查点保存的效率。由于我们只在所有任务处理完同一个输入数据时进行状态保存，因此不需要存储与处理过程无关的其他信息，这有助于减少存储空间的占用，并提高检查点的生成速度。

其次，这种策略构建了一个类似于“事务”的处理模型。在每个检查点，要么所有任务都完整地处理完了一个数据，并且状态得到了保存；要么就是没有处理完，状态也没有保存。这种“全有或全无”的特性确保了系统状态的一致性。如果出现故障，我们可以恢复到之前保存的状态，而故障时正在处理的所有数据都需要重新处理。

为了实现故障恢复，源（Source）任务需要能够将偏移量作为算子状态保存下来，并且在需要时能够向数据源重新提交偏移量、请求重放数据。这就要求外部数据源能够支持重置偏移量的操作。Kafka是一个满足这些要求的典型例子，它允许我们保存并重置消费者的偏移量，从而实现数据的重新读取和处理。

综上所述，通过合理地选择状态保存策略，并利用外部数据源的特性，我们可以在Flink流处理应用中实现高效且可靠的故障恢复机制。这不仅可以保证数据处理的正确性，还可以提高系统的可用性和稳定性。

1.3 保存的具体流程

在Flink流处理应用中，源（Source）任务负责从外部数据源读取数据，并记录当前的偏移量。这个偏移量被作为算子状态（Operator State）保存下来，以便在故障发生时能够重新提交偏移量并请求重放数据。

一旦源任务读取了数据，它将这些数据发送给下游的Map任务。Map任务将每个单词转换成(word, count)的二元组，其中count的初始值为1。这种转换是无状态的算子任务，意味着它不会存储任何状态信息。

接下来，使用word作为键（key）进行分区，调用sum()方法对count值进行求和统计。sum()算子将当前求和的结果作为按键分区状态（Keyed State）保存下来。这种状态是与应用中特定的键值关联的，因此不同的键值会有各自的状态。

最终，通过这种处理流程，我们可以得到当前单词的频次统计(word, count)。这个结果可以用于各种分析和报告，帮助我们了解数据的分布和模式。

2.从检查点恢复状态

在运行流处理程序时，Flink 会周期性地保存检查点。当发生故障时，就需要找到最近一

次成功保存的检查点来恢复状态。

这里 Source 任务已经处理完毕，所以偏移量为 5 ； map 任务也处理完成了。而 sum 任务

在处理中发生了故障，此时状态并未保存。

接下来就需要从检查点来恢复状态了。具体的步骤为：

（1）重启应用

遇到故障之后，第一步当然就是重启。我们将应用重新启动后，所有任务的状态会清空

（2）读取检查点，重置状态

找到最近一次保存的检查点，从中读出每个算子任务状态的快照，分别填充到对应的状态

中。这样， Flink 内部所有任务的状态，就恢复到了保存检查点的那一时刻，也就是刚好处理

完第三个数据的时候

（3）重放数据

从检查点恢复状态后还有一个问题：如果直接继续处理数据，那么保存检查点之后、到发

生故障这段时间内的数据，也就是第 4 、 5 个数据（“ flink ”“ hello ”）就相当于丢掉了；这会造

成计算结果的错误。

为了不丢数据，我们应该从保存检查点后开始重新读取数据，这可以通过 Source 任务向

外部数据源重新提交偏移量（ offset ）来实现，

（4）继续处理数据

接下来，我们就可以正常处理数据了。首先是重放第 4 、 5 个数据，然后继续读取后面的

数据

当处理到第 5 个数据时，就已经追上了发生故障时的系统状态。之后继续处理，就好像没

有发生过故障一样；我们既没有丢掉数据也没有重复计算数据，这就保证了计算结果的正确性。

在分布式系统中，这叫作实现了“精确一次”（ exactly-once ）的状态一致性保证。

3.检查点算法

3.1 检查点分界线（Barrier）

在不暂停流处理的前提下，让每个任务“认出”触发检查点保存的那个数据，可以通过引入特殊的数据结构来实现。这种特殊的数据结构被称为检查点分界线（Checkpoint Barrier）。

检查点分界线是一种特殊的数据形式，类似于水位线（watermark），用于标识检查点保存的时间点。在数据流中，Source 任务会接收到保存检查点的指令，并在当前数据流中插入这个结构。之后的所有任务在遇到这个标识时，就会开始对状态进行持久化快照保存。

由于数据流是保持顺序依次处理的，遇到这个标识就代表之前的数据都处理完了，可以保存一个检查点。而在标识之后的数据引起的状态改变，就不会体现在这个检查点中，而需要保存到下一个检查点。

检查点分界线与水位线类似，也是一条特殊的数据，由 Source 算子注入到常规的数据流中。它的位置是限定好的，不能超过其他数据，也不能被后面的数据超过。分界线中带有一个检查点 ID，这是当前要保存的检查点的唯一标识。

通过这种方式，检查点分界线将一条流逻辑上分成了两部分：分界线之前到来的数据导致的状态更改，都会被包含在当前分界线所表示的检查点中；而基于分界线之后的数据导致的状态更改，则会被包含在之后的检查点中。

通过合理地使用检查点分界线，我们可以实现在不暂停流处理的情况下，让每个任务识别并响应触发检查点保存的数据。这种设计有助于提高系统的可用性和稳定性，确保数据处理的正确性和一致性。

3.2 分布式快照算法

在处理多个分区的分界线传递时，Flink 采用了异步分界线快照（asynchronous barrier
snapshotting）算法，这是 Chandy-Lamport 算法的一种变体。

该算法的核心在于两个原则。首先，当上游任务向多个并行下游任务发送分界线时，需要确保分界线被广播到所有下游任务。这样可以确保所有并行分区都能正确地识别到检查点保存的时间点。

其次，当多个上游任务向同一个下游任务传递分界线时，下游任务需要进行“分界线对齐”（barrier alignment）操作。这意味着下游任务需要等待所有并行分区的分界线都到达，然后才开始进行状态保存。这样可以确保所有分区都能在相同的时间点进行状态保存，从而实现一致的检查点。

通过这种异步分界线快照算法，Flink 可以在不暂停流处理的情况下，有效地处理多个分区之间的分界线传递，并确保每个任务都能正确地识别触发检查点保存的数据。这有助于提高系统的可用性和稳定性，确保数据处理的正确性和一致性。

4.保存点（Savepoint）

除了检查点（checkpoint）外，Flink 还提供了另一个非常独特的功能，那就是保存点（savepoint）。从名称上就可以看出，保存点也是一种存盘的备份方式，其原理和算法与检查点基本相同，只是多了一些额外的元数据。

实际上，保存点就是通过检查点的机制来创建流式作业状态的一致性镜像（consistent image）的。这种一致性镜像能够确保在从保存点恢复应用程序时，所有任务的状态都能够准确地回溯到之前的状态。

在保存点中，状态快照是以算子 ID 和状态名称组织起来的，形成一种键值对的形式。当从保存点启动应用程序时，Flink 会将保存点的状态数据重新分配给相应的算子任务。这样，任务就可以从一致的状态镜像开始执行，确保数据的正确性和一致性。

与检查点相比，保存点更加灵活。由于保存点包含了一些额外的元数据，用户可以自由地选择将应用程序恢复到某个特定的状态，而不是只能恢复到最后一次检查点的状态。此外，由于保存点可以独立于运行中的作业进行创建，因此用户可以在不影响作业运行的情况下进行状态的备份和恢复操作。

保存点是一个手动触发的存盘备份功能，与Flink的自动检查点机制不同。用户可以明确地手动触发保存点操作，以创建应用程序的状态镜像。相比之下，检查点是由Flink自动管理的，主要用于故障恢复。

保存点的用途非常灵活，可以作为强大的运维工具使用。以下是保存点的具体用途和场景：

版本管理和归档存储：用户可以在需要时创建一个保存点，并将其设置为特定版本，对应用程序的状态进行归档存储。
更新Flink版本：当Flink版本升级时，由于Flink的底层架构已经非常稳定，程序本身通常是兼容的。用户可以通过创建一个保存点来停止应用程序，进行Flink版本升级，然后从保存点重启应用程序，而无需重新执行所有计算。
更新应用程序：除了更新Flink版本，用户还可以直接更新应用程序。前提是程序的状态拓扑结构和数据类型保持不变，以便能够从之前的保存点正常加载。这对于修复应用程序中的逻辑错误或进行不同业务逻辑的测试非常有用。
调整并行度：如果应用程序在运行过程中发现资源不足或存在大量剩余资源，用户可以通过从保存点重启应用程序来调整并行度。
暂停应用程序：用户可以使用保存点来灵活地暂停和重启应用程序，以优化集群资源的配置。

为了确保保存点的兼容性和状态的正确加载，用户应该为每个算子手动指定ID。在程序代码中，可以使用SingleOutputStreamOperator的uid()方法来指定算子ID。

其中，:jobId是要进行镜像保存的作业ID，:targetDirectory是可选的目标路径，表示保存点的存储路径。用户也可以在程序代码中设置默认的保存点路径。

云智慧发布对象关系型数据库CloudPanguDB，打破传统技术壁垒
近日，云智慧推出关系型数据库CloudPanguDB（中文名称：盘古数据库），旨在通过高兼容性能和创新技术架构，降低企业项目整体运营成本。无论是处理海量复杂数据，还是构建清晰有序的数据结构关系，CloudPanguDB都具有强大的应用价值。随着各产业数字化转型的迅速发展，企业对国产化数据库需求与日俱增。CloudPanguDB以云智慧自身产品技术为基础，统一优化技术架构，功能覆盖关系型数据库、全文
云智慧：拥抱AI算法驱动的智能运维服务创新引擎
随着信息化、数字化、智能化的加码，企业对人工智能、大数据等技术应用呈现出明显兴趣，海笔研究对国内中型规模企业调研表明，在2020年，54.1%的企业选择购买人工智能类应用，41.9%的企业选择购买大数据及BI类应用，各类产品软件的应用大幅提升了企业信息系统复杂度，以及运维管理难度。业务发展催生服务需求从系统管理者角度出发，信息系统从“单机Excel表格”到“集中式单系统”再到“微服务、云架构”等，
python本地连接minio 伶星37 python 网络服务器
在你浏览器能成功访问到你的minio网页，并且成功登录之后。接下来如果你想用python连接数据库，并且想用python连接minio，就可以用这个blog。连接代码client=Minio("localhost:9000",#9000是默认端口号access_key="admin",#你的账户secret_key="password",#你的密码secure=False,#这点我会详细说明)为什
C++开发内存监控工具推荐点云SLAM 开发工具开发环境 c++开发语言 AddProperty gperftools Address 内存监控访问越界
在C++开发中，内存管理是至关重要的，尤其是当程序处理大数据或长时间运行时，内存泄漏或不当使用可能导致性能下降或崩溃。以下是几种常见且有效的内存监控工具，它们可以帮助开发者实时分析、诊断和优化程序的内存使用。1.ValgrindValgrind是一个广泛使用的内存调试和性能分析工具，它的Memcheck工具可以帮助你检查程序中的内存泄漏、内存越界、未初始化内存使用等问题。特点：检测内存泄漏。检查内
mongodb与爬虫的关系 getapi mongodb 爬虫数据库
MongoDB与爬虫之间的关系主要体现在数据存储和管理的层面。爬虫（WebCrawler或Spider）是一种自动化工具，用于从互联网上抓取网页内容或特定数据。而MongoDB是一个NoSQL数据库，常被用来存储和管理爬虫抓取到的数据。以下是它们之间关系的具体分析：1.爬虫的数据存储需求爬虫在运行过程中会抓取大量的非结构化或半结构化数据（例如HTML页面、JSON数据、图片链接等）。这些数据通常具
【MongoDB】分片部署和应用实践全过程 gaoyi1234560 mongodb 数据库运维开发
基本概念Router(mongos)：数据库集群请求的入口ConfigServers(replicaset)存储数据库的元数据，如路由，分片的配置Share:数据库拆分分片具体操作配置主机名：vi/etc/hosts192.168.0.222m1192.168.0.111m2192.168.0.113m3安装目录为：/opt/mongodb/cluster创建目录和日志目录：mkdir-p/opt
Java 大视界 -- Java 大数据在智慧农业精准灌溉与施肥决策中的应用（144）青云交大数据新视界 Java 大视界 java 大数据智慧农业精准灌溉施肥决策数据分析机器学习
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
Java 大视界 -- 基于 Java 的大数据机器学习模型的多模态融合技术与应用（143）青云交大数据新视界 Java 大视界 java 大数据机器学习多模态融合智能安防智能客服数据处理
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
SQL Server 2022常见问题软件研究员数据库 sql server
根据本人多年使用数据库的经验，总结SQLServer2022数据库常见问题包含安装、链接、性能等问题，下面简单说下。一、安装失败问题主要是以下问题：1、硬件配置问题sqlServer2022运行的最低硬件配置要求：根据官网公布要求最低1G内存，最低6G可用磁盘空间，处理器速度1.4GHz，x64处理器；显示器Super-VGA(800x600)。注意：在这里我说的是最低配置。2、软件插件问题缺少.
Elasticsearch 搜索引擎原理与实践 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介Elasticsearch是开源分布式搜索引擎，提供搜素、分析、数据可视化等功能。它是一个基于Lucene的全文搜索服务器，能够把结构化或非结构化的数据经过索引生成一个索引库，使其可以被搜索到。在现代Web应用中，搜索功能已经成为不可或缺的一项功能。但是传统上，传统搜索方式需要依赖于数据库查询或者其他复杂的查询接口。而Elasticsearch提供了一种高效、稳
redis过期删除、内存淘汰、双写一致性---java 皮卡兔子屋 #redis redis java mybatis
过期删除Redis的缓存失效不会立即删除，Redis的过期删除策略是选择「惰性删除+定期删除」这两种策略配和使用。惰性删除策略的做法是，不主动删除过期键，每次从数据库访问key时，都检测key是否过期，如果过期则删除该key。定期删除策略的做法是，每隔一段时间「随机」从数据库中取出一定数量的key进行检查，并删除其中的过期key。内存淘汰Redis提供了8种不同的数据淘汰策略，默认是noevict
生物信息复习笔记（3）——GEO数据库 Kriol 生物信息初学笔记
Platform：测序平台信息。不同测序平台对每一个基因编号不一样。拿到测序结果之后只是知道了某个基因ID的表达情况，需要将基因ID匹配成对应的基因，需要根据Platform信息去注释。GSM：样本。一个测序数据集里有很多个GSM，点进去可以看到该样本的各种信息（样本来源，临床表征，各种处理样本方式，处理数据方式）。GSE：包含所有信息的完整数据集。（最重要）做生信样本量不能少：30以上。精准搜索
国内外的网络安全成难题，IPLOOK 2022年用产品筑起“护城墙” 爱浦路 IPLOOK 网络安全安全架构
《爱尔兰时报》和爱尔兰国家广播电台（RTE）于12月31日对2021年爱尔兰科技行业的赢家和弱点进行了年终盘点。双方纷纷表示，2021年爱尔兰科技行业最大的弱点是爱尔兰的网络安全，这一年是一场前所未有的灾难。随着人工智能、大数据、5G等新兴技术的发展，企业面临的威胁日益增加，信息安全的重要性变得越来越突显。现在我们把视线从爱尔兰的网络安全问题拉回到国内的网络安全现状。我国对网络安全问题保持时刻警惕
【Python系列】高效Parquet数据处理策略：合并与分析实践小团团0 python 开发语言
在大数据时代，数据的存储、处理和分析变得尤为重要。Parquet作为一种高效的列存储格式，被广泛应用于大数据处理框架中，如ApacheSpark、ApacheHive等。Parquet是一个开源的列存储格式，它被设计用于支持复杂的嵌套数据结构，同时提供高效的压缩和编码方案，以优化存储空间和查询性能。以下将详细介绍如何使用Python对Parquet文件进行数据处理与合并，并提供相应的源码示例。一、
JavaWeb学习笔记时间会给答案scidag java java-ee servlet 笔记学习数据库
一.刨析JDBC1.概念：JDBC就是java语言操作关系型数据库的一套API2.常用API2.1DriverManager:作用1.注册驱动2.获取数据库连接;都是静态方法，直接类名.方法2.2Connection:作用1.获取sql执行对象2.事务管理《《关于管理事务回滚常用方法setAutoCommit（）commit(),rollback()2.3Statement:作用执行SQL语句《《
CSS3学习教程，从入门到精通，CSS3 布局语法知识点及案例代码（15）知识分享小能手编程语言如门前端开发网页开发 css3 学习 css 前端 html5 html Java后端开发
CSS3布局知识点及案例代码一、盒模型知识点CSS盒模型是理解CSS布局的基础，它包括内容（content）、内边距（padding）、边框（border）和外边距（margin）四个部分。content：盒子的内容区域，定义宽度和高度。padding：内容与边框之间的空间，可控制内容与边框的距离。border：围绕内容和内边距的边框，可设置边框的样式、宽度和颜色。margin：边框与其他元素之间
CSS3学习教程，从入门到精通，CSS3 盒子模型语法知识点及案例代码（13）知识分享小能手编程语言如门前端开发网页开发 css3 学习前端 css html5 html Java后端开发
CSS3盒子模型语法知识点及案例代码CSS3盒子模型概述CSS3盒子模型是用于控制网页元素布局和外观的重要工具。它包括标准盒子模型、IE盒子模型以及CSS3引入的弹性盒子模型和网格布局模型。一、标准盒子模型（StandardBoxModel）语法selector{width:value;height:value;padding:value;border:value;margin:value;}wi
CSS3学习教程，从入门到精通，CSS3 背景样式语法知识点及案例代码（11）知识分享小能手编程语言如门前端开发网页开发 css3 学习前端 css html5 Java Java后端开发
CSS3背景样式语法知识点及案例代码一、背景颜色（background-color）/*设置元素的背景颜色*/selector{background-color:color-value;}selector：选择器，指定要设置背景颜色的元素。color-value：颜色值，可以是颜色名称、十六进制颜色代码、RGB颜色值或HSL颜色值等。案例：.box{width:200px;height:200px
10初识Spring MVC框架 TechLens JAVA EE笔记 servlet spring java
学习内容一、回顾1.JSPModel2架构模型采用JSP+Servlet+JavaBean技术实现了页面显示、流程控制和业务逻辑的分离Jsp负责生成动态网页，只用做显示页面；Servlet负责流程控制，用来处理各种请求的分派；JavaBeans负责业务逻辑，对数据库的操作流程控制等通用逻辑以硬编码的方式实现，每次开发新的Web应用程序均需重新编写流程控制、通用逻辑代码2.WebMVC应用框架Spr
Spring MVC +Spring 框架学习总结-入门必学知识点柚子味* Java spring spring mvc java spring mvc
Spring框架是由于软件开发的复杂性而创建的。Spring使用的是基本的JavaBean来完成以前只可能由EJB完成的事情。然而，Spring的用途不仅仅限于服务器端的开发。从简单性、可测试性和松耦合性角度而言，绝大部分Java应用都可以从Spring中受益。spring相关视频教程：https://www.bilibili.com/video/BV1nz4y1d7uySpringMVC是Spr
CSS3学习教程，从入门到精通，CSS3 图像属性知识点及案例代码（16）知识分享小能手前端开发网页开发编程语言如门 css3 学习前端 css html5 javascript css前端开发
CSS3图像属性知识点及案例代码一、图像属性概述CSS3提供了丰富的图像属性，可以控制图像的显示方式、大小、位置、滤镜效果等。以下是一些常用的图像属性：二、常用图像属性1.background-image作用:设置元素的背景图像。语法:background-image:url("image.jpg");案例:.box{width:300px;height:200px;background-imag
专业课笔记——（第一章：C、C++基础知识）大小胖虎 C/C++基础知识笔记算法 C C++数据类型操作类型笔记
目录一、数据类型二、不同格式输出的含义三、运算符优先级四、计算机基础知识五、零碎基础知识点一、数据类型1、C语言中的最简单的数据类型：整数类型、字符类型、浮点类型（C语言没有逻辑型(bool)它是C++特有的，而c语言它是通过0、1表示实现的）构造类型：枚举型、数组类型、结构体类型、共用体类型、类类型(C++特有)2、计算字符串长度：strlen()：c语言中的函数length()：c++中的函数
SQLyog 13.1.6 社区免费中文版：高效便捷的MySQL管理工具 m0_74823264 面试学习路线阿里巴巴 mysql 数据库
SQLyog13.1.6社区免费中文版：高效便捷的MySQL管理工具sqlyog_13.1.6.7z项目地址:https://gitcode.com/open-source-toolkit/a94c8项目介绍SQLyog13.1.6社区免费中文版是一款专为MySQL设计的数据库管理工具，以其强大的功能和直观的图形用户界面（GUI）深受开发者和数据库管理员的喜爱。该版本为社区免费版，提供了中文界面，
探索NebulaGraph：一个开源分布式图数据库的技术解析一休哥助手数据库分布式系统开源分布式数据库
1.介绍NebulaGraph的定位和用途NebulaGraph是一款开源的分布式图数据库，专注于存储和处理大规模图数据。它的主要定位是为了解决图数据存储和分析的问题，能够处理节点和边数量巨大、结构复杂的图结构数据。NebulaGraph被设计用来应对各种领域的图数据挑战，包括社交网络分析、推荐系统、网络安全监测等。无论是从数据量还是计算复杂度上，NebulaGraph都能够应对各种挑战，为用户提
整形在内存中的存储（例题逐个解析）祁同伟. #C语言 c语言
目录一.相关知识点1.截断：2.整形提升：3.如何截断，整型提升？（1）负数（2）正数（3）无符号整型，高位补0注意：提升后得到的是补码。要根据打印类型，判断是否有符号位；有效数字二.例题1.2.3.4.疑问：不应该算数转换为unsignedint吗？5.6.一.相关知识点1.截断：直接保留低位的二进制位2.整形提升：表达式中的字符(char)和短整形(short)操作数在使用之前被转换为普通整型
MySQL 中，分库分表机制和分表分库策略小赖同学啊 java mysql oracle 数据库
在MySQL中，分库分表是一种常见的数据库水平扩展方案，用于解决单库单表数据量过大导致的性能瓶颈问题。通过将数据分散到多个数据库或表中，可以提高系统的并发处理能力、降低单点故障风险，并提升查询性能。一、分库分表的作用提升性能：分散数据存储和查询压力，避免单库单表的性能瓶颈。提高并发能力：多个数据库或表可以并行处理请求，提高系统吞吐量。降低单点故障风险：数据分散存储，单个数据库或表故障不会影响整个系
TDengine 入坑 xijieyu tdengine docker linux
的最近想折腾一个时序数据库，所以入坑了TDengine我的环境是WIN10+虚拟机ubuntu，开发语言是C#。在虚拟机里一开始使用docker来拉取TDengine镜像，后来发现docker的网络配置不熟，所以干脆直接在宿主机上安装TDengine直接使用。安装完了后，taos怎么都连接不上，显示"Unabletoestablishconnection"，根据官方教程中的解释，一步一步排除各类连
springCloud集成tdengine(原生和mapper方式) 其一张小娟 spring cloud tdengine mybatis
第一种mapper方式，原生方式在主页看第二章一、添加pom文件com.zaxxerHikariCPcom.taosdata.jdbctaos-jdbcdriver3.5.3二、在nacos中配置好数据库连接spring:datasource:url:jdbc:TAOS://localhost:6030/testusername:rootpassword:yourPassWorddriver-cl
数据库数值函数详解 web安全工具库数据库 oracle jvm
各类资料学习下载合集https://pan.quark.cn/s/8c91ccb5a474数值函数是数据库中用于处理数值数据的函数，可以用于执行各种数学运算、统计计算等。数值函数在数据分析及处理时非常重要，能够帮助我们进行数据的聚合、计算和转换。在本篇博客中，我们将详细介绍常用的数据库数值函数，并通过Python和SQLite进行示例，帮助您理解和应用这些函数。1.数值函数的基本概念数值函数是用于
利用AI与MySQL提升工业物联网健康监测的智慧水平——构建预测性维护的新纪元墨夶数据库学习资料1 人工智能 mysql 物联网
在工业4.0和智能制造的大背景下，如何确保生产设备的高效稳定运行成为企业竞争力的核心要素之一。传统的事后维修方式已经难以满足现代制造业的需求，而基于人工智能（AI）的预测性维护系统则为这一挑战提供了全新的解决方案。今天，我们将深入探讨如何结合AI技术和MySQL数据库，打造一个智能、高效的工业物联网（IIoT）健康监测平台，助力企业在激烈的市场竞争中脱颖而出。一、为什么选择AI+MySQL？1.A
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag

容错机制 （检查点 Checkpoint）

容错机制

检查点 Checkpoint

1.检查点的保存

1.1 周期性的触发保存

1.2 保存的时间点

1.3 保存的具体流程

2.从检查点恢复状态

（1）重启应用

（2）读取检查点，重置状态

（3）重放数据

（4）继续处理数据

3.检查点算法

3.1 检查点分界线（Barrier）

3.2 分布式快照算法

4.保存点（Savepoint）

你可能感兴趣的:(flink知识点,数据库,大数据,flink)

容错机制（检查点 Checkpoint）