Firechou

Kafka快速实战以及基本原理详解

Kafka介绍

kafka官网：https://kafka.apache.org/

Apache Kafka是一个分布式流处理平台，最初由LinkedIn开发并于2011年开源。它主要用于解决大规模数据的实时流式处理和数据管道问题。

Kafka是一个分布式的发布-订阅消息系统，可以快速地处理高吞吐量的数据流，并将数据实时地分发到多个消费者中。Kafka消息系统由多个broker（服务器）组成，这些broker可以在多个数据中心之间分布式部署，以提供高可用性和容错性。

Kafka的基本架构由生产者、消费者和主题（topic）组成。生产者可以将数据发布到指定的主题，而消费者可以订阅这些主题并消费其中的数据。同时，Kafka还支持数据流的处理和转换，可以在管道中通过Kafka Streams API进行流式计算，例如过滤、转换、聚合等。

Kafka使用高效的数据存储和管理技术，能够轻松地处理TB级别的数据量。其优点包括高吞吐量、低延迟、可扩展性、持久性和容错性等。

Kafka在企业级应用中被广泛应用，包括实时流处理、日志聚合、监控和数据分析等方面。同时，Kafka还可以与其他大数据工具集成，如Hadoop、Spark和Storm等，构建一个完整的数据处理生态系统。

MQ的作用

MQ：MessageQueue，消息队列。队列，是一种FIFO先进先出的数据结构。消息则是跨进程传递的数据。一个典型的MQ系统，会将消息由生产者发送到MQ进行排队，然后根据一定的顺序交由消息的消费者进行处理。
QQ和微信就是典型的MQ。只不过他对接的使用对象是人，而Kafka需要对接的使用对象是应用程序。

MQ的作用主要有以下三个方面：

异步

例子：快递员发快递，直接到客户家效率会很低。引入菜鸟驿站后，快递员只需要把快递放到菜鸟驿站，就可以继续发其他快递去了。客户再按自己的时间安排去菜鸟驿站取快递。
作用：异步能提高系统的响应速度、吞吐量。

解耦

例子：《Thinking in JAVA》很经典，但是都是英文，我们看不懂，所以需要编辑社，将文章翻译成其他语言，这样就可以完成英语与其他语言的交流。
作用：
1、服务之间进行解耦，才可以减少服务之间的影响。提高系统整体的稳定性以及可扩展性。
2、另外，解耦后可以实现数据分发。生产者发送一个消息后，可以由一个或者多个消费者进行消费，并且消费者的增加或者减少对生产者没有影响。

削峰

例子：长江每年都会涨水，但是下游出水口的速度是基本稳定的，所以会涨水。引入三峡大坝后，可以把水储存起来，下游慢慢排水。
作用：以稳定的系统资源应对突发的流量冲击。

为什么要用Kafka

ELK组合是常用的日志收集框架，Kafka的业务场景决定了产品的特点：

数据吞吐量很大：需要能够快速收集各个渠道的海量日志。
集群容错性高：允许集群中少量节点崩溃。
功能不需要太复杂：Kafka的设计目标是高吞吐、低延迟和可扩展，主要关注消息传递而不是消息处理。所以，Kafka并没有支持死信队列、顺序消息等高级功能。
允许少量数据丢失：Kafka本身也在不断优化数据安全问题，目前基本上可以认为Kafka可以做到不会丢数据。

安装Kafka

单机版和集群版参考kafka安装教程。
传送门：https://blog.csdn.net/u010355502/article/details/132414447

消费模式

一般消费

只会消费生产端新添加的数据。

bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test

指定消费进度

通过添加参数--from-begining从头开始消费：

bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --from-beginning --topic test

指定从某一条开始消费：

bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --partition 0 --offset 4 --topic test

表示从第0号Partition上的第四个消息开始读起。

分组消费

对于每个消费者，可以指定一个消费者组。kafka中的同一条消息，只能被同一个消费者组下的某一个消费者消费。而不属于同一个消费者组的其他消费者，也可以消费到这一条消息。在kafka-console-consumer.sh脚本中，可以通过--consumer-property group.id=testGroup来指定所属的消费者组。例如，可以启动三个消费者组，来验证一下分组消费机制：

# 两个消费者实例属于同一个消费者组
bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --consumer-property group.id=testGrroup --topic test
bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --consumer-property group.id=testGrroup --topic test
# 这个消费者实例属于不同的消费者组
bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --consumer-property group.id=testGrroup2 --topic test

查看消费者组的偏移量：
可以使用kafka-consumer-groups.sh观测消费者组的情况，包括他们的消费进度：

bin/kafka-consumer-groups.sh --bootstrap-server localhost:9092 --describe --group testGroup

业务上是通过topic来分发消息，实际上数据是保存在partition这样一个数据结构上。

消息传递机制

图示：

概念说明：

客户端Client

包括消息生产者和消息消费者。

消费者组ConsumerGroup

每个消费者可以指定一个所属的消费者组，相同消费者组的消费者共同构成一个逻辑消费者组。每一个消息会被多个感兴趣的消费者组消费，但是在每一个消费者组内部，一个消息只会被消费一次。

服务端Broker

一个Kafka服务器就是一个Broker。

话题Topic

这是一个逻辑概念，一个Topic被认为是业务含义相同的一组消息。客户端都通过绑定Topic来生产或者消费自己感兴趣的话题。

分区Partition

Topic只是一个逻辑概念，而Partition就是实际存储消息的组件。每个Partiton就是一个queue队列结构。所有消息以FIFO先进先出的顺序保存在这些Partition分区中。

Kafka集群

为什么要用集群

单机服务下，Kafka已经具备了非常高的性能。TPS能够达到百万级别。但是，在实际工作中使用时，单机搭建的Kafka会有很大的局限性。
一方面：消息太多，需要分开保存。Kafka是面向海量消息设计的，一个Topic下的消息会非常多，单机服务很难存得下来。这些消息就需要分成不同的Partition，分布到多个不同的Broker上。这样每个Broker就只需要保存一部分数据。这些分区的个数就称为分区数。
另一方面：服务不稳定，数据容易丢失。单机服务下，如果服务崩溃，数据就丢失了。为了保证数据安全，就需要给每个Partition配置一个或多个备份，保证数据不丢失。Kafka的集群模式下，每个Partition都有一个或多个备份。Kafka会通过一个统一的ZooKeeper集群作为选举中心，给每个Partition选举出一个主节点Leader，其他节点就是从节点Follower。主节点负责响应客户端的具体业务请求，并保存消息。而从节点则负责同步主节点的数据。当主节点发生故障时，Kafka会选举出一个从节点成为新的主节点。
Kafka集群中的这些Broker信息，包括Partition的选举信息，都会保存在额外部署的Zookeeper集群当中，这样，kafka集群就不会因为某一些Broker服务崩溃而中断。

Kafka集群架构

说明：

Topic是一个逻辑概念，Producer和Consumer通过Topic进行业务沟通。
Topic并不存储数据，Topic下的数据分为多组Partition，尽量平均的分散到各个Broker上。每组Partition包含Topic下一部分的消息。每组Partition包含一个Leader Partition以及若干个Follower Partition进行备份，每组Partition的个数称为备份因子 replica factor。
Producer将消息发送到对应的Partition上，然后Consumer通过Partition上的Offset偏移量，记录自己所属消费者组Group在当前Partition上消费消息的进度。
Producer发送给一个Topic的消息，会由Kafka推送给所有订阅了这个Topic的消费者组进行处理。但是在每个消费者组内部，只会有一个消费者实例处理这一条消息。
最后，Kafka的Broker通过Zookeeper组成集群。然后在这些Broker中，需要选举产生一个担任Controller角色的Broker。这个Controller的主要任务就是负责Topic的分配以及后续管理工作。在我们实验的集群中，这个Controller实际上是通过ZooKeeper产生的。

集群部署

Kafka集群部署请参考如下教程。
传送门：https://blog.csdn.net/u010355502/article/details/132414447

理解Topic&Partition&Broker

# 创建一个分布式的Topic
./kafka-topics.sh --bootstrap-server 192.168.0.48:9092 --create --replication-factor 2 --partitions 4 --topic disTopic
# 列出所有的Topic
./kafka-topics.sh --bootstrap-server 192.168.0.48:9092 --list
# 查看列表情况
./kafka-topics.sh --bootstrap-server 192.168.0.48:9092 --describe --topic disTopic

–create
创建集群，可以指定一些补充的参数。大部分的参数都可以在配置文件中指定默认值。

partitons参数表示分区数，这个Topic下的消息会分别存入这些不同的分区中。示例中创建的disTopic，指定了四个分区，也就是说这个Topic下的消息会划分为四个部分。

replication-factor表示每个分区有几个备份。示例中创建的disTopic，指定了每个partition有两个备份。

–describe
查看Topic信息。

partiton参数列出了四个partition，后面带有分区编号，用来标识这些分区。

Leader表示这一组partiton中的Leader节点是哪一个。这个Leader节点就是负责响应客户端请求的主节点。从这里可以看到，Kafka中的每一个Partition都会分配Leader，也就是说每个Partition都有不同的节点来负责响应客户端的请求。这样就可以将客户端的请求做到尽量的分散。

Replicas参数表示这个partition的多个备份是分配在哪些Broker上的，也称为AR。这里的0,1,2就对应配置集群时指定的broker.id。但是，Replicas列出的只是一个逻辑上的分配情况，并不关心数据实际是不是按照这个分配。甚至有些节点服务挂了之后，Replicas中也依然会列出节点的ID。

ISR参数表示partition的实际分配情况。他是AR的一个子集，只列出那些当前还存活，能够正常同步数据的那些Broker节点。

Partition日志文件

之前在配置Kafka集群时，指定了一个log.dirs属性，指向了一个服务器上的日志目录。进入这个目录，就能看到每个Broker的实际数据承载情况。
Kafka当中，Topic是一个数据集合的逻辑单元。同一个Topic下的数据，实际上是存储在Partition分区中的，Partition就是数据存储的物理单元。而Broker是Partition的物理载体，这些Partition分区会尽量均匀的分配到不同的Broker机器上。而之前接触到的offset，就是每个消息在partition上的偏移量。

Kafka为何要这样来设计Topic、Partition和Broker的关系呢？

Kafka设计需要支持海量的数据，而这样庞大的数据量，一个Broker是存不下的。那就拆分成多个Partition，每个Broker只存一部分数据。这样极大的扩展了集群的吞吐量。
每个Partition保留了一部分的消息副本，如果放到一个Broker上，就容易出现单点故障。所以就给每个Partition设计Follower节点，进行数据备份，从而保证数据安全。另外，多备份的Partition设计也提高了读取消息时的并发度。
在同一个Topic的多个Partition中，会产生一个Partition作为Leader。这个Leader Partition会负责响应客户端的请求，并将数据往其他Partition分发。

Kraft集群（了解）

Kraft是Kafka从2.8.0版本开始支持的一种新的集群架构方式。其目的主要是为了摆脱Kafka对Zookeeper的依赖。因为以往基于Zookeeper搭建的集群，增加了Kafka演进与运维的难度，逐渐开始成为Kakfa拥抱云原生的一种障碍。使用Kraft集群后，Kafka集群就不再需要依赖Zookeeper，将之前基于Zookeeper管理的集群数据，转为由Kafka集群自己管理。

虽然官方规划会在未来完全使用Kraft模式代替现有的Zookeeper模式，但是目前来看，Kraft集群还是没有Zookeeper集群稳定，所以现在大部分企业还是在使用Zookeeper集群。
2022年10月3日发布的3.3.1版本才开始将KRaft标注为准备用于生产。KIP-833: Mark KRaft as Production Ready。这离大规模使用还有比较长的距离。
实际上，Kafka摆脱Zookeeper是一个很长的过程。在之前的版本迭代过程中，Kafka就已经在逐步减少Zookeeper中的数据。在Kafka的bin目录下的大量脚本，早期都是要指定zookeeper地址，后续长期版本更迭过程中，逐步改为通过–bootstrap-server参数指定Kafka服务地址。到目前版本，基本所有脚本都已经抛弃了–zookeeper参数了。

传统的Kafka集群，会将每个节点的状态信息统一保存在Zookeeper中，并通过Zookeeper动态选举产生一个Controller节点，通过Controller节点来管理Kafka集群，比如触发Partition的选举。而在Kraft集群中，会固定配置几台Broker节点来共同担任Controller的角色，各组Partition的Leader节点就会由这些Controller选举产生。原本保存在Zookeeper中的元数据也转而保存到Controller节点中。

Raft协议是目前进行去中心化集群管理的一种常见算法，类似于之前的Paxos协议，是一种基于多数同意，从而产生集群共识的分布式算法。Kraft则是Kafka基于Raft协议进行的定制算法。

新的Kraft集群相比传统基于Zookeeper的集群，有一些很明显的好处：

Kafka可以不依赖于外部框架独立运行。这样减少Zookeeper性能抖动对Kafka集群性能的影响，同时Kafka产品的版本迭代也更自由。
Controller不再由Zookeeper动态选举产生，而是由配置文件进行固定。这样比较适合配合一些高可用工具来保持集群的稳定性。
Zookeeper的产品特性决定了他不适合存储大量的数据，这对Kafka的集群规模(确切的说应该是Partition规模)是极大的限制。摆脱Zookeeper后，集群扩展时元数据的读写能力得到增强。

不过，由于分布式算法的复杂性。Kraft集群和同样基于Raft协议定制的RocketMQ的Dledger集群一样，都还在不太稳定，在真实企业开发中，用得相对还是比较少。

深入浅出：API接口原理与实现专注API从业者 API接口经验分享电商平台开发语言数据库算法大数据
API（ApplicationProgrammingInterface，应用程序编程接口），如同软件世界中的信使，为不同的应用程序搭建起沟通的桥梁，使它们能够共享数据与功能，无需了解彼此的内部运作机制。一、API接口的原理想象一下，你去餐厅用餐，无需进入厨房，只需通过菜单点餐，服务员便会将你的需求传达给厨师，并将制作好的美食端到你面前。API接口就如同餐厅的服务员，它定义了应用程序之间交互的规则：
分布式电商系统中的API网关架构设计专注API从业者经验分享 API接口电商平台分布式大数据数据仓库架构
在分布式电商系统中，API网关扮演着至关重要的角色，它是系统对外的统一入口，负责请求路由、协议转换、安全认证、流量控制等功能。以下是关于分布式电商系统中API网关架构设计的详细内容：设计目标统一入口：为所有外部请求提供一个统一的访问点，简化客户端与后端服务的交互。请求路由：根据请求的特征（如URL、请求方法等）将请求转发到对应的后端微服务。安全防护：实现身份验证、授权、防攻击等安全机制，保护后端服
I/O 多路复用我荔枝呢！ I/O多路复用 java
I/O多路复用是一种高效的I/O操作技术，允许单个线程同时监控多个文件描述符（如套接字），并在其中任何一个文件描述符就绪时进行读写操作。这种技术广泛应用于高并发网络服务器中，如Redis、Nginx等。I/O多路复用的工作原理1.监控多个文件描述符：使用系统调用（如select、poll、epoll）监控多个文件描述符的状态（可读、可写、异常等）。2.事件驱动：当某个文件描述符就绪时，系统调用返回
hash冲突及hash冲突的4种解决方案我荔枝呢！哈希算法散列表算法
哈希出现冲突的情况：输入域与输出域不匹配：哈希函数的输入可以是任意长度的数据，组合无限，而哈希值的长度固定，输出域有限，根据鸽巢原理，必然会有不同输入映射到同一个输出值。（鸽巢原理：这是哈希冲突的根本原因。根据鸽巢原理（也称为抽屉原理），如果将n+1n+1个元素放入nn个容器中，则至少有一个容器包含多于一个元素。在哈希表中，这意味着当输入数据的数量超过哈希表的容量时，必然会发生冲突。）哈希函数设计
java八股文之Redis qq_45923849 java redis 开发语言
1.Rdis常见的使用场景缓存分布式锁（redision，setnx）计数器保存token消息队列延迟队列2.说明一下缓存雪崩，缓存穿透和缓存击穿以及解决方式1.缓存雪崩定义：缓存雪崩指的是当大量的缓存数据同时失效，或者Redis服务器突然宕机，导致后端数据库突然承受大量请求的压力，从而可能导致数据库崩溃的情况。解决：1.分散缓存过期时间：给缓存设置不同的过期时间，避免同时失效。2.使用Rdis集
SpringBoot3.0.3集成Redisson3.20.0 青阳科技 SpringBoot3.0.3 spring boot redis 分布式
一、概述使用SpringBoot构建分布式应用程序时，常常需要实现分布式锁、分布式限流、分布式任务调度和分布式缓存等功能，这些功能都可以通过Redis来实现。而Redisson是一个优秀的Redis客户端，它提供了丰富的分布式功能，可以帮助我们更方便地实现这些功能。那么，SpringBoot集成Redisson后我们可以实现哪些功能？1.分布式锁在分布式系统中，多个节点可能会同时对同一个资源进行修
springboot整合redisson实现分布式锁及布隆过滤器 lncy1991 工作记录 redis 过滤器 spring
下载安装redisson整合maven添加依赖使用的版本是3.13，因为springboot使用的是2.1.3版本，因此按照官方上的提示，移除redisson-spring-data-22org.springframework.bootspring-boot-starter-data-redisorg.redissonredisson-spring-boot-starterorg.redisson
【Java八股文】07-Redis面试篇 bblb Java八股文系列 java redis 面试复习分布式分布式锁 canal
【Java八股文】07-Redis面试篇Redis面试篇认识redis为什么用Redis作为MySQL的缓存？数据结构讲一下Redis底层的数据结构ZSet底层是由什么实现的线程模型Redis是单线程吗？Redis怎么进行I/O多路复用的？Redis采用单线程为什么还这么快？事务Redis锁有哪几种实现方式如何实现redis原子性？Redis中incr命令保证原子性的原理是什么redis分布式锁的
【Python爬虫(24)】Redis：Python爬虫的秘密武器奔跑吧邓邓子 Python爬虫 python 爬虫 redis 开发语言缓存
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、Redis数据结构大揭秘1.1字符串（String）1.2哈希
【Python爬虫(12)】正则表达式：Python爬虫的进阶利刃奔跑吧邓邓子 Python爬虫 python 爬虫正则表达式进阶高级
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、引言二、正则表达式高级语法详解2.1分组（Grouping）2
Java jvm 标记-清除算法（Mark-Sweep）阿豆学编程 Java JVM jvm 算法 java
标记-清除算法（Mark-Sweep）是一种经典的垃圾回收算法，它通过两阶段的过程来回收不再使用的对象，具体步骤为：标记阶段（MarkPhase）：遍历所有对象，标记出所有存活的对象。清除阶段（SweepPhase）：回收那些未被标记的对象，即那些不再被任何引用引用的对象。1.标记-清除算法的工作原理标记-清除算法分为两个阶段，分别是标记阶段和清除阶段。1.1标记阶段在标记阶段，垃圾回收器会从根对
WinForm开发核心基础之事件驱动设计 dotnet研习社 C#开发基础 .net dotnet
引言在Windows窗体应用程序（WinForm）开发中，事件驱动设计是构建用户交互式应用的核心机制。无论是按钮点击、键盘输入还是窗口重绘，所有用户与程序的交互行为本质上都是通过事件来驱动执行的。理解事件驱动模型不仅能够帮助我们构建响应式的界面，更是深入GUI编程的关键一步。本文将深入解析WinForm中事件驱动设计的原理、实现方式及最佳实践。一、什么是事件驱动设计？1.1传统程序与事件驱动程序的
量子计算行业深度研究报告：从理论突破到产业变革萧十一郎@ 深度研究量子计算
目录一、量子计算行业全景洞察1.1量子计算基本原理1.2量子计算发展历程1.3量子计算发展现状二、量子计算关键技术剖析2.1量子比特技术2.1.1超导量子比特2.1.2离子阱量子比特2.1.3光量子比特2.1.4其他量子比特技术2.2量子纠错技术2.3量子算法研究2.3.1Shor算法2.3.2Grover算法2.3.3其他量子算法三、量子计算产业生态构建3.1量子计算产业链结构3.2产业链上游：
ElasticSearch+Kibana通过Docker部署到Linux服务器中易安杰 elasticsearch 搜索引擎 linux 全文检索中文分词
1、ElasticSearch概念Elasticsearch是一个基于Lucene构建的开源搜索引擎，它提供了一个分布式、RESTful风格的搜索和数据分析引擎。Elasticsearch能够对大量数据进行快速全文搜索，并且具有非常好的水平扩展能力，这意味着当你需要处理更多数据时，可以通过增加更多的服务器来提升性能。文档和字段：elasticsearch是面向文档（Document）存储的，可以是
基于非洲秃鹫算法优化的最大熵图像多阈值分割（python）图像算法打怪图像分割算法 python 开发语言
基于非洲秃鹫算法优化的最大熵图像多阈值分割（python）文章目录基于非洲秃鹫算法优化的最大熵图像多阈值分割（python）1.最大熵阈值分割原理2.基于非洲秃鹫算法优化的多阈值分割3.算法结果：4.参考文献：5.Python代码摘要：本文介绍基于最大熵的图像分割，并且应用非洲秃鹫算法进行阈值寻优。1.最大熵阈值分割原理Kapur等人于1985年提出的最大熵法是另一种广受关注的阈值选取方法，其是在
【Hadoop】使用Docker容器搭建伪分布式集群慕青Voyager 分布式 hadoop docker
使用Docker容器搭建Hadoop伪分布式集群1、编写docker-compose.yaml文件配置集群version:"3"services:namenode:image:apache/hadoop:3.3.6hostname:namenodecommand:["hdfs","namenode"]ports:-9870:9870env_file:-./configenvironment:ENS
web网络安全:SQL 注入攻击爱编程的小庄网络安全前端 web安全 sql
SQL注入攻击（SQLInjection）概述SQL注入（SQLInjection）是Web应用程序中最常见的安全漏洞之一。攻击者通过在应用程序的输入字段中插入恶意SQL代码，能够操控数据库执行非预期操作，导致数据泄露、篡改甚至系统完全失控。本文将详细介绍SQL注入的工作原理、常见类型、危害以及防御方法。SQL注入的工作原理SQL注入攻击的核心在于应用程序未正确验证或转义用户输入，导致恶意SQL代
YOLOv8与BiFormer注意力机制的融合：提升多场景目标检测性能的研究向哆哆 YOLO 目标检测目标跟踪 yolov8
文章目录保姆级YOLOv8改进：适用于多种检测场景的BiFormer注意力机制（Bi-levelRoutingAttention）1.YOLOv8的改进背景2.BiFormer注意力机制的核心原理2.1Bi-levelAttention结构2.2路由策略与加权融合3.YOLOv8与BiFormer的结合3.1YOLOv8架构概述3.2BiFormer与YOLOv8的融合策略4.实现代码示例5.结果
循环水泵：工业冷却系统的核心枢纽 CodeJourney. 人工智能数据库算法架构
在现代工业生产中，循环水泵作为冷却系统的核心设备，发挥着不可替代的关键作用。无论是火力发电、石油化工，还是钢铁冶炼等行业，都离不开循环水泵高效稳定地运行，以保障生产流程的连续性和设备的安全性。本文将全面深入地探讨循环水泵的结构组成、工作原理、运行特点、维护要点以及未来发展趋势，力求为读者呈现一幅关于循环水泵的完整知识图景。一、循环水泵的重要作用循环水泵在工业系统中的主要任务是为凝汽式汽轮机提供大量
【大数据技术】搭建完全分布式高可用大数据集群（MySQL+Hive） Want595 Python大数据采集与分析大数据分布式 mysql
搭建完全分布式高可用大数据集群（MySQL+Hive）apache-hive-3.1.3-bin.tar.gzmysql-connector-java-8.0.30注：请在阅读本篇文章前，将以上资源下载下来。写在前面本文主要介绍搭建完全分布式高可用集群Hive的详细步骤。注意：统一约定将软件安装包存放于虚拟机的/software目录下，软件安装至/opt目录下。安装MySQL请按照以下步骤将MyS
MD5加密算法和BCrypt密码加密算法敲代码的小王！ java 安全算法
目录一、BCrypt算法与MD5算法介绍1、MD5算法1.MD5算法介绍2.MD5算法工作原理3.MD5算法的优劣2、BCrypt算法1.BCrypt算法介绍2.BCrypt算法原理3.BCrypt算法优劣3、两种算法的对比和总结1.MD5与bcrypt对比2.总结二、两种算法的使用1、MD5算法的使用说明：2、BCrypt算法的使用1.引入依赖2.BCrypt算法使用前言：随着网络安全威胁的日益
第 19 天：时间管理（Timers），让事件按时间执行！ Bluesonli ue5 unreal engine 游戏 c++前端
目标✅理解UE5中定时器（Timer）的原理与用途✅使用FTimerHandle实现事件延时、倒计时系统✅比较Tick()与Timer的使用场景✅构建一个简单的倒计时示例1️⃣为什么需要时间管理？在游戏开发中，很多行为不需要每帧都更新，而是按照一定时间间隔执行，例如：延迟执行事件（如开火冷却、动画播放完成后触发后续逻辑）倒计时效果（如倒计时计时器）优化性能：与Tick()相比，定时器能减少不必要的
HDFS分布文件系统（Hadoop Distributed File System）柿子小头 hdfs hadoop 大数据
目录一.HDFS的本质二.HDFS的架构与原理三、HDFS特性四.HDFS的常用命令1.显示HDFS指定路径下的所有文件2.在HDFS上创建文件夹3.上传本地文件到HDFS4.查看文件5.删除HDFS上的文件或者目录6.修改指定文件的权限信息（读、写、执行）一般语法：chmod[可选项]五、HDFS实战应用六、总结一.HDFS的本质HadoopDistributedFileSystem（HDFS）
机器学习(四) 本文(2万字) | 梯度下降GD原理 | Python复现 | 小酒馆燃着灯机器学习人工智能深度学习目标检测 python pytorch
第四章梯度下降一引入梯度二从一元到多元2.1一元函数2.1.1引入梯度下降2.1.2学习率2.1.3继续更新迭代2.2二元函数2.3多元函数三多种梯度方法3.1批量梯度下降（BatchGradientDescent，BGD）3.1.1对目标函数求偏导3.1.2每次迭代对参数进行更新3.1.3优缺点3.2随机梯度下降（StochasticGradientDescent，SGD）3.2.1对目标函数求
【AI大数据】数据中台的数据分析与挖掘：从数据到业务的决策 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
文章目录1.前言2.基本概念术语说明2.1数据模型及其实体关系实体（Entity）属性（Attribute）实体关系（EntityRelationships）2.2数据仓库2.3分析引擎2.4噪声数据2.5数据湖2.6数据总线2.7数据仓库模型3.核心算法原理和具体操作步骤以及数学公式讲解3.1数据挖掘技术概览（1）数据预处理（2）数据探查（3）数据清洗（4）数据转换（5）数据挖掘（6）知识发现（
LLM 中的 Matryoshka 量化：原理与优势数据掘金量化 LLM
什么是Matryoshka量化？MatQuant如何改进LLM性能指标MatQuant对模型量化的影响每个比特宽度处理模型权重的特定部分，并且它们的组合输出被聚合以优化整体量化性能。折线图显示了基于每个FFN（前馈网络）参数的有效比特数的不同量化技术下Gemma-29B的任务性能。右下角(int2)：尽管比特范围有限，但MatQuant（蓝色）实现了对量化桶的更好利用，从而提高了效率。基线（红色三
Unity3D 实用技巧 - 理解骨骼动画原理 & 在Unity3D中使用 Unity官方开发者社区
其实我们在游戏中，会常会应用到动画。所以今天小编与大家一起来深入了解“动画”，其实动画主要分为关节动画、骨骼动画、单一网格模型动画(关键帧动画)。1)关节动画：把角色分成若干独立部分，一个部分对应一个网格模型，部分的动画连接成一个整体的动画，角色比较灵活，Quake2中使用这种动画；2)骨骼动画：广泛应用的动画方式，集成了以上两个方式的优点，骨骼按角色特点组成一定的层次结构，有关节相连，可做相对运
html实现背景颜色透明，文字效果不透明快乐的二进制鸭 html css css3
html实现背景颜色透明，文字效果不透明通过伪元素的方式添加遮罩层（给背景颜色，层级，透明度，定位）即可，弹窗原理。{{itemTitles}}评标时间：14:30:00 - 18:30:00正在评标张三离开张三进入张三离开.contentLi{border-radius:0px45px0px45px;padding:49px40px30px39px;position:rela
数学--GCD和LCM wperseverance 蓝桥杯算法
GCD/LCM一、提前说明二、实现1.GCD（1）快速上手，内置函数（2）自己实现，理解原理2.LCM（1）快速上手，内置函数（2）自己实现，理解原理总结提示：以下是本篇文章正文内容，下面案例可供参考一、提前说明1.最大公约数（GCD）2.最小公倍数（LCM）3.从Python3.5开始，math模块提供了math.gcd()函数，可以直接计算两个数的最大公约数。4.最小公倍数可以通过公式LCM(
Python3 生成器与迭代器的使用瞎叨叨的一天最强 Python3 基础 python 编程语言
专栏地址：最强Python3基础公众号：Python生产力文章目录前言一、生成器二、迭代器三、生成器的原理总结前言集合数据类型的迭代我们在Python3列表、元组、字典和集合的比较（及各种生成式）已经讲过，每一种都可以使用不同的方法来进行迭代，但是我们可以发现每一种循环方式的最后都有一个迭代器iter()的方式，虽然看起来和其他方式差不多，获取的结果也一样，但是迭代器绝对是一种强大的方法。一、生成
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL