降世神童

大数据系列 | Kafka架构分析及应用

1. 消息系统介绍
2. Kafka原理分析
3. Kafka架构分析
4. Kafka的安装与配置
- 4.1. Zookeeper集群安装配置
- 4.2. 安装Kafka集群
- 4.3. 配置kafka自启动服务
5. kafka生产者和消费者的应用
- 5.1. 生产者使用
- 5.2. 消费者使用
6. Kafka Controller控制器

1. 消息系统介绍

常用消息系统对比：
■ RabbitMQ：Erlang编写，支持多协议AMQP、XMPP、SMTP、STOMP。支持负载均衡、数据持久化。同时支持Peer-to-Peer和发布/订阅模式。.
■ Redis：基于Key-Value对的NoSQL数据库，同时支持MQ功能，可做轻量级队列服务使用。就入队操作而言，Redis对短消息（小于10KB)的性能RabbitMQ好，长消息的性能比RabbitMQ差。
■ ZeroMQ：轻量级，不需要单独的消息服务器或中间件，应用程序本身扮演该角色，Peer-to-Peer。它实质上是一个库，需要开发人员自己组合多种技术，使用复杂度高。
■ ActiveMQ：JMS实现，Peer-to-Peer，支持持久化.、XA事务。
■ Kafka/Jafka：高性能跨语言的分布式发布/订阅消息系统，数据持久化，全分布式，同时支持在线和离线处理。
■ MetaQ/RocketMQ：纯Java实现，发布/订阅消息系统，支持本地事务和XA分布式事务。

消息系统适用场景：

■ 解耦： 各位系统之间通过消息系统这个统一的接口交换数据，无须了解彼此的存在
■ 冗余： 部分消息系统具有消息持久化能力，可规避消息处理前丢失的风险
■ 扩展： 消息系统是统一的数据接口，各系统可独立扩展
■ 峰值处理能力： 消息系统可顶住峰值流量，业务系统可根据处理能力从消息系统中获取并处理对应量的请求
■ 可恢复性： 系统中部分组件失效并不会影响整个系统，它恢复后仍然可从消息系统中获取并处理数据
■ 异步通信： 在不需要立即处理请求的场景下，可以将请求放入消息系统，合适的时候再处理

2. Kafka原理分析

Kafka是一个高吞吐量、持久性的分布式发布/订阅消息系统。其有以下特点。
● 高吞吐量：单机可支持每秒100万条消息的读写。
● 消息持久化：所有消息均被持久化到磁盘，无消息丢失，支持消息重放。
● 完全分布式：Producer、Broker、Consummer均支持水平扩展。

Kafka 的数据是存储在磁盘中的，为什么可以满足每秒百万级别消息的生产和消费？主要是因为 Kafka 用到了磁盘顺序，所以其读写速度超过内存随机（往硬盘的）读写速度。

Kafka主要应用在实时数据计算领域。利用Flume实时采集日志文件中的新增数据，然后将其存储到Kafka中，最后在Kafka 后对接实时计算程序。这其实是一个典型的实时数据计算流程。

3. Kafka架构分析

Kafka 中包含 Broker、Topic、Partition、Message、Producer和Consumer等组件

● Broker：消息的代理。 Kafka 集群中的节点（机器）被称为 Broker。
● Topic：主题。这是一个逻辑概念，负责存储 Kafka 中的数据，相同类型的数据一般会存储到同一个 Topic 中。可以把 Topic 认为是数据库中的表。
● Partition： Topic 物理上的分组。 1 个 Topic 在 Broker 中被分为 1 个或者多个 Partition。分区是在创建 Topic 时指定的，每个 Topic 都是有分区的，至少 1 个。 Kafka 中的数据实际上存储在 Partition 中。
● Message：消息，是数据通信的基本单位。每个消息都属于 1 个 Partition。
● Producer：消息和数据的生产者，向 Kafka 的 Topic 生产数据。
● Consumer：消息和数据的消费者，从 Kafka 的 Topic 消费数据。

Zookeeper 并不属于 Kafka 的组件，但是 Kafka 可以根据需求选择依赖 Zookeeper。自Kafka 2.8版本开始，它“抛弃”了Zookeeper，引入了KIP-500架构升级，使用Raft协议实现去中心化。在新的架构中，每个Controller节点都保存所有元数据，通过KRaft协议保证副本的一致性，从而解决了Zookeeper带来的复杂度增加、必须具备Zookeeper运维能力、Controller故障处理麻烦、分区瓶颈等问题8。因此，Kafka并不再是必须依赖Zookeeper。

4. Kafka的安装与配置

4.1. Zookeeper集群安装配置

使用第三方开源zookeeper产品：
大数据系列 | Zookeeper架构分析及应用

4.2. 安装Kafka集群

官方地址：https://kafka.apache.org/downloads

kafka1安装：

root@Agent1:~# tar xf /opt/kafka_2.13-3.7.0.tgz -C /root
root@Agent1:~# cd kafka_2.13-3.7.0/config/
root@Agent1:~/kafka_2.13-3.7.0/config# vim server.properties

修改Kafka的配置文件：
主要修改server.properties配置文件中的broker.id、 log.dirs和zookeeper.connect参数

broker.id=0
log.dirs=/data/kafka-logs
#zookeeper.connect=localhost:2181
zookeeper.connect=Agent1:2181,Agent2:2181,Agent2:2181

root@Agent1:~# mkdir -p /data/kafka-logs

● broker.id：Kafka集群中Broker的编号，默认是从0开始的，所以Agent1主机中的broker.id 值为 0。
● log.dirs： Kafka 中的数据存储目录。建议指定到存储空间比较大的磁盘中，因为在实际工作中 Kafka 中会存储很多数据。
● zookeeper.connect： Zookeeper 集群的地址，多个地址之间使用逗号分隔。

root@Agent1:~/kafka_2.13-3.7.0# bin/kafka-server-start.sh -daemon config/server.properties
root@Agent1:~/kafka_2.13-3.7.0# jps
160227 Jps
159628 QuorumPeerMain
160141 Kafka

同样的方式安装Agent2和Agent3主机，并修改broker.id参数的值

kafka2安装：

root@Agent2:~/kafka_2.13-3.7.0/config# vim server.properties
broker.id=1
log.dirs=/data/kafka-logs
zookeeper.connect=Agent1:2181,Agent2:2181,Agent2:2181

root@Agent2:~/kafka_2.13-3.7.0# bin/kafka-server-start.sh -daemon config/server.properties
root@Agent2:~/kafka_2.13-3.7.0# jps
154018 Kafka
153505 QuorumPeerMain
154070 Jps

kafka3安装：

root@Agent3:~/kafka_2.13-3.7.0/config# vim server.properties
broker.id=2
log.dirs=/data/kafka-logs
zookeeper.connect=Agent1:2181,Agent2:2181,Agent2:2181

root@Agent3:~/kafka_2.13-3.7.0# bin/kafka-server-start.sh -daemon config/server.properties
root@Agent3:~/kafka_2.13-3.7.0# jps
162163 Jps
162116 Kafka
161589 QuorumPeerMain

启动Kafka集群:

root@Agent1:~/kafka_2.13-3.7.0# bin/kafka-server-start.sh -daemon config/server.properties
root@Agent2:~/kafka_2.13-3.7.0# bin/kafka-server-start.sh -daemon config/server.properties
root@Agent3:~/kafka_2.13-3.7.0# bin/kafka-server-start.sh -daemon config/server.properties

验证Kafka集群的运行状态：
分别在Agent1、 Agent2和Agent3上执行jps命令验证是否有Kafka进程，如果都有则说明Kafka集群启动成功了，否则需要到对应的机器上查看 Kafka 的日志信息

root@Agent1:~/kafka_2.13-3.7.0# jps
924314 Jps
507311 QuorumPeerMain
160799 Kafka
169837 Application

配置kafka命令的环境变量：

# vim /etc/profile
# kafka
export KAFKA_HOME=/opt/kafka_2.13-3.0.0
export PATH=$PATH:$KAFKA_HOME/bin

# source /etc/profile

4.3. 配置kafka自启动服务

# cat /lib/systemd/system/kafka.service 
[Unit]
Description=Apache Kafka Server
After=network.target remote-fs.target kafka-zookeeper.service
 
[Service]
Type=forking
User=root
Group=root
Environment="PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/usr/java/jdk1.8/bin:/opt/zookeeper-3.4.6/bin:/root/bin"
ExecStart=/opt/kafka_2.13-3.0.0/bin/kafka-server-start.sh -daemon /opt/kafka_2.13-3.0.0/config/server.properties
ExecStop=/opt/kafka_2.13-3.0.0/bin/kafka-server-stop.sh
Restart=on-failure
 
[Install]
WantedBy=multi-user.target

# chmod a+x kafka.service

Environment此配置必须配置，否则会导致kafka启动失败

# systemctl daemon-reload
# systemctl start kafka
# systemctl status kafka.service
● kafka.service - Apache Kafka Server
   Loaded: loaded (/usr/lib/systemd/system/kafka.service; enabled; vendor preset: disabled)
   Active: active (running) since Tue 2024-08-20 13:58:55 CST; 4s ago
  Process: 2744 ExecStart=/opt/kafka_2.13-3.0.0/bin/kafka-server-start.sh -daemon /opt/kafka_2.13-3.0.0/config/server.properties (code=exited, status=0/SUCCESS)
 Main PID: 3092 (java)
    Tasks: 61
   Memory: 301.3M
   CGroup: /system.slice/kafka.service
           └─3092 java -Xmx1G -Xms1G -server -XX:+UseG1GC -XX:MaxGCPauseMillis=20 -XX:InitiatingHeapOccupancyPercent=35 -XX:+ExplicitGCInvokesConcurrent -...

Aug 20 13:58:55 dn01 systemd[1]: Starting Apache Kafka Server...
Aug 20 13:58:55 dn01 systemd[1]: Started Apache Kafka Server.

5. kafka生产者和消费者的应用

5.1. 生产者使用

创建Topic：
在安装好Kafka集群之后，还需要先在Kafka中创建Topic，之后就可以基于 Kafka 生产和消费数据了。

root@Agent3:~/kafka_2.13-3.7.0# bin/kafka-topics.sh --create --topic hello --partitions 5 --replication-factor 2 --bootstrap-server localhost:9092
Created topic hello.

● --create：创建 Topic。
● --zookeeper：指定Kafka集群使用的Zookeeper集群地址，指定1个或者多个都可以，多个用逗号分隔。
● --partitions：指定Topic中的分区数量。
● --replication-factor：指定Topic中分区的副本因子，这个参数的值需要小于或等于Kafka集群中Broker的数量。
● --topic：指定Topic的名称

root@Agent3:~/kafka_2.13-3.7.0# bin/kafka-topics.sh --describe --topic hello --bootstrap-server localhost:9092
Topic: hello    TopicId: wvzIUg03RN6FMc9iA4-QNw PartitionCount: 5       ReplicationFactor: 2    Configs:
        Topic: hello    Partition: 0    Leader: 0       Replicas: 0,1   Isr: 0,1
        Topic: hello    Partition: 1    Leader: 2       Replicas: 2,0   Isr: 2,0
        Topic: hello    Partition: 2    Leader: 1       Replicas: 1,2   Isr: 1,2
        Topic: hello    Partition: 3    Leader: 0       Replicas: 0,2   Isr: 0,2
        Topic: hello    Partition: 4    Leader: 2       Replicas: 2,1   Isr: 2,1

启动基于控制台的生产者并向指定 Topic 中生产数据：
Kafka 默认提供了基于控制台的生产者，直接使用Kafka的bin目录下的kafka-console-producer.sh 即可，方便测试
启动基于控制台的生产者之后，生产测试数据： hehe

root@Agent3:~/kafka_2.13-3.7.0# bin/kafka-console-producer.sh --topic hello --bootstrap-server localhost:9092
>hehe
>

● broker-list：指定Kafka集群的地址，指定1个或者多个都可以，指定多个时用逗号隔开。
● topic：指定要生产数据的Topic名称

5.2. 消费者使用

kafka默认提供了基于控制台的消费者，直接使用Kafka 的 bin目录下的kafka-consoleconsumer.sh即可，方便测试。

root@Agent1:~# cd kafka_2.13-3.7.0/
root@Agent1:~/kafka_2.13-3.7.0# bin/kafka-console-consumer.sh --topic hello --from-beginning --bootstrap-server localhost:9092
hehe

● bootstrap-server：指定Kafka集群的地址，指定1个或者多个都可以，指定多个时用逗号分隔。
● topic：指定要消费数据的Topic名称
● --from-beginning：Kafka消费者默认是消费最新生产的数据，如果想消费之前生产的数据，则需要添加参数–from-beginning，表示从头消费。

Kafka的生产者和消费者也可以使用Java代码来实现。不过在实际工作中并不会经常这么用，因为和 Kafka 经常对接使用的技术框架（例如 Flume）已经内置了对应的消费者和生产者代码，在使用时只需要进行简单的配置即可。
kafka和zookeeper对接成功之后，可以在zookeeper中查看kafka的信息：

[zk: localhost:2181(CONNECTED) 5] ls /brokers
[ids, seqid, topics]

[zk: localhost:2181(CONNECTED) 1] ls /brokers/ids
[0, 1, 2]

[zk: localhost:2181(CONNECTED) 2] get /brokers/ids/0
{"features":{},"listener_security_protocol_map":{"PLAINTEXT":"PLAINTEXT"},"endpoints":["PLAINTEXT://Agent1:9092"],"jmx_port":-1,"port":9092,"host":"Agent1","version":5,"timestamp":"1711374513109"}

6. Kafka Controller控制器

kafka控制器的作用是在Zookeeper的帮助下管理和协调整个Kafka集群，任意一台Broker可以成为Controller，但是只有一台会Controller
leader和控制器可以不是同一台机器。ZooKeeper集群中会有一个选举过程来决定哪台服务器作为Leader，这个选举是基于ZooKeeper的内部机制进行的。一旦选举完成，Leader就负责处理所有的客户端请求，并确保集群中的其他服务器（被称为Follower）与它保持同步。
控制器负责维护集群的元数据信息，处理客户端的创建、删除节点等操作，并将这些操作同步到其他服务器上。因此，控制器和Leader虽然有所区别，但在实践中，控制器通常是Leader，因为Leader负责处理所有客户端请求。但理论上，它们可以在不同的服务器上。

控制器的选取：
Broker启动时，会尝试创建ZK中 /controller znode，第一个创建/controller的Broker会是Controller

[zk: localhost:2181(CONNECTED) 2] get /controller
{"version":2,"brokerid":1,"timestamp":"1711374505881","kraftControllerEpoch":-1}

控制器的功能：

● topic管理：当使用kafka-topics脚本时，后台工作通过 controller 完成
● 分区重分配：对已有 topic 分区进行细粒度的分配
● Preferred Leader 选举：Kafka为了避免部分Broker负载过重而提供的一种换Leader的方案
● 集群成员管理（新增 Broker、Broker 主动关闭、Broker 宕机）：自动检测 Broker、controller 通过 watch 机制检查 ZK 的 /brokers/ids 子节点数量变更
● 数据服务：controller向其他Broker提供数据服务、controller上保存了最全的集群元数据

控制器故障转移Failover：
Controller存在单点
故障转移：当运行中的Controller突然宕机，Kafka能够快速感知，并立即启用备用Controller代替之前失败的Controller，这个过程称为 Failover

Python Qt6快速入门-图形视图(Graphics View) 视觉与物联智能 Python编程实例 python pyqt6 qt6 GUI 开发语言
图形视图(GraphicsView)文章目录图形视图(GraphicsView)1、GraphicsView架构1.1场景(Scene)1.2视图(View)1.3项目(Item)2、GraphicsView坐标系统2.1项目坐标2.2场景坐标2.3视图坐标2.4坐标映射3、QGraphicsView使用实例GraphicsView提供了一个用于管理大量定制2D图形项目并与之交互的界面，以及一个用
AI大模型在智能客服系统中的应用季风泯灭的季节 AI大模型应用技术二人工智能
目录引言1.基于大模型的智能客服系统架构2.对话生成与上下文管理对话生成上下文管理3.提高客服系统响应精度的策略1.使用专门训练的数据集2.引入实体识别和意图分类3.反馈循环和持续优化4.AI大模型在企业中的优化与调优策略1.模型微调（Fine-tuning）2.模型蒸馏（ModelDistillation）3.响应延迟优化4.持续监控与反馈结论引言随着人工智能（AI）技术的不断发展，AI大模型在
【PHP】Laravel 介绍史上最优雅的 PHP 框架 Ustinian_310 laravel php
1.Laravel介绍Laravel是一个开源的PHPWeb应用框架，由TaylorOtwell创建并于2011年6月首次发布。它遵循模型-视图-控制器（MVC）架构模式，旨在简化Web开发的任务，提供了一套丰富的功能，帮助开发者快速构建安全、可扩展的Web应用程序。附注：文末附有Laravel的社区入口，感兴趣的小伙伴可以去社区寻找更多学习资料以下是Laravel的一些主要特点和组件：核心特点M
PHP Laravel框架架构余味鱼尾数据库 php mysql 后端
1.根目录结├──app/├──artisan├──bootstrap/├──config/├──database/├──public/├──resources/├──routes/├──storage/├──tests/├──.env├──.gitignore├──composer.json├──package.json├──phpunit.xml└──README.md2.重要目录和文件说明1
【大数据入门核心技术-Hive】（十一）HiveSQL数据分区 forest_long 大数据技术入门到21天通关大数据 hive hadoop 数据仓库 hdfs
目录一、分区的概念二、创建分区1）静态分区1、单分区测试2、多分区测试2)动态分区3、动态分区和静态分区混合使用三、分区的其它操作1、恢复分区2、归档分区3、交换分区四、分区数据查询1、单分区数据查询2、多分区数据查询方法1：通过union方法2：通过or一、分区的概念数据分区的概念以及存在很久了，通常使用分区来水平分散压力，将数据从物理上移到和使用最频繁的用户更近的地方，以及实现其目的。hive
Doris实战——特步集团零售数据仓库项目实践吵吵叭火 #Doris 大数据大数据数据仓库
目录一、背景二、总体架构三、ETL实践3.1批量数据的导入3.2实时数据接入3.3数据加工3.4BI查询四、实时需求响应五、其他经验5.1DorisBE内存溢出5.2SQL任务超时5.3删除语句不支持表达式5.4Drop表闪回六、未来展望原文大佬的这篇Doris数仓建设案例有借鉴意义，这里摘抄下来用作学习和知识沉淀。如有侵权等告知~一、背景特步集团有限公司是中国领先的体育用品企业之一，为了提高特步
固件开发项目实例1000例专栏--基础知识：微控制器架构 xiaoheshang_123 固件开发项目实例1000例专栏嵌入式硬件
目录微控制器架构1.微控制器概述2.微控制器的主要组成部分3.微控制器的工作原理4.常见的微控制器架构5.微控制器的选择6.实践案例小结“固件开发项目1000例”专栏中，“微控制器架构”是基础知识部分的重要一章。这一章节旨在帮助读者深入了解微控制器的基本结构、工作原理及其关键组成部分。以下是这一章节的详细介绍：微控制器架构1.微控制器概述微控制器（MicrocontrollerUnit,MCU）是
基于HarmonyOS 5.0 Next的应用开发设计模式与前端框架的架构整合与实践【附代码实例】一键难忘精通AI实战千例专栏合集 harmonyos 设计模式前端框架
文章目录HarmonyOS5.0Next应用开发：架构设计中的设计模式与前端框架设计HarmonyOS5.0Next概览设计模式在HarmonyOS应用开发中的应用单例模式工厂模式观察者模式设计模式的使用分层架构设计1.公共能力层（CommonLayer）2.基础特性层（FeatureLayer）3.产品定制层（ProductLayer）模块化设计1.模块化结构2.模块化代码示例前端框架的设计Ar
性能测试JVM监控有哪些？ Feng.Lee 漫谈测试 jvm
目录一、jps二、jstat三、jstack四、JVM监控的主要指标五、图形界面监控工具六、第三方监控工具企业级的应用系统开发大多数会使用Java语言，并且使用OracleJ2EE架构。Java程序运行在HotSotVM（就是常用的JVM，也包括OpenJDK）之上，通过堆JVM的监控，我们可以度量java程序效率，分析程序的性能问题。一、jps我们要知道机器上运行的JVM进程号可以由jps得到。
SpringMVC使用嗯嗯嗯吧面试学习路线阿里巴巴 java java进阶后端
SpringMVC:Java实现的MVC轻量级框架MVC:模型视图控制器最典型的mvc架构就是:jsp+service+servlet.Model2时代演变成mvc架构,以前是jsp(jsp本身就是servlet)+dao=视图层+模型层架构一定是演进过来的(ALLinOne)>淘宝技术这十年架构发展_Apple_Web的博客-CSDN博客王坚:去IOE化方便团队开发,java是项目越大,越好开发
狂神说学习——SpringMVC new worker 狂神说学习 springmvc java
1、回顾MVC1.1、什么是MVCMVC是模型(Model)、视图(View)、控制器(Controller)的简写，是一种软件设计规范。是将业务逻辑、数据、显示分离的方法来组织代码。MVC主要作用是降低了视图与业务逻辑间的双向偶合。MVC不是一种设计模式，MVC是一种架构模式。当然不同的MVC存在差异。**Model（模型）：**数据模型，提供要展示的数据，因此包含数据和行为，可以认为是领域模型
C++ 中的事件驱动架构泡沫o0 #C/C++软件设计思路 c++c语言 linux 开发语言 qt 嵌入式程序设计
Event-DrivenArchitecture(EDA)事件驱动架构(EDA)的引入源于对传统的请求-响应式架构模式的限制。在这种模式下，系统的各个组件通常是通过直接调用彼此的接口来进行通信，这种紧耦合的方式限制了系统的灵活性和可扩展性。随着应用程序的复杂性和规模的增加，需要一种更加灵活和松耦合的架构模式来应对不断变化的需求。事件驱动架构（EDA）是一种软件架构范式，其核心思想是系统中的各个组件
Kafka 如何实现高性能言之。架构面试 kafka 分布式
1.高吞吐量的设计分布式架构：Kafka通过分布式的集群架构设计来横向扩展，提高吞吐量。多个生产者、消费者和节点可以同时并行工作，分担流量负载。分区机制：Kafka使用分区来分散负载，每个topic可以有多个分区，每个分区可以独立处理读写操作。消费者可以并行地处理多个分区的数据，从而提升性能。分区内部的消息顺序性得到保证，但多个分区之间消息顺序不保证，这种设计能够实现高并发的处理。2.顺序写入与高
游戏策划如何设计游戏主体架构，主导游戏的框架设计、核心循环设计、系统设计，管理策划团队？小宝哥Code 游戏策划游戏策划游戏架构
游戏策划在设计游戏主体架构时，负责定义游戏的整体框架，决定游戏的核心玩法和循环，同时管理策划团队，确保设计方案的高效实施。设计游戏主体架构是一个涉及多个层面的复杂过程，需要策划团队在与程序、美术、音效等其他部门的紧密合作中完成。以下是游戏策划设计主体架构的关键步骤和方法：1.定义游戏的核心体验游戏主体架构的设计首先要围绕游戏的核心体验展开。游戏的核心体验是玩家在游戏中最重要的互动体验，是决定游戏是
探索现代电商架构：基于Rails的DDD、CQRS与事件溯源姚月梅Lane
探索现代电商架构：基于Rails的DDD、CQRS与事件溯源ecommerceApplicationwithCQRSandEventSourcingbuiltonRailsandRailsEventStore项目地址:https://gitcode.com/gh_mirrors/ecom/ecommerce在现代软件开发中，构建一个高效、可扩展且易于维护的电商应用是一项极具挑战性的任务。然而，开源
《亿级流量下的架构实战：HTTP全链路解析与智能监控系统搭建》我的青春不太冷架构 http 网络协议科技经验分享学习网络
文章目录全链路解析：HTTP请求响应与数据可视化监控一、HTTP请求响应全流程解析1.全链路交互流程图2.关键技术实现2.1前端请求构造（ES6+语法示例）2.2服务端处理架构（Node.js/Express）二、数据可视化监控方案1.数据存储架构设计2.数据库操作层实现3.管理界面实现方案3.1可视化看板路由//routes/admin.js3.2数据可视化模板（EJS示例）4.最佳实践建议4.
对抗训练对模型性能有何影响？借雨醉东风热点追踪人工智能机器学习深度学习
关注我，持续分享逻辑思维&管理思维&面试题；可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导；推荐专栏《10天学会使用asp.net编程AI大模型》，目前已完成所有内容。一顿烧烤不到的费用，让人能紧跟时代的浪潮。从普通网站，到公众号、小程序，再到AI大模型网站。干货满满。学成后可接项目赚外快，绝对划算。不仅学会如何编程，还将学会如何将AI技术应用到实际问题中，为您的职业生涯增添一笔宝贵的财富
系统架构师计算题(1)——计算机系统基础知识(上) Chris_166 软考系统架构师系统架构师考试计算题
持续刷题，持续总结，持续更新!目录1.文件系统题型1：多级索引2.存储管理题型1：页式存储题型2：段式存储题型3：段页式存储3.磁盘读取题型1：访问耗时4.RAID题型1：计算容量1.文件系统文件在系统中的存储结构有如下几种：(1)连续结构。连续结构也称顺序结构，它将逻辑上连续的文件信息（如记录）依次存放在连续编号的物理块上。只要知道文件的起始物理块号和文件的长度，就可以很方便地进行文件的存取。(
（3-5）文生图模型架构：扩散模型码农三叔训练 RAG 多模态)人工智能 python 深度学习大模型文生图多模态
3.5扩散模型扩散模型（DiffusionModels）是一类用于生成图像的深度学习模型，近年来在图像生成任务中取得了显著的进展。扩散模型的基本思想是通过逐步添加噪声到数据中，然后学习从噪声中恢复原始数据的过程。3.5.1扩散模型的基本概念扩散模型是一种基于随机过程的生成模型，通过逐步添加和去除噪声，实现从随机噪声到高质量数据的转化，其独特的训练和生成机制使其在图像生成领域表现出色。1.扩散过程扩
AI Agent 指南：架构、构建与部署大模型之路 Agent 人工智能架构 agent LLM AI Agent
当下AIAgent正崭露头角，重塑着我们与技术交互的模式。它犹如一位智能助手，凭借独立推理、规划及自主行动能力，在无需用户持续干预的情况下，精准达成既定目标。从智能客服自动处理客户咨询，到智能投资顾问自主制定投资策略，AIAgent的应用场景不断拓展，深度融入生活与工作的诸多方面，成为推动智能化变革的关键力量。深入探究AIAgent的工作原理、设计准则、基础设施需求以及构建部署流程，对于解锁其潜能
数据中台：国内大厂中台建设架构集锦 Freedom3568 数据中台数据中台中台架构总体架构大厂
文章目录简介数据中台总体架构图阿里巴巴数据中台网易严选中台架构图网易云音乐数据中台架构转转数据中台某企业数据中台架构图农行数据中台架构总结简介数据中台到底是什么，几年过去了，一直众说纷。笔者认为数据中台不应该是一个单纯的系统或者是一个软件工具，而应该是一套架构、一套数据流转模式。数据中台需要采集数据作为原材料进行数据加工、数据建模、然后分门别类地储存，再根据实际的业务场景，打造各类数据服务（含数据
快速学习安装使用etcd 蓝胖子不是胖子学习 etcd 数据库
1.什么是etcd？etcd是一个分布式键值存储系统，主要用于分布式系统的配置管理和服务发现。它提供了可靠的数据存储，etcd可以用来构建高可用的分布式键值数据库，根据官网介绍并且支持分布式锁、Leader选举等功能，通常被用作微服务架构中的注册中心。在目前go的大部分组件还有框架中都被采用为注册中心组件相当于zookper和redis2.安装etcd2.1.在本地安装etcd2.1.1.Linu
互联网大厂的微服务架构系统应对超大流量解决方案欧子说Java 架构微服务 java
常见的限流方式有：限制总并发数（数据库连接池、线程池等等）限制瞬时并发数（如Nginx的limit_conn模块）限制时间窗口的平均速率（如Guava的RateLimiter、Nginx的limit_req模块）限制远程接口的调用速率、限制消息系统的消费速率1.1接入层限流抗疫项目中，一般ISV会把Nginx作为业务的接入层，通过Nginx将请求分发到后端的应用集群上。接入层(流量层)是整个系统的
Spring Boot 基础开发：实现 RESTful API 开发 YY...yy SpringBoot框架学习 spring boot restful 后端
前言在现代Web开发中，RESTfulAPI已经成为前后端分离架构的核心。SpringBoot提供了强大的支持，使得RESTfulAPI的开发变得高效且简洁。本文将从以下几个方面详细讲解如何在SpringBoot中实现RESTfulAPI开发：@RestController设计API：简化Controller的编写HTTP状态码与响应封装：了解常见状态码及其使用场景Swagger3集成：生成接口文
2个大厂 100亿级超大流量红包架构方案_日均百亿级红包架构 2401_87555613 架构 python 开发语言
1、Cache住所有查询，两层cache除了使用ckv做全量缓存，还在数据访问层dao中增加本机内存cache做二级缓存，cache住所有读请求。查询失败或者查询不存在时，降级内存cache；内存cache查询失败或记录不存在时降级DB。DB本身不做读写分离。2、DB写同步cache，容忍少量不一致，DB写操作完成后，dao中同步内存cache，业务服务层同步ckv，失败由异步队列补偿，定时的ck
面向算网的数字孪生关键技术研究及应用探讨罗伯特之技术屋大数据与数字化的设计应用专栏网络大数据
摘要为了解决算网运营中面临的感知实时精度高、融合管控智能程度高、系统场景复杂度高、新技术部署难度高等问题，从宏观政策、行业标准化及运营商实践等方面对数字孪生网络发展现状进行分析，提出面向算网的数字孪生网络体系架构，对数字孪生网络关键能力进行深入研究，同时对数字孪生网络在提升算网业务感知、赋能算网智能运营的典型应用进行探讨。01概述数字孪生被业界视为物理世界和数字世界之间的桥梁。通过数字孪生技术建立
java web + mysql 实现图书管理系统鱼弦【练习两年半】程序基础【HOT】技术热谈 mysql 数据库
鱼弦：CSDN内容合伙人、CSDN新星导师、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）要使用JavaWeb和MySQL实现图书管理系统，你可以按照以下步骤进行操作：数据库设计：创建一个MySQL数据库，并命名为图书管理系统。设计数据库表，例如：图书表（Book）、用户表（User）等。
深入理解MP4视频文件裁剪原理[上] 码农心语视频技术 LINUX nginx学习 mp4 文件格式裁剪深入理解
目录1.引言2.MP4文件的结构2.1Box的格式2.1MP4文件格式架构3.MP4各box3.1ftypbox3.2freebox3.3**mdatbox\***深入理解MP4视频文件裁剪原理[上]深入理解MP4视频文件裁剪原理[中]深入理解MP4视频文件裁剪原理[下]深入理解MP4视频文件裁剪原理[下下]1.引言随着数字媒体的迅速发展，视频成为人们生活中不可或缺的一部分。MP4（Movin
毕设开源 python大数据旅游数据分析可视化系统(源码分享) bee_dc 毕业设计毕设大数据
文章目录0前言1课题背景2数据处理3数据可视化工具3.1django框架介绍3.2ECharts4Django使用echarts进行可视化展示（mysql数据库）4.1修改setting.py连接mysql数据库4.2导入数据4.3使用echarts可视化展示5实现效果5.1前端展示5.2后端展示6最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到
架构 | 基于 crontab 进程监控增强集群可用性问仙长何方蓬莱架构
INDEX§0前言§1思路§2实现§0前言集群的高可用性可以直接简明的使用SLA来衡量，无所谓其他指标。正常来讲，高可用对应了一整套方案，包括预防：降低故障概率发现：快速发现故障、甚至定位问题恢复：快速恢复集群，这里只强调恢复集群可用性说白了就是降低发病频率，然后早发现早治疗预防降低故障概率有两个主要方向完善工作流程：包括制定研发红线、编码规范、测试规范、标准上线流程比如，将灰度发布、线上验证、全
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

大数据系列 | Kafka架构分析及应用

大数据系列 | Kafka架构分析及应用

1. 消息系统介绍

2. Kafka原理分析

3. Kafka架构分析

4. Kafka的安装与配置

4.1. Zookeeper集群安装配置

4.2. 安装Kafka集群

4.3. 配置kafka自启动服务

5. kafka生产者和消费者的应用

5.1. 生产者使用

5.2. 消费者使用

6. Kafka Controller控制器

你可能感兴趣的:(大数据技术专栏,大数据,kafka,架构)