Alice菌

超全的Kafka知识点总结(建议收藏!)

前段时间写了Kafka快速入门系列1-8，但苦于知识点非常繁琐，对于很多初级选手来说并不友好，因此博主又根据所学，整理了一份关于Kafka知识点总结，希望对大家的学习有所帮助(✪ω✪)

码字不易,先赞后看!

文章目录

1. 什么是Kafka
2. Kafka的使用场景
3. Kafka优缺点
4. Kafka架构（流程）
5. Kafka架构（API）
6.Topic内部有哪些组成？
7.分区和消费组内的消费者之间的关系有哪些情况？
8. 分区数、消费者与读取效率之间的关系
9. 副本数与broker之间的关系
10. 什么是主/从副本
11. 主/从复本的作用是什么
12. Isr是什么
13. 生产者生产数据到kafka集群，数据到分区的方式
14. Consumer消费数据的流程
15. Kafka中的数据删除机制是什么？
16. Kafka如何保证数据不丢失
17. Kafka高性能的原因有哪里
18. Kafka高效查询数据的有哪些原因
19. 如何从Kafka得到准确的信息(不是重读数据)?
20. Kafka的设计是什么样的呢？
21. 数据传输的事物定义有哪三种？
22. Kafka判断一个节点是否还活着有哪些条件？
23. Kafka 与传统消息系统之间有哪些区别？
24. Kafka创建Topic时将分区放置到不同的Broker的策略是什么？
25. Kafka新建的分区会在哪个目录下创建
26. partition的数据如何保存到硬盘
27. kafka的ack机制
28. Kafka的消费者如何消费数据
29. 如何使kafka集群内的数据是有序的？
30. Zookeeper汇总保留了哪些数据？
31. kafka consumer 什么情况会触发再平衡reblance?
32、描述下kafka consumer 再平衡步骤?
33. 手动提交offset有什么好处？？
34. 为什么kafka中的数据需要定期删除或合并？

1. 什么是Kafka

kafka是一个分布式，分区的，多副本的，多订阅者的消息发布订阅系统。

2. Kafka的使用场景

应用耦合、异步处理、限流削峰、消息驱动的系统。

3. Kafka优缺点

优点：

可靠性强（分布式-分区-副本）、扩展性强（可伸缩）、性能高（数据读写）、耐用性强（数据持久化）、时效性强。

缺点：

由于是批量发送，数据并非真正的实时。
仅支持统一分区内消息有序，无法实现全局消息有序；
有可能消息重复消费；
依赖zookeeper进行元数据管理。

4. Kafka架构（流程）

生产者、kafka集群、消费者、zookeeper

5. Kafka架构（API）

生产者、消费者、StreamAPI、ConnectAPI

6.Topic内部有哪些组成？

每个Topic包含一个或者多个Partition，一个partition当中存在多个segment文件段，每个segment分为两部分，.log文件和.index文件。

7.分区和消费组内的消费者之间的关系有哪些情况？

Partition = 消费任务的并发度=刚刚好，每个任务读取一个partition数据

Partition > 消费任务的并发度=有部分消费任务读取多个分区的数据

Partition < 消费任务的并发度=有部分消费任务空闲(可以创建多于分区的消费者数量)

8. 分区数、消费者与读取效率之间的关系

分区数越多，同一时间可以有越多的消费者来进行消费，消费数据的速度就会越快，提高消费的性能

9. 副本数与broker之间的关系

数据副本（包含本身）数一般情况下小于等于broker的个数

10. 什么是主/从副本

被复制的分区叫做主副本（Leader）,复制出来的叫做从副本（Follower）

11. 主/从复本的作用是什么

主副本负责数据的读写。
从副本只做数据备份，不做数据读写。

12. Isr是什么

ISR是一组与leaders完全同步的消息副本（包括leaders本身）。

13. 生产者生产数据到kafka集群，数据到分区的方式

a)没有指定分区编号，没有指定key时采用轮询方式存储数据

b)没有指定分区编号，指定key时，数据分发策略为对key求取hash值，这个值与分区数量取余，余数就是分区编号。

c)指定分区编号，所有数据输入到指定的分区内

d)自定义分区

14. Consumer消费数据的流程

1、首先Consumer连接指定的Topic partition所在leader broker，使用折半/二分查找，先确定数据所在的segment。

2、确定在哪个segment后，使用确定的segment内的index文件找到数据具体的位置采用pull方式从kafkalogs中获取消息。

15. Kafka中的数据删除机制是什么？

1、时间：默认存储168小时（一周）

2、数据的大小：默认 -1 （不删除），可以自行设置。

16. Kafka如何保证数据不丢失

从大体上来看的话，Kafka中主要的角色有数据生产者(Producer)，Kafka集群中负责存储数据的Broker，数据消费者（Consumer），因此这个问题需要从三个角度来进行回答!

1、生产者如何保证数据不丢失？？通过ack 机制确保数据不丢失。

2、kafka集群如何保证数据不丢失？？通过数据副本保证数据不丢失。

3、消费者如何保证数据不丢失？？通过维护数据的offset 保证数据不丢失。

17. Kafka高性能的原因有哪里

顺序读写、分区、批量发送、数据压缩

18. Kafka高效查询数据的有哪些原因

1、Kafka把topic中一个parition大文件分成多个小文件段，通过多个小文件段，就容易定期清除或删除已经消费完文件，减少磁盘占用。

2、通过索引信息可以快速定位message和确定response的最大大小。

3、通过index元数据全部映射到memory，可以避免segment file的IO磁盘操作。

4、通过索引文件稀疏存储，可以大幅降低index文件元数据占用空间大小。

19. 如何从Kafka得到准确的信息(不是重读数据)?

在数据生产过程中避免重复。

在数据消耗期间避免重复。

20. Kafka的设计是什么样的呢？

Kafka将消息以topic为单位进行归纳。将向Kafka topic发布消息的程序成为producers。将预订topics并消费消息的程序成为consumer。 Kafka以集群的方式运行，可以由一个或多个服务组成，每个服务叫做一个broker。producers通过网络将消息发送到Kafka集群，集群向消费者提供消息。

21. 数据传输的事物定义有哪三种？

1、最多一次:消息不会被重复发送，最多被传输一次，但也有可能一次不传输，可能会造成数据丢失。

2、最少一次: 消息不会被漏发送，最少被传输一次，但也有可能被重复传输。可能会造成数据的重复消费。

3、精确的一次（Exactly once）:不会漏传输也不会重复传输,每个消息都传输被一次而且仅仅被传输一次，这是大家所期望的。

22. Kafka判断一个节点是否还活着有哪些条件？

1、节点必须可以维护和ZooKeeper的连接，Zookeeper通过心跳机制检查每个节点的连接

2、如果节点是个follower,他必须能及时的同步leader的写操作，延时不能太久

23. Kafka 与传统消息系统之间有哪些区别？

1、Kafka 持久化日志：这些日志可以被重复读取和无限期保留

2、Kafka 是一个分布式系统：它以集群的方式运行，可以灵活伸缩，在内部通过复制数据提升容错能力和高可用性

3、Kafka 支持实时的流式处理

24. Kafka创建Topic时将分区放置到不同的Broker的策略是什么？

前提：副本因子不能大于 Broker 的个数；

第一个分区（编号为0）的第一个副本放置位置是随机从 brokerList 选择的；

其他分区的第一个副本放置位置相对于第0个分区依次往后移。

例如：有5个 Broker，5个分区，假设第一个分区放在第四个 Broker 上，那么第二个分区将会放在第五个 Broker 上；第三个分区将会放在第一个 Broker 上；第四个分区将会放在第二个 Broker 上，第五个分区将会放在第三个 Broker 上；

25. Kafka新建的分区会在哪个目录下创建

若 log.dirs 参数只配置了一个目录，那么分配到各个 Broker 上的分区将在这个目录下创建文件夹用于存放数据。

若 log.dirs 参数配置了多个目录，那么 Kafka 会在含有分区目录总数最少的文件夹中创建新的分区目录，分区目录名为 Topic名+分区ID。注意（不是磁盘使用量最少的目录）

26. partition的数据如何保存到硬盘

topic中的多个partition以文件夹的形式保存到broker，每个分区序号从0递增，且消息有序 Partition文件下有多个segment（xxx.index，xxx.log） segment 文件里的大小和配置文件大小一致可以根据要求修改默认为1g 如果大小大于1g时，会滚动一个新的segment并且以上一个segment最后一条消息的偏移量命名。

27. kafka的ack机制

request.required.acks有三个值 0 1 -1

0:生产者不会等待broker的ack，这个延迟最低但是存储的保证最弱当server挂掉的时候就会丢数据

1：服务端会等待ack值 leader副本确认接收到消息后发送ack但是如果leader挂掉后它不确保是否复制完成新leader也会导致数据丢失

-1：同样在1的基础上服务端会等所有的follower的副本受到数据后才会受到leader发出的ack，这样数据不会丢失

28. Kafka的消费者如何消费数据

消费者每次消费数据的时候，消费者都会记录消费的物理偏移量（offset）的位置等到下次消费时，他会接着上次位置继续消费。同时也可以按照指定的offset进行重新消费。

29. 如何使kafka集群内的数据是有序的？

只创建一个分区。（但是实际这样会存在性能问题，具体业务具体分析后确认。）

30. Zookeeper汇总保留了哪些数据？

        1、消费者提交的偏移量。
        2、leader检测、分布式同步、配置管理、识别新节点何时离开或连接、集群、节点实时状态
        3、分区和消费者的所有者关
        4、broker id

31. kafka consumer 什么情况会触发再平衡reblance?

1、一旦消费者加入或退出消费组，导致消费组成员列表发生变化，消费组中的所有消费者都要执行再平衡。
2、订阅主题分区发生变化，所有消费者也都要再平衡。

32、描述下kafka consumer 再平衡步骤?

        1、关闭数据拉取线程，清空队列和消息流，提交偏移量；
        2、释放分区所有权，删除zk中分区和消费者的所有者关系；
        3、将所有分区重新分配给每个消费者，每个消费者都会分到不同分区；
        4、将分区对应的消费者所有关系写入ZK，记录分区的所有权信息；
        5、重启消费者拉取线程管理器，管理每个分区的拉取线程。

33. 手动提交offset有什么好处？？

使更新offset更及时，避免因offset更新不及时导致重复消费数据的问题。

34. 为什么kafka中的数据需要定期删除或合并？

Kafka只用于做数据的临时存储、临时缓冲，不是永久存储（永久性存储使用HDFS）。

本次的分享内容到这里就结束了，关于上面的内容部分用红色注明的在这里解释一下。黑色的是最最基础，必须要求掌握的，红色标记的部分是知识拓展，大家在理解层面上知晓即可…如果本篇对你有帮助，不要忘了点赞加关注哟|ू･ω･` )

日志收集平台day01：项目设计 intqao 日志收集平台项目 linux kafka zookeeper nginx python
一、项目需求本项目的目的是模拟生产环境下对web服务器产生的日志进行收集并存入数据库，最终以web应用方式展示日志数据。二、技术选型环境：CentOs7web服务器：nginx/1.20.1（仅测试使用）消息队列：kafka2.12分布式应用程序协调服务软件：zookeeper3.6.3生产者：filebeat-7.17.5-1.x86_64消费者：使用python中的模块pykafka实现消费者
SpringBoot使用Kafka如何保证消息不丢失小信丶消息队列技术栈 spring boot kafka 后端
概述在SpringBoot中使用Kafka时，要确保消息不丢失，主要涉及到生产者（Producer）、消费者（Consumer）以及KafkaBroker的配置和设计。1.SpringBoot与Kafka配置SpringBoot中使用Kafka时，可以通过spring-kafka来简化配置和操作。以下是如何保证消息不丢1.1Producer配置Kafka生产者是消息的发送方，确保消息的可靠性和不丢
logback+kafka+ELK实现日志记录（操作）酷酷的码农小哥 java kafka spring boot spring
logback+kafka+ELK实现日志记录前言环境准备配置Logbackpom文件改造新增logback-spring.xmlboot配置文件一下怎么去下载安装我就不多说了，直接上代码。日志平台业务思路用户请求进入后台根据搜索的参数去查询内容返回所有信息,返回json数据，当用户查看详情后根据查询到的内容里面的traceId去es里查询和traceId相等的所有日志信息最后返回给前端业务流程[
Databend 产品月报（2024年8月）数据库
很高兴为您带来Databend2024年8月的最新更新、新功能和改进！我们希望这些增强功能对您有所帮助，并期待您的反馈。KafkaConnectSinkConnector插件我们推出了一种将Kafka连接到Databend的新方式：databend-kafka-connect，这是一个KafkaConnectsinkconnector插件。该插件支持AppendOnly和Upsert两种写入模式，
Hadoop 与 Spark：大数据处理的比较王子良. 大数据经验分享 hadoop spark 大数据
欢迎来到我的博客！非常高兴能在这里与您相遇。在这里，您不仅能获得有趣的技术分享，还能感受到轻松愉快的氛围。无论您是编程新手，还是资深开发者，都能在这里找到属于您的知识宝藏，学习和成长。博客内容包括：Java核心技术与微服务：涵盖Java基础、JVM、并发编程、Redis、Kafka、Spring等，帮助您全面掌握企业级开发技术。大数据技术：涵盖Hadoop（HDFS）、Hive、Spark、Fli
【檀越剑指大厂--RocketMQ】RocketMQ运维篇 Kwan的解忧杂货铺@新空间代码工作室 s总檀越剑指大厂 java-rocketmq rocketmq 运维
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kuan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,kafka,Spring,微服务,Netty等常用开发工具系列:罗列常用的开发工具,如IDEA,M
c#使用Confluent.Kafka实现生产者发送消息至kafka（远程连接kafka发送消息超时的解决 Local：Message timed out） Shinobi_Jack kafka 分布式
水一篇：参考：c#使用Confluent.Kafka实现生产者发送消息至kafka（远程连接kafka发送消息超时的解决Local：Messagetimedout）-寒冰之光-博客园该死的Kafka，远程连接Kafka超时以及解决办法-博客王大锤-博客园
Kafka、ActiveMQ、RabbitMQ、RocketMQ消息队列和消息中间件MQ与RabbitMQ面试题【推荐】王大师王文峰 Java基础到框架面经吐血整理 RabbitMQ 消息队列消息中间件面试题 kafka activeMQ
‍Kafka、ActiveMQ、RabbitMQ、RocketMQ消息队列和消息中间件MQ与RabbitMQ面试题【推荐】学习目标（附超链接传送门）❔消息队列前言❔面试官提问：为什么使用消息队列？消息队列有什么优点和缺点？❔消息队列怎么路由❔为什么使用消息队列，他的场景有哪些❔面试官问:MQ消息队列是什么❔消息队列怎么传输❔其他消息队列应用场景❔传统的做法有两种1.串行的方式；2.并行方式❔Kaf
（表格详细对比）Kafka、ActiveMQ、RabbitMQ、RocketMQ 之间有哪些区别和优缺点小小鱼儿小小林 #RabbitMQ面试宝典面试这样回答 kafka activemq rabbitmq
目录面试官：Kafka、ActiveMQ、RabbitMQ、RocketMQ之间的区别有哪些KafkaActiveMQRabbitMQRocketMQ拓展：表格详细对比拓展：表格简单对比该文章专注于面试，面试只要回答关键点即可，不需要对框架有非常深入的回答，如果你想应付面试，是足够了，抓住关键点面试官：Kafka、ActiveMQ、RabbitMQ、RocketMQ之间的区别有哪些Kafka优点：
Kafka 入门与应用实战：吞吐量优化与与 RabbitMQ、RocketMQ 的对比小白的一叶扁舟 Java开发 kafka rabbitmq rocketmq spring boot java
前言在现代微服务架构和分布式系统中，消息队列作为解耦组件，承担着重要的职责。它不仅提供了异步处理的能力，还能确保系统的高可用性、容错性和扩展性。常见的消息队列包括Kafka、RabbitMQ和RocketMQ，其中Kafka因其高吞吐量、分布式特性和可靠性成为大规模数据流处理的首选。本篇文章将深入介绍Kafka的基本概念、执行流程、吞吐量优化策略、生命周期，重点对比Kafka与RabbitMQ和R
Kafka 迁移 AutoMQ 时 Flink 位点管理的挑战与解决方案 AutoMQ 云计算云原生 Kafka 消息计算大数据 AWS AutoMQ 阿里云腾讯云 GCP
编辑导读：AutoMQ是一款与ApacheKafka100%完全兼容的新一代Kafka，可以做到至多10倍的成本降低和极速的弹性。凭借其与Kafka的完全兼容性可以与用户已有的Flink等大数据基础设施进行轻松整合。Flink是重要的流处理引擎，与Kafka有着密切的关系。本文重点介绍了当用户需要将生产Kafka集群迁移到AutoMQ时，如何处理好Flink的位点来确保整体迁移的平滑过渡。引言在云
Kafka后台启动命令费曼乐园 kafka kafka
#保存日志nohup./kafka-server-start.sh../config/server.properties>/path/to/logfile.log2>&1&#不保存日志nohup./kafka-server-start.sh../config/server.properties>/dev/null2>&1&nohup:是一个Unix/Linux命令，用于运行一个命令并忽略挂断（ha
Kafka 到 Kafka 数据同步
简述Kafka为处理实时数据提供了一个统一、高吞吐、低延迟的平台，其持久化层本质上是一个“按照分布式事务日志架构的大规模发布/订阅消息队列”，这使它作为企业级基础设施来处理流式数据非常有价值。因此实现Kafka到Kafka的数据同步也成了一项重要工作。本篇文章主要介绍如何使用CloudCanal构建一条Kafka到Kafka的数据同步链路。技术点消费者消息推送在任务创建后，CloudCanal会自
kafka和mq的区别 xsmxh-1314 笔记 kafka rabbitmq java
作为消息队列来说，企业中选择mq的还是多数，因为像Rabbit，Rocket等mq中间件都属于很成熟的产品，性能一般但可靠性较强，而kafka原本设计的初衷是日志统计分析，现在基于大数据的背景下也可以做运营数据的分析统计，而redis的主要场景是内存数据库，作为消息队列来说可靠性太差，而且速度太依赖网络IO，在服务器本机上的速度较快，且容易出现数据堆积的问题，在比较轻量的场合下能够适用。Rabbi
kafka学习笔记4-TLS加密 —— 筑梦之路筑梦之路 Java技术 linux系统运维学习笔记
1.准备证书文件mkdir/opt/kafka/pkicd!$#生成CA证书opensslreq-x509-nodes-days3650-newkeyrsa:4096-keyoutca.key-outca.crt-subj"/CN=Kafka-CA"#生成私钥opensslgenrsa-outkafka.key4096#生成证书签名请求(CSR)opensslreq-new-keykafka.ke
kafka学习笔记6 ACL权限 —— 筑梦之路筑梦之路 Java技术 linux系统运维 kafka 学习笔记
在Kafka中，ACL（AccessControlList）是用来控制谁可以访问Kafka资源（如主题、消费者组等）的权限机制。ACL配置基于Kafka的kafka-acls.sh工具，能够管理对资源的读取、写入等操作权限。ACL介绍Kafka的ACL是基于以下几个方面的：资源类型（ResourceType）:Kafka支持多种资源类型，包括主题（Topic）、消费者组（ConsumerGroup
Shell控监Kafka积压 docsz linux kafka
1、获取Kafka消息堆积情况vicheck-kafka-lag.sh#！/bin/bashTOPIC="total_random"GROUP_ID="etl-dw"BOOTSTRAP_SERVER="node-01:9092,node-02:9092,node-03:9092"#检查第一个参数是否为数字if![[$1=~^[0-9]+$]];thenecho"错误:传入参数必须是数字">&2ex
java微服务中消息队列处理中间件基础语法学习，零基础学习慧香一格学习消息队列 java java 中间件消息队列处理
在Java微服务中，消息队列处理中间件可以帮助实现服务之间的异步通信、解耦和负载均衡。常用的Java消息队列工具包括RabbitMQ、ApacheKafka和ActiveMQ。下面我将详细介绍这些消息队列工具在Java中的基础语法和使用方法。1.RabbitMQRabbitMQ是一个广泛使用的开源消息代理软件，支持多种协议（AMQP、MQTT、STOMP等）。我们可以使用SpringAMQP来简化
消息队列篇--原理篇--RabbitMQ和Kafka对比分析 weisian151 消息队列篇 rabbitmq kafka 分布式
RabbitMQ和Kafka是两种非常流行的消息队列系统，但它们的设计哲学、架构特点和适用场景存在显著差异。对比如下。1、架构设计RabbitMQ：基AMQP协议：RabbitMQ是基于AMQP（高级消息队列协议）构建的，支持多种消息传递模式，如发布/订阅、路由、RPC等。单片架构：RabbitMQ采用的是传统的Broker架构，所有消息都通过一个或多个Broker节点进行处理。Broker负责接
Kafka系列5-Kafka 常见面试题只是甲大数据和数据仓库 #Kafka Kafka面试题 Kafka分区 Kafka性能
文章目录一.常见面试题1.1Kafka中的ISR(InSyncRepli)、OSR(OutSyncRepli)、AR(AllRepli)代表什么？1.2Kafka中的HW、LEO等分别代表什么？1.3Kafka中是怎么体现消息顺序性的？1.4Kafka中的分区器、序列化器、拦截器是否了解？它们之间的处理顺序是什么？1.5Kafka生产者客户端的整体结构是什么样子的？使用了几个线程来处理？分别是什么
Kafka消息轨迹方案设计与实现小马不敲代码大数据 kafka
在处理过的几个千万级TPS的Kafka集群中，消息追踪始终是一个既重要又棘手的问题。一条消息从Producer发出后，经过复杂的处理流程，最终被Consumer消费，中间可能会经历重试、重平衡、多副本复制等多个环节。如果没有完善的追踪机制，一旦出现问题将很难定位。本文将详细介绍Kafka消息轨迹的实现方案。1、Kafka消息处理模型在设计追踪方案前，我们需要先理解Kafka的消息处理模型。一条消息
kafka学习笔记2 —— 筑梦之路筑梦之路 Java技术 linux系统运维 kafka 学习笔记
KRaft模式Kafka的KRaft模式是一种新的元数据管理方式，旨在去除对ZooKeeper的依赖，使Kafka成为一个完全自包含的系统。在Kafka的传统模式下，元数据管理依赖于ZooKeeper，这增加了部署和运维的复杂性。为了解决这个问题，Kafka社区引入了KRaft模式。在KRaft模式下，所有的元数据，包括主题、分区信息、副本位置等，都被存储在Kafka集群内部的特殊日志中。这个日志
nginx反向代理kafka集群实现内外网隔离访问 —— 筑梦之路筑梦之路 linux系统运维大数据 nginx kafka 运维
背景说明我们在使用Kafka客户端连接到Kafka集群时，即使连接的节点只配置了一个集群的Broker地址，该Broker将返回给客户端集群所有节点的信息列表。然后客户端使用该列表信息（Topic的分区信息）再与集群进行数据交互。这里Kafka列表信息为服务配置文件service.properties中advertised.listeners配置项中的信息。例如：advertised.listen
k8s部署Kafka集群潞哥的博客 kubernetes kafka 容器
1.1、Kafka(消息队列)是一个分布式消息中间件,支持分区的、多副本的、多订阅者的、基于zookeeper协调的分布式消息系统。通俗来说：kafka就是一个存储系统，存储的数据形式为“消息"；1.2、常用的消息系统有哪些以及各自的特点有activemq，rabbitmq，rocketmq，kafka1.3、为什么使用消息队列1)、提高扩展性：因为消息队列解耦了处理过程，有新增需求时只要另外增加
K8S环境快速部署Kafka(K8S外部可访问) 2401_83817392 程序员 kubernetes kafka 容器
apiVersion:v1kind:Servicemetadata:name:zookeeper-nodeportnamespace:kafka-testspec:type:NodePortports:port:2181nodePort:32181selector:app:zookeeperrelease:kafka执行命令：kubectlapply-fzookeeper-nodeport-svc
kafka学习笔记5 PLAIN认证——筑梦之路筑梦之路 linux系统运维 Java技术 kafka 学习笔记
在Kafka中，SASL（SimpleAuthenticationandSecurityLayer）机制包括三种常见的身份验证方式：SASL/PLAIN认证：含义是简单身份验证和授权层应用程序接口，PLAIN认证是其中一种最简单的用户名、密码认证方式，生产环境使用维护简单易用。可用于Kafka和其他应用程序之间的认证。SASL/SCRAM认证：SCRAM-SHA-256、SCRAM-SHA-512
我的软件架构师——Java 职位面试经历。小蜗牛慢慢爬行 java 面试开发语言职场和发展后端 spring boot spring
最近，我参加了一家领先的服务型公司的软件架构师（Java）职位的面试。我在这里分享了一些面试官问我的问题。我只列出了与Java相关的问题，因为本文主要关注Java。面试官问我有关AWS、Docker、Kubernetes、Kafka、ElasticSearch、SQL/NoSQL和设计模式的问题。ClassNotFoundException和NoClassDefFoundError有什么区别？当您
你说通过Kafka AdminClient获取Lag会有性能问题？尊嘟假嘟0.o javakafka大数据
版本日期备注1.02024.8.25文章首发本文内容已用一种抽象的方式做成了视频，喜欢看视频的同学可以在B站上搜索“抽象狗哥”观看相应的内容。0.前言前阵子团队里出了个大故障，本质是因为其他语言实现的client有问题，非常频繁的请求大量元数据，而Kafka服务端这边也没有做什么限制，导致KafkaBroker宕了。在相关的复盘报告中，复盘方提到了我这边的监控程序（用于观察线上实时作业的堆压）会频
kafka 学习笔记3-传统部署Kraft模式集群——筑梦之路筑梦之路 kafka 学习笔记
部署kafka集群规划一般模式下，元数据在zookeeper中，运行时动态选举controller，由controller进行Kafka集群管理。kraft模式架构下，不再依赖zookeeper集群，而是用三台controller节点代替zookeeper，元数据保存在controller中，由controller直接进行Kafka集群管理。ip主机名角色nodeid192.168.100.131
【kafka】简单运用go语言操作kafka实现生产者和消费者功能的包，confluent-kafka-go和sarama {⌐■_■} kafka golang 分布式
confluent-kafka-go和sarama对比特性confluent-kafka-gosarama底层实现基于librdkafkaC库完全用Go实现性能高吞吐量、低延迟吞吐量较低，适合常规应用安装依赖需要C编译器和librdkafka无需外部依赖，纯Go实现功能支持Kafka所有功能，包括事务支持Kafka核心功能，事务支持较弱使用难度配置复杂，需理解底层C库使用简便，快速上手社区支持由C
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb