宋发元

Kafka 面试备战指南

一、基础概念与架构

什么是 Kafka？核心设计目标是什么？
答：Kafka 是分布式流处理平台，核心设计目标为 高吞吐、低延迟、高扩展性。采用发布-订阅模型，适用于实时数据管道、流处理等场景。
Kafka 核心组件有哪些？
答：
- Producer：消息生产者
- Consumer：消息消费者
- Broker：服务节点，存储消息
- Topic：消息分类的逻辑概念
- Partition：Topic 的物理分片，保证并行处理
- Zookeeper/KRaft：元数据管理与集群协调（新版本逐步用 KRaft 替代 Zookeeper）。
为什么 Kafka 需要 Partition？
答：
- 水平扩展：Topic 数据分散到多个 Broker，突破单机限制。
- 并行消费：每个 Partition 只能被一个 Consumer 线程消费，提升吞吐量。
Kafka 如何保证消息持久化？
答：
- 消息以 顺序追加（append-only） 方式写入磁盘，利用磁盘顺序读写的高性能。
- 通过 分段（Segment） 存储（如 1GB 一个文件）和 索引文件（快速定位消息）。

二、生产者与消费机制

Producer 发送消息如何保证不丢失？
答：
- 设置 acks=all：要求所有 ISR（In-Sync Replicas）副本确认写入。
- 开启 retries（重试机制）应对网络抖动。
- 避免 Producer 缓冲区满：监控 buffer.memory 和 max.block.ms。
Producer 的异步发送和同步发送区别？
答：
- 异步：批量发送（batch.size 控制），高吞吐但需处理回调确认成功。
- 同步：逐条发送，低吞吐但实时性强。
Consumer 的 Rebalance 是什么？触发条件？
答：
- Rebalance：Consumer 组内重新分配 Partition 所有权的过程。
- 触发条件：Consumer 加入/离开组、Topic Partition 数量变化、心跳超时。
如何避免 Consumer 重复消费？
答：
- 确保 幂等消费逻辑（如数据库唯一键）。
- 手动提交 Offset（enable.auto.commit=false），处理完业务后提交。
- 结合事务或使用 Kafka 的 Exactly-Once 语义（需 v0.11+）。

三、高可用与一致性

Kafka 如何实现高可用？
答：
- 副本机制：每个 Partition 有多个副本（Leader + Followers）。
- ISR 集合：与 Leader 保持同步的副本，Leader 故障时从 ISR 选举新 Leader。
- Unclean Leader 选举：unclean.leader.election.enable 控制是否允许非 ISR 副本成为 Leader（可能丢数据）。
HW（高水位）和 LEO（Log End Offset）的区别？
答：
- LEO：日志末端 Offset，表示下一条待写入消息的位置。
- HW：消费者可见的最大 Offset，保证所有 ISR 副本已同步到该位置。
Kafka 如何实现 Exactly-Once 语义？
答：
- 幂等 Producer：通过唯一 PID + Sequence Number 去重。
- 事务：跨分区原子性写入（需配合事务型 Consumer）。

四、性能优化与故障处理

如何提升 Kafka 吞吐量？
答：
- Producer：批量发送（batch.size）、压缩（compression.type）、异步发送。
- Consumer：增加分区数、多线程消费、调整 fetch.min.bytes。
- Broker：优化磁盘顺序 I/O、调整 num.io.threads。
Kafka 如何保证消息顺序性？
答：
- 单 Partition 内有序：同一 Partition 的消息按写入顺序消费。
- 需确保业务逻辑按 Key 分区（如订单 ID），相同 Key 写入同一 Partition。
遇到消息积压（Lag）如何处理？
答：
- 紧急扩容：增加 Consumer 实例数（不超过 Partition 数）。
- 提升单 Consumer 处理能力：优化消费逻辑、异步处理。
- 跳过非关键消息：重置 Offset（谨慎操作）。

五、高级特性与生态

Kafka Streams 和 Flink 的区别？
答：
- Kafka Streams：轻量级库，直接集成在应用中，适合简单流处理。
- Flink：独立集群，支持复杂计算（窗口、状态、CEP）。
Kafka Connect 的作用？
答：用于与其他系统（如 MySQL、HDFS）高效导入/导出数据，提供预置 Connector。
Kafka 消息过期机制？
答：
- 基于时间（log.retention.hours）或大小（log.retention.bytes）删除旧 Segment。
- 支持日志压缩（cleanup.policy=compact），保留 Key 的最新值。

六、高频场景题

设计一个秒杀系统，如何用 Kafka 削峰填谷？
答：
- 前端请求先写入 Kafka，后端以固定速率消费，避免流量击穿数据库。
- 结合库存预扣减 + Kafka 异步处理最终订单。
Kafka 如何实现百万级 TPS？
答：
- 分区数横向扩展（千级 Partition）。
- 批量处理 + 压缩 + 高效序列化（如 Avro）。
- 分布式集群部署（多 Broker 分散负载）。

七、延伸考点

Zookeeper 在 Kafka 中的作用：管理 Broker 注册、Topic 配置、Leader 选举（旧版本）。
Kafka 为什么快：顺序 I/O、PageCache 零拷贝、批量处理。
新版本特性：KRaft 模式（去 Zookeeper）、增量 Cooperative Rebalance（减少停顿）。

八、进阶设计与源码原理

Kafka 的 PageCache 与零拷贝（Zero-Copy）是如何提升性能的？
答：
- PageCache：消息写入时先到 OS 的 PageCache（内存），由操作系统异步刷盘，减少磁盘直接 I/O。
- Zero-Copy：Consumer 消费时，数据直接从 PageCache 通过 DMA 传输到网卡（无需经过用户态），减少 CPU 拷贝次数（sendfile 系统调用）。
Kafka 副本同步过程中，如果 Follower 长时间未同步，Leader 如何处理？
答：
- Leader 维护 ISR（In-Sync Replicas）列表，Follower 若超过 replica.lag.time.max.ms 未同步，会被踢出 ISR。
- 若 unclean.leader.election.enable=false，只有 ISR 中的副本可成为新 Leader，否则可能选择非 ISR 副本（导致数据丢失）。
Kafka 的 Controller 是什么？故障后如何恢复？
答：
- Controller：集群中一个特殊的 Broker，负责 Partition 的 Leader 选举、副本分配等元数据管理。
- 故障恢复：通过 Zookeeper/KRaft 重新选举新的 Controller，并从 Zookeeper/KRaft 读取元数据重建状态。
Kafka 日志分段（Segment）的底层结构是怎样的？
答：
- 每个 Partition 对应一个日志目录，包含多个 Segment 文件（如 0000000000.log）。
- 索引文件：.index（Offset 索引）和 .timeindex（时间戳索引），通过二分查找快速定位消息。

九、实际场景与设计题

如果 Consumer 消费速度远慢于 Producer 生产速度，除了增加 Consumer，还有什么方案？
答：
- 动态调整分区数：增加 Topic 的 Partition 数量（需提前规划 Key 的分布）。
- 消息分桶：将消息按优先级拆分到多个 Topic，优先处理高优先级 Topic。
- 降级处理：抽样丢弃非关键消息，或简化消费逻辑。
如何设计一个 Kafka 集群监控系统？需要关注哪些指标？
答：
- 关键指标：
  - Broker：CPU/磁盘 IO、网络吞吐、请求队列深度。
  - Topic：Partition 数量、消息堆积 Lag、ISR 副本数。
  - Consumer：消费延迟、心跳状态。
- 工具：Prometheus + Grafana（集成 JMX Exporter）、Kafka Manager。
Kafka 与 RocketMQ 的核心区别是什么？如何选型？
答：
- Kafka：高吞吐、适合日志/大数据场景，但消息延迟较高（批处理）。
- RocketMQ：低延迟、支持事务消息、死信队列，适合金融/订单场景。
- 选型：按业务需求权衡吞吐、延迟、功能完备性。

十、源码与调优深度问题

Kafka Producer 的 RecordAccumulator 是什么？如何工作？
答：
- 作用：缓存待发送消息，按 Topic-Partition 分组，批量发送以提高吞吐。
- 机制：每个批次（Batch）达到 batch.size 或等待 linger.ms 时间后触发发送。
Kafka 为什么选择自己实现 TCP 协议而不是用 HTTP？
答：
- 性能：自定义二进制协议（无 HTTP 头开销），更高效编解码。
- 长连接复用：减少 TCP 连接建立开销，支持多路复用请求。
Kafka 的延迟操作（Delayed Operation）有哪些？举例说明其作用。
答：
- 延迟操作类型：如 DelayedProduce（等待副本同步）、DelayedFetch（等待足够数据）。
- 作用：优化请求处理，避免频繁轮询，合并操作提升效率。

十一、故障排查与调优

发现 Kafka Broker 磁盘 IO 过高，如何排查？
答：
- 检查方向：
  - 是否 Partition 分布不均（部分 Broker 负载过高）。
  - 是否消息保留策略失效（日志删除不及时）。
  - 是否 Producer 压缩算法不当（如未启用 Snappy/LZ4）。
- 工具：iostat、sar、Kafka 日志（查看 GC 情况）。
Consumer 频繁发生 Rebalance，可能是什么原因？如何解决？
答：
- 原因：
  - Consumer 处理消息时间过长，导致心跳超时（session.timeout.ms）。
  - 网络不稳定，导致心跳无法到达 Coordinator。
- 解决：
  - 增大 session.timeout.ms 和 max.poll.interval.ms。
  - 优化消费逻辑，减少单次 Poll 的数据量（max.poll.records）。

十二、开放设计题

如果让你设计一个分布式消息队列，会参考 Kafka 的哪些设计？改进哪些不足？
答：
- 参考：分区机制、顺序追加日志、副本同步策略。
- 改进：
  - 支持多租户隔离（Kafka 较弱）。
  - 更灵活的消息路由（如 Tag 过滤，类似 RocketMQ）。
  - 更细粒度的延迟消息（Kafka 需外部实现）。
如何用 Kafka 实现“延迟队列”（如订单30分钟未支付自动关闭）？
答：
- 方案1：使用外部时间轮（如 Redis ZSet）记录到期时间，到期后投递到 Kafka。
- 方案2：创建多个 Topic（如 delay_1m, delay_5m），消息先写入延迟 Topic，由 Consumer 定时转移至目标 Topic。

十三、最新特性与趋势

KRaft 模式与 Zookeeper 模式的优劣对比？
答：
- KRaft 优势：
  - 去中心化，减少运维复杂度。
  - 元数据管理性能更高（减少 ZK 网络开销）。
- 劣势：新版本稳定性待验证，旧集群迁移成本高。
Kafka 3.0+ 版本有哪些重要更新？
答：
- 增量式 Cooperative Rebalance：减少 Consumer 重平衡时的 Stop-The-World 时间。
- ZStandard 压缩：更高压缩比，更低 CPU 消耗。
- 加强 Exactly-Once 语义：优化事务性能。

十四、刁钻追问

为什么 Kafka 不直接支持消息级别的延迟，而是需要外部实现？
答：
- 设计哲学：Kafka 定位为高通量日志系统，延迟消息会增加存储和调度复杂度（需维护时间索引）。
- 替代方案：通过外部时间轮或分层 Topic 实现，保持核心逻辑简洁。
Kafka 的 ISR 机制可能导致脑裂问题吗？如何避免？
答：
- 脑裂风险：网络分区时，旧 Leader 可能继续服务写请求，导致数据不一致。
- 解决：依赖 Zookeeper/KRaft 的协调机制，检测 Leader 存活状态并触发重新选举。

十五、深度原理与调优陷阱

Kafka 的 max.poll.records 和 fetch.max.bytes 有什么区别？设置不当会导致什么问题？
答：
- max.poll.records：单次 Poll 请求返回的最大消息数（默认 500）。
- fetch.max.bytes：单次请求从 Broker 拉取的最大数据量（默认 50MB）。
- 陷阱：若 fetch.max.bytes 过小，可能导致多次网络请求；若 max.poll.records 过大，可能引发 Consumer 内存溢出。
为什么 Kafka 的 Topic 分区数不是越多越好？
答：
- 元数据膨胀：每个分区在 Zookeeper/KRaft 中存储元数据，过多分区导致集群管理开销剧增。
- 文件句柄压力：每个分区对应多个 Segment 文件，分区过多可能导致 Broker 文件句柄不足。
- 经验值：单 Broker 建议不超过 4000 个分区，集群总量控制在 20 万以内。
Kafka 的 min.insync.replicas 参数有什么作用？如何影响可用性？
答：
- 定义：要求写入成功的 ISR 副本最小数量（默认 1）。
- 影响：若设置 min.insync.replicas=2，当 ISR 副本数不足 2 时，Producer 会抛出 NotEnoughReplicasException，在数据可靠性和可用性之间权衡。

十六、生产环境疑难场景

如何实现 Kafka 消息的“优先级队列”（如 VIP 用户消息优先处理）？
答：
- 方案1：拆分多个 Topic（如 high_priority、low_priority），Consumer 优先消费高优先级 Topic。
- 方案2：在消息头添加优先级标记，Consumer 拉取后按优先级排序处理（需单 Consumer 消费，可能成为瓶颈）。
Kafka 集群跨数据中心同步（如异地多活）有哪些方案？各有什么优缺点？
答：
- MirrorMaker：Kafka 官方工具，简单但延迟高，易丢消息。
- Confluent Replicator：商业工具，支持精确 Offset 同步。
- 双写：应用层同时写入两地集群，复杂度高但控制灵活。
Broker 的 JVM 内存如何合理分配？为什么不能分配过大？
答：
- 建议：Heap 不超过 6GB（避免 GC 停顿），剩余内存留给 PageCache。
- 原因：Kafka 依赖 PageCache 加速读写，过大的 Heap 会挤占 OS 缓存，反而降低性能。

十七、源码与协议层追问

Kafka 的 Leader 选举算法是什么？和 ZAB/Raft 有什么区别？
答：
- 算法：基于 Controller 的 优先副本选举（优先选择 ISR 中的第一个副本）。
- 对比：非强一致性算法（允许 ISR 外的副本成为 Leader），而 Raft 要求多数派确认。
Kafka 的 Log 类如何管理 Segment 文件？删除过期数据的触发条件是什么？
答：
- 管理机制：Log 维护活跃 Segment（当前写入）和只读 Segments，按时间或大小滚动切割。
- 删除触发：后台线程定期检查，基于 log.retention.{hours|bytes} 或日志压缩策略。
Producer 的 linger.ms 和 batch.size 哪个优先级更高？
答：先达到阈值者触发发送。例如，若 linger.ms=100ms，batch.size=32KB：
- 若 50ms 内累积到 32KB，立即发送。
- 若 100ms 时未满 32KB，也会发送。

十八、安全与运维

如何为 Kafka 集群配置 SSL 加密和 SASL 认证？
答：
- SSL：配置 listeners=SSL://:9093，生成 Keystore 和 Truststore。
- SASL：支持 PLAIN/SCRAM 等机制，配置 JAAS 文件并启用 SASL_SSL 监听器。
Kafka 的 ACL（访问控制列表）如何实现 Topic 级权限管理？
答：
- 启用 authorizer.class.name=kafka.security.auth.SimpleAclAuthorizer。
- 使用 kafka-acls.sh 命令，如：
```
bin/kafka-acls.sh --add --allow-principal User:Alice --operation Read --topic TestTopic
```
如何安全地扩容 Kafka 集群？
答：
- 步骤：
  1. 新 Broker 加入集群。
  2. 使用 kafka-reassign-partitions.sh 迁移部分 Partition 到新 Broker。
  3. 监控流量和负载均衡，逐步迁移避免瞬时压力。
- 风险点：迁移期间可能影响 Producer 和 Consumer 性能。

十九、与其他技术栈整合

Spark Streaming 消费 Kafka 时，Direct API 和 Receiver API 有什么区别？
答：
- Receiver API：通过 WAL 预读数据，可能丢数据且效率低（已弃用）。
- Direct API：直接管理 Offset，精确一次消费，推荐使用。
如何将 Kafka 数据实时同步到 HDFS？
答：
- 方案1：使用 Kafka Connect HDFS Connector。
- 方案2：自研 Consumer，写入 HDFS 并定期生成文件（结合 Hive 分区）。
Kafka 和 Debezium 如何实现 CDC（变更数据捕获）？
答：
- 原理：Debezium 连接数据库（如 MySQL Binlog），将数据变更转换为 Kafka 消息。
- 用途：实时数据同步、微服务解耦。

二十、刁钻场景压轴题

若 Kafka 集群所有 Broker 同时宕机，恢复后如何保证数据一致性？
答：
- 优先恢复 Leader：从 ISR 副本中选择，保证 HW 之前的数据一致。
- 数据丢失场景：若所有副本数据损坏，需从备份恢复（如 Confluent 的 Backup & Restore）。
设计一个 Kafka 消息轨迹（Trace）追踪系统，如何实现？
答：
- 方案：
  1. 在消息头注入 TraceID。
  2. 通过拦截器（Interceptor）记录 Producer/Consumer 日志。
  3. 日志汇总到 ELK 或分布式追踪系统（如 Jaeger）。
为什么 Kafka 的 Consumer 不能像 RabbitMQ 那样“广播消息”给所有 Consumer？如何实现类似功能？
答：
- 设计差异：Kafka Consumer Group 是竞争消费模型。
- 实现广播：为每个 Consumer 分配独立 Group ID（但会导致 Offset 难以管理）。

二十一、高级运维与监控

如何动态调整 Kafka Topic 的分区数？调整后对生产者和消费者有何影响？
答：
- 调整命令：kafka-topics.sh --alter --partitions <新分区数>。
- 影响：
  - 生产者：需更新分区策略，否则新分区可能无流量（需 Key 重新哈希）。
  - 消费者：触发 Rebalance，可能暂时停服。
- 注意：只能增加分区，不能减少。
Kafka 的 log.flush.interval.messages 和 log.flush.interval.ms 参数有什么区别？如何配置？
答：
- log.flush.interval.messages：累积多少条消息后强制刷盘（默认无限）。
- log.flush.interval.ms：间隔多久强制刷盘（默认无限）。
- 配置建议：生产环境通常依赖 OS 的 PageCache 异步刷盘，除非要求强持久化（如金融场景）。
如何监控 Kafka 的 ISR 副本同步延迟？延迟过高如何解决？
答：
- 监控指标：kafka.server:type=ReplicaManager,name=IsrShrinksPerSec（ISR 收缩次数）。
- 解决：
  1. 检查 Follower Broker 的磁盘/网络性能。
  2. 调优 replica.fetch.max.bytes 和 replica.fetch.wait.max.ms。
  3. 避免单 Broker 负载过高（迁移部分 Partition）。

二十二、复杂故障恢复与数据一致性

若 Kafka 的某个 Partition 的所有副本（Leader + Followers）全部损坏，如何恢复数据？
答：
- 无备份：数据永久丢失，需从上游数据源（如数据库日志）重新灌入。
- 有备份：使用工具（如 Confluent Backup & Restore）恢复。
- 教训：务必启用跨集群镜像（如 MirrorMaker2）或定期备份。
Kafka 的 delete.topic.enable=false 时，删除 Topic 会有什么现象？如何彻底清理？
答：
- 现象：Topic 标记为删除但数据仍存，重启 Broker 后可能重现。
- 彻底清理：
  1. 手动删除 Zookeeper 中 /brokers/topics/ 节点。
  2. 删除 Broker 磁盘上对应 Topic 的日志目录。
如何检测和处理 Kafka 中的“僵尸消息”（无限重试也无法处理的消息）？
答：
- 检测：监控 Consumer 的 last.offset.committed 与 current.offset 差值长期不变。
- 处理：
  1. 将消息转入“死信队列”（需自定义逻辑）。
  2. 人工介入分析原因（如消息格式错误）。

二十三、Kafka 生态与扩展工具

Kafka Schema Registry 的作用是什么？如何配合 Avro 使用？
答：
- 作用：集中管理消息的 Schema 版本，实现兼容性检查。
- 流程：
  1. Producer 发送 Avro 数据前向 Schema Registry 注册 Schema。
  2. Consumer 消费时根据 Schema ID 拉取 Schema 反序列化。
Kafka 的 Tiered Storage（分层存储）是什么？解决什么问题？
答：
- 定义：将旧数据从本地磁盘迁移到廉价对象存储（如 S3）。
- 优势：降低存储成本，扩展历史数据保留能力。
- 现状：Confluent 企业版支持，社区版需自研。
如何用 Kafka 实现“事件溯源（Event Sourcing）”模式？
答：
- 核心：将系统状态变更作为事件序列持久化到 Kafka Topic。
- 消费：重建状态时重放所有事件（需保证顺序性和幂等性）。

二十四、性能极限与压测

如何对 Kafka 集群进行压力测试？需要关注哪些瓶颈点？
答：
- 工具：kafka-producer-perf-test.sh 和 kafka-consumer-perf-test.sh。
- 瓶颈点：
  - 网络带宽（跨机房场景）。
  - 磁盘 IOPS（机械硬盘 vs SSD）。
  - Broker CPU（启用压缩时）。
单条 Kafka 消息过大会有什么问题？如何优化？
答：
- 问题：
  - 生产者/消费者内存压力增大。
  - 磁盘写入和网络传输效率降低。
- 优化：
  1. 拆分消息（如分片上传）。
  2. 启用压缩（compression.type=lz4）。
  3. 调整 message.max.bytes 和 fetch.max.bytes。

二十五、开放架构设计题

设计一个支持千万级在线用户的实时弹幕系统，如何基于 Kafka 设计架构？
答：
- 架构要点：
  1. 按直播间 ID 分区，保证同一房间消息顺序性。
  2. 前端 WebSocket 服务消费 Kafka，推送消息到用户。
  3. 使用 Kafka Streams 过滤敏感词（实时处理）。
  4. 历史弹幕存储到 HBase/Cassandra。
如何用 Kafka 实现分布式系统的最终一致性（如订单与库存系统）？
答：
- 方案：
  1. 订单服务创建订单后发 Kafka 消息。
  2. 库存服务消费消息扣减库存，成功后发确认事件。
  3. 订单服务监听确认事件更新状态。
- 补偿机制：若库存不足，发取消订单消息。

二十六、刁钻源码与协议题

Kafka 的 GroupCoordinator 是如何管理 Consumer Group 状态的？
答：
- 核心机制：
  1. Consumer 启动时向 Coordinator（某个 Broker）注册。
  2. Coordinator 维护 Group 的元数据（成员列表、Offset）。
  3. 心跳超时或成员变动时触发 Rebalance。
Kafka 的请求处理线程模型是怎样的？为什么分 num.network.threads 和 num.io.threads？
答：
- 线程模型：
  - Network threads：处理网络请求（接收/发送数据包）。
  - IO threads：执行磁盘读写和业务逻辑（如写入日志）。
- 分离原因：避免网络层阻塞磁盘 IO，提升并发能力。

二十七、源码级灵魂拷问

Kafka 的 ReplicaFetcherThread 如何工作？如果 Follower 的 Fetch 请求延迟高，如何定位问题？
答：
- 机制：Follower 通过 ReplicaFetcherThread 向 Leader 发起 Fetch 请求，维护一个待拉取 Offset 队列。
- 定位：
  1. 检查 Broker 的 kafka.network:type=RequestMetrics,name=TotalTimeMs,request=Fetch 指标。
  2. 分析磁盘 IO 延迟（iostat）、网络带宽（iftop）。
  3. 检查是否因 replica.fetch.max.bytes 过小导致频繁请求。
Kafka 的 Selector 类在网络层的作用是什么？与 Java NIO 有何关联？
答：
- 作用：基于 Java NIO 的 Selector 实现多路复用，监听多个 Channel 的 IO 事件（读/写/连接）。
- 优化：Kafka 自定义了 Selector 实现，减少内存分配（如复用 ByteBuffer），提升网络吞吐。
Kafka 日志追加（Log Append）的加锁粒度是怎样的？如何保证高并发写入？
答：
- 锁粒度：每个 Partition 对应一个锁（Log 对象内部锁），保证同一 Partition 的顺序写入。
- 并发优化：不同 Partition 的写入完全并行，利用多磁盘/多线程优势。

二十八、极端场景设计

如果 Kafka 集群出现“分区倾斜”（某几个 Partition 负载极高），如何快速解决？
答：
- 应急方案：
  1. 动态扩容 Partition 的副本数，分摊 Leader 压力。
  2. 紧急调整 Producer 的分区策略（如随机轮询替代哈希）。
- 根治措施：优化 Key 设计（避免热点 Key），使用一致性哈希。
如何用 Kafka 实现“全局有序消息”（跨 Partition 有序）？
答：
- 理论限制：Kafka 无法原生支持跨 Partition 全局有序。
- 折中方案：
  1. 单 Partition 写入（牺牲扩展性）。
  2. 消费端按时间窗口排序（需容忍延迟）。

二十九、面试官心理与反杀技巧

当面试官问“你还有什么问题想问我们？”时，如何回答能加分？
答：
- 技术向：
  “贵司的 Kafka 集群规模多大？遇到的最大挑战是什么？”
  “是否有基于 Kafka 二次开发的自研组件？”
- 业务向：
  “Kafka 在贵司业务中的核心场景是什么？（如实时推荐/风控）”
如果被问到完全不懂的问题，如何应对？
答：
- 诚实承认：
  “这个问题我之前没深入研究过，但我理解可能是为了解决 XXX 问题，我猜测方向是 XXX，您能提示一下吗？”
- 转移焦点：
  “类似场景我在 YYY 技术中遇到过，解决方案是 ZZZ，不知是否适用此问题？”

三十、复习方法论

1. 优先级金字塔

T0 必考：
Producer 不丢失、Consumer Rebalance、Partition 设计、高可用原理（ISR/HW/Leader选举）。
T1 高频：
性能优化（吞吐/延迟）、Exactly-Once、Kafka 为什么快、消息积压处理。
T2 差异化：
源码原理（如 PageCache/零拷贝）、生态工具（Kafka Connect/Streams）、生产问题案例。

2. 答案结构化

问题：“如何保证消息不丢失？”
回答模板：
1. 分层防御：Producer → Broker → Consumer 全链路分析。
2. 参数+原理：acks/retries/flush 参数 + ISR 机制 + Offset 提交策略。
3. 监控兜底：Lag 监控 + 异常告警 + 定期端到端测试。

3. 反客为主

主动输出：回答后补充一句：
“我在项目中曾因 auto.commit=true 导致消息丢失，后来改为手动提交并加幂等，这是当时的解决方案……”
引导技术深度：
“Kafka 的零拷贝底层用了 sendfile 系统调用，结合 DMA 减少 CPU 拷贝，这也是它吞吐高的关键原因之一。”

最后一步：模拟自测

自测题：

不查资料，能否手绘 Kafka 架构图并标注数据流向？
能否在 3 分钟内说清 Rebalance 的全流程？
能否用最简代码实现 Producer 的幂等发送？

自测通过标准：

能向非技术人员 类比解释 Kafka（如：快递仓库分货架存放包裹，快递员批量送货，顾客按顺序取货）。
对每个问题能关联至少一个 实际案例（如性能调优、故障排查）。

终极大招：
面试前夜，用 费曼学习法 将 Kafka 核心知识点讲给朋友（或镜子）听，直到能用最简单语言解释清楚。

三十一、建议

复习建议

动手实验：搭建集群，体验 Producer/Consumer API，观察日志和监控。
深入源码：了解核心类（如 LogSegment、ReplicaManager）。
模拟面试：结合项目经历，阐述 Kafka 解决的实际问题（如日志收集、实时统计）。

应对策略

遇到源码题：结合核心类名（如 Log, ReplicaManager）和设计思想回答，不必死记代码。
场景题：先明确业务需求（如延迟、一致性要求），再匹配 Kafka 特性。
对比题：从架构设计（如协议、存储模型）、适用场景、运维成本多维度分析。
遇到超纲问题：先拆解问题（如“如何设计追踪系统” → 拆为消息标记、日志收集、可视化），再结合现有技术栈回答。
原理结合实践：举例说明你在项目中如何调优 Kafka（如调整 num.io.threads 解决磁盘瓶颈）。
主动引导话题：若被问及不熟悉的领域，可关联到已知知识点（如“Kafka 安全机制” → 引申到 SSL 配置经验）。

继续补充你的实际项目经验（如用 Kafka 处理日志/实时统计），展现 原理结合实战 的能力，大厂面试官会更青睐！

最后提醒：大厂面试注重 系统性思维，回答时展现“自顶向下”分析能力（从问题表象 → 底层原理 → 解决方案），而非死记答案。掌握这些题目后，建议模拟真实面试场景，练习流畅表达！

终极建议

理解而非背诵：面试官可能换一种问法，核心是掌握原理。
关联项目经验：如：“我在上家公司用 Kafka 处理日志，曾遇到消息积压问题，通过动态扩容 Consumer 和优化消费逻辑解决”。
模拟追问：对每个答案自问“为什么？”（如：为什么 Kafka 依赖 PageCache？→ 因为顺序读写比随机读写快 3-4 个数量级）。

掌握以上内容，你已经超越了 90% 的候选人！最后 24 小时，重点复习 高频题（如 Rebalance、Exactly-Once） 和 你的项目中的 Kafka 设计细节，自信迎战即可！

你可能感兴趣的:(kafka,面试,分布式)

C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
php 高并发下日志量巨大，如何高效采集、存储、分析贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.问题背景高并发系统每秒产生大量日志（如访问日志、错误日志、业务日志等）。单机写入、存储、分析能力有限，容易成为瓶颈。需要支持实时采集、分布式存储、快速检索与分析。2.主流架构方案一、分布式日志采集架构[应用服务器(PHP等)]|v[日志采集Agent（如Filebeat、Fluentd、Logstash）]|v[消息队列/缓冲（如Kafka、Redis、RabbitMQ）]|v[日志存储（如E
Shader面试题100道之（81-100）还是大剑师兰特 #Shader 综合教程100+大剑师 shader面试题 shader教程
Shader面试题（第81-100题）以下是第81到第100道Shader相关的面试题及答案：81.Unity中如何实现屏幕空间的热扭曲效果（HeatDistortion）？热扭曲效果可以通过GrabPass抓取当前屏幕图像，然后在片段着色器中使用噪声或动态UV偏移模拟空气扰动，再结合一个透明通道控制扭曲强度来实现。82.Shader中如何实现物体轮廓高亮（OutlineHighlight）？轮廓
Kafka系列之：Dead Letter Queue死信队列DLQ 快乐骑行^_^ Kafka Kafka系列 Dead Letter Queue 死信队列 DLQ
Kafka系列之：DeadLetterQueue死信队列DLQ一、死信队列二、参数errors.tolerance三、创建死信队列主题四、在启用安全性的情况下使用死信队列更多内容请阅读博主这篇博客：Kafka系列之：KafkaConnect深入探讨-错误处理和死信队列一、死信队列死信队列（DLQ）仅适用于接收器连接器。当一条记录以JSON格式到达接收器连接器时，但接收器连接器配置期望另一种格式，如
消息中间件巡检搬砖小常消息中间件运维笔记 RocketMQ kafka 中间件巡检运维
除资源使用情况外，消息中间件RocketMQ、kafka还可以巡检哪些？一、RocketMQ巡检1、检查broker写入耗时是否有压力2、检查brokerbusy的数量与频率3、主题发送TPS、发送错误率巡检4、从节点消费情况检查5、集群各broker消息流转情况巡检二、Kafka巡检1、检查是否有分区发生ISR频繁扩张收缩2、检查分区leader选举值是否处于正常水平3、检查controller
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
无面试无offer? 你需要AI 求职co-pilot的帮助!
大家好啊，我写的开源免费求职AIco-pilot工具发布了v3.0.0，欢迎大家参与、使用!https://github.com/weicanie/prisma-ai一、项目介绍开源免费的求职co-pilot，自动化简历准备至offer到手的整个流程。优化您的项目、定制您的简历、为您匹配工作，并帮助您做好面试准备。二、核心价值prisma-ai旨在解决求职者在准备简历和寻找工作时最头疼的3个问题:
RocketMQ 之死信队列 firepation RocketMQ rocketmq
在分布式消息系统中，消息的可靠传递和处理至关重要。然而，由于各种原因（如消息处理失败、消费超时等），一些消息可能无法被正常消费。这些无法被消费的消息如果不加以处理，会影响系统的稳定性和数据一致性。为了解决这一问题，RocketMQ提供了死信队列（DeadLetterQueue，DLQ）机制。本文将深入探讨RocketMQ的死信队列，包括其实现原理、应用场景以及使用示例。什么是死信队列？死信队列是一
OkHttp3源码解析--设计模式，android开发实习面试题
this.cache=builder.cache;}//构造者publicstaticfinalclassBuilder{Cachecache;…//构造cache属性值publicBuildercache(@NullableCachecache){this.cache=cache;returnthis;}//在build方法中真正创建OkHttpClient对象，并传入前面构造的属性值publi
自动化运维工程师面试题解析【真题】
ZabbixAgent默认监听的端口是A.10050。以下是关键分析：选项排除：C.80是HTTP默认端口，与ZabbixAgent无关。D.5432是PostgreSQL数据库的默认端口，不涉及ZabbixAgent。B.10051是ZabbixServer的默认监听端口，用于接收Agent发送的数据，而非Agent自身的监听端口。ZabbixAgent的配置：根据官方文档，ZabbixAgen
javaSE面试题---语法基础、面向对象、常用类、集合、多线程、文件和IO yang_xiao_wu_ java 面试开发语言 javase java基础多线程文件和IO
目录语法基础1.jdkjrejvm区别2.基本数据类型3.引用数据类型4.自动类型转换、强制类型转换5.常见的运算符6.&和&&区别7.++--在前和在后的区别8.+=有什么作用9.switch..case中switch支持哪些数据类型10.break和continue区别11.while和dowhile区别12.如何生成一个取值范围在[min,max]之间的随机数13.数组的长度如何获取？数组下
vue3面试题(个人笔记) 武昌库里写JAVA 面试题汇总与解析课程设计 spring boot vue.js java 学习
vue3比vue2有什么优势？性能更好，打包体积更小，更好的ts支持，更好的代码组织，更好的逻辑抽离，更多的新功能。描述Vue3生命周期CompositionAPI的生命周期：onMounted()onUpdated()onUnmounted()onBeforeMount()onBeforeUpdate()onBeforeUnmount()onErrorCaptured()onRenderTrac
flutter知识点 ZhDan91 flutter
#时隔4年了#4年前用flutter开发海外项目和医疗项目。绘制界面的语法与html还是较类似的。把这些封印的记忆和技术回顾一下，最开始是开发Android出身的，所以开发起flutter来依旧是用的androidstudio开发工具。整理下用到的知识点：整理来源：flutter面试题——基础篇（1）-CSDN博客1、Dart是单线程的。在单线程中以消息循环来运行的。其中敖汉两个任务队列。一个是微
2025年渗透测试面试题总结-2025年HW(护网面试) 43（题目+回答）独行soc 2025年护网面试职场和发展 linux 科技渗透测试安全护网
安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录2025年HW(护网面试)431.自我介绍与职业规划2.Webshell源码级检测方案3.2025年新型Web漏洞TOP54.渗透中的高价值攻击点5.智能Fuzz平台架构设计6.堆栈溢出攻防演进7.插桩技术实战应用8.二进制安全能力矩阵9.C语言内存管理精要10.Pyth
python相关内容二湫默 python 开发语言
1.技术面试题（1）详细描述单调栈的工作原理和应用场景答：工作原理：维护一个栈结构，栈中元素保持单调递增或单调递减的顺序。遍历数据时，新元素入栈前，弹出栈顶所有不满足单调关系的元素，再将新元素入栈，确保栈的单调性。应用场景：解决下一个元素更大的问题，如数组中后面一个元素比前面一个入栈的元素大，则需要上一个元素出栈，然后大的那个元素入栈。（2）详细描述单调队列的工作原理和应用场景答：工作原理：维护队
ZooKeeper架构及应用场景详解走过冬季学习笔记 zookeeper 架构分布式
ZooKeeper是一个开源的分布式协调服务，由Apache软件基金会维护。它旨在为分布式应用提供高性能、高可用、强一致性的基础服务，解决分布式系统中常见的协调难题（如配置管理、命名服务、分布式锁、服务发现、领导者选举等）。核心软件架构ZooKeeper的架构设计围绕其核心目标（协调）而优化，主要包含以下关键组件：集群模式(Ensemble):ZooKeeper通常部署为集群（称为ensemble
zookeeper etcd区别 sun007700 zookeeper etcd 分布式
ZooKeeper与etcd的核心区别体现在设计理念、数据模型、一致性协议及适用场景等方面。‌ZooKeeper基于ZAB协议实现分布式协调，采用树形数据结构和临时节点特性，适合传统分布式系统；而etcd基于Raft协议，以高性能键值对存储为核心，专为云原生场景优化，是Kubernetes等容器编排系统的默认存储组件。‌‌1‌‌2‌架构与设计目标差异‌‌ZooKeeper‌。‌设计定位‌:专注于分
面试官：Spring 如何控制 Bean 的加载顺序？
在大多数情况下，我们不需要手动控制Bean的加载顺序，因为Spring的IoC容器足够智能。核心原则：依赖驱动加载SpringIoC容器会构建一个依赖关系图（DependencyGraph）。如果BeanA依赖于BeanB（例如，A的构造函数需要一个B类型的参数），Spring会保证在创建BeanA之前，BeanB已经被完全创建和初始化好了。@ServicepublicclassServiceA{
C++面试核心知识点全面解析：从基础到高级
掌握这些核心知识点，轻松应对90%的C++技术面试一、基础语法与关键字1.1const关键字的多种用法//1.常量变量constintMAX_SIZE=100;//2.常量指针与指针常量constint*ptr1=&var;//指向常量的指针int*constptr2=&var;//常量指针constint*constptr3=&var;//指向常量的常量指针//3.常量成员函数classMyCl
Java实习模拟面试之安徽九德 —— 面向对象编程、Spring框架与数据库技术详解培风图南以星河揽胜 java面试 java 面试 spring
关键词：Java实习生、模拟面试、安徽九德、SpringBoot、MySQL、Redis、面向对象编程、团队协作一、前言作为一名计算机相关专业的学生，想要顺利进入一家互联网公司或软件开发企业实习，技术面试是必须面对的一道门槛。本文将带你走进一场真实的Java实习生模拟面试场景，以“安徽九德”公司为背景，围绕其发布的招聘岗位要求，进行一次全方位的技术面试演练。本次模拟面试涵盖以下核心知识点：Java
C++ 性能优化指南三月微风 c++性能优化开发语言
C++性能优化指南（针对GCC编译器，面向高级工程师面试）代码优化面试常问点：如何避免不必要的对象拷贝？为什么要用引用或std::move？虚函数调用有什么性能开销？原理解释：传递对象时按值会拷贝整个对象，特别是大对象会频繁分配/释放内存，影响性能；应尽量改用引用或指针传递。C++11引入移动语义（move），允许“窃取”临时对象的资源，避免深拷贝。虚函数调用需要先通过对象的虚函数表指针（vptr
C#常见面试题 rapLiu c#数据库开发语言
1.http和https的区别1.HTTP明文传输，数据都是未加密的，安全性较差，HTTPS（SSL+HTTP）数据传输过程是加密的，安全性较好。2.使用HTTPS协议需要到CA（CertificateAuthority，数字证书认证机构）申请证书，一般免费证书较少，因而需要一定费用。证书颁发机构如：Symantec、Comodo、GoDaddy和GlobalSign等。3.HTTP页面响应速度比
C#常见面试题 rapLiu java 开发语言
1.i++中为什么用到锁在C#中，i++通常不需要用锁，因为i++操作本身是一个原子操作。原子操作是指一个操作要么完全执行，要么完全不执行，不会被中断。因此，在单线程环境下，i++操作是安全的。然而，在多线程环境下，如果多个线程同时对i进行++操作，就可能会出现竞争条件（racecondition），导致数据不一致或错误的结果。为了避免这种情况，需要使用锁来保护i的操作，确保在同一时刻只有一个线程
前端面试题总结——JS篇又又呢前端 javascript 开发语言
一、说说JavaScript中的数据类型？存储上有什么差别？1、数据类型基本类型number：数值类型十进制：letintNum=55八进制（零开头）：letnum1=070十六进制（0x开头）：lethexNum1=0xANaN：特殊数值，意为“不是数值”string：字符串类型boolean：布尔值，true或falseundefined：表示未定义null：空值symbol：是原始值，且符号
分布式选举算法＜一＞ Bully算法
分布式选举算法详解：Bully算法引言在分布式系统中，节点故障是不可避免的。当主节点（Leader）发生故障时，系统需要快速选举出新的主节点来保证服务的连续性。Bully算法是一种经典的分布式选举算法，以其简单高效的特点被广泛应用于各种分布式系统中。什么是Bully算法？Bully算法是一种基于优先级的分布式选举算法。每个节点都有一个唯一的ID，ID值越大的节点优先级越高。当主节点故障时，优先级最
全面探索Kafka：架构、应用与流处理
Kafka：企业级消息系统与流处理平台的深度解析ApacheKafka作为分布式流处理平台，广泛应用于大数据处理和实时分析领域。本文将基于其官方文档，详细探讨Kafka的核心功能、应用场景以及如何进行有效管理。背景简介Kafka作为高吞吐量的消息系统，支持企业级的发布-订阅模式。它能够处理大量实时数据，并支持高并发读写操作。本文将依据Kafka官方文档的内容，逐层深入，从入门到高级应用，帮助读者全
前端面试题——5.AjAX的缺点？浅端前端面试题前端面试题
①传统的web交互是：用户一个网页动作，就会发送一个http请求到服务器，服务器处理完该请求再返回一个完整的HTML页面，客户端再重新加载，这样极大地浪费了带宽。②AJAX的出现解决了这个问题，它只会向服务器请求用户所需要的数据，并在客户端采用JavaScript处理返回的数据，操作DOM更新页面。③AJXA优点：无刷新更新页面异步服务器通信前端后端负载均衡④AJAX缺点：干掉了Back和Hist
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，