我一直在流浪

分布式 - 消息队列Kafka：Kafka分区常见问题总结

文章目录

- - 01. Kafka 的分区是什么？
  - 02. Kafka 为什么需要分区？
  - 03. Kafka 分区有什么作用？
  - 03. Kafka 为什么使用分区的概念而不是直接使用多个主题呢？
  - 04. Kafka 分区的数量有什么限制？
  - 05. Kafka 分区的副本有什么作用？
  - 06. Kafka 分区的消息是如何分配到不同的分区中的？
  - 07. Kafka 分区可以增加或者减少吗？
  - 08. Kafka 的分区数大于服务器台数时如何分配存储副本？
  - 09. Kafka 创建Topic时如何将分区设置到不同的broker中？
  - 10. Kafka 为什么需要手动调整分区的副本分配？
  - 11. Kafka 如何手动的调整分区的副本分配？
  - 12. kafka 如何手动增加分区的副本数量？
  - 13. Kafka 为什么需要手动增加分区的副本数量？
  - 14. Kafka 分区负载均衡如何实现？
  - 15. Kafka Leader分区负载平衡如何实现？
  - 16. Kafka 集群如何选择合适的Topic/Partition数量？
  - 17. Kafka 分区数量是否越多越好呢？
  - 18. Kafka 如何确定分区数量？
  - 19. Kafka 如何保证顺序的消费主题中的消息？
  - 20. Kafka 如何保证顺序的消费分区中的消息？
  - 21. Kafka 自动分区分配机制是什么？
  - 22. Kafka 自动分区分配机制如何开启？

01. Kafka 的分区是什么？

Kafka是一种分布式流处理平台，它将数据分成多个主题（topics），每个主题可以分成多个分区（partitions）。分区是Kafka中最基本的概念之一，它是一种逻辑上的概念，用于将主题中的数据分散存储在不同的节点上，以实现数据的并行处理和高可用性。每个分区都是一个有序的、不可变的消息序列，其中的消息按照写入的顺序进行排序，并且每个消息都有一个唯一的偏移量 offset 来标识它在分区中的位置。消费者可以通过指定偏移量来读取分区中的消息，从而实现对数据的随机访问和重放。

分区的数量是在创建主题时指定的，一般情况下，每个主题都会有多个分区，以便实现数据的并行处理和负载均衡。分区的数量应该根据数据量和处理能力来确定，通常建议每个分区的大小不要超过1GB。

02. Kafka 为什么需要分区？

我们在使用 Apache Kafka 生产和消费消息的时候，肯定是希望能够将数据均匀地分配到所有服务器上。比如很多公司使用 Kafka 收集应用服务器的日志数据，这种数据都是很多的，特别是对于那种大批量机器组成的集群环境，每分钟产生的日志量都能以 GB 数，因此如何将这么大的数据量均匀地分配到 Kafka 的各个 Broker 上，就成为一个非常重要的问题。

Kafka 之所以要分区，是为了实现数据的分布和负载均衡。

在 Kafka 中，一个 Topic 可以被分成多个 Partition，每个 Partition 可以被存储在不同的 Broker 上。当你向一个 Topic 发送消息时，Kafka 会根据消息的 Key 计算出该消息应该被存储在哪个 Partition 上。如果该 Partition 存在多个副本，Kafka 会将消息复制到所有副本中。

通过将一个 Topic 分成多个 Partition，Kafka 可以将数据分布到多个 Broker 上，从而实现数据的分布和负载均衡。如果一个 Topic 只有一个 Partition，那么所有的消息都会被存储在同一个 Broker 上，这会导致该 Broker 的负载过高，而其他 Broker 的资源却没有得到充分利用。

另外，通过将一个 Topic 分成多个 Partition，Kafka 还可以实现消息的并发处理。每个 Partition 都可以被多个消费者组中的消费者并发地消费，从而提高消息的处理速度。

需要注意的是，Partition 的数量和副本数需要根据实际情况进行设置。如果 Partition 的数量过少，会导致数据无法充分分布到多个 Broker 上，从而影响负载均衡和并发处理的效果。如果 Partition 的数量过多，会导致 Kafka 集群的管理和维护变得复杂，从而影响系统的可靠性和稳定性。

03. Kafka 分区有什么作用？

Kafka 分区的作用主要有以下几个方面：

① 提高并发性能：多个消费者可以同时消费同一个主题的不同分区，从而提高消费的并发性能。
② 实现负载均衡：将一个主题分成多个分区后，可以将不同的分区分配到不同的 Kafka 节点上，从而实现负载均衡。
③ 提高可靠性：将一个主题分成多个分区后，即使某个分区出现故障，其他分区仍然可以正常工作，从而提高可靠性。

03. Kafka 为什么使用分区的概念而不是直接使用多个主题呢？

Kafka 有主题（Topic）的概念，它是承载真实数据的逻辑容器，而在主题之下还分为若干个分区，也就是说Kafka 的消息组织方式实际上是三级结构：主题 - 分区 - 消息。主题下的每条消息只会保存在某一个分区中，而不会在多个分区中被保存多份，如下所示：

分区的作用就是提供负载均衡的能力，或者说对数据进行分区的主要原因，就是为了实现系统的高伸缩性。不同的分区能够被放置到不同节点的机器上，而数据的读写操作也都是针对分区这个粒度而进行的，这样每个节点的机器都能独立地执行各自分区的读写请求处理。并且，我们还可以通过添加新的节点机器来增加整体系统的吞吐量。

除了提供负载均衡这种最核心的功能之外，利用分区也可以实现其他一些业务级别的需求，比如实现业务级别的消息顺序的问题。

① 使用分区可以将一个主题分成多个部分，每个部分可以在不同的服务器上进行存储和处理。这样可以更好地利用集群中的资源，提高处理能力和吞吐量。而如果直接使用多个主题，每个主题都需要独立地进行管理和维护，会增加系统的复杂度和管理成本。

② 使用分区可以提供更好的消息顺序保证。在一个分区内，消息的顺序是有序的，而在不同分区之间，消息的顺序是不确定的。这样可以更好地保证消息的顺序性，避免消息乱序的情况发生。

③ 使用分区可以提供更好的容错性。如果一个分区出现故障，只会影响该分区内的消息，而不会影响整个主题。这样可以更好地保证系统的可用性和稳定性。

因此，Kafka 使用分区的概念而不是直接使用多个主题，是为了提供更好的可扩展性、性能、消息顺序保证和容错性。

04. Kafka 分区的数量有什么限制？

Kafka 分区的数量没有明确的限制，但是分区数量过多会影响 Kafka 的性能。一般来说，建议将分区数量控制在几百到几千个之间。

05. Kafka 分区的副本有什么作用？

Kafka 分区的副本可以提高数据的可靠性。每个分区可以有多个副本，当某个副本出现故障时，其他副本可以继续工作，从而保证数据的可靠性。

06. Kafka 分区的消息是如何分配到不同的分区中的？

Kafka 分区的消息是根据消息的 key 进行哈希计算后分配到不同的分区中的。如果消息没有 key，那么 Kafka 会使用轮询的方式将消息分配到不同的分区中。

07. Kafka 分区可以增加或者减少吗？

在 Kafka 中，分区的数量是在创建 Topic 时指定的，一旦创建后就不能直接增加或减少分区的数量。这是因为 Kafka 的分区机制是基于一致性哈希算法实现的，如果直接增加或减少分区的数量，会导致哈希算法重新计算，从而影响已经存储的消息的分区和副本的分配。

如果需要增加或减少分区的数量，需要进行以下步骤：

① 创建一个新的 Topic，分配新的分区数量。

② 将原来的 Topic 中的消息重新发送到新的 Topic 中。

③ 停止消费者消费原来的 Topic，开始消费新的 Topic。

需要注意的是，将消息从原来的 Topic 中重新发送到新的 Topic 中可能会导致消息的顺序发生变化，因此需要在应用程序中进行相应的处理。

另外，增加或减少分区的数量也会影响 Kafka 集群的负载均衡和性能。如果分区的数量过多，会导致 Kafka 集群的管理和维护变得复杂，从而影响系统的可靠性和稳定性。如果分区的数量过少，会导致数据无法充分分布到多个 Broker 上，从而影响负载均衡和并发处理的效果。因此，在创建 Topic 时需要根据实际情况进行分区数量的设置，避免频繁地增加或减少分区的数量。

08. Kafka 的分区数大于服务器台数时如何分配存储副本？

如果 kafka 服务器只有 3 个节点，那么设置 kafka 的分区数大于服务器台数，在 kafka底层如何分配存储副本：

[root@localhost kafka-01]# bin/kafka-topics.sh --zookeeper localhost:2182 --create --partitions 9 --replication-factor 3  --topic test2
Created topic test2.
[root@localhost kafka-01]# bin/kafka-topics.sh --zookeeper localhost:2182 --describe --topic test2
Topic:test2     PartitionCount:9        ReplicationFactor:3     Configs:
Topic: test2    Partition: 0    Leader: 1       Replicas: 1,0,2 Isr: 1,0,2
Topic: test2    Partition: 1    Leader: 2       Replicas: 2,1,0 Isr: 2,1,0
Topic: test2    Partition: 2    Leader: 0       Replicas: 0,2,1 Isr: 0,2,1
Topic: test2    Partition: 3    Leader: 1       Replicas: 1,2,0 Isr: 1,2,0
Topic: test2    Partition: 4    Leader: 2       Replicas: 2,0,1 Isr: 2,0,1
Topic: test2    Partition: 5    Leader: 0       Replicas: 0,1,2 Isr: 0,1,2
Topic: test2    Partition: 6    Leader: 1       Replicas: 1,0,2 Isr: 1,0,2
Topic: test2    Partition: 7    Leader: 2       Replicas: 2,1,0 Isr: 2,1,0
Topic: test2    Partition: 8    Leader: 0       Replicas: 0,2,1 Isr: 0,2,1

这样是为了leader和follower均匀的分配在每个服务器上，尽量不让每个分区的leader和follower都分配在某几个服务器上，比如只分配在broker0、broker1上，那么这2个服务器挂掉后，数据就丢失了，这样分配的好处是除非3个服务器都挂掉，不然就还可以从broker2同步数据。

在 Kafka 中，如果设置的分区数大于服务器节点数，Kafka 会将多个 Partition 存储在同一个 Broker 上，从而实现多个 Partition 共享同一个 Broker 的存储空间。在这种情况下，Kafka 会将每个 Partition 的副本分配到不同的 Broker 上，以保证数据的可靠性和容错性。

具体来说，Kafka 会使用一致性哈希算法来计算每个 Partition 的副本应该存储在哪个 Broker 上。一致性哈希算法会将每个 Broker 和 Partition 映射到一个哈希环上，然后根据哈希值来确定每个 Partition 的副本应该存储在哪个 Broker 上。如果某个 Broker 宕机，Kafka 会自动将该 Broker 上的 Partition 副本迁移到其他 Broker 上，以保证数据的可靠性和容错性。

需要注意的是，如果设置的分区数过多，会导致 Kafka 集群的管理和维护变得复杂，从而影响系统的可靠性和稳定性。因此，在设置分区数时需要根据实际情况进行权衡，避免设置过多的分区数。

09. Kafka 创建Topic时如何将分区设置到不同的broker中？

在 Kafka 中，一个 Topic 可以被分成多个 Partition，每个 Partition 可以被存储在不同的 Broker 上。在创建 Topic 时，你可以指定 Partition 的数量和副本数，但是不能直接指定 Partition 存储在哪个 Broker 上。

Kafka 使用 Partition 的方式来实现数据的分布和负载均衡。当你向一个 Topic 发送消息时，Kafka 会根据消息的 Key 计算出该消息应该被存储在哪个 Partition 上。如果该 Partition 存在多个副本，Kafka 会将消息复制到所有副本中。

10. Kafka 为什么需要手动调整分区的副本分配？

Kafka是一个分布式的消息队列系统，它的分区副本机制是保证数据可靠性和高可用性的重要手段之一。在Kafka中，每个分区都有多个副本，其中一个副本作为leader，负责处理读写请求，其他副本作为follower，负责从leader同步数据。当leader副本出现故障时，Kafka会自动将其中一个follower副本提升为新的leader，以保证服务的可用性。

然而，由于Kafka集群的规模和复杂性，有时候需要手动调整分区副本的分配情况，以优化集群的性能和可靠性。例如：

① 副本分配不均衡：如果某些分区的副本分配不均衡，可能会导致某些broker的负载过重，影响整个集群的性能。此时需要手动调整副本分配，使得每个broker的负载均衡。

② 副本同步延迟：如果某些follower副本同步leader副本的延迟过高，可能会导致数据不一致，影响数据可靠性。此时需要手动调整副本分配，将follower副本分配到延迟较低的broker上。

③ 副本故障：如果某些副本出现故障，需要手动将其替换为新的副本，以保证数据可靠性和高可用性。

因此，手动调整分区副本是Kafka集群管理中的重要工作之一，需要根据实际情况进行调整，以保证集群的性能和可靠性。

11. Kafka 如何手动的调整分区的副本分配？

在生产环境中，每台服务器的配置和性能不一致，但是Kafka只会根据自己的代码规则创建对应的分区副本，就会导致个别服务器存储压力较大，所以需要手动调整分区副本的存储。可以通过手动调整分区的副本来实现数据的容错和可靠性。具体来说，可以将一个分区的副本从一个 Broker 迁移到另一个 Broker，以保证数据的可靠性和容错性。

kafka-reassign-partitions工具可以通过重新分配分区副本来实现负载均衡和副本同步延迟的调整。

① 创建一个新的 topic，3个分区，2个副本，并查看副本存储情况

[root@localhost kafka-01]# bin/kafka-topics.sh --zookeeper localhost:2183 --create --partitions 3 --replication-factor 2  --topic test3
Created topic test3.

[root@master01 kafka01]# bin/kafka-topics.sh --zookeeper localhost:2183 --describe --topic test3
Topic:test3     PartitionCount:3        ReplicationFactor:2     Configs:
Topic: test3    Partition: 0    Leader: 1       Replicas: 1,0   Isr: 1,0
Topic: test3    Partition: 1    Leader: 2       Replicas: 2,1   Isr: 2,1
Topic: test3    Partition: 2    Leader: 0       Replicas: 0,2   Isr: 0,2

② 创建副本存储计划（所有副本都指定存储在 broker0、broker1 中）

[root@hadoop101 kafka_2.12-2.2.1]# vi increase-replication-factor.json
{
    "version":1,
    "partitions":[{"topic":"test3","partition":0,"replicas":[0,1]},
                  {"topic":"test3","partition":1,"replicas":[0,1]},
                  {"topic":"test3","partition":2,"replicas":[1,0]}]
}

③ 执行以下命令，执行副本存储计划，将JSON文件作为参数传入：

[root@master01 kafka01]# bin/kafka-reassign-partitions.sh --zookeeper localhost:2183 --reassignment-json-file increase-replication-factor.json --execute
Current partition replica assignment

{"version":1,"partitions":[{"topic":"test3","partition":2,"replicas":[0,2],"log_dirs":["any","any"]},{"topic":"test3","partition":1,"replicas":[2,1],"log_dirs":["any","any"]},{"topic":"test3","partition":0,"replicas":[1,0],"log_dirs":["any","any"]}]}

Save this to use as the --reassignment-json-file option during rollback
Successfully started reassignment of partitions.

④ 等待重新分配完成后，执行以下命令，验证分区副本是否已经重新分配成功：

[root@master01 kafka01]# bin/kafka-reassign-partitions.sh --zookeeper localhost:2183 --reassignment-json-file increase-replication-factor.json --verify
Status of partition reassignment:
Reassignment of partition test3-0 completed successfully
Reassignment of partition test3-1 completed successfully
Reassignment of partition test3-2 completed successfully

⑤ 查看分区副本存储情况，可以看到所有副本都指定存储在 broker0、broker1 中了

[root@master01 kafka01]# bin/kafka-topics.sh --zookeeper localhost:2183 --describe --topic test3
Topic:test3     PartitionCount:3        ReplicationFactor:2     Configs:
Topic: test3    Partition: 0    Leader: 0       Replicas: 0,1   Isr: 1,0
Topic: test3    Partition: 1    Leader: 0       Replicas: 0,1   Isr: 1,0
Topic: test3    Partition: 2    Leader: 1       Replicas: 1,0   Isr: 0,1

12. kafka 如何手动增加分区的副本数量？

① 创建一个主题，分区数量为3，副本数量为1，并查看主题的分区副本数：

[root@master01 kafka01]# bin/kafka-topics.sh --zookeeper localhost:2183 --create --partitions 3 --replication-factor 1 --topic test4
Created topic test4.

[root@master01 kafka01]# bin/kafka-topics.sh --zookeeper localhost:2183 --describe --topic test4
Topic:test4     PartitionCount:3        ReplicationFactor:1     Configs:
Topic: test4    Partition: 0    Leader: 0       Replicas: 0     Isr: 0
Topic: test4    Partition: 1    Leader: 1       Replicas: 1     Isr: 1
Topic: test4    Partition: 2    Leader: 2       Replicas: 2     Isr: 2

② 创建副本存储计划，用于指定新的副本分配方案，每个分区增加2个副本，分别存储在 broker0、broker1、broker2 中：

[root@master01 kafka01]# vi increase-replication-factor.json
{
    "version":1,
    "partitions":[{"topic":"test4","partition":0,"replicas":[0,1,2]},
                  {"topic":"test4","partition":1,"replicas":[0,1,2]},
                  {"topic":"test4","partition":2,"replicas":[0,1,2]}]
}

③ 执行副本存储计划：

[root@master01 kafka01]# bin/kafka-reassign-partitions.sh --zookeeper localhost:2183 --reassignment-json-file increase-replication-factor.json --execute
Current partition replica assignment

{"version":1,"partitions":[{"topic":"test4","partition":2,"replicas":[2],"log_dirs":["any"]},{"topic":"test4","partition":1,"replicas":[1],"log_dirs":["any"]},{"topic":"test4","partition":0,"replicas":[0],"log_dirs":["any"]}]}

Save this to use as the --reassignment-json-file option during rollback
Successfully started reassignment of partitions.

④ 验证副本存储计划：

[root@master01 kafka01]# bin/kafka-reassign-partitions.sh --zookeeper localhost:2183 --reassignment-json-file increase-replication-factor.json --verify
Status of partition reassignment:
Reassignment of partition test4-0 completed successfully
Reassignment of partition test4-1 completed successfully
Reassignment of partition test4-2 completed successfully

⑤ 当所有分区的副本重分配完成后，就成功地手动增加了 Kafka 主题的副本数量，查看副本和分区：

[root@master01 kafka01]# bin/kafka-topics.sh --zookeeper localhost:2183 --describe --topic test4
Topic:test4     PartitionCount:3        ReplicationFactor:3     Configs:
Topic: test4    Partition: 0    Leader: 0       Replicas: 0,1,2 Isr: 0,2,1
Topic: test4    Partition: 1    Leader: 1       Replicas: 0,1,2 Isr: 1,2,0
Topic: test4    Partition: 2    Leader: 2       Replicas: 0,1,2 Isr: 2,0,1

13. Kafka 为什么需要手动增加分区的副本数量？

Kafka 是一个分布式的消息系统，它的设计目标是高可用性和高吞吐量。为了实现这个目标，Kafka 采用了副本机制来保证数据的可靠性和容错性。每个分区都可以配置多个副本，每个副本都保存了完整的分区数据，其中一个副本被指定为 leader，负责处理读写请求，其他副本则作为 follower，负责复制 leader 的数据。

手动增加副本是为了增加系统的可用性和容错性。当某个副本出现故障时，Kafka 会自动将其替换为其他副本，但是如果副本数不足，就无法保证数据的可靠性和容错性。因此，手动增加副本可以提高系统的可用性和容错性，减少数据丢失的风险。

此外，手动增加副本还可以提高系统的读取性能。由于每个副本都可以处理读请求，增加副本可以提高读取请求的并发处理能力，从而提高系统的读取性能。

14. Kafka 分区负载均衡如何实现？

Kafka是一个分布式消息系统，它将消息分成多个分区并将其存储在多个Broker上。每个分区都有一个Leader和多个Follower副本。Leader负责处理读写请求，而Follower只是简单地复制Leader的数据。

分区负载平衡是指在Kafka集群中，将分区均匀地分配给不同的Broker，以确保每个Broker的负载均衡。这可以通过使用Kafka的自动分区分配机制来实现。当新的Broker加入集群或现有的Broker离开集群时，Kafka会自动重新分配分区以保持负载平衡。此外，Kafka还提供了手动分区分配机制，允许管理员手动指定分区分配方案。

15. Kafka Leader分区负载平衡如何实现？

正常情况下，Kafka本身会自动把 Leader 分区均匀分散在各个机器上，来保证每台机器的读写吞吐量都是均匀的。但是如果某些broker宕机，会导致Leader 分区过于集中在其他少部分几台broker上，这会导致少数几台broker的读写请求压力过高，其他宕机的broker重启之后都是follower 分区，读写请求很低，造成集群负载不均衡。

① auto.leader.rebalance.enable，默认是true：用于控制是否启用自动的 leader rebalance（分区 leader 的重新分配）功能。

当该参数设置为 true 时，Kafka 会自动检测 broker 的变化（例如 broker 的上线、下线、宕机等），并尝试重新分配分区的 leader，以保证集群的负载均衡和高可用性。

当该参数设置为 false 时，Kafka 将不会自动进行 leader rebalance，而是需要手动进行操作。

② leader.imbalance.per.broker.percentage，默认是10%：用于控制每个 Broker 上的分区领导者数量的平衡程度。具体来说，它表示每个 Broker 上领导者分区数量的最大偏差百分比。

例如，如果设置 leader.imbalance.per.broker.percentage 为 10，则表示每个 Broker 上领导者分区数量的最大偏差百分比为 10%。如果某个 Broker 上的领导者分区数量超过了平均值的 10%，则该 Broker 将不再接受新的领导者分区，直到其他 Broker 上的领导者分区数量增加，使得整个集群的领导者分区数量平衡。

通过调整 leader.imbalance.per.broker.percentage 参数，可以控制集群中分区领导者的分布情况，从而提高集群的可用性和性能。但是，如果设置过小，可能会导致某些 Broker 上的领导者分区数量过多，从而影响整个集群的稳定性。

③ leader.imbalance.check.interval.seconds，默认值300秒：用于控制Kafka集群中leader分区的负载均衡检查的时间间隔。

它表示每隔多少秒，Kafka就会检查集群中所有分区的leader副本的负载情况，如果发现某个broker上的leader分区负载过重，就会尝试将其迁移到负载较轻的broker上，以实现更好的负载均衡。

需要注意的是，leader.imbalance.check.interval.seconds的值越小，Kafka集群的负载均衡就会越频繁地进行检查和调整，但同时也会增加集群的负担。因此，在设置这个参数时需要根据实际情况进行权衡和调整。

16. Kafka 集群如何选择合适的Topic/Partition数量？

为Kafka集群选择合适的Topic/Partition数量需要考虑多个因素，包括：

① 数据量：如果数据量较大，可以增加Partition数量以提高并行处理能力。

② 消费者数量：如果有多个消费者，可以增加Partition数量以提高并行消费能力。

③ 硬件资源：如果硬件资源充足，可以增加Partition数量以提高集群的吞吐量。

④ 数据保留时间：如果数据保留时间较长，可以增加Partition数量以分散数据存储的压力。

⑤ 数据处理方式：如果数据需要按照某种方式进行处理，可以根据处理方式将数据分配到不同的Partition中。

一般来说，建议将Partition数量设置为集群中Broker数量的2-3倍，这样可以充分利用集群的资源，同时保证数据的高可用性。但具体的数量还需要根据实际情况进行调整。

17. Kafka 分区数量是否越多越好呢？

显然不是，因为每个分区都有自己的开销：

一、客户端/服务器端需要使用的内存就越多

Kafka0.8.2之后，在客户端producer有个参数batch.size，默认是16KB。它会为每个分区缓存消息，一旦满了就打包将消息批量发出。看上去这是个能够提升性能的设计。不过很显然，因为这个参数是分区级别的，如果分区数越多，这部分缓存所需的内存占用也会更多。假设你有10000个分区，按照默认设置，这部分缓存需要占用约157MB的内存。而consumer端呢？我们抛开获取数据所需的内存不说，只说线程的开销。如果还是假设有10000个分区，同时consumer线程数要匹配分区数(大部分情况下是最佳的消费吞吐量配置)的话，那么在consumer client就要创建10000个线程，也需要创建大约10000个Socket去获取分区数据。这里面的线程切换的开销本身已经不容小觑了。

服务器端的开销也不小，如果阅读Kafka源码的话可以发现，服务器端的很多组件都在内存中维护了分区级别的缓存，比如controller，FetcherManager等，因此分区数越多，这种缓存的成本就越大。

二、文件句柄的开销

每个分区在底层文件系统都有属于自己的一个目录。该目录下通常会有两个文件：base_offset.log和base_offset.index。Kafak的controller和ReplicaManager会为每个broker都保存这两个文件句柄(file handler)。很明显，如果分区数越多，所需要保持打开状态的文件句柄数也就越多，最终可能会突破你的ulimit -n的限制。

三、降低高可用性

Kafka通过副本(replica)机制来保证高可用。具体做法就是为每个分区保存若干个副本(replica_factor指定副本数)。每个副本保存在不同的broker上。其中的一个副本充当leader 副本，负责处理producer和consumer请求。其他副本充当follower角色，由Kafka controller负责保证与leader的同步。如果leader所在的broker挂掉了，contorller会检测到然后在zookeeper的帮助下重选出新的leader——这中间会有短暂的不可用时间窗口，虽然大部分情况下可能只是几毫秒级别。但如果你有10000个分区，10个broker，也就是说平均每个broker上有1000个分区。此时这个broker挂掉了，那么zookeeper和controller需要立即对这1000个分区进行leader选举。比起很少的分区leader选举而言，这必然要花更长的时间，并且通常不是线性累加的。如果这个broker还同时是controller情况就更糟了。

18. Kafka 如何确定分区数量？

可以遵循一定的步骤来尝试确定分区数：创建一个只有1个分区的topic，然后测试这个topic的producer吞吐量和consumer吞吐量。假设它们的值分别是Tp和Tc，单位可以是MB/s。然后假设总的目标吞吐量是Tt，那么分区数 = Tt / max(Tp, Tc)

说明：Tp表示producer的吞吐量。测试producer通常是很容易的，因为它的逻辑非常简单，就是直接发送消息到Kafka就好了。Tc表示consumer的吞吐量。测试Tc通常与应用的关系更大，因为Tc的值取决于你拿到消息之后执行什么操作，因此Tc的测试通常也要麻烦一些。

19. Kafka 如何保证顺序的消费主题中的消息？

Kafka 通过分区（Partition）和偏移量（Offset）来保证顺序消费主题中的消息。

在 Kafka 中，每个主题可以被分成多个分区，每个分区都是一个有序的消息队列。消费者可以订阅一个或多个分区，并从每个分区的起始位置开始消费消息。消费者可以通过指定偏移量来控制从哪个位置开始消费消息，这个偏移量可以是任意位置，不一定是分区的起始位置。

当一个消费者订阅了一个分区后，它会不断地从分区中拉取消息，直到消费者关闭或者分区被删除。消费者可以通过轮询的方式来拉取消息，每次拉取一批消息，然后处理这些消息。消费者处理完一批消息后，可以提交这批消息的偏移量，表示这批消息已经被消费了。Kafka 会记录每个消费者在每个分区上消费的偏移量，以便下次消费者继续从上次消费的位置开始消费。

通过分区和偏移量的机制，Kafka 可以保证同一个分区内的消息是有序的，而不同分区之间的消息则可能是无序的。如果一个主题只有一个分区，那么消费者就可以保证按照消息的顺序消费这个主题中的所有消息。

20. Kafka 如何保证顺序的消费分区中的消息？

Kafka 通过分区（partition）和消费者组（consumer group）来保证顺序消费分区中的消息。

首先，Kafka 将一个主题分成多个分区，每个分区内的消息是有序的。消费者可以订阅一个或多个分区，每个消费者只能消费一个分区内的消息。这样，每个分区内的消息顺序就得到了保证。

其次，Kafka 允许多个消费者组同时消费同一个主题。每个消费者组内的消费者可以消费不同的分区，但同一个分区只能被同一个消费者组内的一个消费者消费。这样，同一个分区内的消息顺序也得到了保证。

因此，如果要保证顺序消费分区中的消息，需要满足以下两个条件：

每个分区内的消息是有序的。
同一个分区只能被同一个消费者组内的一个消费者消费。

需要注意的是，如果消费者组内的消费者数量大于分区数量，就会出现一些消费者无法消费到消息的情况。此时，可以通过增加分区数量或减少消费者数量来解决。

21. Kafka 自动分区分配机制是什么？

Kafka的自动分区分配机制是指在Kafka集群中新增或删除broker时，Kafka会自动重新分配分区以保证负载均衡和高可用性。具体来说，Kafka的自动分区分配机制包括以下几个步骤：

① 计算每个broker的分区数：Kafka会统计每个broker当前拥有的分区数，并计算出每个broker应该拥有的分区数，以保证负载均衡。

② 计算每个消费者组的消费者数：Kafka会统计每个消费者组中的消费者数，并计算出每个消费者应该消费的分区数，以保证消费者之间的负载均衡。

③ 分配分区：Kafka会根据每个broker的分区数和每个消费者组的消费者数，计算出每个消费者应该消费的分区，并将分区分配给对应的消费者。

④ 重新分配分区：当新增或删除broker时，Kafka会重新计算每个broker的分区数，并重新分配分区，以保证负载均衡和高可用性。

需要注意的是，Kafka的自动分区分配机制是基于消费者组的，因此同一个消费者组中的消费者会共同消费分配给该消费者组的分区。如果需要实现多个消费者组消费同一个主题的分区，可以使用Kafka的多消费者组机制。

22. Kafka 自动分区分配机制如何开启？

Kafka的自动分区分配机制是默认开启的，但是在某些情况下可能会被禁用。如果需要开启自动分区分配机制，可以按照以下步骤进行操作：

① 确认partition.assignment.strategy参数设置为 org.apache.kafka.clients.consumer.RangeAssignor，这是默认的分区分配策略。

② 确认auto.partition.assignment参数设置为true，这是默认的自动分区分配开关。

③ 如果使用自定义的分区分配策略，需要确保该策略实现了org.apache.kafka.clients.consumer.ConsumerPartitionAssignor接口，并在partition.assignment.strategy参数中指定该策略的类名。

④ 如果需要手动分配分区，可以将auto.partition.assignment参数设置为false，然后在消费者启动后调用assign()方法手动分配分区。

需要注意的是，如果消费者组中新增或删除了消费者，或者主题的分区数发生了变化，Kafka会自动触发分区重新分配。

你可能感兴趣的:(【分布式-消息队列Kafka】,分布式,kafka)

消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
Kafka 消息丢失如何处理？架构文摘JGWZ 学习
今天给大家分享一个在面试中经常遇到的问题：Kafka消息丢失该如何处理？这个问题啊，看似简单，其实里面藏着很多“套路”。来，咱们先讲一个面试的“真实”案例。面试官问：“Kafka消息丢失如何处理？”小明一听，反问：“你是怎么发现消息丢失了？”面试官顿时一愣，沉默了片刻后，可能有点不耐烦，说道：“这个你不用管，反正现在发现消息丢失了，你就说如何处理。”小明一头雾水：“问题是都不知道怎么丢的，处理起来
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
【六】阿伟开始搭建Kafka学习环境能源恒观中间件学习 kafka spring
阿伟开始搭建Kafka学习环境概述上一篇文章阿伟学习了Kafka的核心概念，并且把市面上流行的消息中间件特性进行了梳理和对比，方便大家在学习过程中进行对比学习，最后梳理了一些Kafka使用中经常遇到的Kafka难题以及解决思路，经过上一篇的学习我相信大家对Kafka有了初步的认识，本篇将继续学习Kafka。一、安装和配置学习一项技术首先要搭建一套服务，而Kafka的运行主要需要部署jdk、zook
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
Kafka是如何保证数据的安全性、可靠性和分区的喜欢猪猪 kafka 分布式
Kafka作为一个高性能、可扩展的分布式流处理平台，通过多种机制来确保数据的安全性、可靠性和分区的有效管理。以下是关于Kafka如何保证数据安全性、可靠性和分区的详细解析：一、数据安全性SSL/TLS加密：Kafka支持SSL/TLS协议，通过配置SSL证书和密钥来加密数据传输，确保数据在传输过程中不会被窃取或篡改。这一机制有效防止了中间人攻击，保护了数据的安全性。SASL认证：Kafka支持多种
esp32开发快速入门 8 : MQTT 的快速入门，基于esp32实现MQTT通信 z755924843 ESP32开发快速入门服务器网络运维
MQTT介绍简介MQTT（MessageQueuingTelemetryTransport，消息队列遥测传输协议），是一种基于发布/订阅（publish/subscribe）模式的"轻量级"通讯协议，该协议构建于TCP/IP协议上，由IBM在1999年发布。MQTT最大优点在于，可以以极少的代码和有限的带宽，为连接远程设备提供实时可靠的消息服务。作为一种低开销、低带宽占用的即时通讯协议，使其在物联
06选课支付模块之基于消息队列发送支付通知消息 echo 云清学成在线 java rabbitmq 消息队列支付通知学成在线
消息队列发送支付通知消息需求分析订单服务作为通用服务，在订单支付成功后需要将支付结果异步通知给其他对接的微服务，微服务收到支付结果根据订单的类型去更新自己的业务数据技术方案使用消息队列进行异步通知需要保证消息的可靠性即生产端将消息成功通知到服务端：消息发送到交换机-->由交换机发送到队列-->消费者监听队列，收到消息进行处理，参考文章02-使用Docker安装RabbitMQ-CSDN博客生产者确
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
华为云分布式缓存服务DCS 8月新特性发布华为云PaaS服务小智华为云分布式缓存
分布式缓存服务（DistributedCacheService，简称DCS）是华为云提供的一款兼容Redis的高速内存数据处理引擎，为您提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力，满足用户高并发及数据快速访问的业务诉求。此次为大家带来DCS8月的特性更新内容，一起来看看吧！
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
KVM+GFS分布式存储系统构建KVM高可用 henan程序媛分布式 GFS 高可用 KVM
一、案列分析1.1案列概述本章案例主要使用之前章节所学的KVM及GlusterFs技术,结合起来从而实现KVM高可用。利用GlusterFs分布式复制卷，对KVM虚拟机文件进行分布存储和冗余。分布式复制卷主要用于需要冗余的情况下把一个文件存放在两个或两个以上的节点,当其中一个节点数据丢失或者损坏之后，KVM仍然能够通过卷组找到另一节点上存储的虚拟机文件，以保证虚拟机正常运行。当节点修复之后，Glu
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
大模型训练数据库Common Crawl WindyChanChan 数据集语言模型数据库
CommonCrawl介绍‌‌CommonCrawl是一个非营利组织，致力于通过大规模分布式爬虫系统定期抓取整个Web并将其存储在一个可公开访问的数据库中。CommonCrawl的数据收集和处理过程包括使用Python开源爬虫工具收集全球范围内的网站数据，并将其上传到‌CommonCrawl基金会的数据仓库中。该项目从2008年开始，至今已经积累了大量的原始网页数据、元数据和文本提取数据。这些数据
慢速连接攻击是什么？慢速连接攻击怎么防护？快快小毛毛网络 ddos 服务器
慢速连接攻击（SlowConnectionAttack），又称慢速攻击（SlowlorisAttack），是一种网络攻击技术，旨在通过占用服务器上的所有可用连接资源来使其无法响应正常请求。与传统的拒绝服务（DoS）和分布式拒绝服务（DDoS）攻击不同，慢速攻击并不依赖于发送大量数据包来消耗带宽，而是利用HTTP、TCP或SSL等协议的特性，通过发送大量不完整的请求或缓慢发送数据来占用服务器资源，使
分布式锁和spring事务管理暴躁的鱼锁及事务分布式 spring java
最近开发一个小程序遇到一个需求需要实现分布式事务管理业务需求用户在使用小程序的过程中可以查看景点，对景点地区或者城市标记是否想去，那么需要统计一个地点被标记的人数，以及记录某个用户对某个地点是否标记为想去，用两个表存储数据，一个地点表记录改地点被标记的次数，一个用户意向表记录某个用户对某个地点是否标记为想去。由于可能有多个用户同时标记一个地点，每个用户在前端点击想去按钮之后，后台接收到请求，从数据
Gobelieve 架构 weixin_34099526 数据库 golang json
Gobelievegithub地址声明:转简书JackieF的文章,为了自己方便copy了一份,加一些自己的东西.链接：https://www.jianshu.com/p/8121d6e85282IMCore主要分三大块:im客户连接服务器（可分布式部署，暂无负载均衡模块)imr路由查询服务器（主要解决im分布式部署的问题）ims存储服务器(主从部署)基础模块1.数据包协议包：header(12)
Kafka详细解析与应用分析芊言芊语 kafka 分布式
Kafka是一个开源的分布式事件流平台（EventStreamingPlatform），由LinkedIn公司最初采用Scala语言开发，并基于ZooKeeper协调管理。如今，Kafka已经被Apache基金会纳入其项目体系，广泛应用于大数据实时处理领域。Kafka凭借其高吞吐量、持久化、分布式和可靠性的特点，成为构建实时流数据管道和流处理应用程序的重要工具。Kafka架构Kafka的架构主要由
linux挂载文件夹小码快撩 linux
1.使用NFS（NetworkFileSystem）NFS是一种分布式文件系统协议，允许一个系统将其文件系统的一部分共享给其他系统。检查是否安装NFSrpm-qa|grepnfs2.启动和启用NFS服务假设服务名称为nfs-server.service，你可以使用以下命令启动和启用它：sudosystemctlstartnfs-server.servicesudosystemctlenablenf
Kafka 基础与架构理解 StaticKing KAFKA kafka
目录前言Kafka基础概念消息队列简介：Kafka与传统消息队列（如RabbitMQ、ActiveMQ）的对比Kafka的组件Kafka的工作原理：消息的生产、分发、消费流程Kafka系统架构Kafka的分布式架构设计Leader-Follower机制与数据复制Log-basedStorage和持久化Broker间通信协议Zookeeper在Kafka中的角色总结前言Kafka是一个分布式的消息系
Rides实现分布式锁，保障数据一致性,Redisson分布式事务处理朱杰jjj 缓存分布式
分布式环境下分布式锁有三种方式：基于数据库分布式锁基于Redis分布式锁基于zk分布式锁本帖只介绍Redis分布式锁为什么需要用到分布式锁？在单机环境下一个服务中多个线程对同一个事物或数据资源进行操作时，可以通过添加加锁方式（synchronized和lock）来解决数据一致性的问题。但是如果出现多个服务的情况下，这时候我们在通过synchronized和lock的方式来加锁会出现问题，因为多个服
机电综合管理系统架构小熊coder 机载系统系统架构
文章目录一、机电综合管理系统架构1.系统概述2.架构层次3.核心组件二、余度管理1.余度概述2.硬件冗余3.软件冗余4.通信冗余三、总线架构1.MIL-STD-1553B总线2.ARINC429总线3.ARINC629总线4.AFDX/ARINC664总线四、未来发展趋势1.分布式架构2.高速网络3.智能化与自动化结语机电综合管理系统（ElectromechanicalManagementSyst
华为云分布式缓存服务DCS与开源服务差异对比 hcinfo_18 redis使用华为云 Redis5.0 分布式缓存服务 Redis客户端
分布式缓存服务DCS提供单机、主备、集群等丰富的实例类型，满足用户高读写性能及快速数据访问的业务诉求。支持丰富的实例管理操作，帮助用户省去运维烦恼。用户可以聚焦于业务逻辑本身，而无需过多考虑部署、监控、扩容、安全、故障恢复等方面的问题。DCS基于开源Redis、Memcached向用户提供一定程度定制化的缓存服务，因此，除了拥有开源服务缓存数据库的优秀特性，DCS提供更多实用功能。一、与开源Red
Dubbo架构概览：服务注册与发现、远程调用、监控与管理木南曌 dubbo 架构
Dubbo是一个成熟的、高性能的、基于Java的微服务开发框架，它主要用于解决分布式系统中的服务治理问题，包括服务的注册与发现、远程过程调用（RPC）、服务监控与管理等多个关键环节。以下是Dubbo架构概览的详细介绍：服务注册与发现Dubbo的服务注册与发现机制是其核心功能之一，它依赖于注册中心来管理服务的生命周期和定位服务提供者。1.服务提供者（Provider）服务提供者是实际提供服务的节点，
【仿RabbitMQ消息队列项目day2】使用muduo库中基于protobuf的应用层协议进行通信月夜星辉雪 rabbitmq 网络分布式 c++后端服务器 linux
一.什么是muduo?muduo库是⼀个基于非阻塞IO和事件驱动的C++高并发TCP网络编程库。简单来理解，它就是对原生的TCP套接字的封装，是一个比socket编程接口更好用的编程库。二.使用muduo库完成一个英译汉翻译服务TranslateServer.hpp:#pragmaonce#include#include#include#include#include"muduo/net/TcpC
使用 RabbitMQ 实现秒杀订单系统的异步消息处理 c137范特西 rabbitmq 分布式
使用RabbitMQ实现秒杀订单系统的异步消息处理在秒杀系统中，如何确保高并发环境下的订单处理稳定高效是个很大的挑战。为了解决这个问题，我们通常会引入消息队列，通过异步处理来削峰填谷。这篇文章将详细讲解如何使用RabbitMQ来设计一个秒杀订单系统的异步消息处理流程，重点是如何使用交换机（Exchange）、队列（Queue）、路由键（RoutingKey）以及死信队列（DeadLetterQue
nfs服务搭建 GHope
nfs是什么？基哥度娘网络文件系统(NFS)是sun微系统最初开发的分布式文件系统协议,[1]允许客户端计算机上的用户通过计算机网络访问文件很像本地存储被访问。NFS与许多其他协议一样,在开放网络计算远程过程调用(很久以前RPC)系统上建立。NFS是在请求注释(RFC)中定义的开放标准,允许任何人实现协议。NFSNFS优势：节省本地存储空间，将常用的数据存放在一台NFS服务器上且可以通过网络访问，
hbase介绍 CrazyL- 云计算+大数据 hbase
hbase是一个分布式的、多版本的、面向列的开源数据库hbase利用hadoophdfs作为其文件存储系统，提供高可靠性、高性能、列存储、可伸缩、实时读写、适用于非结构化数据存储的数据库系统hbase利用hadoopmapreduce来处理hbase、中的海量数据hbase利用zookeeper作为分布式系统服务特点：数据量大：一个表可以有上亿行，上百万列（列多时，插入变慢）面向列：面向列（族）的
Flume：大规模日志收集与数据传输的利器傲雪凌霜，松柏长青后端大数据 flume 大数据
Flume：大规模日志收集与数据传输的利器在大数据时代，随着各类应用的不断增长，产生了海量的日志和数据。这些数据不仅对业务的健康监控至关重要，还可以通过深入分析，帮助企业做出更好的决策。那么，如何高效地收集、传输和存储这些海量数据，成为了一项重要的挑战。今天我们将深入探讨ApacheFlume，它是如何帮助我们应对这些挑战的。一、Flume概述ApacheFlume是一个分布式、可靠、可扩展的日志
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS