Lenses-Kafka Monitoring Suite

一、Kafka Cluster Metrics

1. Cluster Health——集群节点层面的统计总览——kafkaAm虽然有部分功能,但是不像这样展示的很清晰,而且这样很cool
123.png
监控项 介绍 实现 kafkaAm是否已实现
Brokers broker数量 -
Active Controllers 活跃的Controller -
Cluster Heartbeat 心跳次数/s 消费者向coordinator发送心跳,以保持自身在组中活动 kafka.network:type=RequestMetrics, name=TotalTimeMs,request=Heartbeat
underreplicated Partitions 正在做复制的partition的数量 -
offline Partitions 不可用的partition数量 -
Preferred Replica Imbalance 不平衡的分区 kafka.controller:type=KafkaController,name =PreferredReplicaImbalanceCount
Unclean Leader Elections Unclean的leader选举数量 kafka.controller:type=ControllerStats, name=UncleanLeaderElectionsPerSec
2. Message and Data Rate——以Topic为维度统计message速率
监控项 介绍 实现 kafkaAm是否已实现
Messages/s Topic的TPS -
Inflow/s Topic的流入速率 -
Outflow/s Topic的流出速率 -
3. Request Rates——KafkaApis消息处理请求耗时每个cluster or broker的信息展示的一目了然
image.png
监控项 介绍 实现 kafkaAm是否已实现
Produce 生产者请求 -
Fetch 取数据请求 kafka.network:type=RequestMetrics, name=TotalTimeMs,request=Fetch
Offsets Offsets kafka.network:type=RequestMetrics, name=TotalTimeMs,request=Offsets
Offset Commit 提交Offsets kafka.network:type=RequestMetrics, name=TotalTimeMs,request=OffsetCommit
Offset Fetch 获取Offsets kafka.network:type=RequestMetrics, name=TotalTimeMs,request=OffsetFetch
Metadata 元数据 kafka.network:type=RequestMetrics, name=TotalTimeMs,request=Metadata
Update Metadata 更新元数据 kafka.network:type=RequestMetrics, name=TotalTimeMs,request=UpdateMetadata
Fetch Consumer 获取消费者 -
Fetch Follower 获取生产者 -
Leader and ISR Leader和ISR数据 -
Find Coordinator 获取控制器 kafka.network:type=RequestMetrics, name=TotalTimeMs,request=FindCoordinator
Describe Groups 获取组信息 ApiKeys.DESCRIBE_GROUPS
4. Network Traffic——每个topic的进出速率正常情况下 流入流出应当是趋于平衡
监控项 介绍 实现 kafkaAm是否已实现
Ingress Rate Topic流入速率 -
Egress Rate Topic流出速率 -
Egress - Ingress Difference 流入流出差异 Egress Rate - Ingress Rate
Lenses-Kafka Monitoring Suite_第1张图片
豆芽图片20180807093846.png
5. Issues——集群存在的问题监控
监控项 介绍 实现 kafkaAm是否已实现
Underreplicated Partition 正在做复制的partition的数量 -
offline Partitions 不可用的partition -
Brokers Balance and Performance
监控项 介绍 实现 kafkaAm是否已实现
Request Handler Idle Ratio 请求处理程序空闲率 kafka.network:type=Processor, name=IdlePercent,networkProcessor=0
Total Time to Process a Request 请求处理总时间 -
Replica Count per Broker 每个broker上副本数量 统计
Leader Replica Count per Broker 每个broker上Leader数量 -
Underreplicated Partition per Broker 每个broker上不同步的分区 统计

二、Consumer Producer Metrics

//TODO:这个我们系统暂时采集不到

三、Hard Disk Usage Metrics——硬盘使用数据

监控项 介绍 实现 kafkaAm是否已实现
Topic Size Topic占用空间 ApiKeys.DESCRIBE_LOG_DIRS
Topic Size including Replication Topic占用空间包含副本 ApiKeys.ALTER_REPLICA_LOG_DIRS
Data Stored per Broker 每个broker数据存储 ApiKeys.DESCRIBE_LOG_DIRS ApiKeys.ALTER_REPLICA_LOG_DIRS
average record size on topic Topic单条数据平均大小 -

四、Client Application Monitoringkafka进程的内存、GC这部分有助于我们分析问题

监控项 介绍 实现 kafkaAm是否已实现
JVM Memory Used 内存占用 MemoryMXBean
GC 垃圾回收时间 GarbageCollectorMXBean
CPU CPU占用 java.lang:type=OperatingSystem:ProcessCpuLoad java.lang:type=OperatingSystem:ProcessCpuTime
Open File Descriptors 打开文件描述符

你可能感兴趣的:(Lenses-Kafka Monitoring Suite)