061、监控指标之TiKV

资源相关

Grafana监控 TiKV-Details —> Cluster - Store Size / Available Size
061、监控指标之TiKV_第1张图片
Grafana监控 TiKV-Details —> Cluster - Cluster - CPU/Memory/IO Util
061、监控指标之TiKV_第2张图片
Grafana监控 TiKV-Details —> Cluster - MBps/QPS
061、监控指标之TiKV_第3张图片
Grafana监控 TiKV-Details —> Cluster - Region/Leader
region 如果超过5万个,可能会影响与pd的心跳。061、监控指标之TiKV_第4张图片

线程池相关

Grafana监控 TiKV-Details —> Thread CPU - gRPC poll CPU
061、监控指标之TiKV_第5张图片
Grafana监控 TiKV-Details —> Thread CPU - Unified Read pool CPU
读线程的数量
061、监控指标之TiKV_第6张图片
Grafana监控 TiKV-Details —> Thread CPU - Scheduler worker CPU
写线程的数量不要超过: 90% * storage.scheduler_worker_pool_size
061、监控指标之TiKV_第7张图片
Grafana监控 TiKV-Details —> Thread CPU - Raft store CPU
061、监控指标之TiKV_第8张图片
raft线程不要超过: 80% * raftstore.store-pool-size

Grafana监控 TiKV-Details —> Thread CPU - Async apply CPU
061、监控指标之TiKV_第9张图片
apply线程不要超过: 80% * raftstore.apply-pool-size

Error相关

Grafana监控 TiKV-Details —> Errors - Server is Busy
061、监控指标之TiKV_第10张图片

Duration相关

** TiDB写入流程**
061、监控指标之TiKV_第11张图片
Grafana监控 TiKV-Details —> gRPC - 99% gRPC message duration
这个相当于是整体处理图
061、监控指标之TiKV_第12张图片
Grafana监控 TiKV-Details —> KV Request —> KV Request Duration 99 by byte
这个图可以判断KV Rquest 多 ,这图包含网络+TiKV的返回耗时。如果要判断到底是网络还是TiKV处理多。 这个要结合其他图
061、监控指标之TiKV_第13张图片
Grafana监控 TiKV-Details —> Schedule-Commit —> Scheduler command duration
061、监控指标之TiKV_第14张图片
Grafana监控 TiKV-Details —> Schedule-Commit —> Scheduler latch wati duration
latch wati duration: 跟流量相关,可减缓写入速度,相关参数storage.scheduler_pending_write_threshold
061、监控指标之TiKV_第15张图片

Grafana监控 TiKV-Details —> Raft Propose —> Propose wait duration
061、监控指标之TiKV_第16张图片

Grafana监控 TiKV-Details —> Raft IO —> Append log duration
061、监控指标之TiKV_第17张图片

Grafana监控 TiKV-Details —> Raft IO —> Commit log duration
061、监控指标之TiKV_第18张图片

Grafana监控 TiKV-Details —> Raft Propose —> Apply wait duration
061、监控指标之TiKV_第19张图片

Grafana监控 TiKV-Details —> Raft IO —> Apply log duration
061、监控指标之TiKV_第20张图片

你可能感兴趣的:(TiDB从入门到精通,tidb)