PromQL学习 计算集群cpu平均使用率

计算集群cpu平均使用率

通过计算cpu空闲使用率 用1-空闲率 则为cpu使用率

  • node_cpu_seconds 表示机器在非重启情况下开机到现在所使用的时间(s)

  • 由于cpu资源会不断的被机器利用,其中对应了很多模式,包括内核进程、用户进程、io等待、中断等使用模式

  • 可以通过查询node_cpu_seconds 指标来看各种对应的模式

  • cpu空闲对应的模式:model=“idle”:空闲的cpu时间

查询cpu空闲使用率:

  • 使用irate计算时间窗口 [5m] 内 cpu空闲(model=“idle”)的增长率

irate: 内置函数 求时间窗口内指标的增长率 ,它不同于rate的是,它不会造成长尾问题,敏感性更高。

irate(node_cpu_seconds_total{mode="idle"}[5m])

输出tag:instance 并使用avg求每个机器cpu空闲平均值

ava:聚合函数 求平均值

avg by(instance) (irate(node_cpu_seconds_total{mode="idle"}[5m])

查询cpu平均使用率

通过1-cpu空闲率得出每个机器的平均使用率

1 - (avg by(instance) (irate(node_cpu_seconds_total{mode="idle"}[5m])))

查询集群所有机器的cpu平均使用率

avg( 1 - (avg(irate(node_cpu_seconds_total{mode="idle"}[1m])))) 

你可能感兴趣的:(Prometheus)