Prometheus-Metrics

Metrics

Prometheus存在多种不同的监控指标Metrics,在不同的场景下应该要选择不同的Metrics。

1.Counter:只增不减的计数器

Counter类型的指标其工作方式和计数器一样,只增不减(除非系统发生重置)。常见的监控指标,如http_requests_total是Counter类型的监控指标。 一般在定义Counter类型指标的名称时推荐使用==_total==作为后缀。

  • 通过increase函数获取过去五分钟请求数量

    increase(http_requests_total[5m])
      
    
  • counter中函数

     Inc() //指标加一
     Add(float64) //指标加任意非负数
    

2.Gauge:可增可减的仪表盘

与Counter不同,Gauge类型的指标侧重于反应系统的当前状态。因此这类指标的样本数据可增可减。常见指标如:node_memory_MemFree(主机当前空闲的内容大小)、node_memory_MemAvailable(可用内存大小)都是Gauge类型的监控指标。

通过Gauge指标,用户可以直接查看系统的当前状态。

  • gauge中函数

    Dec() //减一
    Inc() //加一
    Add(float64) //指标加任意数 
    Set(float64) //直接设置值
    

3.使用Histogram分析数据分布情况

Histogram和Summary主用用于统计和分析样本的分布情况。

以系统API调用的平均响应时间为例:如果大多数API请求都维持在100ms的响应时间范围内,而个别请求的响应时间需要5s,那么就会导致某些WEB页面的响应时间落到中位数的情况,而这种现象被称为长尾问题。

为了区分是平均的慢还是长尾的慢,最简单的方式就是按照请求延迟的范围进行分组。例如,统计延迟在010ms之间的请求数有多少而1020ms之间的请求数又有多少。通过这种方式可以快速分析系统慢的原因。

  • Histogram中的函数

    Observe() //上报一个指标
    

4.Summary

使用较少

你可能感兴趣的:(监控程序)