prometheus+grafana+node_exporter监控

prometheus概述

概述

  • 什么是普罗米修斯?

  • 特征

  • 组件

  • 建筑学

  • 什么时候合适?

  • 什么时候不适合?

什么是普罗米修斯?

Prometheus是最初在SoundCloud上构建的开源系统监视和警报工具包 。自2012年成立以来,许多公司和组织都采用了Prometheus,该项目拥有非常活跃的开发人员和用户社区。现在,它是一个独立的开源项目,并且独立于任何公司进行维护。为了强调这一点并阐明该项目的治理结构,Prometheus在2016年加入了 Cloud Native Computing Foundation,这是继Kubernetes之后的第二个托管项目。

有关Prometheus的详细说明,请参见媒体部分中的资源链接 。

特征

普罗米修斯的主要特点是:

  • 一个多维数据模型,其中包含通过度量标准名称和键/值对标识的时间序列数据
  • PromQL,一种灵活的查询语言 ,可利用此维度
  • 不依赖分布式存储;单个服务器节点是自治的
  • 时间序列收集通过HTTP上的拉模型进行
  • 通过中间网关支持推送时间序列
  • 通过服务发现或静态配置发现目标
  • 多种图形和仪表板支持模式

组件

Prometheus生态系统由多个组件组成,其中许多是可选的:

  • Prometheus主服务器,它会刮取并存储时间序列数据
  • 客户端库,用于检测应用程序代码
  • 一个支持短期工作的推送网关
  • 专用出口商,用于诸如HAProxy,StatsD,Graphite等的服务。
  • 一个alertmanager处理警报
  • 各种支持工具

大多数Prometheus组件都是用Go编写的,因此易于构建和部署为静态二进制文件。

建筑学

该图说明了Prometheus的体系结构及其某些生态系统组件:

普罗米修斯建筑

Prometheus直接或通过中介推送网关从已检测作业中删除指标,以处理短暂的作业。它在本地存储所有报废的样本,并对这些数据运行规则,以汇总和记录现有数据中的新时间序列或生成警报。Grafana或其他API使用者可以用来可视化所收集的数据。

什么时候合适?

Prometheus可以很好地记录任何纯数字时间序列。它既适用于以机器为中心的监视,也适用于高度动态的面向服务的体系结构的监视。在微服务世界中,它对多维数据收集和查询的支持是一种特别的优势。

Prometheus是为可靠性而设计的,它是您在中断期间要使用的系统,可让您快速诊断问题。每个Prometheus服务器都是独立的,而不依赖于网络存储或其他远程服务。当基础结构的其他部分损坏时,您可以依靠它,并且无需设置广泛的基础结构即可使用它。

什么时候不适合?

普罗米修斯重视可靠性。即使在故障情况下,您始终可以查看有关系统的可用统计信息。如果您需要100%的准确性(例如按请求计费),则Prometheus并不是一个不错的选择,因为所收集的数据可能不会足够详细和完整。在这种情况下,最好使用其他系统来收集和分析数据以进行计费,并使用Prometheus进行其余的监视。

prometheus下载安装

  • 下载Prometheus
  • 配置Prometheus
  • 开始普罗米修斯
  • 使用表达式浏览器
  • 使用绘图界面

欢迎来到普罗米修斯!Prometheus是一个监视平台,它通过在这些目标上刮擦度量标准HTTP端点来从被监视的目标收集度量标准。本指南将向您展示如何使用Prometheus安装,配置和监视我们的第一个资源。您将下载,安装并运行Prometheus。您还将下载并安装导出器,该工具可在主机和服务上显示时间序列数据。我们的第一个导出器将是Prometheus本身,它提供有关内存使用,垃圾回收等的各种主机级别指标。

下载Prometheus

下载适用于您的平台的最新版本的Prometheus,然后将其解压缩:

tar xvfz prometheus-*.tar.gz
cd prometheus-*

Prometheus服务器是一个称为prometheus(或prometheus.exe在Microsoft Windows上)的二进制文件。我们可以运行二进制文件,并通过传递--help标志来查看有关其选项的帮助。

./prometheus --help
usage: prometheus []

The Prometheus monitoring server

. . .

在启动Prometheus之前,让我们对其进行配置。

配置Prometheus

Prometheus配置为YAML。Prometheus下载在一个名为的文件中带有一个示例配置,prometheus.yml这是一个入门的好地方。

我们删除了示例文件中的大多数注释,以使其更加简洁(注释以开头的行#)。

global:
  scrape_interval:     15s
  evaluation_interval: 15s

rule_files:
  # - "first.rules"
  # - "second.rules"

scrape_configs:
  - job_name: prometheus
    static_configs:
      - targets: ['localhost:9090']

有示例配置文件中配置的三个模块:globalrule_files,和scrape_configs

global块控制Prometheus服务器的全局配置。我们有两个选择。第一个scrape_interval控制,Prometheus多久刮一次目标。您可以为单个目标覆盖此目标。在这种情况下,全局设置是每15秒刮一次。该evaluation_interval选项控制Prometheus多久评估一次规则。Prometheus使用规则来创建新的时间序列并生成警报。

rule_files块指定了我们希望Prometheus服务器加载的任何规则的位置。目前,我们还没有任何规则。

最后一块,scrape_configs控制Prometheus监视哪些资源。由于Prometheus还将有关自身的数据公开为HTTP端点,因此它可以抓取并监视其自身的运行状况。在默认配置中,有一个名为的作业,prometheus它会刮擦Prometheus服务器公开的时间序列数据。该作业包含一个静态配置的目标localhoston端口9090。Prometheus希望指标可用于路径上的目标/metrics。因此,此默认作业是通过以下网址进行抓取:http:// localhost:9090 / metrics。

返回的时间序列数据将详细说明Prometheus服务器的状态和性能。

有关配置选项的完整说明,请参阅 配置文档。

开始普罗米修斯

要使用我们新创建的配置文件启动Prometheus,请切换到包含Prometheus二进制文件的目录并运行:

./prometheus --config.file=prometheus.yml

普罗米修斯应该开始。您还应该能够在http:// localhost:9090上浏览到有关其自身的状态页。给它大约30秒钟的时间,以从其自己的HTTP指标终结点收集有关其自身的数据。

您还可以通过导航到自己的指标终结点:http:// localhost:9090 / metrics来验证Prometheus是否正在提供有关其自身的指标。

使用表达式浏览器

让我们尝试查看Prometheus收集的有关自身的一些数据。要使用Prometheus的内置表达式浏览器,请导航至 http:// localhost:9090 / graph,然后在“图形”选项卡中选择“控制台”视图。

正如您可以从http:// localhost:9090 / metrics收集的那样,称为Prometheus导出的有关其自身的一个指标 promhttp_metric_handler_requests_total/metricsPrometheus服务器已处理的请求总数)。继续并将其输入到表达式控制台中:

promhttp_metric_handler_requests_total

这将返回多个不同的时间序列(以及每个时间序列的最新值),所有时间序列均带有度量名称promhttp_metric_handler_requests_total,但带有不同的标签。这些标签指定不同的请求状态。

如果我们只对导致HTTP代码的请求感兴趣200,则可以使用此查询来检索该信息:

promhttp_metric_handler_requests_total{code="200"}

要计算返回的时间序列数,您可以编写:

count(promhttp_metric_handler_requests_total)

有关表达语言的更多信息,请参见 表达语言文档。

使用绘图界面

要绘制表达式的图形,请导航到http:// localhost:9090 / graph并使用“图形”选项卡。

例如,输入以下表达式以图形化显示在自抓取的Prometheus中发生的每秒HTTP请求速率返回状态代码200:

rate(promhttp_metric_handler_requests_total{code="200"}[1m])

您可以尝试使用图形范围参数和其他设置。

安装node_exporter

1.下载安装包
下载地址:https://prometheus.io/download/

2.解压安装包
tar -zxvf node_exporter-1.1.2.linux-amd64.tar.gz
mv node_exporter-1.1.2.linux-amd64 node_exporter

3.添加到系统服务

  • centos7以上
    vi /usr/lib/systemd/system/node_exporter.service
    添加以下内容:
[Service]
ExecStart=/server/node_exporter/node_exporter 
[Install]
WantedBy=multi-user.target

[Unit]
Description=node_exporter
After=network.target

systemctl daemon-reload #重加载系统服务

systemctl restart node_exporter.service #启动node_exporter服务

systemctl enable node_exporter.service #加入开机自启

systemctl status node_exporter.service#查看启动状态


以上代表启动成功。
启动成功后默认端口为9100,可以查看下。

  • centos7以下操作
    nohup /server/node_exporter/node_exporter > /dev/null &
    ps -ef | grep node

    加入开机自启:
    vim /etc/rc.local
    添加如下内容
    nohup /server/node_exporter/node_exporter > /dev/null &

4.开通端口
在prometheus服务器上telnet node_exporter端口,如果不通,则需要开启端口,或者关闭防火墙(正式环境不允许)。
下面演示开启防火墙:
systemctl status firewalld
firewall-cmd --zone=public --add-port=9100/tcp --permanent
systemctl restart firewalld.service
firewall-cmd --reload

5.添加prometheus规则

- job_name: 'k8s'
  static_configs:
  - targets: ['127.0.0.1:9100']

添加完成后务必重启prometheus生效。

pkill -9 prometheus

nohup ./prometheus --config.file="/server/prometheus/prometheus.yml" &

安装grafana

wget https://dl.grafana.com/oss/release/grafana-7.5.7-1.x86_64.rpm
sudo yum install grafana-7.5.7-1.x86_64.rpm

systemctl start grafana.service
网页输入ip:3000


默认账户密码为admin admin,进去会提示修改密码,修改即可。
然后点击'+',导入仪表。

仪表样例官方地址:
https://grafana.com/grafana/dashboards?search=docker

输入node搜索,点击一个仪表样例。

点击copy,打开grafana界面,输入id,加载,然后选择数据源为prometheus,就会看到一个精细的仪表监控了。


至此,完美实现prometheus+grafana+node_exporter监控。

你可能感兴趣的:(prometheus+grafana+node_exporter监控)