寂冄

Prometheus+Grafana（详细讲解）

Prometheus(普罗米修斯）监控系统

1、Prometheus概述

1.1 任务背景

某公司由于业务快速发展，公司要求对现有机器进行业务监控，责成运维部门来实施这个任务。任务要求如下：

部署监控服务器，实现7x24实时监控
针对公司的业务及研发部门设计监控系统，对监控项和触发器拿出合理意见
做好问题预警机制，对可能出现的问题要及时告警并形成严格的处理机制
做好监控告警系统，要求可以实现告警分级
- 一级报警电话通知
- 二级报警微信通知
- 三级报警邮件通知
处理好公司服务器异地集中监控问题

为什么要监控？

实时收集数据，通过报警及时发现问题，及时处理。数据为优化也可以提供依据。

监控四要素：

监控对象 [主机状态服务资源页面，url]
用什么监控
什么时间监控 [7x24 5x8]
报警给谁

监控技术选型：

mrtg (MRTG - Tobi Oetiker’s MRTG - The Multi Router Traffic Grapher)通过snmp协议得到设备的流量信息，并以包含PNG格式的图形的HTML文档方式显示给用户。
cacti (仙人掌) 用php语言实现的一个软件，它的主要功能是用snmp服务获取数据，然后用rrdtool储存和更新数据。官网地址:Cactus | Description, Distribution, Family, & Facts | Britannica
ntop 官网地址: https://www.ntop.org/ 。
nagios 能够跨平台,插件多,报警功能强大。官网地址: https://www.nagios.org/
centreon 底层使用的就是nagios。是一个nagios整合版软件。官网地址:https://www.centreon.com/
ganglia 设计用于测量数以千计的节点,资源消耗非常小。官网地址:http://ganglia.info/
open-falcon 小米发布的运维监控软件，高效率，高可用。时间较短，用户基数小。官网地址: http://open-falcon.org/
zabbix 跨平台，画图，多条件告警，多种API接口。使用基数特别大。官网地址: https://www.zabbix.com/
prometheus 基于时间序列的数值数据的容器监控解决方案。官网地址: https://prometheus.io/

综合分析：Prometheus比较适合公司的监控需求

1.2 Prometheus特点

Prometheus 受启发于 Google 的 Brogmon 监控系统（相似的 Kubernetes 是从 Google的 Brog 系统演变而来），从 2012 年开始由前 Google 工程师在 Soundcloud 以开源软件的形式进行研发，并且于 2015 年早期对外发布早期版本。2016 年 5 月继 Kubernetes 之后成为第二个正式加入 CNCF 基金会的项目，同年 6 月正式发布 1.0 版本。2017 年底发布了基于全新存储层的 2.0 版本，能更好地与容器平台、云平台配合。

Prometheus 作为新一代的云原生监控系统，目前已经有超过 650+位贡献者参与到Prometheus 的研发工作上，并且超过 120+项的第三方集成。

Prometheus 是一个开源的完整监控解决方案，其对传统监控系统的测试和告警模型进行了彻底的颠覆，形成了基于中央化的规则计算、统一分析和告警的新模型。相比于传统监控系统，Prometheus 具有以下优点：

1 易于管理

Prometheus优秀的设计使得其本身非常易于管理，不会因为Prometheus增加管理成本。

Prometheus 核心部分只有一个单独的二进制文件，不存在任何的第三方依赖(数据库，缓存等等)。唯一需要的就是本地磁盘，因此不会有潜在级联故障的风险。
Prometheus 基于 Pull 模型的架构方式，可以在任何地方（本地电脑，开发环境，测试环境）搭建我们的监控系统。也可以通过中间网关支持push模型
对于一些复杂的情况，还可以使用 Prometheus 服务发现(Service Discovery)的能力动态管理监控目标。

2 可监控服务的内部运行状态

Pometheus 鼓励用户监控服务的内部状态，基于 Prometheus 丰富的 Client 库，用户可以轻松的在应用程序中添加对 Prometheus 的支持，从而让用户可以获取服务和应用内部真正的运行状态。

3 强大的数据模型

所有采集的监控数据均以指标(metric)的形式保存在内置的时间序列数据库当中(TSDB)。所有的样本除了基本的指标名称以外，还包含一组用于描述该样本特征的标签。

如下所示：

http_request_status{code=‘200’,content_path=‘/api/path’,environment=‘produment’} =>[value1@timestamp1,value2@timestamp2…]
http_request_status{code=‘200’,content_path=‘/api/path2’,environment=‘produment’} =>[value1@timestamp1,value2@timestamp2…]

每一条时间序列由指标名称(Metrics Name)以及一组标签(Labels)唯一标识。每条时间序列按照时间的先后顺序存储一系列的样本值。

http_request_status：指标名称(Metrics Name)
{code=‘200’,content_path=‘/api/path’,environment=‘produment’}：表示维度的标签，基于这些 Labels 我们可以方便地对监控数据进行聚合，过滤，裁剪。
[value1@timestamp1,value2@timestamp2…]：按照时间的先后顺序存储的样本值。

4 强大的查询语言 PromQL

Prometheus 内置了一个强大的数据查询语言 PromQL。通过 PromQL 可以实现对监控数据的查询、聚合。同时 PromQL 也被应用于数据可视化(如 Grafana)以及告警当中。

通过 PromQL 可以轻松回答类似于以下问题：

在过去一段时间中 95%应用延迟时间的分布范围？
预测在 4 小时后，磁盘空间占用大致会是什么情况？
CPU 占用率前 5 位的服务有哪些？(过滤)

5 高效

对于监控系统而言，大量的监控任务必然导致有大量的数据产生。而 Prometheus 可以高效地处理这些数据，对于单一 Prometheus Server 实例而言它可以处理：

数以百万的监控指标
每秒处理数十万的数据点

6 可扩展

可以在每个数据中心、每个团队运行独立的 Prometheus Sevrer。Prometheus 对于联邦集群的支持，可以让多个 Prometheus 实例产生一个逻辑集群，当单实例 PrometheusServer 处理的任务量过大时，通过使用功能分区(sharding)+联邦集群(federation)可以对其进行扩展。

7 易于集成

使用 Prometheus 可以快速搭建监控服务，并且可以非常方便地在应用程序中进行集成。目前支持：Java，JMX，Python，Go，Ruby，.Net，Node.js 等等语言的客户端 SDK，基于这些 SDK 可以快速让应用程序纳入到 Prometheus 的监控当中，或者开发自己的监控数据收集程序。

同时这些客户端收集的监控数据，不仅仅支持 Prometheus，还能支持 Graphite 这些其他的监控工具。同时 Prometheus 还支持与其他的监控系统进行集成：Graphite， Statsd， Collected，Scollector， muini， Nagios 等。 Prometheus 社区还提供了大量第三方实现的监控数据采集支持：JMX，CloudWatch，EC2，MySQL，PostgresSQL，Haskell，Bash，SNMP，Consul，Haproxy，Mesos，Bind，CouchDB，Django，Memcached，RabbitMQ，Redis，RethinkDB，Rsyslog 等等。

8 可视化

Prometheus提供了强大的可视化能力，不能自身提供了独立的可视化解决方案，且可以和很多流行的可视化工具进行整合。

Prometheus Server 中自带的 Prometheus UI，可以方便地直接对数据进行查询，并且支持直接以图形化的形式展示数据。同时 Prometheus 还提供了一个独立的基于Ruby On Rails 的 Dashboard 解决方案 Promdash。
最新的 Grafana 可视化工具也已经提供了完整的 Prometheus 支持，基于 Grafana 可以创建更加精美的监控图标。
基于 Prometheus 提供的 API 还可以实现自己的监控可视化 UI。

9 开放性

通常来说当我们需要监控一个应用程序时，一般需要该应用程序提供对相应监控系统协议的支持，因此应用程序会与所选择的监控系统进行绑定。为了减少这种绑定所带来的限制，对于决策者而言要么你就直接在应用中集成该监控系统的支持，要么就在外部创建单独的服务来适配不同的监控系统。

而对于 Prometheus 来说，使用 Prometheus 的 client library 的输出格式不止支持Prometheus 的格式化数据，也可以输出支持其它监控系统的格式化数据，比如 Graphite。因此你甚至可以在不使用 Prometheus 的情况下，采用 Prometheus 的 client library 来让你的应用程序支持监控数据采集。

2、Prometheus的使用

2.1 Prometheus架构和生态圈组件

架构解析：

存储计算层
- Prometheus Server，里面包含了存储引擎和计算引擎。
- Retrieval 组件为取数组件，它会主动从 Pushgateway 或者 Exporter 拉取指标数据。
- Service discovery，可以动态发现要监控的目标。
- TSDB（Time Series Database时间序列数据库），数据核心存储与查询。
- HTTP server，对外提供 HTTP 服务。
采集层
采集层分为两类，一类是生命周期较短的作业，还有一类是生命周期较长的作业。
- 短作业：直接通过 API，在退出时间指标推送给 Pushgateway。
- 长作业：Retrieval 组件直接从 Job 或者 Exporter 拉取数据。Prometheus提供了各种常用的exporter，方便我们使用Prometheus对服务进行监控。
应用层
应用层主要分为两种，一种是 AlertManager，另一种是数据可视化。
- AlertManager
  
  对接 Pagerduty，是一套付费的监控报警系统。可实现短信报警、5 分钟无人 ack 打电话通知、仍然无人 ack，通知值班人员 Manager…
  Email，发送邮件… …
- 数据可视化
Prometheus build-in WebUI
Grafana
其他基于 API 开发的客户端

2.2 Prometheus实验环境规划

主机	运行服务	监控范围
prometheus10	prometheus server
mysql11	mysql + node_export+ mysql_export	数据库+主机
application12	java应用（springboot应用）+node_export	java应用+主机

克隆机器，修改为静态ip（要求能上外网）

vi /etc/sysconfig/network-scripts/ifcfg-ens33

#根据自己的VMWare虚拟机网段配置，修改如下几个参数
IPADDR="192.168.11.10"  # 根据自己的网段，将11修改为自己的网段号
PREFIX="24" #不用改
GATEWAY="192.168.11.2" # 根据自己的网段，将11修改为自己的网段号
DNS1="8.8.8.8"			# 不用修改
DNS1="114.114.114.114"  # 不用修改

修改主机名

# hostnamectl set-hostname 新的主机名
# 示例如下：
hostnamectl set-hostname prometheus10

关闭防火墙,selinux

 # 停止防火请，并禁止开启自启动
systemctl stop firewalld 
systemctl disable firewalld
# 关闭selinux，修改后需重启虚拟机
vi /etc/selinux/config
#修改SELINUX=enforcing
SELINUX=disabled

配置ip和主机名映射

vi /etc/hosts
#增加如下内容
192.168.11.10 prometheus10
192.168.11.11 mysql11

说明：

每台机器都要修改，注意每个机器的IPADDR最后一段一定要不同。
为了更好的操作体验，最好在windows机器也配置ip的主机名映射
- C盘/windows/system32/drivers/hosts

2.3 安装Prometheus Server

Prometheus 基于 Golang 编写，编译后的软件包，不依赖于任何的第三方依赖。只需要下载对应平台的二进制包，解压并且添加基本的配置即可正常启动 Prometheus Server。

上传安装包
链接：https://pan.baidu.com/s/181ejEqC7FDlQmC3w8LuUlg
提取码：m3yg

上传 prometheus-2.29.1.linux-amd64.tar.gz 到虚拟机的/opt/software 目录
```
[root@prometheus10 opt]# ls /opt/software/
prometheus-2.29.1.linux-amd64.tar.gz
```

解压到/opt/module 目录下

#新建module目录
[root@prometheus10 opt]# mkdir /opt/module 
#解压缩
[root@prometheus10 opt]# tar xzvf /opt/software/prometheus-2.29.1.linux-amd64.tar.gz -C /opt/module/
#prometheus文件夹改名
[root@prometheus10 opt]# mv /opt/module/prometheus-2.29.1.linux-amd64/ /opt/module/prometheus-2.29.1

阅读配置文件

prometheus的配置内容在 prometheus.yml中，默认配置如下：

 # my global config 全局配置块： 控制 Prometheus 服务器的全局配置
global:
  scrape_interval: 15s # 配置拉取数据的时间间隔（这里设置为15s），如果不设置默认为 1 分钟。
  evaluation_interval: 15s # 规则验证（生成 alert）的时间间隔（这里设置为15s），如果不设置默认为 1 分钟。.
   # scrape_timeout is set to the global default (10s).
 
 # Alertmanager configuration  告警配置
 alerting:
   alertmanagers:
     - static_configs:
         - targets:
           # - alertmanager:9093 
 
 # 规则配置文件
 # Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
 rule_files:
   # - "first_rules.yml"
   # - "second_rules.yml"
 
 # 配置采集目标相关， prometheus 监视的目标
 scrape_configs:
   # Prometheus自身的运行信息可以通过 HTTP 访问，所以 Prometheus 可以监控自己的运行数据
   # job_name：监控作业的名称
   - job_name: "prometheus"
 
     # metrics_path defaults to '/metrics'
     # scheme defaults to 'http'.
     # static_configs: 表示静态目标配置，就是固定从某个 target 拉取数据
     static_configs:
       - targets: ["localhost:9090"]

Prometheus 是可以在运行时自动加载配置的。启动时需要添加：--web.enable-lifecycle

启动prometheus server

# 先进入到Prometheus安装目录
[root@prometheus10 ~]# cd /opt/module/prometheus-2.29.1/
# 启动prometheus
[root@prometheus10 prometheus-2.29.1]# ./prometheus

访问测试Prometheus

http://192.168.11.10:9090 , Prometheus默认占用9090端口

2.4 监控Linux主机

在 Prometheus 的架构设计中，Prometheus Server 主要负责数据的收集，存储并且对外提供数据查询支持，而实际的监控样本数据的收集则是由 Exporter 完成。因此为了能够监控到某些东西，如主机的 CPU 使用率，我们需要使用到 Exporter。Prometheus 周期性的从 Exporter 暴露的 HTTP 服务地址（通常是/metrics）拉取监控样本数据。

Exporter 可以是一个相对开放的概念，其可以是一个独立运行的程序独立于监控目标以外，也可以是直接内置在监控目标中。只要能够向 Prometheus 提供标准格式的监控样本数据即可。

为了能够采集到主机的运行指标如 CPU, 内存，磁盘等信息。我们可以使用 Node Exporter。Node Exporter 同样采用 Golang 编写，并且不存在任何的第三方依赖，只需要下载，解压即可运行。可以从 https://prometheus.io/download/ 获取最新的 node_exporter 版本的二进制包。

上传安装包

链接：https://pan.baidu.com/s/1PGfEUFSvv4hfLTn64suj2A
提取码：oozq
上传 node_exporter-1.2.2.linux-amd64.tar.gz 到虚拟机的/opt/software 目录

```powershell
[root@mysql11 ~]# ls /opt/software
node_exporter-1.2.2.linux-amd64.tar.gz
```

解压安装包到/opt/module 目录下

#新建module目录
[root@mysql11 ~]# mkdir /opt/module 
#解压缩
[root@mysql11 ~]# tar xzvf /opt/software/node_exporter-1.2.2.linux-amd64.tar.gz -C /opt/module/
#node_exporter文件夹改名
[root@mysql11 ~]# mv /opt/module/node_exporter-1.2.2.linux-amd64/ /opt/module/node_exporter-1.2.2

启动export，并通过metrics端点查看当前node export获取的监控信息
```
# 执行./node_exporter
#先进入node_exporter的目录
[root@mysql11 ~]# cd /opt/module/node_exporter-1.2.2/
# 再执行node_exporter
[root@mysql11 node_exporter-1.2.2]# ./node_exporter
```
浏览器输入：http://mysql11:9100/metrics，(如果没有在windows机器配置ip映射，需要将mysql11改为具体的ip)，可以看到当前 node exporter 获取到的当前主机的所有监控数据。

回到Prometheus服务器，修改Prometheus配置文件，增加对Linux主机的监控job

# 在 scrape_configs 配置项下添加配置：

scrape_configs:
  - job_name: "prometheus"
    static_configs:
      - targets: ["localhost:9090"]
  # 添加Node Exporter监控配置
  - job_name: "node_exporter"
    static_configs:
      - targets: ["mysql11:9100"]

如果开启了热加载，此时可以访问热加载接口以完成配置文件的加载。`curl -X POST http://localhost:9090/-/reload`

重启Prometheus，通过页面查看是否成功

http://192.168.11.10:9090 , Prometheus默认占用9090端口

2.5 监控MySQL

为了能够采集到MySQL的运行指标，我们可以使用 MySQL Exporter。MySQL Exporter 是社区专门为采集 MySQL/MariaDB 数据库监控指标而设计开发，通过 Exporter 上报核心的数据库指标，用于异常报警和监控大盘展示。

数据库授权

因为 MySQL Exporter 是通过查询数据库中状态数据来对其进行监控，所以需要为对应的数据库实例进行授权。我们新建一个账户名为exporter，密码为 123456的账户，并为其授予相应的权限。
```
CREATE USER 'exporter'@'localhost' IDENTIFIED BY '123456' WITH MAX_USER_CONNECTIONS 3;
GRANT PROCESS, REPLICATION CLIENT, SELECT ON *.* TO 'exporter'@'localhost';
flush privileges;
```
注意:授权ip为localhost，是因为exporter账密由mysql_exporter使用用来检索数据库运行指标，而mysql expoerter和mysql在同一台机器上。所以这个localhost是指的mysql_exporter的IP。
上传安装包

链接：https://pan.baidu.com/s/1gTOOCRAjgxMfOIhzOZ5_ZA
提取码：jwuu
上传 node_exporter-1.2.2.linux-amd64.tar.gz 到虚拟机的/opt/software 目录

```powershell
[root@mysql11 ~]# ls /opt/software
mysqld_exporter-0.13.0.linux-amd64.tar.gz
```

解压安装包到/opt/module 目录下

#新建module目录
[root@mysql11 ~]# mkdir /opt/module 
#解压缩
[root@mysql11 ~]# [root@mysql11 ~]# tar xzvf /opt/software/mysqld_exporter-0.13.0.linux-amd64.tar.gz -C /opt/module/
#mysql_exporter文件夹改名
[root@mysql11 ~]#  mv /opt/module/mysqld_exporter-0.13.0.linux-amd64/ /opt/module/mysqld_exporter-0.13.0

在mysqld_exporter文件夹中，新建一个my.cnf配置

执行 vi /opt/module/node_exporter-1.2.2/my.cnf ，新建my.cnf文件，内容配置如下:
```
[client]
user=exporter
password=123456
```
启动mysql_exporter，并访问9104端口
```
#先进入mysql_exporter的目录
[root@mysql11 ~]# cd /opt/module/mysqld_exporter-0.13.0/
[root@mysql11 mysqld_exporter-0.13.0]#
# 再执行mysql_exporter
[root@mysql11 mysqld_exporter-0.13.0]# ./mysqld_exporter --config.my-cnf=my.cnf
```
浏览器输入：http://mysql11:9104/metrics，(如果没有在windows机器配置ip映射，需要将mysql11改为具体的ip)，可以看到当前 mysql exporter 获取到mysql的所有监控数据。

回到Prometheus服务器，修改Prometheus配置文件，增加对MySQL的监控job

# 在 scrape_configs 配置项下添加配置：

scrape_configs:
  - job_name: "prometheus"
    static_configs:
      - targets: ["localhost:9090"]
  - job_name: "node_exporter"
    static_configs:
      - targets: ["mysql11:9100"]
  - job_name: "mysql_exporter"
    static_configs:
      - targets: ["mysql11:9104"]

重启Prometheus，通过页面查看是否成功

http://192.168.11.10:9090 , Prometheus默认占用9090端口

2.6 监控java应用

在使用 Spring Boot 作为开发框架时，需要监控应用的状态，例如 JVM/Spring MVC 等。而为了使监控深入到应用的内部，就需要应用自身暴露作为Exporter暴露监控指标，这就和应用的开发语言和技术框架紧密相关了。Prometheus 监控SpringBoot服务基于 Spring Actuator 机制采集 JVM 等数据。

修改应用的依赖和配置


<dependency>
  <groupId>org.springframework.bootgroupId>
  <artifactId>spring-boot-starter-actuatorartifactId>
dependency>
<dependency>
  <groupId>io.micrometergroupId>
  <artifactId>micrometer-registry-prometheusartifactId>
dependency>

注意：需要配置java环境，安装jdk，可以参考博主之前的文章
Tomcat安装配置
jdk下载链接：https://pan.baidu.com/s/1UC6Kqw-e52Ct66Ldl3ZoDw
提取码：9cof

修改springboot项目配置文件

management:
  server:
    port: 8091
  endpoint:
    prometheus:
      enabled: true
  endpoints:
    web:
      exposure:
        include: health,info,prometheus
  metrics:
    tags:
      application: spring-boot-mvc-demo

打包，并运行jar包，并访问配置的8091端口
链接：https://pan.baidu.com/s/1m3-8enM9BBQ-yhBXSAanAA
提取码：jhhu

 java -jar springboot-prometheus.jar

此时访问 http://ip:8091/actuator/prometheus ,以看到当前java应用的所有监控数据。

回到Prometheus服务器，修改Prometheus配置文件，增加对Java应用的监控job

# 在 scrape_configs 配置项下添加配置：

scrape_configs:
  - job_name: "prometheus"
    static_configs:
      - targets: ["localhost:9090"]
  - job_name: "node_exporter"
    static_configs:
      - targets: ["mysql11:9100"]
  - job_name: "mysql_exporter"
    static_configs:
      - targets: ["mysql11:9104"]
  # 添加监控java应用的job
  - job_name: "springboot_exporter"
    metrics_path: '/actuator/prometheus'
    static_configs:
      - targets: ["mysql11:8091"]

重启Prometheus，通过页面查看是否成功

http://192.168.11.10:9090 , Prometheus默认占用9090端口

3 PromQL 介绍

Prometheus 通过指标名称（metrics name）以及对应的一组标签（labelset）唯一定义一条时间序列。指标名称反映了监控样本的基本标识，而 label 则在这个基本特征上为采集到的数据提供了多种特征维度。用户可以基于这些特征维度过滤，聚合，统计从而产生新的计算后的一条时间序列。PromQL 是 Prometheus 内置的数据查询语言，其提供对时间序列数据丰富的查询，聚合以及逻辑运算能力的支持。并且被广泛应用在 Prometheus的日常应用当中，包括对数据查询、可视化、告警处理当中。可以这么说，PromQL 是Prometheus 所有应用场景的基础，理解和掌握 PromQL 是 Prometheus 入门的第一课。

3.1 基本用法

1 查询时间序列

当 Prometheus 通过 Exporter 采集到相应的监控指标样本数据后，我们就可以通过PromQL 对监控样本数据进行查询。当我们直接使用监控指标名称查询时，可以查询该指标下的所有时间序列。如

prometheus_http_requests_total

等同于

prometheus_http_requests_total{}

该表达式会返回指标名称为 prometheus_http_requests_total 的所有时间序列

prometheus_http_requests_total{code="200",handler="alerts",instance="localhost:9090",job="prometheus",method="get"}=(20889@1518096812.326)
prometheus_http_requests_total{code="200",handler="graph",instance="localhost:9090",job="prometheus",method="get"}= (21287@1518096812.326)

PromQL 还支持用户根据时间序列的标签匹配模式来对时间序列进行过滤，目前主要支持两种匹配模式：完全匹配和正则匹配。

PromQL 支持使用 = 和 != 两种完全匹配模式：
- 通过使用 label=value 可以选择那些标签满足表达式定义的时间序列；
  
  例如，如果我们只需要查询所有 prometheus_http_requests_total 时间序列中满足标
  签 instance 为 localhost:9090 的时间序列，则可以使用如下表达式
```
prometheus_http_requests_total{instance="localhost:9090"}
```
- 反之使用 label!=value 则可以根据标签匹配排除时间序列；
  
  反之使用 instance!=“localhost:9090” 则可以排除这些时间序列
```
prometheus_http_requests_total{instance!="localhost:9090"}
```
PromQL还可以支持使用正则表达式作为匹配条件，多个表达式之间使用 | 进行分离：
- 使用 label=~regx 表示选择那些标签符合正则表达式定义的时间序列；
  
  例如，如果想查询多个环节下的时间序列序列可以使用如下表达式：
```
mysql_global_status_buffer_pool_pages{state=~"data|free"}
```
- 反之使用 label!~regx 进行排除；
  
  排除用法
```
mysql_global_status_buffer_pool_pages{state!~"data|free"}
```

2 范围查询

直接通过类似于 PromQL 表达式 httprequeststotal 查询时间序列时，返回值中只会包含该时间序列中的最新的一个样本值，这样的返回结果我们称之为瞬时向量。而相应的这样的表达式称之为瞬时向量表达式。
而如果我们想过去一段时间范围内的样本数据时，我们则需要使用区间向量表达式。区间向量表达式和瞬时向量表达式之间的差异在于在区间向量表达式中我们需要定义时间选择的范围，时间范围通过时间范围选择器 [] 进行定义。例如，通过以下表达式可以选择最近 5 分钟内的所有样本数据：

mysql_global_status_buffer_pool_pages{state=~"data|free"}[5m]

该表达式将会返回查询到的时间序列中最近 5 分钟的所有样本数据：

mysql_global_status_buffer_pool_pages{instance="mysql201:9104", job="mysql_exporter", state="data"}
317 @1704184450.732
317 @1704184465.732
317 @1704184480.732
317 @1704184495.732
317 @1704184510.732
317 @1704184525.732
317 @1704184540.732
317 @1704184555.732
317 @1704184570.732
317 @1704184585.732
317 @1704184600.732
317 @1704184615.732
317 @1704184630.736
317 @1704184645.732
317 @1704184660.732
317 @1704184675.732
317 @1704184690.732
317 @1704184705.732
317 @1704184720.732
317 @1704184735.732
mysql_global_status_buffer_pool_pages{instance="mysql201:9104", job="mysql_exporter", state="free"}
7874 @1704184450.732
7874 @1704184465.732
7874 @1704184480.732
7874 @1704184495.732
7874 @1704184510.732
7874 @1704184525.732
7874 @1704184540.732
7874 @1704184555.732
7874 @1704184570.732
7874 @1704184585.732
7874 @1704184600.732
7874 @1704184615.732
7874 @1704184630.736
7874 @1704184645.732
7874 @1704184660.732
7874 @1704184675.732
7874 @1704184690.732
7874 @1704184705.732
7874 @1704184720.732
7874 @1704184735.732

通过区间向量表达式查询到的结果我们称为区间向量。除了使用 m 表示分钟以外，PromQL 的时间范围选择器支持其它时间单位：

s - 秒
m - 分钟
h - 小时
d - 天
w - 周
y - 年

3 时间位移操作

在瞬时向量表达式或者区间向量表达式中，都是以当前时间为基准：

mysql_global_status_buffer_pool_pages{state=~"data|free"} # 瞬时向量表达式，选择当前最新的数据 
mysql_global_status_buffer_pool_pages{state=~"data|free"}[5m] # 区间向量表达式，选择以当前时间为基准，5 分钟内的数据

而如果我们想查询，5 分钟前的瞬时样本数据，或昨天一天的区间内的样本数据呢? 这个时候我们就可以使用位移操作，位移操作的关键字为 offset。可以使用 offset 时间位移操作：

mysql_global_status_buffer_pool_pages{state=~"data|free"} offset 5m
mysql_global_status_buffer_pool_pages{state=~"data|free"}[5m] offset 5m

4 使用聚合操作

一般来说，如果描述样本特征的标签(label)在并非唯一的情况下，通过 PromQL 查询数据，会返回多条满足这些特征维度的时间序列。而 PromQL 提供的聚合操作可以用来对这些时间序列进行处理，形成一条新的时间序列：

#查询系统所有 http 请求的总量
sum(prometheus_http_requests_total)
# 按照 mode 计算主机 CPU 的平均使用时间
avg(node_cpu_seconds_total) by (mode)
# 按照主机查询各个主机的 CPU 使用率
sum(sum(rate(node_cpu_seconds_total{mode!='idle'}[5m]))  /  sum(rate(node_cpu_seconds_total [5m]))) by (instance)

5 标量和字符串

除了使用瞬时向量表达式和区间向量表达式以外，PromQL 还直接支持用户使用标量(Scalar)和字符串(String)。

标量（Scalar）：一个浮点型的数字值标量只有一个数字，没有时序。例如：10

需要注意的是，当使用表达式 count(prometheus_http_requests_total)，返回的数据类型，依然是瞬时向量。用户可以通过内置函数 scalar()将单个瞬时向量转换为标量。
字符串（String）：一个简单的字符串值

直接使用字符串，作为 PromQL 表达式，则会直接返回字符串。
```
"this is a string"
'these are unescaped: \n \\ \t'
'these are not unescaped: \n ' " \t`
```

6 合法的 PromQL 表达式

所有的 PromQL 表达式都必须至少包含一个指标名称(例如 http_request_total)，或者一个不会匹配到空字符串的标签过滤器(例如{code=”200”})。因此以下两种方式，均为合法的表达式：

prometheus_http_requests_total # 合法
prometheus_http_requests_total{} # 合法
{method="get"} # 合法

而如下表达式，则不合法：

{job=~".*"} # 不合法

同时，除了使用 {label=value} 的形式以外，我们还可以使用内置的 _ _name_ _ 标签
来指定监控指标名称：

{__name__=~"prometheus_http_requests_total"} # 合法
{__name__=~"node_disk_bytes_read|node_disk_bytes_written"} # 合法

3.2 PromQL操作符

使用 PromQL 除了能够方便的按照查询和过滤时间序列以外，PromQL 还支持丰富的操作符，用户可以使用这些操作符对进一步的对事件序列进行二次加工。这些操作符包括：数学运算符，逻辑运算符，布尔运算符等等。

1 数学运算

PromQL 支持的所有数学运算符如下所示：

    + (加法)
    - (减法)
    * (乘法)

	/ (除法)
	% (求余)
 	^ (幂运算)

2 布尔运算

Prometheus 支持以下布尔运算符如下：

  == (相等)
  != (不相等)
  >(大于)
  < (小于)
  >= (大于等于)
  <= (小于等于)

使用 bool 修饰符改变布尔运算符的行为
布尔运算符的默认行为是对时序数据进行过滤。而在其它的情况下我们可能需要的是真正的布尔结果。例如，只需要知道当前模块的 HTTP 请求量是否>=1000，如果大于等于1000 则返回 1（true）否则返回 0（false）。这时可以使用 bool 修饰符改变布尔运算的默认行为。例如：

prometheus_http_requests_total > bool 1000

使用 bool 修改符后，布尔运算不会对时间序列进行过滤，而是直接依次瞬时向量中的各个样本数据与标量的比较结果 0 或者 1。从而形成一条新的时间序列。

prometheus_http_requests_total{code="200",handler="query",instance="localhost:9090",job="prometheus",method="get"} 1
prometheus_http_requests_total{code="200",handler="query_range",instance="localhost:9090",job="prometheus",method="get"} 0

同时需要注意的是，如果是在两个标量之间使用布尔运算，则必须使用 bool 修饰符

2 == bool 2 # 结果为 1

3 集合运算符

使用瞬时向量表达式能够获取到一个包含多个时间序列的集合，我们称为瞬时向量。通过集合运算，可以在两个瞬时向量与瞬时向量之间进行相应的集合操作。目前，Prometheus 支持以下集合运算符：

and (并且)
or (或者)
unless (排除)

vector1 and vector2 会产生一个由 vector1 的元素组成的新的向量。该向量包含vector1 中完全匹配 vector2 中的元素组成。

# 求取 访问总数>5 且最近5分钟增长速率>0.0001
prometheus_http_requests_total > 5  and rate(prometheus_http_requests_total{}[5m]) > 0.0001

vector1 or vector2 会产生一个新的向量，该向量包含 vector1 中所有的样本数据，以及 vector2 中没有与 vector1 匹配到的样本数据。

# 求取 请求总数<10 或者 >20 的向量
prometheus_http_requests_total <10 or prometheus_http_requests_total > 20

vector1 unless vector2 会产生一个新的向量，新向量中的元素由 vector1 中没有与vector2 匹配的元素组成。

prometheus_http_requests_total > 5  unless rate(prometheus_http_requests_total{}[5m]) > 0.0001

4 聚合操作

Prometheus 还提供了下列内置的聚合操作符，这些操作符作用域瞬时向量。可以将瞬时表达式返回的样本数据进行聚合，形成一个新的时间序列。

sum (求和)
min (最小值)
max (最大值)
avg (平均值)
stddev (标准差)
stdvar (标准差异)
count (计数)
count_values (对 value 进行计数)
bottomk (后 n 条时序)
topk (前 n 条时序)
quantile (分布统计)

使用聚合操作的语法如下：

([parameter,] ) [without|by ()]

其中只有 count_values , quantile , topk , bottomk 支持参数(parameter)。

without 用于从计算结果中移除列举的标签，而保留其它标签。by 则正好相反，结果向量中只保留列出的标签，其余标签则移除。通过 without 和 by 可以按照样本的问题对数据进行聚合。
例如：

sum(prometheus_http_requests_total) without (instance)

等价于

sum(prometheus_http_requests_total) by (code,handler,job)

如果只需要计算整个应用的 HTTP 请求总量，可以直接使用表达式：

sum(prometheus_http_requests_total)

count_values 用于时间序列中每一个样本值出现的次数。count_values 会为每一个唯一的样本值输出一个时间序列，并且每一个时间序列包含一个额外的标签。例如：

count_values("count",prometheus_http_requests_total) by (code,handler,instance,job)

topk 和 bottomk 则用于对样本值进行排序，返回当前样本值前 n 位，或者后 n 位的时间序列。获取 HTTP 请求数前 5 位的时序样本数据，可以使用表达式：

topk(5, prometheus_http_requests_total)

quantile 用于计算当前样本数据值的分布情况 quantile(φ, express)其中 0 ≤ φ ≤ 1。例如，当 φ 为 0.5 时，即表示找到当前样本数据中的中位数：

quantile(0.5, prometheus_http_requests_total)

4、Grafana的简单使用

4.1 Grafana的安装

grafana 是一款采用 Go 语言编写的开源应用，主要用于大规模指标数据的可视化展现，是网络架构和应用分析中最流行的时序数据展示工具，目前已经支持绝大部分常用的时序数据库。下载地址：https://grafana.com/grafana/download

上传安装包
链接：https://pan.baidu.com/s/1hThWApv7IYBXO3dZDVCmZQ
提取码：0l81

上传 grafana-enterprise-8.1.2.linux-amd64.tar.gz 到虚拟机的/opt/software 目录
```
[root@prometheus10 ~]# ls /opt/software/
grafana-enterprise-8.1.2.linux-amd64.tar.gz
```

解压安装包到/opt/module 目录下

#新建module目录
[root@prometheus10 ~]# mkdir /opt/module 
#解压缩
[root@prometheus10 ~]# tar xzvf /opt/software/grafana-enterprise-8.1.2.linux-amd64.tar.gz -C /opt/module

启动grafana

# 先进入到grafana安装目录
[root@prometheus10 ~]# cd /opt/module/grafana-8.1.2/
# 启动grafana
[root@prometheus10 grafana-8.1.2]# ./bin/grafana-server web > ./grafana.log 2>&1 &

访问web管理界面

打开地址: http://ip:3000 ,默认用户名和密码都是admin

4.2 Grafana集成Prometheus

Grafana配置Prometheus连接信息

点击配置，选择DataSource
点击Add datasource
配置Prometheus Server的地址
点击下方的Save & Test，出现绿色的Data source is working 即说明Prometheus正常联通
点击Back返回，即可看到新添加的Prometheus

手动创建仪表盘Dashboard

手动新建仪表盘

在面板中配置监控项

导入仪表盘

手动一个个添加 Dashboard 比较繁琐，Grafana 社区鼓励用户分享 Dashboard，通过https://grafana.com/dashboards网站，可以找到大量可直接使用的Dashboard模板。
Grafana 中所有的 Dashboard 通过 JSON 进行共享，下载并且导入这些 JSON 文件，就可以直接使用这些已经定义好的 Dashboard：

选择自己喜欢的模板，选中跳转转页面后，点击Download JSON

导入模板JSON

导入完毕，即可查看到添加的仪表盘

你可能感兴趣的:(Prometheus,prometheus,grafana)

K8S学习之基础三十六：node-exporter部署云上艺旅 K8S学习 kubernetes 学习贪心算法 prometheus 云原生
Prometheusv2.2.1编写yaml文件，包含创建ns、configmap、deployment、service#创建monitoring空间viprometheus-ns.yamlapiVersion:v1kind:Namespacemetadata:name:monitoring#创建SA并绑定权限kubectlcreateserviceaccountmonitor-nmonitori
给我的 IM 系统加上监控两件套：【Prometheus + Grafana】蝎子莱莱爱打怪 prometheus grafana
监控是一个系统必不可少的组成部分，实时，准确的监控，将会大大有助于我们排查问题。而当今微服务系统的话有一个监控组合很火那就是Prometheus+Grafana，嘿你别说这俩兄弟配合的相当完美，Prometheus负责数据采集，Grafana负责可视化展示,各就其位，各司其职一起来完成监控这个活儿。紧接着我们简单对这两工具做个介绍~1、Prometheus与Grafana简介Prometheus作
微服务监控prometheus+Grafana chen2017sheng 经验总结微服务 prometheus grafana
目录Prometheus概述核心组件特点使用场景Grafana概述功能特点使用场景Prometheus+Grafana组合部署和配置一、准备工作二、部署Prometheus三、部署Grafana四、创建监控仪表盘五、验证和调优总结微服务监控是确保微服务架构稳定运行的关键环节，其中Prometheus与Grafana的组合是业界广泛采用的监控解决方案。以下是对这一组合的详细介绍：Prometheus
Prometheus+Grafana监控平台搭建_grafana专业监控项 2401_89828619 prometheus grafana
Prometheus提供多种类型的Exporter用于采集各种不同服务的运行状态。目前支持的有数据库、硬件、消息中间件、存储系统、HTTP服务器、JMX等。·alertmanager警告管理器，用来进行报警。·其他辅助性工具Prometheus系统架构图：它的服务过程是这样的Prometheusdaemon负责定时去目标上抓取metrics(指标)数据，每个抓取目标需要暴露一个http服务的接口给
使用 Docker 部署 Prometheus + Grafana 监控平台 2401_84048398 程序员 docker prometheus grafana
一、Prometheus简介==================================================================================Prometheus（普罗米修斯）是一套开源的监控&报警&时间序列数据库的组合，由SoundCloud公司开发。Prometheus基本原理是通过HTTP协议周期性抓取被监控组件的状态，这样做的好处是任意组件
K8S学习之基础三十四：K8S之监控Prometheus部署pod版云上艺旅 K8S学习 kubernetes 学习 prometheus 云原生
使用KubernetesPod的方式部署Prometheus是一种常见的方法，尤其是在容器化和微服务架构中。以下是详细的步骤：1.创建命名空间（可选）为了方便管理，可以为Prometheus创建一个单独的命名空间。yaml复制apiVersion:v1kind:Namespacemetadata:name:monitoring将上述内容保存为namespace.yaml，然后应用：bash复制ku
K8S学习之基础三十五：k8s之Prometheus部署模式云上艺旅 K8S学习 kubernetes 学习 prometheus 云原生容器
Prometheus有多种部署模式，适用于不同的场景和需求。以下是几种常见的部署模式：1.单节点部署这是最简单的部署模式，适用于小型环境或测试环境。特点：单个Prometheus实例负责所有的数据采集、存储和查询。配置简单，易于维护。不具备高可用性和扩展性。适用场景：小型项目或测试环境。对高可用性要求不高的场景。部署步骤：下载并解压Prometheus。配置prometheus.yml。启动Pro
Prometheus架构详解 HeZephyr 工具 prometheus 架构
1Prometheus简介Prometheus是一个开源的系统监控报警工具套件，它最初由SoundCloud开发，并于2016年成为CNCF（云原生计算基金会）托管的第二个项目（第一个是kubernetes）。Prometheus以其简单高效的方式收集指标而闻名，能更好地与容器平台、云平台配合，这使得它在现代云原生环境中非常受欢迎。Prometheus被广泛应用于各种场景中，包括但不限于：应用性能
kubernetes集群监控 Kube-Prometheus-Stack xiaojinran k8s prometheus docker 运维 kubernetes prometheus 容器 grafana
kubernetes集群监控概述Kubernetes（K8s）集群监控是指对Kubernetes集群中的各个组件和资源进行实时监测和数据收集，以获取对集群健康状态、性能指标和事件的可视化和告警。Kubernetes集群监控的内容通常包括以下几个方面：基础设施监控：监控物理服务器、虚拟机或云实例的资源使用情况，包括CPU、内存、磁盘和网络等指标。这可以帮助确保集群的底层基础设施正常运行，并及时发现资
kube-prometheus-stack部署prometheus全栈监控k8s 时空无限 Kubernetes kubernetes
添加源helmrepoaddprometheus-communityhttps://prometheus-community.github.io/helm-charts更新源helmrepoupdate成功输出Hangtightwhilewegrabthelatestfromyourchartrepositories......Successfullygotanupdatefromthe"prom
k8s-06-prometheus-stack 多懂一些 kubernetes 实战 nginx linux centos prometheus
安装#下载yaml#[下载](https://github.com/prometheus-community/helm-charts/tree/main/charts/kube-prometheus-stack)#镜像下载dockerlogin--username=xxxx registry.cn-shanghai.aliyuncs.comdockerpullregistry.cn-shangha
prometheus-helm的使用 weixin_43806846 prometheus
1、部署Prometheus监控平台1、下载安装Prometheus（当前集群版本1.26.3）gitclonehttps://github.com/prometheus-operator/kube-prometheus.git-brelease-0.12安装：cdkube-prometheus/创建命名空间和crd：kubectlapply--server-side-fmanifests/set
springboot集成钉钉_钉钉通知机器人与SpringBoot的集成 weixin_39622643 springboot集成钉钉
SpringBootAdmin集成自定义监控告警(2.0.1版本)------钉钉机器人-yuancao24的博客-CSDN博客https://blog.csdn.net/yuancao24/article/details/83576194prometheus-spring-boot-starter:一个管理异常通知的神奇starter，实现了钉钉消息提醒与邮件提醒https://gitee.co
K8s 集群监控：从指标采集到可视化展示的完整方案花笺墨韵 kubernetes
目录一、引言二、指标采集（一）K8s内置指标（二）Prometheus指标采集三、数据存储（一）Prometheus本地存储（二）远程存储四、可视化展示（一）Grafana基础（二）K8s相关仪表盘模板五、总结一、引言Kubernetes（K8s）集群环境复杂且动态变化，应用程序的运行状况、资源的使用情况时刻都在改变。为了保障K8s集群高效、稳定地运行，及时发现潜在问题并做出响应，一套完善的监控体
Prometheus + Grafana 配置监控指标笑远 prometheus grafana 运维数据库
Prometheus+Grafana配置监控指标在前一篇指南中，我们详细介绍了如何安装和配置Prometheus与Grafana。接下来，我们将深入探讨如何配置Prometheus来采集具体的监控指标，并使用Grafana将这些指标可视化。本指南将涵盖以下内容：选择和配置Exporters（除了NodeExporter之外）配置Prometheus以采集相关指标在Grafana中创建和配置仪表板高
DevOps工具链 zhangpeng455547940 devops 运维
DevOps工具链的核心组成部分包括：代码编辑和版本控制工具svn、git自动化构建工具Jenkins、GitLabCI/CD、TravisCI持续集成和持续部署工具Jenkins、Ansible容器编排工具K8S、DockerSwarm持续监控工具Prometheus，Grafana，InfluxDB服务配置管理工具Ansible，Chef，PuppetGit：代码管理Maven：依赖管理、项目
K8S日常问题优化沉默的八哥运维运维 kubernetes
在实际工作中，优化Kubernetes的性能和成本通常需要结合资源利用率分析、集群配置调整以及自动化工具的整合。以下是我在项目中实践过的一些典型优化场景和解决方案：一、资源利用率优化1.合理配置Requests/Limits问题：许多团队未准确设置Pod的requests和limits，导致资源浪费或频繁OOM。优化方法：使用Prometheus+Grafana监控Pod的实际CPU/内存使用量。
【Prometheus】prometheus 架构介绍 Learn Forever Prometheus 架构运维 docker
1.组件说明prometheusserver是Prometheus组件中的核心部分，负责实现对监控数据的获取，存储以及查询。exporter简单说是采集端，通过http服务的形式保留一个url地址，prometheusserver通过访问该exporter提供的endpoint端点，即可获取到需要采集的监控数据。AlertManager在prometheus中，支持基于PromQL创建告警规则，如
物联网实时数据存储方案选择动亦定 MySQL 物联网数据库物联网时序数据库数据库
存储物联网设备发出的实时数据时，需考虑数据量、速度、类型和访问需求。以下是几种常见的存储方案：1.时序数据库适用场景:适合处理时间序列数据，如传感器数据。优点:高效存储和查询时间序列数据，支持高写入和查询吞吐量。常见选择:InfluxDB、TimescaleDB、Prometheus。2.NoSQL数据库适用场景:适合非结构化或半结构化数据，如JSON、XML。优点:灵活的数据模型，易于扩展，适合
k8s集群中部署dcgm-exporter收集GPU指标 thinkerCoder kubernetes 容器运维 GPU
总体步骤：部署dcgm-exporter的DaemonSet和Service，确保Service有正确的标签和端口。创建ServiceMonitor，选择dcgm-exporter的Service，并指定端口。检查Prometheus的targets页面，确认dcgm-exporter是否被正确发现和抓取。可能需要调整Prometheus的RBAC或网络策略，确保访问权限。1，部署dcgm-exp
在线监控+日志分析方案徐福记c 运维运维
1.在线监控系统设计技术选型：Prometheus+Grafana+各ExporterPrometheus：负责定时拉取各服务指标数据并存储。Grafana：可视化仪表盘，支持多数据源（Prometheus、Loki等）。Exporter：SpringBoot应用：通过Micrometer暴露/actuator/prometheus端点。MySQL：部署mysqld_exporter采集数据库性能
使用Yarn创建Grafana模板的完整指南云服务器linux运维yarn
在本篇文章中，我将带你逐步完成如何使用Yarn生成Grafana模板的过程。Grafana是一款开源的数据可视化工具，我们可以使用它来创建各种仪表板，以便更好地监控和展示数据。请跟随我一起来完成这一过程。整体流程概览在开始之前，我们先来看看整个操作的流程。以下是步骤的概述，以表格形式展示：步骤描述1安装Node.js和Yarn2创建新的Yarn项目3安装Grafana的API客户端库4编写Graf
ansbile 批量部署 node-exporter BUG弄潮儿 java
下载node-exporterhttps://github.com/prometheus/node_exporter/releases下载ansiblehttps://github.com/ansible/ansible/releases启动node-exporterservice文件node-exporter.service[Unit]Description=node_exporterRequi
k8s下部署ansible进行node-export二安装 BUG弄潮儿 kubernetes ansible 容器云原生
下载node-exporterhttps://github.com/prometheus/node_exporter/releases下载ansiblehttps://github.com/ansible/ansible/releases启动node-exporterservice文件node-exporter.service[Unit]Description=node_exporterRequi
是时候解决告警事件数据孤岛问题了监控告警告警风暴
大家有没有发现，随着公司发展，慢慢引入了越来越多的监控、可观测性的系统，云上的、云下的，开源的、商业的，通用的、特定产品的，导致告警事件分散在非常多的地方，形成一个一个的数据孤岛。比如下面这些监控系统，你们应该不止用了一个吧：上图中有些系统你可能会困惑，比如OceanBase，明明是个数据库，为啥出现在这里。因为OceanBase自己内置有自己的监控能力，没有复用Prometheus之类的通用监控
构建高可用性、高性能和可扩展的Zabbix Server架构运维
简介本教程讲解了一下如何设计构建一个高性能、高可靠、高扩展的Zabbix监控集群。架构图架构图PDF下载：https://songxwn.com/file/Zabbix\_HA.pdfPigsty时序数据库集群ZabbixServer和Grafana的数据都是存放在数据库的，而Zabbix性能很大程度取决于数据库。所以要搭建数据库集群，提供性能和冗余性。(数据库最好使用SSD，最好是NVMESSD
Grafana 对接 Zabbix 数据源API错误运维
介绍主要报错为Invalidparams.Invalidparameter"/":unexpectedparameter"user".主要原因为Zabbix6.4.0以上的版本更新了API，导致Grafana的数据源插件不兼容。解决方案更新到最新的Grafana和grafana-zabbix插件即可。（大于4.2.10）grafana-clipluginsupgrade-all参考：https:/
Mysql性能监控及优化，基于Prometheus+grafana 士多啤莉娜 mysql prometheus grafana docker
本篇不详写prometheus、grafana的搭建，需要可以翻阅linux监控篇一、mysql监控1、运行mysql-exporter注：mysql的搭建在文章尾部，这里直接进入主题Prometheus对Mysql进行数据采集需要在被mysql所在服务器安装mysql-exporter注意修改命令中数据库连接信息dockerrun-d-p9104:9104-eDATA_SOURCE_NAME="
物联网服务器搭建及部署详细说明：掌握 Node.js、MongoDB、Socket.IO 和 JWT 的实用指南极客小张物联网服务器 node.js mongodb 数据库 json 运维开发
关键知识点目录1.环境准备1.1硬件要求1.2软件要求2.搭建步骤3.数据处理与存储3.1数据存储3.2数据实时处理3.2.1安装Socket.IO3.2.2修改服务器代码4.安全性4.1身份验证与授权4.2加密通信4.2.1生成自签名证书（开发环境）4.2.2修改服务器以支持HTTPS5.数据分析和可视化5.1集成Grafana5.2.2图表数据更新6.事件处理与报警6.1事件检测7.接口与集成
非容器化部署prometheus+grafana 罗sir 99 devops prometheus grafana
容器部署和非容器部署（直接在物理机或虚拟机上安装）Prometheus和Grafana各有优缺点，主要区别如下：1.部署和管理的便利性容器部署：使用容器技术（如Docker）可以简化应用的部署和配置。只需拉取镜像并执行dockerrun或docker-compose文件即可部署，且不依赖底层系统的配置，便于快速部署和迁移。非容器部署：需要手动下载二进制文件、解压、配置和管理，步骤相对繁琐。系统环境
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {