我藏起来的秘密

监控 prometheus及其部署及server discovery，alertmanager，grafana（更新结束）

prometheus

一、常用监控简介
- 1、cacti
- 2、Nagios
- 3、Zabbix
- zabbix核心组件介绍
- 4、Prometheus
二、运维监控平台设计思路
三、prometheus监控体系
- （一）监控体系：
四、Prometheus简介
- 1.Prometheus特点：
- 2.使用场景
- 3.不适合的场景
五、prometheus时序数据
- 1.数据来源:
- 2.收集数据:
- 3.prometheus(获取方式)
六、prometheus生态组件
- （一）Exporters介绍
- （二）alerts（告警）介绍
- （三）prometheus server
七、prometheus架构图
八、prometheus数据模型（什么是标签、什么是指标、什么是样本）
- （一）概述
- （一）指标类型
- (二)作业job和实例targets/instance
- （三）prometheusQL（数据查询语言也是时序数据库使用语言）
九、Prometheus部署实验
- （一)准备工作
- （二）安装包下载
- （三）服务开启
- - 1.解压安装包
  - 2.运行服务查看端口是否开启
  - 访问web页面（及页面介绍）
  - 访问页面在控制台使用语句查询
- （四）部署监控其他节点
- - 1.解压安装包，命令优化路径，设置服务控制，开启服务
  - 2.访问192.168.190.12:9100/metrics 查看抓取内容在这里插入代码片在这里插入代码片
  - 3.访问http://192.168.190.11:9090/ 点击—>status—>targets
- （五）同样方式部署server2、3节点192.168.190.13/192.168.190.14
- （六）使用prometheusQL过滤一些信息
- - (1)一般使用语句
  - (2)补充语句
  - - 2.1计算过去5分钟内的cpu使用率
    - 2.2每个节点cpu在5分钟内的平均使用率
    - 2.3其他使用指标
十、部署service discovery服务发现
- （一）相关概念
- （二）静态配置发现
- （三）动态发现
- - 1.基于文件服务发现
  - - 1）编写Prometheus.yml文件
    - 2）编写prometheus.yml文件发现指定的targets文件
    - 3）指定配置文件启动
    - 4）文件发现的作用
  - 2.基于DNS自动发现（仅作了解）
  - 3.基于consul发现
  - - 1）相关概念
    - 2)安装consul_1.9.0版本
    - 3)启动开发者模式
    - 4）编辑/etc/consul目录下的prometheus-servers.json配置文件
    - 5）创建consul自动发现的prometheus.yml文件
    - 6）注册其他node节点
十一、grafana部署及模板展示
- （一）centos系统上的部署步骤（版本7.3.6）
- （二）使用grafana对收集的数据做ui展示
十二、打标签（仅作了解）
- （一）重新打标定义
- （二）relabel config(重新打标配置)
十二、prometheus告警功能
- （一）定义:
- - 1.告警功能概述:
  - 2.通知告警信息
  - 3.prometheus监控系统的告警逻辑
十三、部署告警对接邮箱
- 1.修改alertmanager的配置文件
- 2.配置绑定的邮箱
- 3.启动alertmanager
- - 3.1相关的配置文件
- 4.prometheus启动文件
- 5.指定文件启动prometheus
- 6.模拟故障

监控的目的
1.记录，实时监测事务，对象的状态（异常状态），以便进行即时响应处理
2.监控对象，设置一个健康指标/监控值的一个标准，预警功能

一、常用监控简介

1、cacti

Cacti(英文含义为仙人掌〉是一套基于 PHP、MySQL、SNMP和 RRDtool开发的网络流量监测图形分析工具。
它通过snmpget来获取数据，使用RRDTool绘图，但使用者无须了解RRDTool复杂的参数。它提供了非常强大的数据和用户管理功能，可以指定每一个用户能查看树状结构、主机设备以及任何一张图，还可以与LDAP 结合进行用户认证，同时也能自定义模板，在历史数据的展示监控方面，其功能相当不错。
Cacti
通过添加模板，使不同设备的监控添加具有可复用性，并且具备可自定义绘图的功能，具有强大的运算能力（数据的叠加功能)

2、Nagios

Nagios是一款开源的免费网络监视工具，能有效监控windows、Linux和Unix的主机状态，交换机路由器等网络设置打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员，在状态恢复后发出正常的邮件或短信通知。

nagios主要的特征是监控告警，最强大的就是告警功能，可支持多种告警方式，但缺点是没有强大的数据收集机制，并且数据出图也很简陋，当监控的主机越来越多时，添加主机也非常麻烦，配置文件都是基于文本配置的，不支持web方式管理和配置，这样很容易出错，不宜维护。

3、Zabbix

zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。zabbix能监视各种网络参数，保证服务器系统的安全运营;并提供强大的通知机制以让系统运维人员快速定位/解决存在的各种问题。

zabbix由2部分构成，zabbix server与可选组件zabbix agent。zabbix server可以通过SNMP，zabbix
agent，ping，端口监视等方法提供对远程服务器/网络状态的监视，数据收集等功能，它可以运行在Linux，Solaris，HP-UX，AIX,Free BSD,Open BSD,os x等平台上。

zabbix解决了cacti没有告警的不足，也解决了nagios不能通过web配置的缺点，同时还支持分布式部署，这使得它迅速流行起来，zabbix也成为目前中小企业监控最流行的运维监控平台。
当然，zabbix也有不足之处，它消耗的资源比较多，如果监控的主机非常多时（服务器数量超过500台)，可能会出现监控超时、告警超时、告警系统单点故障等现象，不过也有很多解决办法，比如提高硬件性能、改变zabbix监控模式等。

agent代理：专门的代理服务方式进行监控，专属的协议，装有zabbix-agent的主机就可以被zabbix-server监控，主动或被动的方式，把数据给到server进行处理。
ssh/telent：linux主机支持ssh/telent协议
snmp：网络设备路由器、交换机不能安装第三方程序（agent），使用简单网络协议。大多数的路由器设备支持SNMP协议
ipmi：通过ipmi接口进行监控，我们可以通过标准的ipmi硬件接口，监控被监控对象的物理特征，比如电压，温度，风扇状态电源情况，被广泛使用服务监控中，包括采集cpu温度，风扇转速，主板温度，及远程开关机等等，而且ipmi独立于硬件和操作系统，无论是cpu，bios还是os出现故障，都不会影响ipmi的工作，因为ipmi的硬件设备BMC（bashboard management controller）是独立的板卡，独立供电

zabbix核心组件介绍

Zabbix Server:Zabbix软件实现监控的核心程序，主要功能是与Zabbixproxies和Agents进行交互、触发器计算、发送告警通知;并将数据集中保存。与prometheus的类似可以保存收集到的数据，但是prometheus告警需要使用alter manager组件
Database storage:存储配置信息以及收集到的数据
web Interface: Zabbix的GUI接口，通常与server运行在同一台机器上
Proxy:可选组件，常用于分布式监控环境中，一个帮助zabbix Server收集数据，分担zabbix Server的负载的程序
Agent:部署在被监控主机上，负责收集数据发送给server

4、Prometheus

作为一个数据监控解决方案，它由一个大型社区支持，有来自700多家公司的6300个贡献者，13500个代码提交和7200个拉取请求

Prometheus具有以下特性:

多维的数据模型(基于时间序列的Key、value键值对)
灵活的查询和聚合语言PromQL
提供本地存储和分布式存储
通过基于HTTP和HTTPS的Pull模型采集时间序列数据（pull数据的推送，时间序列：每段时间点的数据值指标，持续性的产生。横轴标识时间，纵轴为数据值，一段时间内数值的动态变化，所有的点连线形成大盘式的折线图）
可利用Pushgateway (Prometheus的可选中间件）实现Push模式
可通过动态服务发现或静态配置发现目标机器（通过consul自动发现和收缩）
支持多种图表和数据大盘

**补充：**open-Falcaon是小米开源的企业级监控工具，用GO语言开发，包括小米、滴滴、美团等在内的互联网公司都在使用它，是一款灵活、可拓展并且高性能的监控方案。

二、运维监控平台设计思路

1.数据收集模块
2.数据提取模块
3.监控告警模块

可以细化为6层

第六层:用户展示管理层	同一用户管理、集中监控、集中维护
第五层:告警事件生成层	实时记录告警事件、形成分析图表（趋势分析、可视化)
第四层:告警规则配置层	告警规则设置、告警伐值设置
第三层:数据提取层	定时采集数据到监控模块
第二层:数据展示层	数据生成曲线图展示（对时序数据的动态展示）
第一层:数据收集层	多渠道监控数据

三、prometheus监控体系

（一）监控体系：

系统层监控（需要监控的数据）
1.CPU、Load、Memory、swap、disk i/o、process等
2.网络监控：网络设备、工作负载、网络延迟、丢包率等

中简件及基础设施类监控
1.消息中间件：kafka、RocketMQ、等消息代理

2.WEB服务器容器：tomcat

3.数据库/缓存数据库：MySQL、PostgreSQL、MogoDB、es、redis
redis监控内容：

redis所在服务器的系统层监控
redis 服务状态
RDB AOF日志监控
日志——>如果是哨兵模式——>哨兵共享集群信息，产生的日志——>直接包含的其他节点哨兵信息及mysql信息

应用层监控
用于衡量应用程序代码状态和性能
#监控的分类#：黑盒监控，白盒监控

业务层监控
用于衡量应用程序的价值，如电商业务的销售量，ops、dau日活、转化率等，业务接口：登入数量，注册数、订单量、搜索量和支付量

四、Prometheus简介

谷歌的内部大型集群系统borg，是kubernetes的前身。其监控系统是Prometheus，而prometheus是其克隆版，所以非常契合k8s的监控对容器非常适用。

Prometheus是一套开源的监控、报警、时间序列、数据库的组合采集的样本以时间序列的方式保存在内存（TSDB时序数据库）中并定时保存到硬盘中（持久化）时序数据库不属于sql数据库也并不是nosql数据库
官网：https://prometheus.io/docs/concepts/data_model/

1.Prometheus特点：

自定义多维数据模型（时序列数据由metric名和一组key/value标签组成）
非常高效的储存平均一个采样数据占大约3.5bytes左右，320万的时间序列，每30秒采样，保持60天，消耗磁盘大概228G
在多维上灵活且强大的查询语句（PromQL）
不依赖分布式储存，支持单主节点工作
通过基于HTTP的pull方式采集时序数据
可以通过push gateway进行时序列数据库推送（pushing）
可以通过服务发现或静态配置去获取要采集的目标服务器
多种可视化图表及仪表盘支持

2.使用场景

Prometheus可以很好地记录任何纯数字时间序列。它既适用于以机器为中心的监视，也适用于高度动态的面向服务的体系结构的监视。在微服务世界中，它对多维数据收集和查询的支持是一种特别的优势。（k8s）

Prometheus是为可靠性而设计的，它是您在中断期间要使用的系统，可让您快速诊断问题。每个Prometheus服务器都是独立的，而不依赖于网络存储或其他远程服务。当基础结构的其他部分损坏时，您可以依靠它，并且无需设置广泛的基础结构即可使用它

3.不适合的场景

普罗米修斯重视可靠性。即使在故障情况下，您始终可以查看有关系统的可用统计信息。如果您需要100%的准确性（例如按请求计费)，则Prometheus并不是一个不错的选择，因为所收集的数据可能不会足够详细和完整。在这种情况下，最好使用其他系统来收集和分析数据以进行计费，并使用Prometheus进行其余的监视。

五、prometheus时序数据

时序数据，是在一段时间内通过重复测量(measurement）而获得的观测值的集合将这些观测值绘制于图形之上，它会有一个数据轴和一个时间轴，服务器指标数据、应用程序性能监控数据、网络数据等也都是时序数据;

1.数据来源:

prometheus基于HTTP call (http/https请求），从配置文件中指定的网络端点(endpoint/IP:端口）上周期性获取指标数据。
很多环境、被监控对象，本身是没有直接响应/处理http请求的功能，prometheus-exporter则可以在被监控端收集所需的数据，收集过来之后，还会做标准化，把这些数据转化为prometheus可识别，可使用的数据（兼容格式）

2.收集数据:

监控概念:白盒监控、黑盒监控
白盒监控:自省方式，被监控端内部，可以自己生成指标，只要等待监控系统来采集时提供出去即可
黑盒监控:对于被监控系统没有侵入性，对其没有直接"影响"，这种类似于基于探针机制进行监控（snmp协议）

Prometheus支持通过三种类型的途径从目标上"抓取（Scrape)"指标数据（基于白盒监控);

Exporters ——>工作在被监控端，周期性的抓取数据并转换为pro兼容格式等待prometheus来收集，自己并不推送
Instrumentation ——>指被监控对象内部自身有数据收集、监控的功能，只需要prometheus直接去获取
Pushgateway ——>短周期5s—10s的数据收集

3.prometheus(获取方式)

Prometheus同其它TSDB相比有一个非常典型的特性:它主动从各Target上拉取(pull)数据，而非等待被监控端的推送(push)

两个获取方式各有优劣，其中，Pull模型的优势在于:
集中控制:有利于将配置集在Prometheus server上完成，包括指标及采取速率等;
Prometheus的根本目标在于收集在rarget上预先完成聚合的聚合型数据，而非一款由事件驱动的存储系统
- 通过targets（标识的是具体的被监控端）
  比如配置文件中的 targets:['localhost:9090']

六、prometheus生态组件

prometheus生态圈中包含了多个组件，其中部分组件可选
1.Prometheus Server：收集和储存时间序列数据
通过scraping以刮擦的方式去获取数据放入storge（TSDB时序数据库），制定Rules/Alerts：告警规则，service discovery是自
动发现需要监控的节点

2.Client Library:客户端库，目的在于为那些期望原生提供Instrumentation功能的应用程序提供便捷的开发途径;

Push Gateway:接收那些通常由短期作业生成的指标数据的网关，并支持由Prometheus Server进行指标拉取操作;
Exporters:用于暴露现有应用程序或服务（不支持Instrumentation)的指标给Prometheus Server

3.Alertmanager:由告警规则对接，从Prometheus Server接收到"告警通知"后，通过去重、分组、路由等预处理功能后以高效向用户完成告警信息发送

4.Data Visualization（Dashboards）: 与TSDB对接并且展示数据库中的数据，Prometheus web UI (Prometheus Server内建)，及Grafana等;

5.Service Discovery:动态发现待监控的Target，从而完成监控配置的重要组件，在容器化环境中尤为有用;该组件目前由PropetheusServer内建支持

（一）Exporters介绍

node-exporter组件，因为prometheus抓取数据是通过http的方式调用的，假如抓取的数据是操作系统的资源负载情况，而linux操作系统内核是没有内置任何http协议的，并不支持直接通过http方式进行，所以需要在每个被监控端安装node-exporter，由其向内核中拿取各种状态信息，然后再通过prometheus兼容的指标格式暴露给prometheus

对于那些未内建Instrumentation，且也不便于自行添加该类组件以暴露指标数据的应用程序来说，常用的办法是于待监控的目标应用程序外部运行一个独立指标暴露程序，该类型的程序即统称为Exporter。

PS:Prometheus站点上提供了大量的Exporter，如果是docker技术跑多个服务就要使用docker-exportes

（二）alerts（告警）介绍

抓取异常值，异常值并不是说服务器的报警只是根据用户自定义的规则标准，prometheus通过告警机制发现和发送警示。
alter负责：告警只是prometheus基于用户提供的"告警规则"周期计算生成，好的监控可以事先预告报警、并提前处理的功能alter接受服务端发送来的告警指示，基于用户定义的告警路由（route）向告警接收人（receivers）发送告警信息（可由用户定义）

ps：在数据查询，告警规则里面会使用到promQL语句

（三）prometheus server

内建了数据样本采集器，可以通过配置文件定义，告诉Prometheus到哪个监控对象中采集指标数据，prometheus采集过后，会存储在自己内建的TSDB数据库中，提供了promQL，支持查询和过滤操作，同时支持自定义规则来作为告警规则，持续分析一场指标，一旦发生，通知给alter来发送报警信息，还支持对接外置的ui工具（grafana）来展示数据，prometheus自带的web展示图像信息比较简单。

采集、抓取数据是其自身的功能。但一般来自于export/instrumentation（指标数据的暴露）来完成，或者是服务自身的内建的测量系统来完成

七、prometheus架构图

1.prometheus-server:
retrieval(获取数据pull/discover），TSDB存储，HTPserver 控制台接口，内建了数据样本采集器，可以通过配置文件定义，告诉prometheus到那个监控对象中采集指标数据，prometheus采集过后，会存储在自己内建的TSDB数据库中(默认为2个月时间))，提供了promQL支持查询和过滤操作，同时支持自定义规则来作为告警规则，持续分析一场指标，一旦发生，通知给alerter来发送告警信息，还支持对接外置的UI工具 (grafana）来展示数据

2.pushgateway（短期周期任务）
允许短暂和批量作业将其指标暴露给普罗米修斯，由于这些类型的作业可能存在时间不足而被删除，因此他们可以将其指标推送到pushgateway，然后pushgateway将这些指标暴露给Prometheus-server端，主要用于业务数据汇报

3.exporters（常规任务—守护进程）
专门采集一些web服务，nginx，mysql服务。因为不适合直接通过http的方式采集数据，所以需要通过exporter采集数据（下载mysql_exporter，采集mysql数据指标）cadvisor：docker数据收集工具（docker也有自己内置的监控收集方式）

exporter和instrumtations，负责专门服务数据的收集然后暴露出来等待promtheus收集

4.service discovery：原生支持k8s的服务发现，支持consul、DNS等

5.prometheus内置TSDB数据库作为存储（时序数据的储存，promtheus的TSDB数据库默认保存15天，可以自行调整）
ps：时间序列数据库（时序数据库）主要用于指处理代表签（按照时间的顺序变化，既时间序列化）的数据，带时间标签的数据也成为时间序列数据，这是一种特殊类型的数据库，一般不会保存长时间的数据（与mysql相比）。
数据保存时间 storge.tsdb.retention=90d参数中修改即可（或启动时间指定）

6.alertmanagr：prometheus可以生成告警信息，但是不能直接提供告警，需要使用一个外置的组件altermanager来进行告警，emailetcd优势在于，收敛、支持静默、去重、可以防止告警信息的轰炸

7.data visualization：prometheus web ui（prometheus-server内建），也可以使用grafana

8.PrmoQL（告警规则编写），通常告警规则的文件指定输出到展示界面（grafana）

9.ui表达式浏览器（调试）

八、prometheus数据模型（什么是标签、什么是指标、什么是样本）

（一）概述

prometheus仅用键值方式存储时序式的聚合数据，他不支持文本信息

其中的"键"成为指标(metric)，通常意味着cpu速率、内存使用率或分区空闲比例等
同一指标可能适配到多个目标或设备、因而它使用"标签"作为元数据，从而为metric添加更多的信息描述维度例如三台设备，在同一时刻，都会产生例如1分组CPO负载的数据，他们都会使用相同的指标(metric)，而此时一个指标，如何表示时间序列?
比如：三个node节点都会有相同的指标（例如cpu0的负载那么就会使用相同的指标名称）
使用指标：标签=标签值的格式来表示，例如：local1 {host=node1,host=node2}

metric（cpu指标）：

cpu_usage{core='1',ip='192.168.190.11'} 14.04
key        cpu0      labels（元数据）      样本

prometheus每一份样本数据都包含了：

时序列标识：key+lables
当前时间序列的样本值value

这些标签可以作为过滤器进行指标过滤及聚合运算，如何从上万的数据过滤出关键有限的时间序列，同时从有限的时间序列在特定范围的样本那就需要手动编写出时间序列的样本表达式来过滤出我们需求的样本数据

（一）指标类型

默认都是以双精度浮点型数据（服务端无数据量类型数据）

counter : 计数器单调递增
gauge:仪表盘:有起伏特征的
histogram:直方图:
在一段时间范围内对数据采样的相关结果，并记入配置的bucket中，他可以存储更多的数据，包括样本值分布在每个bucket的数量，从而prometheus就可以使用内置函数进行计算:
计算样本平均值:以值得综合除以值的数量
计算样本分位值:分位数有助于了解符合特定标准的数据个数，例如评估响应时间超过1秒的请求比例，若超
过20%则进行告警等
summary，摘要，histogram的扩展类型，它是直接由监控端自行聚合计算出分位数，同时将计算结果响应给prometheus server的样本采集请求，因而，其分位数计算是由监控端完成

(二)作业job和实例targets/instance

job:能够接收prometheus server数据scrape
targets 每一个可以被监控的系统，成为targets多个相同的targets的集合（类）称为job
instance:实例与 targets（类似）
与target相比，instance更趋近于一个具体可以提供监控数据的实例，而targets则更像一个对象、目标性质

（三）prometheusQL（数据查询语言也是时序数据库使用语言）

支持两种向量，同时内置提供了一组用于数据处理的函数

即时向量：最近以此时间戳上跟踪的数据指标（一个时间点上的数据）
即时向量选择器：返回0个1个或者多个时间序列上在给定时间戳上的各自的一个样本，该样本成为即时样本
时间范围向量：指定时间范围内所有时间戳上的数据指标
范围向量选择器:返回0个1个或多个时间序列上在给定时间范围内的各自的一组样本（范围向量选择器无法用于绘图)

九、Prometheus部署实验

主机名	地址	安装包
prometheus	192.168.190.11	prometheus-2.27.1.linux-amd64.tar.gz
server1	192.168.190.12	node_exporter-1.1.2.linux-amd64.tar.gz
server2	192.168.190.13
server3	192.168.190.14

所需要的安装包：腾讯云盘：prometheus

（一)准备工作

关闭防火墙及安全机制，修改主机名

hostnamectl set-hostname prometheus		#其他主机分别设置server1.2.3
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
vim /etc/selinux/config
SELINUX=disabled

vim /etc/reslove.conf
nameserver 114.114.114.114

ntpdate ntp1.aliyun.com 		#时间同步

（二）安装包下载

方法一：同步源的方式下载
cat > letc/ yum.repos.d/prometheus.repo <<EOF
[prometheus] name=prometheus
baseurl=https://packagecloud.io/prometheus-rpm/release/el/$releasever/$basearch
repo gpgcheck=1 
enabled-1
gpgkey=https://packagecloud.io/prometheus-rpm/release/gpgkey
https://raw.githubusercontent.com/lest/prometheus-rpm/master/RPM-GPG-KEY-prometheus-rpmgpgcheck=1 metadata_expire=300
EOF

方法二：使用我提供的腾讯云盘下载解压或者官网下载
tar zxvf prometheus-2.27.1.linux-amd64.tar.gz -C /usr/local

（三）服务开启

1.解压安装包

tar zxvf prometheus-2.27.1.linux-amd64.tar.gz -C /usr/local

#默认配置文件
cd /usr/local/prometheus-2.27.1.linux-amd64

cat prometheus.yum
[root@server1 prometheus-2.27.1.linux-amd64]#cat prometheus.yml
# my global config
global:		//全局组件
  //每隔多久抓取一次指标，不设置默认1分钟
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  //内置告警规则的评估周期
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

//对接的altermanager
# Alertmanager configuration
alerting:
  alertmanagers:
  - static_configs:
    - targets:
      # - alertmanager:9093

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:		//告警规则
  # - "first_rules.yml"
  # - "second_rules.yml"

# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:		
  # The job name is added as a label `job=` to any timeseries scraped from this config.
  - job_name: 'prometheus'		//对于指标需要打上的标签，对于PrometheusSQL（查询语句）的标签：比如prometheus{target='values'}

    # metrics_path defaults to '/metrics' 		 //收集数据的路径
    # scheme defaults to 'http'.

    static_configs:		//对于Prometheus的静态配置监听端口具体数据收集的位置 默认的端口9090
    - targets: ['localhost:9090']

2.运行服务查看端口是否开启

#直接开启Prometheus
./prometheus
#另开一个终端查看9090端口
ss -natp | grep 9090

访问web页面（及页面介绍）

#查看表达式浏览器
访问192.168.190.11:9090		

#查看采集数据 Prometheus	会进行周期性的采集数据（完整的），多次周期性（在一个时间区间内）采集的数据集合，形成时间序列
访问192.168.190.11:9090/metrics

访问页面在控制台使用语句查询

1.搜索prometheus http请求统计

prometheus_http_requests_total

2.指定筛选code=302（也可以使用正则匹配）

（四）部署监控其他节点

prometheus想要监控其他节点，则需要借助node_exporter，下载地址http://prometheus.io/download/，腾讯云盘prometheus安装包

1.解压安装包，命令优化路径，设置服务控制，开启服务

tar zxvf node_exporter-1.1.2.linux-amd64.tar.gz

cd node_exporter-1.1.2.linux-amd64
cp node_exporter /usr/local/bin		#f复制命令让系统可以识别

./node_exporter --help		#查看命令可选项

#服务开启方式一，使用systemctl控制
[Unit]
Description=node_exporter
Documentation=https:/prometheus.io/
After=network.targets
[serveice]
Type=simple
User=prometheus
ExecStart=/usr/local/bin/node_exporter \
    --collector.ntp \
    --collector.mountstats \
    --collector.systemd \
    --collertor.tcpstat
ExecReload=/bin/kill -HUP $MAINPID
TimeoutStopSec=20s
Restart=always
[Install]
WantedBy=multi-user.target

#开启服务方法二，直接启动
./node_exporter		#开启服务不指定收集所有内容的话是收集所有信息

2.访问192.168.190.12:9100/metrics 查看抓取内容在这里插入代码片在这里插入代码片

3.访问http://192.168.190.11:9090/ 点击—>status—>targets

需要在192.168.190.11 prometheus服务端停止prometheus修改配置文件添加静态targets才能使得server1节点加入

netstat -nautp | grep prometheus
killall -9 prometheus

vim /usr/local/prometheus-2.27.1.linux-amd64/prometheus.yml
-----某行添加------
- job_name: 'nodes'
    static_configs:
    - targets:
      - 192.168.190.12:9100
      - 192.168.190.13:9100
      - 192.168.190.14:9100
:wq
./prometheus	#启动服务

（五）同样方式部署server2、3节点192.168.190.13/192.168.190.14

在server1上操作
scp /root/node_exporter-1.1.2.linux-amd64 root@192.168.190.13:/root
scp /root/node_exporter-1.1.2.linux-amd64 root@192.168.190.14:/root
cd /root/node_exporter-1.1.2.linux-amd64/
./node_exporter
#或者优化路径
cp node_exporter /usr/local/bin
./node_exporter
---或者放入安装包解压---执行

192.168.190.11：9090查看网页

（六）使用prometheusQL过滤一些信息

(1)一般使用语句

点击graph查看收集数据

node_cpu_seconds_total{cpu=“0”,instance=“192.168.190.13:9100”}

{job=“nodes”, mode=“idle”}

(2)补充语句

2.1计算过去5分钟内的cpu使用率

irate{job="nodes", mode="idle"}[5m]
---解释---
irate：速率计算函数（灵敏度非常高的）
node_cpu_seconds_total:node节点cpu使用总量
mode="idle"是cpu空闲指标
5m过去5分钟内所有cpu空闲的样本值

2.2每个节点cpu在5分钟内的平均使用率

（1- avg（node_cpu_seconds_total{mode='idle'}[5m]))by (instance))* 100
---解释---
avg平均值
（1- avg（node_cpu_seconds_total{mode='idle'}[5m]))：减去空闲率就是使用率

2.3其他使用指标

1.查询1分|钟平均负载超过主机CPU数量两倍的时间序列

node_load1 > on (instance)2 * count (node_cpu_seconds_total{mode='idle'}) by(instance)

2.内存使用率

node_memory _MemTotal_bytes
node_memory_MemFree_bytes
node_memory_Buffers bytes
node_memory_Cached_bytes

3.计算使用率
可用空间:以上后三个指标之和
己用空间:总空间减去可用空间
使用率:己用空间除以总空间

十、部署service discovery服务发现

（一）相关概念

Prometheus指标抓取的生命周期
发现->配置-> relabel ->指标数据抓取-> metrics relabel
Prometheus的服务发现

基于文件的服务发现;
基于DNS的服务发现;
基于API的服务发现:Kubernetes、Consul、Azure、重新标记
target重新打标
metric重新打标

Prometheus Server的数据抓取工作于Pull模型，因而，它必需要事先知道各Target的位置，然后才能从相应的Exporter或Instrumentation中抓取数据

对于小型的系统环境来说，通过static_configs指定各Target便能解决问题，这也是最简单的配置方法;每个Targets用一个网络端点(ip:port）进行标识;
对于中大型的系统环境或具有较强动态性的云计算环境来说，静态配置显然难以适用;因此，Prometheus为此专门设计了一组服务发现机制，以便于能够基于服务注册中心（服务总线）自动发现、检测、分类可被监控的各Target，以及更新发生了变动的Target

指标抓取的生命周期
在每个scrape_interval期间，Prometheus都会检查执行的作业(Job) ;这些作业首先会根据Job上指定的发现配置生成target列表，此即服务发现过程;服务发现会返回一个Target列表，其中包含一组称为元数据的标签，这些标签都以" meta_"为前缀;

服务发现还会根据目标配置来设置其它标签，这些标签带有"“前缀和后缀，b包括"scheme”、" address"和" metrics path _"，分别保存有target支持使用协议(http或https，默认为http) 、 target的地址及指标的URI路径（默认为/metrics) ;
若URI路径中存在任何参数，则它们的前缀会设置为" param "
这些目标列表和标签会返回给Prometheus，其中的一些标签也可以配置中被覆盖;
配置标签会在抓取的生命周期中被重复利用以生成其他标签，例如，指标上的instance标签的默认值就来自于address标签的值;

对于发现的各目标，Prometheus提供了可以重新标记（relabel）目标的机会，它定义在job配置段的relabel_config配置中，常用于实现如下功能

将来自服务发现的元数据标签中的信息附加到指标的标签上
过滤目标
之后便是数据抓取，以及指标返回的过程，抓取而来的指标在保存之前，还允许用户对指标重新打标过滤的方式：
它定义在job配置段的metric_relabel_configs配置中，常用于实现如下功能
删除不必要的指标
从指标中删除敏感或者不需要的标签
添加、编辑或者修改指标的标签值或标签格式

（二）静态配置发现

#修改prometheus服务器上的配置为文件，指定targets的端口上面配置过
- job_name: 'nodes'
  static_config:
  - targets:
    - 192.168.190.12:9100
    - 192.168.190.13:9100
    - 192.168.190.14:9100
------------------------------
prometheus默认指定的是9100，所以我们默认指定9100即可，同时，在进行展示的时候，我们默认会在URL中加入/metric路径（做为指标采集的端点），若不是这个，则需要使用metrics_path进行指定同时在时间序列浏览器上会显示”up“状态的时序状态”1“为正常值

（三）动态发现

1.基于文件服务发现

192.168.190.11
基于文件的服务发现仅仅略优于静态配置的服务发现方式，它不依赖于任何平台或第三方服务，因而也是最为简单和通用的实现方式。
prometheus server定期从文件中加载target信息（pro-server pull指标发现机制-job_name 获取我要pull的对象target）文件可以只用json和yaml格式，它含有定义的target列表，以及可选的标签信息；以下第一配置，能够将prometheus默认的静态配置转换为基于文件的服务发现时所需的配置；（rometheus会周期性的读取、重载此文件中的配置，从而达到动态发现、更新的操作）

1）编写Prometheus.yml文件

#prometheus服务端
- targets:
  - localhost:9090
  labels:
    app: prometheus
    job: prometheus
#node节点  
 - targets:
   - localhost: 9100
   labels:
     app: node-exporter
     job: node
----------------------------
以上文件可有另一个系统生成，例如Puppet、Ansible或saltstack等配置管理系统，也可能是由脚本基于CMDB定期查询生成

cd /usr/local/prometheus-2.27.1.linux-amd64/
#切换到prometheus的工作目录
mkdir file_sd && cd files_sd
mkdir targets

将修改后的prometheus.yml.0上传至该文件夹中,或者直接编写yml文件
cat prometheus.yml.0
mv prometheus.yml.0 prometheus.yml

vim prometheus.yml
------只列出与静态Prometheus.yml文件区别的地方-------
 - job_name: 'prometheus'

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.

    file_sd_configs:
    - files:
      - targets/prometheus_*.yaml
      refresh_interval: 2m

  # All nodes
  - job_name: 'nodes'
    file_sd_configs:
    - files:
      - targets/nodes_*.yaml
      refresh_interval: 2m
 :wq

2）编写prometheus.yml文件发现指定的targets文件

cd targets
[root@prometheus targets]#ls
nodes_centos.yaml  prometheus_server.yaml
或者编写两个yml文件，文件名就是prometheus.yml指定的文件名
------------------------------------------------------
[root@prometheus targets]#vim prometheus_server.yaml
- targets:
  - 192.168.190.11:9090
  labels:
    app: prometheus
    job: prometheus
-------------------------------------------------------
[root@prometheus targets]#vim nodes_centos.yaml 
- targets:
  - 192.168.190.12:9100
  - 192.168.190.13:9100
  - 192.168.190.14:9100
  labels:
    app: node-exporter
    job: node

3）指定配置文件启动

cd /usr/local/prometheus-2.27.1.linux-amd64
./prometheus --config.file=./file_sd/prometheus.yml

注意在node节点开启服务

cd node_exporter-1.1.2.linux-amd64/
./node_exporter

注意：

killall prometheus
netstat -nautp | grep prometheus

4）文件发现的作用

如果增加node或者prometheus服务端节点只需更改nodes_centos.yaml prometheus_server.yaml两个文件添加地址就行，不需要停止服务

2.基于DNS自动发现（仅作了解）

基于DNS的服务发现针对一组DNS域名进行定期查询，以发现待监控的目标查询时使用的DNS服务器由/etc/resolv.conf文件指定;
该发现机制依赖于A、AAAA和SRv资源记录，且仅支持该类方法，
尚不支持RFC6763中的高级DNS发现方式
PS:
##SRV: SRV记录的作用是指明某域名下提供的服务。实例:
_http._tcp.example.com.SRV 10 5 80. www.example.comSRV后面项目的含义:
10 -优先级，类似MX记录
5 -权重
80-端口
www.example.com -实际提供服务的主机名。同时SRV可以指定在端口上对应哪个service
##hprometheus 基于Dws的服务中的SRV记录，让prometheus发现指定target上对应的端口对应的是exporter或instrumentation

3.基于consul发现

192.168.190.11

1）相关概念

一款基于golang开发的开源工具，主要面向分布式，服务化的系统提供服务注册、服务一发现和配置管理的功能提供服务注册/发现、健康检查、Key/Value存储、多数据中心和分布式一致性保证等功能

原理:通过定义json文件将可以进行数据采集的服务注册到consul中，用于自动发现同时使用prometheus做为client端获取consul上注册的服务，从而进行获取数据

2)安装consul_1.9.0版本

unzip consul_1.9.0_linux_amd64.zip -d /usr/local/bin

3)启动开发者模式

consul开发者模式，可以快速开启单节点的consul服务，具有完整功能，方便开发测试

mkdir -pv /consul/data/
mkdir /etc/consul && cd /etc/consul
consul agent -dev -ui -data-dir=/consul/data/ \
-config-dir=/etc/consul/ -client=0.0.0.0
-----------
agent -dev:运行开发模式
agent -server：运行server模式
-ui：ui界面
-data-dir：数据位置
/etc/consul:可以以文件形式定义各个services的配置，也可以基于api接口直接配置
-client：监听地址

4）编辑/etc/consul目录下的prometheus-servers.json配置文件

vim /etc/condul/prometheus-servers.json
{
  "services": [
    {
      "id": "prometheus-server-node01",
      "name": "prom-server-node01",
      "address": "192.168.190.11",
      "port": 9090,
      "tags": ["prometheus"],
      "checks": [{
        "http": "http://192.168.190.11:9090/metrics",
        "interval": "5s"
      }]
    }
  ]
}

#重载配置文件
consul reload
或使用consul service register /etc/consul/prometheus-servic.json

cd ~ 
./prometheus

浏览器访问 192.168.190.11:8500

5）创建consul自动发现的prometheus.yml文件

cd /usr/local/prometheus-2.27.1.linux-amd64/
mkdir consul-sd && cd consul_sd
vim prometheus.yml
-------只列出job部分----------
  - job_name: 'prometheus'

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.

    consul_sd_configs:
    - server: "192.168.190.11:8500"
      tags:
      - "prometheus"
      refresh_interval: 2m

  # All nodes
  - job_name: 'nodes'
    consul_sd_configs:
    - server: "192.168.190.11:8500"
      tags:
      - "nodes"
      refresh_interval: 2m

#指点配置文件启动
cd /usr/local/prometheus-2.27.1.linux-amd64/
killall prometheus
./prometheus --config.file=./consul_sd/prometheus.yml
#开启consul服务
consul agent -dev -ui -data-dir=/consul/data/ \
-config-dir=/etc/consul/ -client=0.0.0.0

6）注册其他node节点

1.在192.168.190.11 /etc/consul/目录下编辑nodes.json文件

vim nodes.json 

{
  "services": [
    {
      "id": "node_exporter-node01",
      "name": "node01",
      "address": "192.168.190.12",
      "port": 9100,
      "tags": ["nodes"],
      "checks": [{
        "http": "http://192.168.190.12:9100/metrics",
        "interval": "5s"
      }]
    },
    {
      "id": "node_exporter-node02",
      "name": "node02",
      "address": "192.168.190.13",
      "port": 9100,
      "tags": ["nodes"],
      "checks": [{
        "http": "http://192.168.190.13:9100/metrics",
        "interval": "5s"
      }]
    }
  ]
}

#重载配置文件
consul reload

2.启动node节点
如果node节点没有上线重启以下node节点服务./node_exporter
浏览器访问192.168.190.11:9090 / 192.168.190.11:8500

十一、grafana部署及模板展示

grafana是一款基于go语言开发的通用可视化工具，支持从不同的数据源加载并展示数据，可作为其数据源的部分储存系统如下所示：

TSDB：Prometheus、IfluxDB、OpenTSDB和Graphit
日志和文档存储：Loki和ElasitchSearch
分布式请求跟踪：Zipkin、Jaeger和Tenpo
SQL DB：Mysql、PostgreSQL和Microsoft SQL server

grafana基础默认监听于TCP协议的3000端口，支持集成其他认证服务，且能够通过/metrics输出内建指标；

数据源（Data Source）：提供用于展示的数据的储存系统
仪表盘（Dashboard）：组织和管理数据的可视化面板（Panel）
团队和用户：提供了面向企业组织层级的管理能力；

（一）centos系统上的部署步骤（版本7.3.6）

wget https://mirros.huaweicloud.com/grafana/7.3.6/grafana-7.3.6-1.x86_64.rpm
yum install grafana-7.3.6-1.x86_64.rpm

#docker容器运行方式
VERSION=7.3.6
docker run -d --name=grafana -p 3000:3000 grafana/grafana
  
#账号密码默认为admin,admin
grafana默认配置文件目录 /etc/grafana/grafana.ini

#直接访问ip:8500进入grafana控制台

#grafana模板
https://grafana.com/grafana/dashboards

默认密码 admin admin
vim /etc/grafana/grafana.ini 
170-180左右标识密码用户 security模块

启动服务

systemctl start grafana-server
systemctl status grafana

浏览器访问 192.168.190.11:3000

（二）使用grafana对收集的数据做ui展示

edit编写prometheus语句生成图表

添加node1数据

在官网中下载官方模板

https://grafana.com/grafana/dashboards

十二、打标签（仅作了解）

（一）重新打标定义

对target重新打标是在数据抓取之前动态重写target标签的强大工具，在每个数据抓取配置中，可以定义多个relabel步骤，它们将按照定义的顺序依次执行;
对于发现的每个target，Prometheus默认会执行如下操作

job的标签设定为其所属的job name的值;
_address_标签的值为该target的套接字地址":"
instance标签的值为_address_的值;
_scheme_标签的值为抓取该target上指标时使用的协议(http或https) ;
_metrics _path_标签的值为抓取该target上的指标时使用URI路径，默认为/metrics;⑥
param_标签的值为传递的URL参数中第一个名称为的参数的值

重新标记期间，还可以使用该target上以"meta "开头的元标签;

各服务发现机制为其target添加的元标签会有所不同;

重新标记完成后，该target上以""开头的所有标签都会被移除;

若在relabel的过程中需要临时存储标签值，则要使用tmp标签名称为前缀进行保存，以避免同Prometheus的内建标签冲突

（二）relabel config(重新打标配置)

修改标签值、增加删除标签，通过调用不同参数实现自己的需求

source_labels：指定调用哪些已有的标签（可引用多个）在重新打标的时候会将这些标签对应的值给引用/提取并连接起来，例如: cpu指标{host=node1; host=node2 }
target_labels：与source_labels组合使用，可以指定使用哪个已有标签赋值给指定的新标签
separator：对应源标签的标签值使用什么连接符，默认为" ;"
regex：对于源标签，使用哪个正则表达式对源标签进行模式匹配、匹配后可以将对应的结果复制到target上，赋值方式:(引用所有正则表达式的内容进行赋值)
modulus ： : hash算法函数
replacement ：把目标标签的值改为新的值
action ：表示重新打标的方式是什么，以及要实现什么功能

十二、prometheus告警功能

Prometheus对指标的收集、存储同告警能力分属于Prometheus Server和AlertManager(通用的组件)两个独立的组件，前者仅负责基于"告警规则"生成告警通知，具体的告警操作则由后者完成;

Alertmanager负责处理由客户端发来的告警通知客户端通常是Prometheus server，但它也支持接收来自其它工具的告警;
Alertmanager对告警通知进行分组、去重后，根据路由规则将其路由到不同的receiver，如Email、短信或PagerDuty等;

目前Alertmanager还不支持钉钉，那用户完全可以通过Webhook与钉钉机器人进行集成，从而通过钉钉接收告警信息。同时AltManager还提供了静默和告警抑制机制来对告警通知行为进行优化
PS:webhook是一个APr概念, webhoo是一种web回调或者http的push APT.Webhook作为一个轻量的事件处理应用

（一）定义:

1.告警功能概述:

prometheus对指标的收集、存储与告警能力分属于Prometheus serve和alertmanager两个独立的组件，pro-server只负责通过"告警规则"生成告警通知，具体告警操作是由alertmmanager完成

告警规则：
是由PromQL编写的布尔值表达式使用>< =与一个常用量值，比如80%进行比较，其返回值为true或false

prometheus-server对抓取到的指标序列与告警规则中做为比较的Prometheus匹配，则会把此样本值抓取过来作比较，若返回值为true则认为指标异常，不能满足false，则为正常值以上表达式为告警规则表达式
比如：筛选一个指标数据cpu使用率<0%系统异常

2.通知告警信息

一旦条件表达式为true了就会触发通知信息，送给altermanager，由alter借助特定服务的API或者访问入口，将此信息发出去一般称为告警媒介，也可以借助邮件进行告警SMTP

3.prometheus监控系统的告警逻辑

route：告警路由，分组、分类分发告警消息给不同渠道

prometheus通过alter-rule规则，生成告警通知给altermanager
altermanager会生成本地的告警路由表（第一路由默认称为根路由，所有的告警信息都需要一个根路由，没有一个匹配项，则需要设置一个默认路由）为实现将特定的信息发送给特定的用户
例如：
按消息级别来看，严重、中等、普通级别，红色报警、蓝色报警，应用发送方
按分组：业务运维、系统运维、基础设施运维、k8s运维

1.告警功能:
除了基本的告警通知能力外，Altermanager还支持对告警进行去重、分组、抑制、

2.静默、抑制、分组等功能;

分组（Grouping):将相似告警合并为单个告警通知的机制，在系统因大面积故障而触发告警潮时，分组机制能避免用户被大量的告警噪声淹没，进而导致关键信息的隐没;
抑制(Inhibition):系统中某个组件或服务故障而触发告警通知后，那些依赖于该组件或服务的其它组件或服务可能也会因此而触发告警，抑制便是避免类似的级联告警的一种特性，从而让用户能将精力集中于真正的故障所在;
静默(silent):是指在一个特定的时间窗口内，即便接收到告警通知，Alertmanager也不会真正向用户发送告警信息的行为;通常，在系统例行维护期间，需要激活告警系统的静默特性;

路由(route):用于配置Alertmanager如何处理传入的特定类型的告警通知，其基本逻辑是根据路由匹配规则的匹配结果来确定处理当前告警通知的路径和行为

十三、部署告警对接邮箱

192.168.190.11
在prometheus-server端定义告警规则，指定alertmanager的位置，将告警信息发送给alert处理

tar zxvf alertmanager-0.22.2.linux-amd64.tar.gz -C /usr/local/
ln -s /usr/local/alertmanager-0.22.2.linux-amd64/ /usr/local/alertmanager

#查看配置文件
cat /usr/local/alertmanager/alertmanager.yml
route:			#路由信息
  group_by: ['alertname']		#分组
  group_wait: 30s		 #分组缓冲/等待时间
  group_interval: 5m	 #重新分组时间
  repeat_interval: 1h	 #重新告警间隔
  receiver: 'web.hook'	 #接收方/媒介
receivers:
- name: 'web.hook'
  webhook_configs:
  - url: 'http://127.0.0.1:5001/'	#标注5001端口
inhibit_rules:		#抑制规则的策略
  - source_match:	#匹配项
      severity: 'critical'	#严重的级别
    target_match:
      severity: 'warning'	#target匹配warning级别
    equal: ['alertname', 'dev', 'instance']		#符合alertname、dev、instance

1.修改alertmanager的配置文件

mv /usr/local/alertmanager/alertmanager.yml /usr/local/alertmanager/alertmanager.yml.bak
cd /usr/local/alertmanager && vim /alertmanager.yml
global:		#全局参数
  resolve_timeout: 5m	
  smtp_from: 984836061@qq.com
  smtp_auth_username: 984836061@qq.com
  smtp_auth_password: bbsoubjcupxfbdff
  smtp_require_tls: false
  smtp_smarthost: 'smtp.qq.com:465'

route:
  group_by: ['alertname']
  group_wait: 10s
  group_interval: 10s
  repeat_interval: 1h
  receiver: 'email-test'
receivers:
- name: 'email-test'
  email_configs:
  - to: 984836061@qq.com
    send_resolved: true

2.配置绑定的邮箱

登入邮箱——>设置——>账户——>pop3/IMAO/SMTP/Exchange/CardDVA/——>开启

3.启动alertmanager

cd /usr/loca/alertmanager
./alertmanager

3.1相关的配置文件

cd /usr/local/alertmanager/prometheus-2.27.1.linux-amd64/
mkdir alert-config
cd alert-config
mdkir [alert_rules,targets]
cd alert_rules

[root@prometheus alert_rules]#vim instance_down.yaml 
#邮件会接收到的信息
groups:
- name: AllInstances
  rules:
  - alert: InstanceDown		#节点服务挂掉 
    # Condition for alerting
    expr: up == 0			#up状态为0时
    for: 1m
    # Annotation - additional informational labels to store more information
    annotations:
      title: 'Instance down'
      description: Instance has been down for more than 1 minute.'
    # Labels - additional labels to be attached to the alert
    labels:
      severity: 'critical'		#告警级别

cd ../targets
[root@prometheus targets]#vim alertmanagers.yaml 

- targets:
  - 192.168.190.11:9093
  labels:
    app: alertmanager

[root@prometheus targets]#vim nodes-linux.yaml 

- targets:
  - 192.168.190.11:9100
  - 192.168.190.12:9100
  - 192.168.190.13:9100
  labels:
    app: node-exporter
    job: node

[root@prometheus targets]#vim prometheus-servers.yaml 

- targets:
  - 192.168.190.11:9090
  labels:
    app: prometheus
    job: prometheus

4.prometheus启动文件

[root@prometheus alert-config]#vim /usr/local/alertmanager/alert-config/prometheus.yml 

# my global config
# Author: MageEdu 
# Repo: http://gitlab.magedu.com/MageEdu/prometheus-configs/
global:
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration
alerting:
  alertmanagers:
  - file_sd_configs:
    - files:
      - "targets/alertmanagers*.yaml"

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  - "rules/*.yaml"
  - "alert_rules/*.yaml"

# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:
  # The job name is added as a label `job=` to any timeseries scraped from this config.
  - job_name: 'prometheus'
    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.
    file_sd_configs:
    - files:
      - targets/prometheus-*.yaml
      refresh_interval: 2m

  # All nodes
  - job_name: 'nodes'
    file_sd_configs:
    - files:
      - targets/nodes-*.yaml
      refresh_interval: 2m

  - job_name: 'alertmanagers'
    file_sd_configs:
    - files:
      - targets/alertmanagers*.yaml
      refresh_interval: 2m

5.指定文件启动prometheus

cd /usr/local/alertmanager
./prometheus --config.file=./alert-config/prometheus.yml

192.168.190.11:9090

6.模拟故障

你可能感兴趣的:(运维,prometheus)

云计算中的“按需扩展”和“自动扩展”有何不同？云上的阿七云计算
在云计算中，“按需扩展”（On-DemandScaling）和“自动扩展”（AutoScaling）都是提升系统灵活性的重要机制，但它们在触发方式、控制方式和应用场景上有所不同。1.按需扩展（On-DemandScaling）概念：按需扩展是指手动调整计算资源的规模，以适应业务需求。例如，当访问量增长时，管理员可以手动添加服务器；当负载降低时，手动释放资源，以控制成本。特点：触发方式：由运维人员或
六西格玛设计培训如何破解风电设备制造质量与成本困局张驰课堂六西格玛培训精益六西格玛六西格玛设计 DFSS 六西格玛黑带培训六西格玛项目
2023年，中国风电行业装机容量突破4.3亿千瓦，稳居全球第一，但高速扩张背后暗藏隐忧：质量痛点：叶片开裂、齿轮箱故障等缺陷频发，运维成本占项目全生命周期成本超30%；成本压力：原材料价格波动、海外技术壁垒倒逼国产替代，企业毛利率普遍承压；-交付风险：项目周期长、供应链协同复杂，延期交付导致巨额违约金。行业共识已清晰：单纯依赖规模扩张的时代终结，向管理要效益成为必选项。而六西格玛设计（DFSS）与
AWS Amazon Aurora MySQL 性能监控与安全治理实战指南 ivwdcwso 运维 aws mysql 安全 rds
引言AmazonAuroraMySQL凭借其云原生架构和高性能特性，已成为企业核心数据库的首选。然而，缺乏体系化的监控与安全治理可能导致资源浪费、性能瓶颈甚至数据泄露。本文结合AWS官方最佳实践与真实运维场景，从监控工具、性能调优、安全加固到自动化治理，构建全链路解决方案。©ivwdcwso(ID:u012172506)一、监控体系搭建：工具选型与指标解读1.原生工具组合：精准捕捉核心指标Clou
探秘【Orion-Visor】：打造高效运维的新纪元许煦津
探秘【Orion-Visor】：打造高效运维的新纪元去发现同类优质开源项目:https://gitcode.com/在数字化转型的浪潮中，运维管理的智能化与用户体验的提升成为了新一代系统开发的关键。今天，我们向您隆重介绍一款名为Orion-Visor的高颜值智能运维&轻量级堡垒机平台，它以现代设计和强大功能，重新定义了服务器运维的标准。项目介绍Orion-Visor，以其简洁直观的界面和丰富实用的
【赵渝强老师】监控Redis 数据库nosqlredis
对运行状态的Redis实例进行监控是运维管理中非常重要的内容，包括：监控Redis的内存、监控Redis的吞吐量、监控Redis的运行时信息和监控Redis的延时。通过Redis提供的监控命令便能非常方便地实现对各项指标的监控。一、监控Redis的内存视频讲解如下：https://www.bilibili.com/video/BV1mi28YXE14/?aid=113294358616...Red
集群、分布式和微服务 happy_king_zi 微服务分布式分布式微服务架构
一、架构演变从单机结构到集群结构，你的代码基本无需要作任何修改，你要做的仅仅是多部署几台服务器，每台服务器上运行相同的代码就行了。但是，当你要从集群结构演进到微服务结构的时候，之前的那套代码就需要发生较大的改动了。所以对于新系统我们建议，系统设计之初就采用微服务架构，这样后期运维的成本更低。但如果一套老系统需要升级成微服务结构的话，那就得对代码大动干戈了。所以，对于老系统而言，究竟是继续保持集群模
linux-运维进阶-28 LNMP动态网站架构 IT@feng Linux-运维进阶 LNMP linux
linux-运维进阶-28LNMP动态网站架构LNMP动态网站架构LNMP动态网站部署架构是一套由Linux+Nginx+MySQL+PHP组成的动态网站系统解决方案。LNMP中的字母L是Linux系统的意思，不仅可以是RHEL、CentOS、Fedora，还可以是Debian、Ubuntu等系统开发环境的部署在使用源码包安装服务程序之前，首先要让安装主机具备编译程序源码的环境，他需要具备C语言、
2024年运维最新linux 使用docker安装 postgres 教程，踩坑实践，2024年最新GitHub已标星16k 2401_84139624 程序员运维 linux docker
为了做好运维面试路上的助攻手，特整理了上百道【运维技术栈面试题集锦】，让你面试不慌心不跳，高薪offer怀里抱！这次整理的面试题，小到shell、MySQL，大到K8s等云原生技术栈，不仅适合运维新人入行面试需要，还适用于想提升进阶跳槽加薪的运维朋友。本份面试集锦涵盖了174道运维工程师面试题128道k8s面试题108道shell脚本面试题200道Linux面试题51道docker面试题35道Je
数据中心运维人员进阶管理指南-突破职业瓶颈，构建多维竞争力数据中心运维高级工程师运维职场和发展面试学习方法程序人生大数据
引言：运维人的“困局”在数字化浪潮席卷全球的今天，数据中心已然成为企业运营的核心基础设施，而运维人员则是保障数据中心稳定运行的幕后英雄。随着数据中心规模的不断扩大和技术复杂度的提升，运维人员的角色也在悄然发生着转变。从专注于技术难题的攻克，到肩负起团队管理和战略规划的重任，进阶为管理者是许多运维人员职业生涯的重要转折点。本文将探讨数据中心运维人员的进阶路径，助你在职业上更上一层楼。一、目的本文旨在
oracle 6508,【案例】Oracle报错ORA-06552 ORA-06553 ORA-006508解决办法一条胖咸鱼 oracle 6508
天萃荷净Oracle研究中心案例分析：运维DBA反映Oracle数据库alert日志中出现大量ORA-06552ORA-06553ORA-006508报错，分析原因为存储过程异常导致，结合MOS官方解决办法。下面数据库来至于一个朋友，他们生产数据库alert.log后台不到的停下面类似的错误，每次报错都是不同的存储过程名。ErrorsinfileD:\APP\LUOPING\diag\rdbms\
自学网络安全（黑客技术）2025年 —三个月学习计划 csbDD web安全安全网络 python linux
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习
生产环境超实用shell脚本一运维linux运维shell
生产环境超实用shell脚本一Shell脚本作为一种强大的自动化工具，能够帮助运维人员轻松应对各种复杂的任务。本文将为您介绍服务器健康检查、日志清理、备份以及监控等多个方面，并详细阐述每个脚本的功能和应用场景，助力您提升运维效率，确保生产环境的稳定运行。服务器健康检查脚本功能:检查服务器的CPU、内存、磁盘、网络等资源使用情况，以及关键服务状态。应用场景:定期监控服务器健康状况，及时发现潜在问题。
Ubuntu 常用运维脚本大全（30个干货）运维
1.系统资源监控#!/bin/bash#监控CPU/内存/磁盘echo"CPU负载:$(uptime|awk-F'loadaverage:''{print$2}')"echo"内存使用:$(free-m|awk'/Mem/{print$3"MB/"$2"MB"}')"echo"磁盘使用:$(df-h/|awk'NR==2{print$5}')"2.进程监控脚本#!/bin/bash#检测指定进程是
Linux运维基础全景指南向贤运维运维 linux 服务器
Linux运维基础全景指南——从入门到精通的系统化管理手册一、Linux系统架构核心认知1.文件系统层次结构（FHS）记忆口诀：根目录下一堆，bin存命令，etc存配置，home放用户，var放变量，tmp临时文件，dev设备挂。目录核心作用典型内容示例/bin基础命令ls,cp,mv,cat/etc系统配置文件nginx.conf,passwd/var动态数据logs,databases/dev
认证支持全面碾压？Apipost的OAuth2.0与ASAP实战演示，Apifox用户看完扎心了
认证缺失的隐秘危机，你可能正在裸奔调试当开发者沉浸在接口调试的逻辑快感中时，往往容易忽视一个致命环节——认证机制。试想：你的API请求未携带合法令牌，就像用密码"123456"登录银行账户；你的OAuth2.0流程配置错误，相当于把用户隐私直接暴露在公网。更讽刺的是，80%的开发者认为认证是运维的职责，却在实际调试中反复踩坑：授权头缺失、令牌过期、回调地址配置错误...这些看似基础的问题，轻则导致
模块一：Docker基础入门（一） GODLIKENESS Docker docker 容器深度学习运维
Docker革命：为什么容器化是云时代的基石？被依赖地狱折磨的开发者们“在我机器上是好的啊！”——这句开发者的经典辩解，背后暴露的是环境差异带来的致命问题。想象这样的场景：运维人员部署Python应用时发现，测试环境的requests2.25.1在生产环境变成了requests3.0.0团队新人花一整天配置RubyonRails环境，却因macOS与Linux的文件系统差异导致bundleinst
2024年linux——环境基础开发工具使用_gcc test file(4)，2024年最新程序设计+Linux运维+Web+数据库+框架+分布式 2401_83740189 程序员运维 linux 前端
最全的Linux教程，Linux从入门到精通======================linux从入门到精通(第2版)Linux系统移植Linux驱动开发入门与实战LINUX系统移植第2版Linux开源网络全栈详解从DPDK到OpenFlow第一份《Linux从入门到精通》466页====================内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linu
Linux 服务器日常维护清单，运维必备！ linux运维
Linux服务器作为众多应用程序和服务的主干，需要定期维护以保证其安全性、效率和寿命。对于系统管理员来说，这看起来就像一项艰巨的任务。本文介绍了一个全面的检查表，以指导系统管理员有效地维护Linux服务器。LinuxServerMaintenanceChecklist:(1)Backups确保自动备份正常运行验证备份数据完整性通过在测试环境中还原备份来定期测试备份(2)UpdatesandPatc
java实现查看进程内存占用情况（附带源码） Katie。 Java 实战项目 java 开发语言
Java实现查看进程内存占用情况1.项目背景与介绍在系统监控和性能调优中，了解各个进程的内存占用情况是非常重要的一环。通过查看进程内存使用情况，开发者和运维人员可以及时发现异常进程、资源瓶颈和内存泄漏问题。虽然操作系统本身通常提供了相应的命令或工具（如Windows的tasklist、Linux的ps等），但在Java应用中实现一个跨平台的进程内存监控工具，可以方便地将监控结果集成到系统管理平台或
如何利用serverless架构降低运维成本 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
《如何利用serverless架构降低运维成本》关键词：Serverless架构、运维成本、FaaS、BaaS、成本模型、性能优化、项目实战摘要：Serverless架构正日益成为企业降低运维成本、提高开发效率的重要手段。本文将从Serverless架构的概述、核心概念详解、技术细节解析、数学模型应用以及实战应用等方面，全面探讨如何利用Serverless架构降低运维成本，为企业数字化转型升级提供
【Elasticsearch】Elasticsearch集群在分布式环境下的管理屿小夏 Elasticsearch elasticsearch 分布式大数据
文章目录前言一、集群规划与设计1.1集群拓扑结构设计1.2节点角色分配1.3分片与副本配置二、集群管理与运维2.1集群监控2.2故障处理2.3性能优化三、扩展与升级3.1集群扩展3.2集群升级3.3灾备与容灾️总结前言Elasticsearch是一种高度可扩展的开源搜索引擎，可以在大规模分布式环境中处理和存储海量数据。随着数据量的增长，单节点的Elasticsearch难以满足业务需求，因而集群部
RabbitMQ 高级配置与优化：从入门到精通 Echo_Wish 让你快速入坑运维运维探秘 rabbitmq 分布式
RabbitMQ高级配置与优化：从入门到精通引言在分布式架构中，消息队列（MQ）是必不可少的一环，而RabbitMQ作为业界广泛使用的消息中间件，凭借其高吞吐、可扩展、可靠性等特性备受青睐。然而，很多开发者和运维人员在使用RabbitMQ时，仅仅停留在"能用"的层面，而忽略了RabbitMQ的高级配置与优化技巧，导致消息积压、延迟过高，甚至是服务器崩溃等问题。本文将深入探讨RabbitMQ的高级配
聊一聊 IM 要如何实现运维与监控？后端java
IM系列imdoc实时通讯文档仓库聊一聊IM是什么？聊一聊IM即时通讯系统聊一聊IM要如何设计？聊一聊IM要如何设计功能模块？聊一聊IM要如何进行架构设计？聊一聊IM要如何进行技术选型？聊一聊IM要如何保证安全性？聊一聊IM要如何保证扩展性？聊一聊IM要如何实现运维与监控？聊一聊IM要如何提升用户体验？聊一聊IM要如何进行测试与部署？聊一聊IM要如何编写文档+技术支持？聊一聊IM要如何打造差异化？
聊一聊 IM 要如何提升用户体验？后端java
IM系列imdoc实时通讯文档仓库聊一聊IM是什么？聊一聊IM即时通讯系统聊一聊IM要如何设计？聊一聊IM要如何设计功能模块？聊一聊IM要如何进行架构设计？聊一聊IM要如何进行技术选型？聊一聊IM要如何保证安全性？聊一聊IM要如何保证扩展性？聊一聊IM要如何实现运维与监控？聊一聊IM要如何提升用户体验？聊一聊IM要如何进行测试与部署？聊一聊IM要如何编写文档+技术支持？聊一聊IM要如何打造差异化？
聊一聊 IM 要如何提升用户体验？后端java
IM系列imdoc实时通讯文档仓库聊一聊IM是什么？聊一聊IM即时通讯系统聊一聊IM要如何设计？聊一聊IM要如何设计功能模块？聊一聊IM要如何进行架构设计？聊一聊IM要如何进行技术选型？聊一聊IM要如何保证安全性？聊一聊IM要如何保证扩展性？聊一聊IM要如何实现运维与监控？聊一聊IM要如何提升用户体验？聊一聊IM要如何进行测试与部署？聊一聊IM要如何编写文档+技术支持？聊一聊IM要如何打造差异化？
IT安全运维指南：手册、工具与资源速览兮动人网络攻防与运维安全运维
1.IT安全运维手册飞塔防火墙手册：https://handbook.fortinet.com.cn/亿邮邮箱系统手册：https://mail.eyou.net/?q=help深信服上网行为管理手册：https://support.sangfor.com.cn/productDocument/read?product_id=22&version_id=943深信服VPN远程办公手册：https:
Kubernetes 网络插件实现原理与典型问题全解析挣扎与觉醒中的技术人 kubernetes 网络 php docker 容器云原生
Kubernetes网络模型是容器编排的核心基础，但也是运维中最复杂的部分之一。本文将深入剖析主流网络插件（CNI）的实现原理，并结合生产环境中的高频问题，提供从底层原理到实战排障的全方位指南。一、Kubernetes网络模型基础1.K8S网络核心要求Pod间直连通信：所有Pod可直接通过IP通信，无需NAT。跨节点网络互通：不同节点上的Pod能够直接通信。Service负载均衡：通过Cluste
《阿里游戏高可用架构设计实践》读后感 weixin_34343689 数据库后端运维
《阿里游戏高可用架构设计实践》读后感在文章当中我印象最深刻的一句话是“高可用的系统是设计出来的，不是靠运维保障出来的！”游戏出现故障会有很多原因，并不是说除了程序Bug以外，可能其他都是运维背黑锅了。其实，这些问题背后真正的原因是系统设计方案有问题，也就是说，技术上是比较弱的。1、高可用目标-传统方法高可用其实都是指几个9，5个9的话可能就是电信级或者金融级的，互联网大部分是3个9到4个9。2、高
从技术基础到大AI时代：如何成为一名合格的软件架构师 nbsaas-boot 人工智能
一、软件架构师的角色定位总体设计者软件架构师既要负责宏观的技术规划，也要兼顾微观的实现细节。架构师在团队中承担“技术领航”的职责，需要将业务需求、技术实现和团队能力进行有机结合，设计出既满足当前需求，又具有弹性和可扩展性的系统方案。团队技术领导者除了设计工作本身，架构师需在团队中发挥引领作用。面对复杂的技术决策与跨部门协作，架构师必须能够与开发、测试、运维、产品经理等多个角色高效沟通，推动相关工作
Linux下网络运维命令总结 C嘎嘎嵌入式开发 Linux 运维 linux 网络
一、网络连通性测试ping作用：检测目标主机是否可达，并测量网络延迟。示例：pingwww.example.com持续发送ICMP报文，按Ctrl+C停止。ping-c4www.example.com发送4个ICMP报文后停止。traceroute作用：显示数据包到达目标主机所经过的路由路径。示例：traceroutewww.example.com使用默认端口进行追踪。traceroute-Iww
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi