zhangjwnx

企业级prometheus+alertmanager+grafana+ victoriametrics高可用架构，实现基于钉钉、邮件的告警通知

整体架构图

prometheus

简介：

官方地址：https://prometheus.io/

Prometheus是基于go语⾔开发的⼀套开源的监控、报警和时间序列数据库的组合，是由SoundCloud公司开发的开源监控系统，Prometheus于2016年加⼊CNCF（Cloud Native Computing Foundation,云原⽣计算基⾦会）,2018年8⽉9⽇prometheus成为CNCF继kubernetes 之后毕业的第⼆个项⽬，prometheus在容器和微服务领域中得到了⼴泛的应⽤，其特点主要如下：

使⽤key-value的多维度(多个⻆度，多个层⾯，多个⽅⾯)格式保存数据
数据不使⽤MySQL这样的传统数据库，⽽是使⽤时序数据库，⽬前是使⽤的TSDB
⽀持第三⽅dashboard实现更绚丽的图形界⾯，如grafana(Grafana 2.5.0版本及以上)
组件模块化
不需要依赖存储，数据可以本地保存也可以远程保存
平均每个采样点仅占3.5 bytes，且⼀个Prometheus server可以处理数百万级别的的metrics指标数据。
⽀持服务⾃动化发现(基于consul等⽅式动态发现被监控的⽬标服务)
强⼤的数据查询语句功(PromQL,Prometheus Query Language)
数据可以直接进⾏算术运算
易于横向伸缩
众多官⽅和第三⽅的exporter(“数据”导出器)实现不同的指标数据收集

为什么使用prometheus？

容器监控的实现⽅对⽐虚拟机或者物理机来说⽐⼤的区别，⽐如容器在k8s环境中可以任意横向扩容与缩容，那么就需要监控服务能够⾃动对新创建的容器进⾏监控，当容器删除后⼜能够及时的从监控服务中删除，⽽传统的zabbix的监控⽅式需要在每⼀个容器中安装启动agent，并且在容器⾃动发现注册及模板关联⽅⾯并没有⽐较好的实现⽅式。

prometheus架构图

部署prometheus监控系统

二进制方式部署Prometheus Server

mkdir /apps
wget https://github.com/prometheus/prometheus/releases/download/v2.38.0/prometheus-2.38.0.linux-amd64.tar.gz
tar -xvf prometheus-2.38.0.linux-amd64.tar.gz
ln -sv prometheus-2.38.0.linux-amd64 prometheus

创建prometheus service 启动脚本

vim /etc/systemd/system/prometheus.service 

[Unit]
Description=Prometheus Server
Documentation=https://prometheus.io/docs/introduction/overview/
After=network.target

[Service]
Restart=on-failure
WorkingDirectory=/apps/prometheus/
ExecStart=/apps/prometheus/prometheus --config.file=/apps/prometheus/prometheus.yml --web.enable-lifecycle

[Install]
WantedBy=multi-user.target

动态(热)加载配置：

# vim /etc/systemd/system/prometheus.service
--web.enable-lifecycle
curl -X POST http://192.168.2.132:9090/-/reload

启动prometheus服务

systemctl daemon-reload && systemctl restart prometheus && systemctl enable 
prometheus

验证prometheus web界⾯：

prometheus存储系统

Prometheus 有着非常高效的时间序列数据存储方法，每个采样数据仅仅占用3.5byte 左右空间，上百万条时间序列，30 秒间隔，保留 60 天，大概 200 多 G空间。

prometheus 本地存储简介：

默认情况下，prometheus将采集到的数据存储在本地的 TSDB数据库中，路径默认为prometheus安装目录的 data目录，数据写入过程为先把数据写入 wal日志并放在内存，然后 2小时后将内存数据保存至一个新的 block块，同时再把新采集的数据写入内存并在 2小时后再保存至一个新的 block块，以此类推。

本地配置参数

--config.file="prometheus.yml" #指定配置文件
--web.listen-address="0.0.0.0:9090" #指定监听地址
--storage.tsdb.path="data/" #指定数存储目录
--storage.tsdb.retention.size=B, KB, MB, GB, TB, PB, EB #指定 chunk大小，默认 512MB
--storage.tsdb.retention.time= #数据保存时长，默认 15天
--query.timeout=2m #最大查询超时时间
-query.max-concurrency=20 #最大查询并发数
--web.read-timeout=5m #最大空闲超时时间
--web.max-connections=512 #最大并发连接数
--web.enable-lifecycle #启用 API动态加载配置功能

prometheus 联邦

- job_name: 'prometheus-federate-2.102'
  scrape_interval: 10s
  honor_labels: true
  metrics_path: '/federate'
  params:
    'match[]':
     - '{job="prometheus"}'
     - '{__name__=~"job:.*"}'
     - '{__name__=~"node.*"}'
  static_configs:
  - targets:
    - '172.31.2.102:9090'

## 注意对于k8s内部的prometheus节点数据的收集,要写容器中对应的job信息，不然prometheus service节点根据匹配条件，无法匹配到
'match[]':
     - '{job="kubernetes-service-endpoints"}'

二进制安装node-exporter

k8s各node节点使⽤⼆进制或者daemonset⽅式安装node_exporter，⽤于收集各k8s node节点宿主机的监控指标数据，默认监听端⼝为9100。

解压二进制程序

cd /apps
wget https://github.com/prometheus/node_exporter/releases/download/v1.3.1/node_exporter-1.3.1.linux-amd64.tar.gz
tar -xvf node_exporter-1.3.1.linux-amd64.tar.gz
ln -sv node_exporter-1.3.1.linux-amd64 node_exporter

创建node_exporter service 启动文件

vim /etc/systemd/system/node-exporter.service
[Unit]
Description=Prometheus Node Exporter
After=network.target

[Service]
ExecStart=/apps/node_exporter/node_exporter

[Install]
WantedBy=multi-user.target

启动node_exporter服务

systemctl daemon-reload && systemctl start node_exporter && systemctl enable node_exporter

添加node节点数据收集

vim /apps/prometheus/prometheus.yml
- job_name: 'promethues-node'
  static_configs:
    - targets: ['192.168.2.131:9100','192.168.2.132:9100']

grafana

grafana是⼀个可视化组件，⽤于接收客户端浏览器的请求并连接到prometheus查询数据，最后经过渲染并在浏览器进⾏体系化显示，需要注意的是，grafana查询数据类似于zabbix⼀样需要⾃定义模板，模板可以⼿动制作也可以导⼊已有模板。

官网：https://grafana.com/
模板下载：https://grafana.com/grafana/dashboards/

安装Grafana Server

https://grafana.com/grafana/download #下载地址
https://grafana.com/docs/grafana/latest/installation/requirements/ #安装⽂档

cd /apps
wget https://dl.grafana.com/enterprise/release/grafana-enterprise-9.1.6-1.x86_64.rpm
或sudo yum install grafana-enterprise-9.1.6-1.x86_64.rpm

grafana server配置⽂件：

vim /etc/grafana/grafana.ini 
[server]
# Protocol (http, https, socket)
protocol = http

# The ip address to bind to, empty will bind to all interfaces
http_addr = 0.0.0.0

# The http port to use
http_port = 3000

启动grafana服务

systemctl daemon-reload && systemctl restart grafana-server && systemctl enable grafana-server

插件管理

饼图插件未安装，需要提前安装
https://grafana.com/grafana/plugins/grafana-piechart-panel/

在线安装：
# grafana-cli plugins install grafana-piechart-panel

离线安装：
# pwd
/var/lib/grafana/plugins
wget https://grafana.com/api/plugins/grafana-piechart-panel/versions/1.6.2/download
unzip grafana-piechart-panel-1.6.2.zip 
mv grafana-piechart-panel-1.6.2 grafana-piechart-panel
systemctl restart grafana-server

alertmanager

prometheus触发一条告警的过程
prometheus—>触发阈值—>超出持续时间—>alertmanager—>分组|抑制|静默—>媒体类型—>邮件|钉钉|企业微信|飞书等。

安装 alertmanager:

cd /apps
wget https://github.com/prometheus/alertmanager/releases/download/v0.24.0/alertmanager-0.24.0.linux-amd64.tar.gz
tar -xvf alertmanager-0.24.0.linux-amd64.tar.gz
ln -sv alertmanager-0.24.0.linux-amd64  alertmanager

创建alertmanager service启动文件

vim /etc/systemd/system/alertmanager.service
[Unit]
Description=Prometheus alertmanager
After=network.target

[Service]
ExecStart=/apps/alertmanager/alertmanager --config.file="/apps/alertmanager/alertmanager.yml"

[Install]
WantedBy=multi-user.target

启动alertmanager服务

systemctl daemon-reload && systemctl restart alertmanager && systemctl enablealertmanager

告警通知

邮件告警通知

官方配置文档：https://prometheus.io/docs/alerting/configuration/

alertmanager配置文件说明：

vim /apps/alertmanager/alertmanager.yml
global:
  resolve_timeout: 1m #单次探测超时时间
  smtp_from: #发件人邮箱地址
  smtp_smarthost: #邮箱 smtp地址。
  smtp_auth_username: #发件人的登陆用户名，默认和发件人地址一致。    
  smtp_auth_password: #发件人的登陆密码，有时候是授权码。
  smtp_require_tls: #是否需要 tls协议。默认是 true。
  
  wechart_api_url: #企业微信 API地址。
  wechart_api_secret： #企业微信 API secret。
  wechart_api_corp_id: #企业微信 corp id信息。

  resolve_timeout: 60s #当一个告警在 Alertmanager持续多长时间未接收到新告警后就标记告警状态为resolved(已解决/已恢复)。

配置详解：

global:
    resolve_timeout: 1m
    smtp_smarthost: 'smtp.qq.com:465'
    smtp_from: '[email protected]'
    smtp_auth_username: '[email protected]'
    smtp_auth_password: '********' #一般为开启pop3/smtp服务的授权码
    smtp_hello: '@qq.com'
    smtp_require_tls: false
route:
    group_by: [alertname] #通过 alertname的值对告警进行分类,- alert:物理节点 cpu使用率
    group_wait: 10s #一组告警第一次发送之前等待的延迟时间，即产生告警后延迟 10秒钟将组内新产生的消息一起合并发送(一般设置为 0秒 ~几分钟)。
    group_interval: 2m #一组已发送过初始通知的告警接收到新告警后，下次发送通知前等待的延迟时间(一般设置为 5分钟或更多)。
    repeat_interval: 5m #一条成功发送的告警，在最终发送通知之前等待的时间(通常设置为 3小时或更长时间)。
    receiver: default-receiver #其它的告警发送给 default-receiver
    routes: #将 critical的报警发送给 myalertname
    - receiver: myalertname
    group_wait: 10s
    match_re:
       severity: critical
receivers: #定义多接收者
- name: 'default-receiver'
    email_configs:
    - to: '[email protected]'
      send_resolved: true #通知已经恢复的告警
- name: myalertname
    webhook_configs:
    - url: 'http://172.30.7.101:8060/dingtalk/alertname/send'
      send_resolved: true #通知已经恢复的告警

配置并启动alertmanager

global:
    resolve_timeout: 1m
    smtp_smarthost: 'smtp.qq.com:465'
    smtp_from: '[email protected]'
    smtp_auth_username: '[email protected]'
    smtp_auth_password: '********' #一般为开启pop3/smtp服务的授权码
    smtp_hello: '@qq.com'
    smtp_require_tls: false
route:
    group_by: [alertname] #采用哪个标签来作为分组依据
    group_wait: 10s 。
    group_interval: 10s
    repeat_interval: 2m
    receiver: web.hook.qq #设置接收人
receivers: #定义多接收者
- name: 'web.hook.qq'
    email_configs:
    - to: '[email protected]'
      send_resolved: true #通知已经恢复的告警
inhibit_rules: #抑制的规则
  - source_match: #源匹配级别，当匹配成功发出通知，但是其它'alertname', 'dev', 'instance'产生的warning级别的告警通知将被抑制
      severity: 'critical' #报警的事件级别
      target_match:
        severity: 'warning' #调用 source_match的 severity即如果已经有'critical'级别的报警，那么将匹配目标为新产生的告警级别为'warning'的将被抑制
      equal: ['alertname', 'dev', 'instance'] #匹配那些对象的告警

钉钉告警通知

告警流程
prometheus—>alertmanager—>dingtalk—>dingdingServer

cd /apps
wget https://github.com/timonwong/prometheus-webhook-dingtalk/releases/download/v2.1.0/prometheus-webhook-dingtalk-2.1.0.linux-amd64.tar.gz
ln -sv prometheus-webhook-dingtalk-2.1.0.linux-amd64 prometheus-webhook-dingtalk

源端存储之victoriametrics

官方地址：
https://github.com/VictoriaMetrics/VictoriaMetrics
https://docs.victoriametrics.com/Single-server-VictoriaMetrics.html

单机版部署

cd /app
wget https://github.com/VictoriaMetrics/VictoriaMetrics/releases/download/v1.81.2/victoria-metrics-linux-amd64-v1.81.2.tar.gz
tar -xvf victoria-metrics-linux-amd64-v1.81.2.tar.gz
参数：
-httpListenAddr=0.0.0.0:8428 #监听地址及端口
-storageDataPath #VictoriaMetrics将所有数据存储在此目录中，默认为执行启动 victoria的当前目录下的 victoria-metrics-data目录中。
-retentionPeriod #存储数据的保留，较旧的数据会自动删除，默认保留期为 1个月，默认单位为 m(月)，支持的单位有 h (hour), d (day), w (week), y (year)。

mv victoria-metrics-prod /usr/local/bin/
cp victoria-metrics-prod /usr/local/bin/

启动service文件

vim /etc/systemd/system/victoria-metrics-prod.service
[Unit]
Description=For Victoria-metrics-prod Service
After=network.target

[Service]
ExecStart=/usr/local/bin/victoria-metrics-prod -httpListenAddr=0.0.0.0:8428 -storageDataPath=/data/victoria -retentionPeriod=3

[Install]
WantedBy=multi-user.target

启动服务

systemctl daemon-reload && systemctl restart victoria-metrics-prod.service
systemctl enable victoria-metrics-prod.service

prometheus配置文件

global:
   scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
   evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
   # scrape_timeout is set to the global default (10s).
remote_write:
  - url: http://192.168.2.131:8428/api/v1/write

grafana配置

添加数据源,类型为 prometheus，地址及端口为 VictoriaMetrics：

victoriametrics-data-source #数据源名称
http://192.168.2.131:8428 #victoriametrics server地址

集群版部署

组件介绍：

vminsert ：
写入组件(写)，vminsert负责接收数据写入并根据对度量名称及其所有标签的一致 hash结果将数据分散写入不同的后端 vmstorage节点之间 vmstorage，vminsert默认端口 8480
vmstorage ：
存储原始数据并返回给定时间范围内给定标签过滤器的查询数据，默认端口 8482
vmselect:
查询组件(读)，连接 vmstorage，默认端口 8481

注意：下载对应的集群版本

部署集群

分别在各个VictoriaMetrics服务器进行安装配置：

cd /app
wget https://github.com/VictoriaMetrics/VictoriaMetrics/releases/download/v1.81.2/victoria-metrics-linux-amd64-v1.81.2-cluster.tar.gz
tar xvf victoria-metrics-linux-amd64-v1.81.2-cluster.tar.gz
vminsert-prod
vmselect-prod
vmstorage-prod
mv vminsert-prod vmselect-prod vmstorage-prod /usr/local/bin/

部署vmstorage-prod组件

负责数据持久化，监听端口为8482，数据写入端口为8400，数据读取端口为8401

启动service文件

vim /etc/systemd/system/vmstorage.service
[Unit]
Description=Vmstorage Server
After=network.target

[Service]
Restart=on-failure
WorkingDirectory=/tmp
ExecStart=/usr/local/bin/vmstorage-prod -loggerTimezone Asia/Shanghai -storageDataPath/data/vmstorage-data -httpListenAddr :8482 -vminsertAddr :8400 -vmselectAddr :8401

[Install]
WantedBy=multi-user.target

服务启动

systemctl daemon-reload && systemctl restart vmstorage.service && systemctl enable vmstorage.service

其他两个节点执行同样的操作

部署 vminsert-prod组件

接收外部的写请求，默认端口 8480

vim /etc/systemd/system/vminsert.service
[Unit]
Description=Vminsert Server
After=network.target

[Service]
Restart=on-failure
WorkingDirectory=/tmp
ExecStart=/usr/local/bin/vminsert-prod -httpListenAddr :8480-storageNode=192.168.2.131:8400,192.168.2.132:8400,192.168.2.133:8400

[Install]
WantedBy=multi-user.target

启动服务

systemctl daemon-reload && systemctl restart vminsert && systemctl enable vminsert

其他两个节点执行相同的操作

部署 vmselect-prod组件

负责接收外部的读请求，默认端口 8481

vim /etc/systemd/system/vmselect.service
[Unit]
Description=Vminsert Server
After=network.target

[Service]
Restart=on-failure
WorkingDirectory=/tmpExecStart=/usr/local/bin/vmselect-prod -httpListenAddr :8481 -storageNode=192.168.2.131:8401,192.168.2.132:8401,192.168.2.133:8401

[Install]
WantedBy=multi-user.target

启动服务

systemctl daemon-reload && systemctl restart vmselect && systemctl enable vmselect

其他两个节点执行相同的操作

验证服务端口

192.168.2.131：
# curl http://192.168.2.131:8480/metrics
# curl http://192.168.2.131:8481/metrics
# curl http://192.168.2.131:8482/metrics

192.168.2.132：
# curl http://192.168.2.132:8480/metrics
# curl http://192.168.2.132:8481/metrics
# curl http://192.168.2.132:8482/metrics

192.168.2.133：
# curl http://192.168.2.133:8480/metrics
# curl http://192.168.2.133:8481/metrics
# curl http://192.168.2.133:8482/metrics

prometheus配置远程写入

#集群写入
remote_write:
  - url: http://192.168.2.131:8480/insert/0/prometheus
  - url: http://192.168.2.132:8480/insert/0/prometheus
  - url: http://192.168.2.133:8480/insert/0/prometheus

grafana数据源配置

victoriametrics-clusterdata-source #数据源名称
http://192.168.2.131:8481/select/0/prometheus #集群数据源地址，可以写成vip实现高可用

开启数据复制

https://docs.victoriametrics.com/Cluster-VictoriaMetrics.html#replication-and-data-safety
默认情况下，数据被 vminsert的组件基于 hash算法分别将数据持久化到不同的vmstorage节点，可以启用 vminsert组件支持的-replicationFactor=N复制功能，将数据分别在各节点保存一份完整的副本以实现数据的高可用。

prometheus-operator

官方地址：https://github.com/prometheus-operator/prometheus-operator
Operator部署器基于已经编写好的yaml文件，可以将prometheus server、alertmanager、grafana、node-exporter等组件一键批量部署。
下载地址：

验证pod状态

验证prometheus web界面：

验证grafana web界面

alertmanager

k8s组件监控

cadvisor监控pod的资源利用率

ingress-nginx监控

kube-state-metrics监控集群状态

参见博客：http://t.zoukankan.com/deny-p-14328900.html

mac系统docker安装k8s 吕海洋操作系统运维 k8s macos docker k8s
一、docker升级到最新版本，否则有可能安装失败二、打开docker配置页面，选择kubernetes，勾选EnableKubernetes等待安装完成也可以通过国内原下载好Kubernetes镜像后在勾选，版本一定要对应三、查看Kubernetes是否成功启动四、安装dashboard可选先查看k8s版本，在docker配置页面Kubernetes里可以看到，v1.22.5访问官方文档选择对应
【数仓】数据质量监控和风与影数据仓库大数据数据库数据挖掘数据仓库
今天来填2个月前的坑。之前提到了数据质量：【数仓】数据质量我在面试中也碰到了数据质量的问题，没回答出来。今天学习一下数据质量监控原则。欢迎点击此处关注公众号。1.数据质量概述数据质量的高低代表了该数据满足数据消费者期望的程度，这种程度基于他们对数据的使用预期，只有达到数据的使用预期才能给予管理层正确的决策参考。数据质量管理作为数据仓库的一个重要模块，主要可以分为数据的健康标准量化、监控和保障。
数据仓库数据质量监控：实现准确决策的关键百度_开发者中心程序人生
随着企业数据量的不断增加，数据仓库已成为企业运营的重要支柱。为了保证数据仓库中的数据能够准确、及时地支持决策，数据仓库数据质量监控变得至关重要。本文将重点介绍数据仓库数据质量监控的相关概念和实践方法。一、数据仓库数据质量监控的概念数据质量数据质量是指数据的准确性、完整性、一致性、及时性和可利用性。在数据仓库中，数据质量问题是不可避免的，因为数据来源广泛、格式多样、转换复杂，容易引入错误。数据质量监
docker 与K8s的恩怨情仇慧香一格 docker K8s 容器 docker kubernetes 容器
Docker和Kubernetes（通常简称为K8s）是容器化和容器编排领域的两大重要工具，它们在技术生态中扮演着不同的角色，并且有着密切的关系。虽然有时候人们会讨论它们之间的关系，但实际上它们更多的是互补而不是对立。下面详细探讨Docker与Kubernetes的关系及其各自的优劣势。Docker什么是Docker？Docker是一个开源的平台，用于自动化应用程序的部署、扩展和管理。它允许开发者
大数据-257 离线数仓 - 数据质量监控监控方法 Griffin架构武子康大数据离线数仓大数据数据仓库 java 后端 hadoop hive
点一下关注吧！！！非常感谢！！持续更新！！！Java篇开始了！目前开始更新MyBatis，一起深入浅出！目前已经更新到了：Hadoop（已更完）HDFS（已更完）MapReduce（已更完）Hive（已更完）Flume（已更完）Sqoop（已更完）Zookeeper（已更完）HBase（已更完）Redis（已更完）Kafka（已更完）Spark（已更完）Flink（已更完）ClickHouse（已
keepalived 、HAProxy www.农民工智能路由器网络
KeepAlived高可用集群配置高可用的web集群监控本机80端口，实现主备切换实现原理实施配置高可用、负载均衡的web集群配置高可用、负载均衡HAProxy配置haproxy负载均衡调度器比较LVS（LinuxVirtualServer）NginxHAProxyday02KeepAlived高可用集群配置高可用的web集群监控本机80端口，实现主备切换实现原理实施配置高可用、负载均衡的web集
Kubernetes Service负载均衡机制蓝颜～岁月 kubernetes 负载均衡运维
当一个Service对象在Kubernetes集群中被定义出来时，集群内的客户端应用就可以通过服务IP访问到具体的Pod容器提供的服务了。从服务iP到Pod的负载均衡机制，则是由每个Node上的kube-proxy负责实现的，本节对kube-proxy的代理模式，会话保持机制和基于拓扑感知的服务路由机制（EndpointSlices）进行说明。kube-proxy的代理模式目前kube-proxy
IoT安全软件：Forescout二次开发_Forescout部署与运维 chenlz2007 物联网物联网运维网络 php 安全 java
Forescout部署与运维1.Forescout架构概述Forescout是一个高度灵活且可扩展的IoT安全平台，旨在帮助组织保护其网络免受各种威胁。Forescout的架构由多个组件组成，包括核心服务器、传感器、代理和客户端。这些组件协同工作，实现对网络中IoT设备的全面监控和管理。1.1核心服务器核心服务器是Forescout平台的中心枢纽，负责管理和协调所有其他组件。它提供了一个集中式的管
Kubernetes--Service负载均衡机制 GaoChuang_ Kubernetes kubernetes 负载均衡
一、负责均衡机制当一个Service对象在Kubernetes集群中被定义，集群内的客户端应用就可以通过服务IP访问到具体的Pod容器提供的服务器了。从服务IP到后端Pod的负载均衡机制，由每个Node上的kube-proxy负责实现。二、kube-proxy的代理模式kube-proxy提供了代理模式(通过启动参数--proxy-mode设置)userspace模式：用户空间模式，由kube-p
使用 Kubernetes 实现负载均衡卫玠_juncheng kubernetes 负载均衡容器
使用Kubernetes实现负载均衡，可以通过Kubernetes的内置服务（Service）资源，配合负载均衡器（如云平台提供的负载均衡器或Ingress控制器）来完成。以下是详细的步骤和调优案例。一、Kubernetes负载均衡的基本概念ClusterIP（默认类型）只能在集群内部访问，分发到Pod的流量通过IPtables或IPVS转发。NodePort通过每个节点的固定端口将流量暴露给外部
如何通过 Nginx 实现 CouchDB 集群的负载均衡并监控请求分发田猿笔记 CouchDB nginx couchdb 负载均衡
在现代分布式系统中，负载均衡是确保高可用性和性能的关键组件。CouchDB是一个强大的分布式数据库，而Nginx是一个高性能的反向代理和负载均衡器。本文将详细介绍如何通过Nginx实现CouchDB集群的负载均衡，并监控请求被分发到哪一台CouchDB节点。1.为什么需要负载均衡？CouchDB集群由多个节点组成，每个节点都可以处理请求。负载均衡的作用是将客户端请求均匀地分发到各个节点，从而实现：
实时监控社区帖子删除的Python系统构建永不放弃yes
本文还有配套的精品资源，点击获取简介：本系统采用Python开发，专注于实时监测网络平台上的帖子删除情况。Python语言以其简洁和丰富的第三方库支持，如requests、BeautifulSoup、Selenium，构成了系统的核心。系统通过定时任务执行监测，实现帖子信息的记录和比较，并提供异常处理及日志记录功能。用户界面和合规性考虑也是系统设计的一部分。1.Python编程语言在删贴监测系统中
Chapter 3-14. Detecting Congestion in Fibre Channel Fabrics mounter625 Linux kernel 网络 tcp/ip 网络协议服务器
PortMonitorPolicyParametersEachpolicycontainsoneormorecounterstomonitor.Countershavethefollowingparameters:每个策略包含一个或多个要监控的计数器。计数器有以下参数：Countername:Thenameofthecounterwhichdescribesitsfunction.说明计数器功能的
项目管理中如何做好费用监控、资源共享项目管理
在项目管理中，做好费用监控和资源共享的关键在于：建立详细的预算计划、实施有效的资源共享策略、利用项目管理工具、定期监控和调整。其中，建立详细的预算计划至关重要。通过明确项目的费用目标和预算限制，制定费用控制的方法和措施，确保项目的所有费用都能够被计划和控制。这不仅有助于防止预算超支，还能提高资源利用效率，确保项目顺利进行。一、建立详细的预算计划在项目启动阶段，制定详细的预算计划是费用监控的基础。这
云原生周刊：Prometheus 3.0 正式发布云计算
开源项目推荐Achilles-SDKAchilles-SDK是一个专为构建Kubernetes控制器而设计的开源开发工具包。它简化了控制器的开发流程，提供了强大的API和高效的抽象层，使开发者能够专注于业务逻辑的实现，而无需处理底层复杂性。Achilles-SDK支持快速构建高性能、可扩展的Kubernetes控制器，是开发Kubernetes原生应用和自动化操作的理想选择。KLKL是一个为终端提
浅谈云计算06 | 云管理系统架构时光札记z 云计算系统架构云计算架构云原生计算机网络
云管理系统架构一、云管理系统架构（一）远程管理系统（二）资源管理系统（三）SLA管理系统（四）计费管理系统二、安全与可靠性保障（一）数据安全防线（二）故障应对策略云管理系统是一种综合性的软件平台，用于对云计算环境中的各类资源、服务和业务流程进行集中化、自动化的管理与监控。它就像是云计算的“智能管家”，整合了多种功能模块，能够跨越不同的物理和虚拟资源，为云服务提供商及用户提供统一的管理界面与操作入口
linux 监控开源软件,利用开源软件打造Linux应用软件平台之监控子系统呆呆小逗比 linux 监控开源软件
它山之石，可以攻玉。监控子系统是每一个高级应用软件平台必不可少的一个子系统，这个子系统应具备的基本功能包括：各进程的运行状态，系统资源的占用状况，重要配置文件的改变情况，重要目录的异动，常用服务的对外提供情况等。一种可行的实现方法是自己写一大堆的脚本，然后加入crond服务去定时做这些监控,另一条捷径是利用开源软件Monit。本文介绍如何利用Monit去快速构建一个具备上述功能的软件平台的监控子系
inotifywait监听php,用inotifywait监视文件变化并执行相应脚本函明
Inotify是一个Linux特性，它监控文件系统操作，比如读取、写入和创建。Inotify反应灵敏，用法非常简单，并且比cron任务的繁忙轮询高效得多。在内核2.6.13以上都可以使用。Inotify一种强大的、细粒度的、异步文件系统监控机制，它满足各种各样的文件监控需要，可以监控文件系统的访问属性、读写属性、权限属性、删除创建、移动等操作，也就是可以监控文件发生的一切变化。inotify-to
bash监控指定目录下的文件变动并执行相应动作 dangdanding Bash 笔记网络安全 bash 服务器 linux 运维
#!/bin/bashdir_to_monitor="/home/sub_dirprev_files=$(ls-A$dir_to_monitor)#echo"prev_files:$prev_files"prev_files_file=$(mktemp)ls-A$dir_to_monitor>$prev_files_filewhiletrue;docurrent_files=$(ls-A$dir_
单片机实物成品-012 酒精监测学个单片机单片机实物成品单片机嵌入式硬件课程设计
项目介绍本项目以软硬件结合的方式，选择C语言作为程序硬件编码语言，以STM32单片机作为核心控制板，在数据传输节点上连接酒精传感器对酒精浓度进行实时检测，且对高浓度酒精采取强制干预和紧急预警，并将数据通过蓝牙无线通信技术传输至上位机，实现酒精浓度的24h远程监控，达到全自动的智能化管理目标。经过不断调试与验证，该系统成功通过测试，可以减少人工干预，提高准确性，有效保障环境安全，优化产品质量，推动科
基于深度学习的人脸表情识别系统：YOLOv5 + YOLOv8 + YOLOv10 + UI界面 + 数据集 2025年数学建模美赛深度学习 YOLO ui 分类人工智能
引言随着人工智能的飞速发展，深度学习技术已广泛应用于各个领域，尤其是在计算机视觉领域。人脸识别和表情识别是其中的一个重要应用，能够在多种场景下提供重要的信息，例如安全监控、情感分析、智能客服、健康监测等。在人脸表情识别任务中，准确识别人脸的情感状态（如高兴、愤怒、悲伤等）是一个极具挑战性的任务。随着YOLO系列算法的不断进步，YOLOv5、YOLOv8和YOLOv10的推出大大提高了目标检测的精度
基于YOLOv8深度学习的人脸年龄检测识别系统 2025年数学建模美赛 YOLO 深度学习人工智能 ui 数据挖掘分类
引言随着人工智能和计算机视觉的飞速发展，人脸分析技术在年龄检测领域取得了显著进展。人脸年龄检测系统在安全监控、广告推荐、健康监测等领域有广泛应用。本文将基于YOLOv8目标检测模型和UI界面，开发一个完整的人脸年龄检测识别系统。我们将详细介绍项目的技术实现、数据集构建、模型训练以及UI设计，并附上完整代码。目录引言系统架构设计数据准备公开人脸年龄数据集数据标注格式数据目录结构模型训练YOLOv8环
云原生周刊：Prometheus 3.0 Beta 发布｜2024.09.16 KubeSphere 云原生 k8s 容器平台 kubesphere 云计算
开源项目推荐KumaKuma是一个现代化的基于Envoy的服务网格，能够在每个云平台上运行，支持单区域或多区域部署，兼容Kubernetes和虚拟机。凭借其广泛的通用工作负载支持，以及对Envoy数据平面代理技术的原生支持（但无需Envoy专业知识），Kuma提供了现代化的L4-L7服务连接、发现、安全、可观察性、路由等功能，适用于任何平台上的任何服务，包括数据库。TopoLVMTopoLVM是一
参考资料-Ja-10至Ja-28消防基坑开挖工程数据汇总疑样
本文还有配套的精品资源，点击获取简介：该压缩包文件包含了一系列Excel表格，用于记录和管理消防工程中的消火栓基坑开挖项目。文件名中的".XLS"扩展名表明内容涉及基坑开挖的尺寸、工程计划、成本估算及施工数据。这些数据对于建筑工程和消防工程的专业人员至关重要，但对于IT领域来说并不直接相关。尽管如此，信息技术，如BIM技术和物联网(IoT)，可以在建筑行业中提高效率，尤其是在项目管理、施工监控和数
如何监控和优化缓存性能?思维导图代码示例（java 架构) 用心去追梦缓存 java 架构
为了监控和优化缓存性能，需要采取一系列策略和技术手段来确保缓存系统的高效运行。以下是一个思维导图结构，以及一个简化的Java架构代码示例，展示了如何通过设计和技术手段来实现这一目标。思维导图结构监控和优化缓存性能性能指标命中率缓存命中次数缓存未命中次数响应时间平均响应时间响应时间分布（如P95,P99）吞吐量每秒请求数每秒处理的数据量资源使用内存占用CPU使用率监控工具Prometheus+Gra
本地缓存泄漏或溢出怎么预防?思维导图代码示例（java 架构) 用心去追梦 java 架构开发语言
为了预防本地缓存泄漏或溢出，可以采取一系列策略和技术手段来确保缓存的高效和安全使用。以下是一个思维导图结构和一个简化的Java架构代码示例，用于展示如何实现这些目标。思维导图结构防止缓存泄漏/溢出容量限制设置最大条目数使用LRU（最近最少使用）等淘汰策略时间限制设置TTL（生存时间）设置过期时间（基于创建或最后访问）清理机制定时任务清理过期数据自动移除未使用的条目监控与报警实时监控缓存使用情况设置
prometheus 搭建监控 confident3 prometheus
prometheus下载prometheus-3.0.0.linux-amd64.tar.gztar-zxvfprometheus-3.0.0.linux-amd64.tar.gzmvprometheus-3.0.0.linux-amd64prometheus-3vim/etc/systemd/system/prometheus.serviceprometheus.service[Unit]Des
Ubuntu环境部署Kubernetes 沫殇-MS Kubernetes ubuntu kubernetes linux 服务器经验分享
环境说明：IPHOSTNAMEUSERDockerversionkubeletversionkubeadmversionkubectlversioncalicoversiondashboardversionOS192.168.100.10masterdeployv20.10.11v1.23.0v1.23.0v1.23.0v3.21.2v2.4.0Ubuntu20.04.3server192.168
《微服务王国的守护者：Spring Cloud Dubbo的奇幻冒险》 Geek_H Java面试热点微服务 spring cloud dubbo java 云原生缓存 hystrix
5.经典问题与解决方案5.3服务追踪与链路监控在微服务架构的广袤宇宙中，服务间的调用关系错综复杂，如同一张庞大的星系网络。当一个请求穿越这个星系，经过多个服务节点时，如何追踪它的路径，如何监控整个链路的健康状况，成为了确保系统稳定运行的关键。服务追踪的必要性想象一下，你是一位星际探险家，你的任务是追踪一艘飞船穿越星系的轨迹。如果飞船在某个星系节点出现了问题，你需要迅速定位问题发生的位置，并了解它之
打造高效团队：项目管理与任务追踪软件的优选之路团队协作工具
项目管理与任务追踪工具是帮助团队有效规划、执行和监控项目进展的重要软件。这些工具通常提供一系列功能，以确保项目按时完成，资源得到合理分配，并且团队之间的沟通保持顺畅。以下是一些常见的项目管理与任务追踪工具：一、综合型项目管理与任务追踪工具板栗看板○一款适用于个人待办、知识笔记、任务协同等多个方面的看板效率工具。○采用看板视图，将任务通过卡片形式展示，支持拖动调整优先级和进度。○提供日程安排、进度跟
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发

企业级prometheus+alertmanager+grafana+ victoriametrics高可用架构，实现基于钉钉、邮件的告警通知

整体架构图

prometheus

简介：

为什么使用prometheus？

prometheus架构图

部署prometheus监控系统

二进制方式部署Prometheus Server

创建prometheus service 启动脚本

动态(热)加载配置：

启动prometheus服务

验证prometheus web界⾯：

prometheus存储系统

prometheus 本地存储简介：

本地配置参数

prometheus 联邦

二进制安装node-exporter

解压二进制程序

创建node_exporter service 启动文件

启动node_exporter服务

添加node节点数据收集

grafana

安装Grafana Server

grafana server配置⽂件：

启动grafana服务

插件管理

alertmanager

安装 alertmanager:

创建alertmanager service启动文件

启动alertmanager服务

告警通知

邮件告警通知

alertmanager配置文件说明：

配置并启动alertmanager

钉钉告警通知

源端存储之victoriametrics

单机版部署

启动service文件

启动服务

prometheus配置文件

grafana配置

集群版部署

组件介绍：

部署集群

部署vmstorage-prod组件

部署 vminsert-prod组件

部署 vmselect-prod组件

验证服务端口

prometheus配置远程写入

grafana数据源配置

开启数据复制

prometheus-operator

k8s组件监控

kube-state-metrics监控集群状态

你可能感兴趣的:(监控,kubernetes,prometheus,grafana)