左客

docker 搭建prometheus监控

1.docker基础环境安装
yum -y install docker
apt-get -y update ;apt-get -y install docker-compose
systemctl enable docker
systemctl start docker
timedatectl
timedatectl set-timezone Asia/Shanghai 宿主机时间设定
2.Prometheus安装
编辑配置文件prometheus.yml
cat prometheus.yml
global:
scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.

scrape_configs:

job_name: 'prometheus'
static_configs:
- targets: ['localhost:9090']
job_name: 'kafka'
static_configs:
- targets: ['localhost:9308']
  labels:
  instance: kafka
job_name: elasticsearch
scrape_interval: 5s
metrics_path: "/_prometheus/metrics"

file_sd_configs:
- files:
  - es.yml

sudo docker stop prometheus
sudo docker rm prometheus
sudo docker run -d --restart=always \
-v /etc/localtime:/etc/localtime \
-v /data/monitor/prometheus/prometheus.yml:/etc/prometheus/prometheus.yml \
--name prometheus \
--net=host docker.io/wang049718/prometheus --web.enable-lifecycle --config.file=/etc/prometheus/prometheus.yml

3.grafana部署
docker run -d --name grafana \
--restart=always \
-v /etc/localtime:/etc/localtime \
-p 3000:3000 \
docker.io/wang049718/grafana
admin/admin
4.监控node_exporter部署
参数说明
--web.listen-address=":9200"
#node_exporter监听的端口，默认是9100，若需要修改则通过此参数。
--web.telemetry-path="/metrics"
#获取metric信息的url，默认是/metrics，若需要修改则通过此参数
--log.level="info"
#设置日志级别
--log.format="logger:stderr"

docker run -d --restart=always \
-v /etc/localtime:/etc/localtime \
--name node-exporter \
--net=host docker.io/wang049718/node-exporter:0.18

Grafana导入模版id 10262

5.告警规则
Prometheus添加规则

alerting: #指定alertmanager报警组件地址
alertmanagers:

static_configs:
- targets: [ '1.1.1.5:9093']

rule_files: #指定报警规则文件

"rules.yml"

增加规则文件rules.yml
groups:

name: example #定义规则组
rules:
- alert: InstanceDown #定义报警名称
  expr: up == 0 #Promql语句，触发规则
  for: 1m # 一分钟
  labels: #标签定义报警的级别和主机
  name: instance
  severity: Critical
  annotations: #注解
  summary: " {{ $labels.instance }}" #报警摘要，取报警信息的appname名称
  description: " 服务停止运行 " #报警信息
  value: "{{ $value }}%" # 当前报警状态值
name: Host
rules:
- alert: HostMemory Usage
  expr: 1 - (node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes) > 0.8
  for: 1m
  labels:
  name: Memory
  severity: Warning
  annotations:
  summary: " {{ $labels.appname }} "
  description: "宿主机内存使用率超过80%."
  value: "{{ $value }}"
- alert: HostCPU Usage
  expr: sum(avg without (cpu)(irate(node_cpu_seconds_total{mode!='idle'}[5m]))) by (instance,appname) > 0.65
  for: 1m
  labels:
  name: CPU
  severity: Warning
  annotations:
  summary: " {{ $labels.appname }} "
  description: "宿主机CPU使用率超过65%."
  value: "{{ $value }}"
- alert: HostLoad
  expr: node_load5 > 4
  for: 1m
  labels:
  name: Load
  severity: Warning
  annotations:
  summary: "{{ $labels.appname }} "
  description: " 主机负载5分钟超过4."
  value: "{{ $value }}"
- alert: HostLoad
  expr: node_load1 > 10
  for: 1m
  labels:
  name: Load
  severity: Warning
  annotations:
  summary: "{{ $labels.appname }} "
  description: " 主机负载1分钟超过10."
  value: "{{ $value }}"
- alert: HostFilesystem Usage
  expr: 1-(node_filesystem_free_bytes / node_filesystem_size_bytes) > 0.8
  for: 1m
  labels:
  name: Disk
  severity: Warning
  annotations:
  summary: " {{ $labels.appname }} "
  description: " 宿主机 [ {{ $labels.mountpoint }} ]分区使用超过80%."
  value: "{{ $value }}%"
- alert: HostDiskio
  expr: irate(node_disk_writes_completed_total{job=~"Host"}[1m]) > 10
  for: 1m
  labels:
  name: Diskio
  severity: Warning
  annotations:
  summary: " {{ $labels.appname }} "
  description: " 宿主机 [{{ $labels.device }}]磁盘1分钟平均写入IO负载较高."
  value: "{{ $value }}iops"
- alert: Network_receive
  expr: irate(node_network_receive_bytes_total{device!~"lo|bond[0-9]|eth[0-9]|cbr[0-9]|veth.|virbr.|ovs-system"}[5m]) / 1048576 > 3
  for: 1m
  labels:
  name: Network_receive
  severity: Warning
  annotations:
  summary: " {{ $labels.appname }} "
  description: " 宿主机 [{{ $labels.device }}] 网卡5分钟平均接收流量超过3Mbps."
  value: "{{ $value }}3Mbps"
- alert: Network_transmit
  expr: irate(node_network_transmit_bytes_total{device!~"lo|bond[0-9]|eth[0-9]|cbr[0-9]|veth.|virbr.|ovs-system"}[5m]) / 1048576 > 3
  for: 1m
  labels:
  name: Network_transmit
  severity: Warning
  annotations:
  summary: " {{ $labels.appname }} "
  description: " 宿主机 [{{ $labels.device }}] 网卡5分钟内平均发送流量超过3Mbps."
  value: "{{ $value }}3Mbps"
name: Container
rules:
- alert: ContainerCPU Usage
  expr: (sum by(name,instance) (rate(container_cpu_usage_seconds_total{image!=""}[5m]))*100) > 60
  for: 1m
  labels:
  name: CPU
  severity: Warning
  annotations:
  summary: "{{ $labels.name }} "
  description: " 容器CPU使用超过60%."
  value: "{{ $value }}%"
- alert: ContainerMem Usage
  expr: container_memory_usage_bytes{name=~".+"} / 1048576 > 1024
  for: 1m
  labels:
  name: Memory
  severity: Warning
  annotations:
  summary: "{{ $labels.name }} "
  description: " 容器内存使用超过1GB."
  value: "{{ $value }}G"
name: Kafka
rules:
- alert: kafka_lag
  expr: kafka_consumergroup_lag > 180
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "剩余队列长度大于180."
  value: "{{ $value }}"
name: Redis
rules:
- alert: rejected_connections
  expr: redis_rejected_connections_total > 0
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "redis达到链接上限，拒绝的个数"
  value: "{{ $value }}"
- alert: blocked_clients
  expr: irate(redis_blocked_clients[5m]) > 10
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "redis是单线程，5分钟阻塞大于10"
  value: "{{ $value }}"
- alert: slave
  expr: redis_connected_slaves == 1
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "slave donw"
  value: "{{ $value }}"
name: ES
rules:
- alert: es_cluster_node
  expr: es_cluster_nodes_number < 3
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "ES集群异常."
  value: "{{ $value }}"
- alert: es_cluster_datanodes_number
  expr: es_cluster_datanodes_number < 3
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "ES集群数据节点异常."
  value: "{{ $value }}"
- alert: es内存使用率
  expr: es_os_mem_used_bytes / es_os_mem_total_bytes * 100 > 80
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "内粗使用率大于80%"
  value: "{{ $value }}"
- alert: es cpu使用率
  expr: es_os_cpu_percent > 0.6
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "cpu使用率大于60%"
  value: "{{ $value }}"
name: web
rules:
- alert: basevisitor
  expr: basevisitor != 200
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "basevisitor 异常"
  value: "{{ $value }}"
- alert: km
  expr: km != 200
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "km 异常"
  value: "{{ $value }}"
- alert: gtower
  expr: gtower != 200
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "gtower 异常"
  value: "{{ $value }}"
- alert: im03
  expr: im03 != 200
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "im03 异常"
  value: "{{ $value }}"
- alert: immonitor
  expr: immonitor != 200
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "immonitor 异常"
  value: "{{ $value }}"
- alert: volcano
  expr: volcano != 200
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "volcano 异常"
  value: "{{ $value }}"
- alert: kfonline
  expr: kfonline != 302
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "kfonline 异常"
  value: "{{ $value }}"
- alert: ocs
  expr: ocs != 403
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "ocs 异常"
  value: "{{ $value }}"
- alert: fliter
  expr: fliter != 200
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "fliter 异常"
  value: "{{ $value }}"
name: mongo
rules:
- alert: cluster
  expr: mongodb_mongod_replset_my_state != 2
  for: 1m
  labels:
  severity: Warning
  annotations:
  description: "集群异常"
  value: "{{ $value }}"Prometheus加载告警规则

docker run -d --restart=always \
-v /etc/localtime:/etc/localtime \
-v /data/monitor/prometheus/prometheus.yml:/etc/prometheus/prometheus.yml \
-v /data/monitor/prometheus/rules.yml:/etc/prometheus/rules.yml \
--name prometheus \
--net=host docker.io/wang049718/prometheus --web.enable-lifecycle --config.file=/etc/prometheus/prometheus.yml

启动告警服务插件
cat alertmanager.yml
global:
resolve_timeout: 2m
smtp_smarthost: smtp.163.com:25
smtp_from: [email protected]
smtp_auth_username: [email protected]
smtp_auth_password: wang049718

templates: ##消息模板

'/etc/alertmanager/template/wechat.tmpl'
route:
group_by: ['alertname_wechat']
group_wait: 30s
group_interval: 60s
receiver: 'email' # 优先使用wechat发送
repeat_interval: 1h
routes: #子路由，使用email发送
receiver: email
match_re:
serverity: email
receivers:
- name: 'email'
  email_configs:
to: '[email protected]'
send_resolved: true # 发送已解决通知
wechat.tmpl
[root@localhost wang]# cat wechat.tmpl
{{ define "wechat.default.message" }}
{{ range $i, $alert :=.Alerts }}
========监控报警==========
告警状态：{{ .Status }}
告警级别：{{ $alert.Labels.severity }}
告警类型：{{ $alert.Labels.alertname }}
告警应用：{{ $alert.Annotations.summary }}
告警主机：{{ $alert.Labels.instance }}
告警详情：{{ $alert.Annotations.description }}
触发阀值：{{ $alert.Annotations.value }}
告警时间：{{ $alert.StartsAt.Format "2006-01-02 15:04:05" }}
========end=============
{{ end }}
{{ end }}

docker run -d -p 9093:9093 --name alertmanager \
--restart always \
-v /etc/localtime:/etc/localtime \
-v /home/wang/alertmanager.yml:/etc/alertmanager/alertmanager.yml \
-v /home/wang:/etc/alertmanager/template \
docker.io/wang049718/alertmanager

6.监控mongo
docker run -itd --net=host -v /etc/localtime:/etc/localtime --name mongo mongo --auth
docker exec -it mongo mongo
use admin
db.createUser({
user: 'admin',
pwd: '123456',
roles: [{ "role": "userAdminAnyDatabase", "db": "admin" },
{ "role": "dbAdminAnyDatabase", "db": "admin" },
{ role: "root", db: "admin" }
]
})

docker exec -it mongo mongo -uadmin -p123456

use col
db.col.insert({title: 'MongoDB 教程',
description: 'MongoDB 是一个 Nosql 数据库',
by: '菜鸟教程',
url: 'http://www.runoob.com',
tags: ['mongodb', 'database', 'NoSQL'],
likes: 100
})
sudo docker run -d --name mongo-explorer \
--restart=always \
-p 9105:9104 \
--cpuset-cpus=2,1 \
-m 300m \
-v /etc/localtime:/etc/localtime \
docker.io/wang049718/mongo --mongodb.uri "mongodb://admin:[email protected]:27017"

模版为json串
7监控mysql
sudo docker run -d --restart=always \
--net=host \
--cpuset-cpus=0,1 \
-m 1200m \
-e DATA_SOURCE_NAME="monitoring:monitoring@(172.21.10.22:3306)"/ \
-v /etc/localtime:/etc/localtime \
--name mysql_exporter \
docker.io/wang049718/mysqld-exporter:latest
8.监控redis
docker stop redis-server
docker rm redis-server
docker run -d --name redis-server -p 6379:6379 \
-v /etc/localtime:/etc/localtime \
-v /home/redis:/data \
--restart always redis \
--requirepass "123456" --appendonly yes
docker run -d --name redis_exporter \
-p 9121:9121 \
-v /etc/localtime:/etc/localtime \
--restart always docker.io/wang049718/redis_exporter \
--redis.addr redis://1.1.1.4:6379 -redis.password 123456

sudo docker run -d --name redis_exporter \
--net=host \
-v /etc/localtime:/etc/localtime \
--cpuset-cpus=0,1 \
-m 1200m \
--restart always \
docker.io/wang049718/redis_exporter \
--redis.addr redis://172.21.10.11:6379

9.监控kafka
sudo docker stop kafka
sudo docker rm kafka
sudo docker run -d --restart=always \
--cpuset-cpus=3,2 \
-m 1200m \
-p 9308:9308 \
-v /etc/localtime:/etc/localtime \
--name kafka \
docker.io/wang049718/kafka_exporter \
/kafka_exporter-1.2.0.linux-amd64/kafka_exporter --kafka.server=172.21.10.4:9092

Json串

10.pushgateway

sudo docker stop pushgateway
sudo docker rm pushgateway
sudo docker run -d --restart=always \
-v /etc/localtime:/etc/localtime \
--name pushgateway -p 9091:9091 \
docker.io/wang049718/pushgateway:latest

访问9091端口（http://pushgatewayIP:9091）

打开prometheus的配置文件

job_name: 'pushgateway'
static_configs:
- targets: ['pushgatewayIP:9091']
  honor_labels: true #作用：如果没有设置instance标签，Prometheus服务器也会附加标签，否则instance标签值会为空

写入测试
单条
echo "test 123" | curl --data-binary @- http://localhost:9091/metrics/job/test
上述测试的目的是，在被监控的机器上，想pushgateway发送了一条数据，内容是“test 123”，指标名称是“test”，指标值是“123”；
　　http://pushgatewayIP:9091/metrics/job/test，此次也声名了，在pushgateway处建立一个job为test的指标。

可以在prometheus图形查看test值

API格式：
　　http://pustgatewayIP/metrices/job/job名/标签名/标签值（一般标签名采用 instance）
例子：
　　http://pustgatewayIP/metrics/job/
　　　　/sb/instance/si
　　　　/testjob/abc/pushgateway1
　　　　/testjob/yyy/pushgateway1
　　分别触发上述三个API，打开pushgateway的web UI

cat <

TYPE docker_runtime counter

docker_runtime{name="cadvisor"} 33
docker_runtime{name="nginx"} 331

docker_runtime{name="abc"} 332

echo "basevisitor curl -I -m 10 -o /dev/null -s -w %{http_code} http://kf-basevisitor.ziroom.com" | curl --data-binary @- http://localhost:9091/metrics/job/web/instance/basevisitor
echo "km curl -I -m 10 -o /dev/null -s -w %{http_code} https://kf-km.ziroom.com/backend/health" | curl --data-binary @- http://localhost:9091/metrics/job/web/instance/km
echo "gtower curl -I -m 10 -o /dev/null -s -w %{http_code} http://kf-gtower.ziroom.com:7002" | curl --data-binary @- http://localhost:9091/metrics/job/web/instance/gtower
echo "im03 curl -I -m 10 -o /dev/null -s -w %{http_code} http://kf-im03.ziroom.com/health-check" | curl --data-binary @- http://localhost:9091/metrics/job/web/instance/im03
echo "fliter curl -I -m 10 -o /dev/null -s -w %{http_code} http://kf-fliter.ziroom.com" | curl --data-binary @- http://localhost:9091/metrics/job/web/instance/fliter
echo "immonitor curl -I -m 10 -o /dev/null -s -w %{http_code} http://kf-immonitor.ziroom.com/health-check" | curl --data-binary @- http://localhost:9091/metrics/job/web/instance/immonitor
echo "volcano curl -I -m 10 -o /dev/null -s -w %{http_code} http://kf-volcano.ziroom.com/monitor/group_all_agent" | curl --data-binary @- http://localhost:9091/metrics/job/web/instance/volcano
echo "kfonline curl -I -m 10 -o /dev/null -s -w %{http_code} http://kfonline.ziroom.com" | curl --data-binary @- http://localhost:9091/metrics/job/web/instance/kfonline
echo "push curl -I -m 10 -o /dev/null -s -w %{http_code} http://kf-push.ziroom.com:7002" | curl --data-binary @- http://localhost:9091/metrics/job/web/instance/push
echo "ocs curl -I -m 10 -o /dev/null -s -w %{http_code} http://kf-ocs.ziroom.com/minio/login" | curl --data-binary @- http://localhost:9091/metrics/job/web/instance/ocs
11.监控es

es监控
/usr/local/services/elasticsearch/bin/elasticsearch-plugin install file:///home/webuser/package/elasticsearch-prometheus-exporter-5.6.4.0.zip

重启服务器
服务器端

job_name: elasticsearch
scrape_interval: 5s
metrics_path: "/_prometheus/metrics"

file_sd_configs:
- files:
  - es.yml

es.yml文件，位置和prometheus.yml在一个文件夹

targets:
- 172.21.10.10:9200
- 172.21.8.49:9200
- 172.21.10.12:9200
  labels:
  server: c2-jenkins
  grafana导入266

sudo docker stop prometheus
sudo docker rm prometheus
sudo docker run -d --restart=always \
-v /etc/localtime:/etc/localtime \
-v /data/monitor/prometheus/prometheus.yml:/etc/prometheus/prometheus.yml \
-v /data/monitor/prometheus/es.yml:/etc/prometheus/es.yml \
-v /data/monitor/prometheus/rules.yml:/etc/prometheus/rules.yml \
--name prometheus \
--net=host prom/prometheus --web.enable-lifecycle --config.file=/etc/prometheus/prometheus.yml

12监控nginx

1.10.3
apt-get -y update
apt-get -y install libpcre3 libpcre3-dev gcc
apt-get -y install openssl libssl-dev libxslt-dev libgd-dev libgeoip-dev

git clone git://github.com/vozlt/nginx-module-vts.git

wget http://nginx.org/download/nginx-1.10.3.tar.gz
tar xvf nginx-1.10.3.tar.gz
nginx/1.10.3
./configure --with-cc-opt='-g -O2 -fPIE -fstack-protector-strong -Wformat -Werror=format-security -Wdate-time -D_FORTIFY_SOURCE=2' --with-ld-opt='-Wl,-Bsymbolic-functions -fPIE -pie -Wl,-z,relro -Wl,-z,now' --prefix=/usr/share/nginx --conf-path=/etc/nginx/nginx.conf --http-log-path=/var/log/nginx/access.log --error-log-path=/var/log/nginx/error.log --lock-path=/var/lock/nginx.lock --pid-path=/run/nginx.pid --http-client-body-temp-path=/var/lib/nginx/body --http-fastcgi-temp-path=/var/lib/nginx/fastcgi --http-proxy-temp-path=/var/lib/nginx/proxy --http-scgi-temp-path=/var/lib/nginx/scgi --http-uwsgi-temp-path=/var/lib/nginx/uwsgi --with-debug --with-pcre-jit --with-ipv6 --with-http_ssl_module --with-http_stub_status_module --with-http_realip_module --with-http_auth_request_module --with-http_addition_module --with-http_dav_module --with-http_geoip_module --with-http_gunzip_module --with-http_gzip_static_module --with-http_image_filter_module --with-http_v2_module --with-http_sub_module --with-http_xslt_module --with-stream --with-stream_ssl_module --with-mail --with-mail_ssl_module --with-threads --add-module=/home/webuser/nginx-module-vts

make && make install
make upgrade

rm -rf /usr/sbin/nginx
ln -s /usr/share/nginx/sbin/nginx /usr/sbin/
nginx -V

http
vhost_traffic_status_zone;
vhost_traffic_status_filter_by_host on;

server
location /status {
vhost_traffic_status_display;
vhost_traffic_status_display_format html;
}
不能是localhost不然不生效

wget -c https://github.com/hnlq715/nginx-vts-exporter/releases/download/v0.9.1/nginx-vts-exporter-0.9.1.linux-amd64.tar.gz
tar -xvf nginx-vts-exporter-0.9.1.linux-amd64.tar.gz -C /usr/local/
cd /usr/local/nginx-vts-exporter-0.9.1.linux-amd64/
./nginx-vts-exporter -nginx.scrape_uri http://172.21.10.3:7002/status/format/json &

9913

sudo docker stop nginx-vts-exporter
sudo docker rm nginx-vts-exporter
sudo docker run -d --name nginx-vts-exporter \
--restart=always \
-p 9913:9913 \
--cpuset-cpus=2,1 \
-e nginx.scrape_uri='http://172.21.10.3:7002/status/format/json' \
-e NGINX_HOST=http://172.21.10.3:7002 \
-m 300m \
-v /etc/localtime:/etc/localtime \
docker.io/sophos/nginx-vts-exporter

9913端口
http://1.1.1.4:9913/metrics 查看数据

grafana配置
2949

边缘计算监控突围：Prometheus在5G MEC环境中的瘦身方案
作者：开源大模型智能运维FreeAiOps引言：5GMEC场景下的监控挑战与机遇随着5G多接入边缘计算（MEC）的普及，监控系统面临前所未有的挑战：资源碎片化：边缘节点通常部署在资源受限的硬件上（如ARM服务器、工业网关），CPU和内存容量仅为传统云服务器的1/5网络波动性：MEC设备常位于基站侧或工厂车间，面临高丢包率（5%-15%）和间歇性断网问题数据爆炸：单台MEC设备可能承载数百个物联网终
时序数据库在数据库领域的应用前景数据库管理艺术数据库时序数据库 struts ai
时序数据库在数据库领域的应用前景关键词：时序数据库、时间序列数据、物联网、监控系统、金融分析、大数据、实时分析摘要：本文深入探讨了时序数据库在现代数据管理中的关键作用和应用前景。我们将从时序数据的基本特性出发，分析时序数据库的核心架构和设计原理，比较主流时序数据库产品的技术特点，并通过实际案例展示其在物联网、金融科技、运维监控等领域的应用价值。文章还将提供时序数据库选型指南，探讨未来技术发展趋势，
Apache Ignite控制脚本(control.sh/bat)完全指南秋泉律Samson
ApacheIgnite控制脚本(control.sh/bat)完全指南概述ApacheIgnite的控制脚本(control.sh/bat)是管理Ignite集群的强大工具，它提供了丰富的命令行接口来监控和控制集群状态。本文将全面介绍这个工具的使用方法，帮助管理员高效管理Ignite集群。控制脚本基础控制脚本位于Ignite安装目录的/bin/文件夹下，根据操作系统不同分为：Unix/Linux
Linux 定时任务全解析：atd 与 crond 的区别及实战案例（含日志备份 + 时间写入）睡觉的时候不会困 Linux linux 服务器运维
1.atd和crond两个任务管理程序的区别atd：用于执行一次性的定时任务，即设置任务在某个特定的时间点仅执行一次，适合处理不需要重复执行的定时操作，比如在未来某个确切时间执行一个脚本、发送一份文件等场景。crond：用于执行周期性的定时任务，可按照设定的周期（如每分钟、每小时、每天、每周等）重复执行任务，常用来做系统监控、日志备份、定期数据清理或生成等周期性需求。对比项atdcrond任务执行
达梦数据库监控观测最佳实践
概述达梦企业管理器简称DEM，架构如下：概略来说，每个数据库主机安装代理程序DMAgent，在监控方面，它将指标发送至DEM服务端，用户可访问DEM控制台查看数据主机和实例的监控指标，在DEM进行配置后可通过http://:8080/dem/metrics端点暴露主机和数据库的Prometheus指标，观测云DataKit可从此端点采集指标完成达梦数据库集成。前提条件监控目标可通过DMAgent上
Shell实现服务检查看门程序 angushine shell
最近在项目中碰到Kafka自己关闭的事件，为保证Kafka的高效可用，因此考虑使用Shell加系统定时任务检查，保证服务的高可用检查Zookeeper#!/bin/bash#配置参数TARGET_PORT=2181#监控端口SERVICE_NAME="zookeeper"#服务名称（用于日志记录）CHECK_INTERVAL=5#检测间隔（秒）LOG_FILE="/data/public/kafk
开源流程引擎Camunda简介 ° 安如少年初如梦662 Java学习记录 java 后端
目录简单介绍主要组件与名词介绍常见名词解释核心组件介绍一些思考与前端的关系前端逻辑的简化后端接口的专注流程引擎的控制作用数据和状态的管理监控和管理的集中化参考资料简单介绍Camunda的本质是可以独立运行的一套流程引擎，流程引擎会根据预先设定（类似流程图内的流程图）好的规则和逻辑进行流程执行。主要组件与名词介绍常见名词解释BPMN：即业务流程模型和标记，是一种业界标准的流程建模语言。Camunda
JAVA API (三)：从基础爬虫构建到带条件数据提取 —— 详解 URL、正则与爬取策略钮祜禄.爱因斯晨 JAVA学习笔记 java 爬虫开发语言
个人主页-爱因斯晨文章专栏-Java学习相关文章：API(一)相关文章：API（二）持续努力中，感谢支持一、爬虫基础（一）爬虫的基本概念定义：爬虫是按照一定规则自动抓取网络信息的程序，在Java环境下，可借助URL、HttpURLConnection等API来实现。应用场景：广泛应用于数据采集，如电商平台的价格监控、各类新闻的聚合；还可用于信息分析，如舆情监测等。（二）Java实现简单爬虫的步骤建
闲鱼监控软件 houcaihua python
闲鱼监秒拍控软件可以根据您的需求，在您设定的价格范围内监控货架上的产品，相当于一个筛选闲鱼信息的工具，可以帮助您准确锁定卖家，尤其是专门做闲鱼生意的卖家。这个工具真的很省时省事。当你设定的目标出现时，它会帮助你自动抢购，让你再也不用担心低价好卖的产品被抢占。闲鱼监控助手是一款闲鱼出品的多关键字搜索工具应用。这个应用总体还是挺有用的，在闲鱼上找二手其实也挺有意思的。闲鱼监控助手可以方便的添加你想要关
闲鱼监控助手：挖掘隐藏的宝藏商品
如何通过闲鱼监控助手挖掘隐藏的宝藏商品概述：在闲鱼这个二手交易平台上，有许多隐藏的宝藏商品等待着我们的发现。而要有效地挖掘这些宝藏商品，我们可以借助闲鱼监控助手。本文将详细介绍如何使用闲鱼监控助手来寻找并购买隐藏的宝藏商品。1.安装并设置闲鱼监控助手首先，我们需要在手机上安装并打开闲鱼监控助手应用。然后，在应用内的设置页面中，我们可以根据自己的需求进行一些个性化设置。例如，设置关键词、价格范围、筛
闲鱼助手——监控解析
importrequestsfrombs4importBeautifulSoupfromseleniumimportwebdriverfromapscheduler.schedulers.blockingimportBlockingScheduler#配置Chrome驱动路径chrome_options=webdriver.ChromeOptions()chrome_options.add_arg
闲鱼监控助手：让你的二手购物更加智能化(pb闲鱼监控) keji689 大数据
概述闲鱼监控助手是一款可以帮助用户更加智能化购买二手商品的应用程序。它可以自动监测商品价格变化、货源情况和评论评分等信息，并提供给用户最佳的购物建议。本文将介绍如何使用这个应用程序，以及它可以为你的二手购物带来的便利。如何使用闲鱼监控助手首先，你需要下载并安装这个应用程序。在安装完成后，你需要在设置页面中输入你的闲鱼账号信息。这样应用程序才能够获取你的购物历史和偏好信息，从而为你提供更加个性化的服
从现在开始，让闲鱼监控助手帮你省时省力找宝贝(闲鱼监控助手)
闲鱼监控助手：省时省力找宝贝的利器在如今这个信息爆炸的时代，网购已经成为我们获取商品和服务的主要途径之一。然而，随之而来的是琳琅满目的商品选择，如何在海量商品中快速找到符合自己需求的宝贝成为了一个挑战。幸运的是，闲鱼监控助手作为一款强大的工具，可以帮助我们省时省力地找到心仪的宝贝。功能介绍闲鱼监控助手具有多项实用功能，包括价格监控、关键词搜索、定时提醒等。通过设置价格监控功能，用户可以轻松追踪商品
找懂的做一个闲鱼监控软件，大概要求如下。 adavsv python
闲鱼采集及监控下单软件开发1，点击宝贝右键打开网页2，点击宝贝右键拉黑卖家3，点击宝贝右键清空列表4，强制聊天，软件界面显示的宝贝如果已经被别人付款，可以实现在软件跟卖家沟通，软件界面有与卖家宝贝聊天窗口5，双击鼠标左键下单该宝贝6，点击宝贝左键显示二维码和主图7，闲鱼卖家账号未实人认证可以下单8，软件页面显示宝贝二维码9，软件页面显示宝贝主图10，软件页面显示检测搜索词及下单宝贝11，每次获取的
闲鱼监控助手实战项目：用 Python 实现闲鱼监控+自动秒拍
项目背景：为什么要做这个闲鱼助手？在闲鱼上抢东西，永远拼不过“秒拍党”。游戏机低价挂出，几秒没了优酷年卡、流量卡一上架立刻被拍想转卖赚差价，总是慢一步于是我写了一个Python闲鱼助手，实现自动闲鱼监控+秒拍下单，帮助我快速捡漏、低买高卖。核心功能一览（关键词自然带入）功能模块说明️‍♀️闲鱼监控实时监控指定关键词商品，自动刷新，发现即处理⚡闲鱼秒拍自动拍下匹配条件商品，支持延迟策略更隐蔽钉钉推送
监测生命体征、活动水平的可穿戴电子产品设计方案不脱发的程序猿
移动电话的普及使我们能够随时随地拨打电话。又经过20年的创新后，语音通话已不再是手机这款智能设备的主要功能，它不仅可以拍摄美丽的照片、播放音频和视频流文件，而且还提供各种各样的服务：现在还逐渐成为我们的私人教练。配备传感器或者连接到穿戴式传感器后，这些设备可用来监控日常活动和个人健康状况。在不断增强的健康意识推动下，人们开始关注测量生命体征参数：如心率、体温、血氧饱和度、血压、活动水平(运动量)和
Zabbix企业级分布式监控付出不多 zabbix 分布式
目录一、zabbix监控系统1.1监控的五大核心类型1.2监控的五层逻辑架构（1）基础设施监控（2）系统层监控（3）应用层监控（4）业务监控（5）端用户体验监控二、监控系统的技术原理2.1监控系统的核心模块2.2数据采集协议分类2.3数据采集模式（1）被动模式（2）主动模式2.4分布式代理架构三、主流开源监控系统对比3.1Zabbix3.2Prometheus+Grafana3.3Nagios3.
最终报告5 阶段复盘报告 Alex_0790
1.我学习的亮点和不足是什么？（作答要求：先写清楚自己的学习目标，找出超出预期的地方，即为亮点；找出低于预期的地方，即为不足）学习目标：能够把元认知课程的知识运用到学习与生活的实践中去。超出预期的地方：首先，在学习完这门课程之后，学会在每个学习的阶段从不同的领域去关注，能够通过认知领域，情感动机领域，行为领域，情景领域来更加细化每个阶段所对应的具体方面。另外，我还能够在学习的过程中监控自己，而不是
HBase监控也想洒脱 JanusGraph hbase
Prometheus+Grafana搭建HBase监控参考https://blog.csdn.net/devcloud/article/details/115069449
HBase 监控 | HBase Metrics 初探（一）禅克
前言：对于任意一个系统而言，做好监控都是非常重要的，HBase也不例外。经常，我们会从JMX中获取相关指标来做展示、对HBase进行监控，那这些指标是怎么生成的呢？如果你想自定义自己的监控指标又该怎么做呢？基于好奇之心和学习的目的，最近打算学习一下HBase监控相关原理及实现，今天先简单捋一捋思路。1.如何下手？我一向比较喜欢先看项目所依赖的pom文件，打开HBase源码，有两个非常相关的模块：h
Kafka服务器的简单部署以及消息的生产、消费、监控
目录1.在服务器上安装Kafka1.1直接安装1.2使用镜像方式配置到服务器1.准备Kafka镜像(1)远程拉取Kafka镜像(2)在本地下载镜像并上传至服务器启动2.创建配置目录1.3编写DockerCompose文件1.4启动Kafka服务(2)测试Kafka服务2.在项目中进行调用2.1消息的生产：（1）首先安装Confluent.Kafka库（NuGet包）（2）向Kafka所在服务器生产
全面指南：如何监控Kafka Topic的生产者客户端码农阿豪@新空间包罗万象 kafka 分布式
个人名片作者简介：java领域优质创作者个人主页：码农阿豪工作室：新空间代码工作室（提供各种软件服务)个人邮箱：[[email protected]]个人微信：15279484656个人导航网站：www.forff.top座右铭：总有人要赢。为什么不能是我呢？专栏导航：码农阿豪系列专栏导航面试专栏：收集了java相关高频面试题，面试实战总结️Spring5系列专栏：整理了Spring5重要知识点与
供应链可视化工具：穿透全球贸易的迷雾花海如潮淹人工智能机器学习大数据
⚡企业的三重供应链炼狱1.多级库存的幽灵黑洞某消费电子公司因无法追踪三级供应商库存，错判芯片缺口30%，导致新品延期损失**$1.8亿**（Gartner2024报告）。更致命的是，53%的企业无法实时查看二级以下库存（IDC全球供应链调研），计划体系形同虚设。2.物流黑箱的蝴蝶效应红海危机中某车企因未实时监控绕行航线，2000辆新车滞留港口45天（马士基航运数据）。传统跟踪依赖邮件问询，异常响应
服务网格可观测性深度实践与创新优化 zzywxc787 网络实时互动经验分享电脑 AI编程 java
主题：突破服务网格监控瓶颈——基于eBPF的无侵入式全链路可观测性实践技术领域：云原生/微服务/服务网格（ServiceMesh）一、问题背景：传统服务网格监控的痛点在Istio、Linkerd等服务网格架构中，可观测性依赖Sidecar代理（如Envoy）采集指标、日志和链路数据。但存在三大瓶颈：性能损耗：Sidecar的流量拦截与上报消耗额外CPU（10%~15%）；数据割裂：应用层业务指标与
filebeat原理架构 jiedaodezhuti 架构
Filebeat是基于Golang开发的轻量级日志采集Agent，其核心架构设计围绕高效、可靠地采集与转发日志数据，主要组件和工作流程如下：‌一、核心架构组件‌‌输入(Inputs)‌负责监控指定的日志源（如文件路径、日志文件）。每个日志源由独立的‌Harvester（采集器）‌处理。‌Harvester（采集器）‌职责‌：逐行读取单个日志文件内容，将数据发送至处理引擎（Libbeat）。‌特性‌
计算机视觉：人工智能的“眼睛” 人工智能教程人工智能计算机视觉机器学习算法 pytorch python 数据结构
前言在人工智能的众多领域中，计算机视觉（ComputerVision）无疑是其中最为引人注目的方向之一。它赋予了机器“看”的能力，使计算机能够像人类一样理解和解释视觉信息。从自动驾驶汽车到医疗影像诊断，从安防监控到虚拟现实，计算机视觉的应用场景无处不在，深刻地改变着我们的生活和工作方式。本文将深入探讨计算机视觉的核心技术、应用场景以及未来的发展趋势，帮助您全面了解这一充满活力的领域。一、计算机视觉
EFK架构日志采集系统
以下是基于‌Filebeat+Elasticsearch+Kibana（EFK）‌构建日志采集系统的核心要点及部署指南，综合多来源最佳实践整理：一、架构核心要点‌组件角色‌‌Filebeat‌：轻量级日志采集器，实时监控文件/目录变化，高效转发日志数据（资源占用仅为Logstash的1/10）。‌Elasticsearch‌：分布式搜索引擎，存储日志并提供实时检索与分析能力。‌Kibana‌：可视
部署 Zabbix 企业级分布式监控别骂我h zabbix 分布式网络
一、监控系统的功能概述监控，从中文的字义来看，有两个内容，一是检测，二是控制。重点在第一个字眼，即检测、预防的意思。监控，对应的英文单词是Monitoring。在计算机领域，可以将其分为5种监控类型：应用性能监控业务交易监控网络性能监控操作系统监控上面5种类型将监控这个概念划分成了多个领域。我们通常所说的监控，都会模糊地包含以上5个细分的领域。在任何一个IT业务环境中，都会存在各种各样的硬件设备、
深度学习在环境感知中的应用：案例与代码实现
让机器学会“看”世界：深度学习如何赋能环境感知？关键词深度学习|环境感知|计算机视觉|传感器融合|语义分割|目标检测|自动驾驶摘要环境感知是机器与外界互动的“眼睛和耳朵”——从自动驾驶汽车识别行人，到智能机器人避开障碍物，再到城市监控系统检测异常，所有智能系统都需要先“理解”环境，才能做出决策。传统环境感知方法依赖手工特征提取，难以应对复杂场景；而深度学习通过数据驱动的方式，让机器从大量数据中自动
Zabbix 企业级分布式监控部署伤不起bb zabbix 分布式
目录一、监控系统基础认知1.为什么需要监控？2.监控的5个层次（从底层到上层）3.监控系统的基本原理二、Zabbix系统详解1.Zabbix是什么？2.Zabbix核心功能3.Zabbix核心组件三、Zabbix部署实战（分布式架构）1.环境准备（4台服务器）2.部署ZabbixServer（核心步骤）步骤1：添加Zabbix源并安装依赖步骤2：配置数据库步骤3：导入Zabbix初始数据步骤4：配
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

docker 搭建prometheus监控

TYPE docker_runtime counter

你可能感兴趣的:(prometheus,监控)