陌殇殇殇

Prometheus监控系统

基础环境

[root@localhost ~]# hostnamectl set-hostname prometheus-server
[root@localhost ~]# bash
[root@prometheus-server ~]# systemctl disable firewalld --now && setenforce 0
[root@prometheus-server ~]# sed -i 's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config

[root@prometheus-server ~]# mv /etc/yum.repos.d/CentOS-* /tmp/
[root@prometheus-server ~]# curl -o /etc/yum.repos.d/centos.repo http://mirrors.aliyun.com/repo/Centos-7.repo
[root@prometheus-server ~]# curl -o /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo

安装prometheus组件说明：

Prometheus Server: 普罗米修斯的主服务器,端口号9090

NodeEXporter: 负责收集Host硬件信息和操作系统信息，端口号9100

cAdvisor:负责收集Host上运行的容器信息,端口号占用8080

Grafana：负责展示普罗米修斯监控界面，端口号3000

Altermanager：等待接收prometheus发过来的告警信息，altermanager再发送给定义的收件人

Prometheus部署

解压二进制包

[rootprometheus-server prometheus-2.28.0]# cd /usr/local/src/
[root@prometheus-server prometheus-2.28.0]# tar -zxvf prometheus-2.28.0.linux-amd64.tar.gz
[root@prometheus-server prometheus-2.28.0]# mv prometheus-2.28.0.linux-amd64 prometheus-2.28.0

添加systemd管理

[root@prometheus-server prometheus-2.28.0]# cat /usr/lib/systemd/system/prometheus.service 
[Unit]
Description=prometheus
[Service]
ExecStart=/usr/local/src/prometheus-2.28.0/prometheus --config.file=/usr/local/src/prometheus-2.28.0/prometheus.yml
ExecReload=/bin/kill -HUP $MAINPID
KillMode=process
Restart=on-failure
[Install]
WantedBy=multi-user.target

加载配置并启动

[root@prometheus-server prometheus-2.28.0]# systemctl daemon-reload
[root@prometheus-server prometheus-2.28.0]# systemctl restart prometheus
[root@prometheus-server prometheus-2.28.0]# systemctl enable prometheus --now
Created symlink from /etc/systemd/system/multi-user.target.wants/prometheus.service to /usr/lib/systemd/system/prometheus.service.

[root@prometheus-server prometheus-2.28.0]# cat prometheus.yml 
# my global config
global:
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration
alerting:
  alertmanagers:
  - static_configs:
    - targets:
      # - alertmanager:9093    # 开启alertmanager告警，去掉 # 号即可

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  # - "first_rules.yml"      # prometheus读取监控的数据文件
  # - "second_rules.yml"

# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:
  # The job name is added as a label `job=` to any timeseries scraped from this config.
  - job_name: 'prometheus'

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.

    static_configs:
    - targets: ['localhost:9090']

  - job_name: 'node server'
    static_configs:
     - targets: ['192.168.33.145:9100','192.168.33.142:9100']    # 监控 node_exporter 数据，主要监控node节点数据（内存，cpu，负载等）

  - job_name: 'docker'
    static_configs:
     - targets: ['192.168.33.145:8080']       #  cadvisor 服务，主要监控docker数据

[root@prometheus-server prometheus-2.28.0]# ps -ef | grep prometheus
root       2075      1  0 03:55 ?        00:00:00 /usr/local/src/prometheus-2.28.0/prometheus --config.file=/usr/local/src/prometheus-2.28.0/prometheus.yml
root       2152   1745  0 04:06 pts/0    00:00:00 grep --color=auto prometheus
[root@prometheus-server prometheus-2.28.0]# netstat -ntpl           
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name    
tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN      1029/sshd           
tcp        0      0 127.0.0.1:25            0.0.0.0:*               LISTEN      1161/master         
tcp6       0      0 :::9090                 :::*                    LISTEN      2075/prometheus     
tcp6       0      0 :::22                   :::*                    LISTEN      1029/sshd           
tcp6       0      0 ::1:25                  :::*                    LISTEN      1161/master

node_exporter部署

解压二进制包

[root@prometheus-server node_exporter-1.2.2]# tar -zxvf node_exporter-1.2.2.linux-amd64.tar.gz
[root@prometheus-server node_exporter-1.2.2]# mv node_exporter-1.2.2.linux-amd64 node_exporter-1.2.2

添加systemd管理

[root@prometheus-server node_exporter-1.2.2]# cat /usr/lib/systemd/system/node_exporter.service    
[Unit]
Description=node_exporter
[Service]
ExecStart=/usr/local/src/node_exporter-1.2.2/node_exporter  --collector.systemd --collector.systemd.unit-include=(docker|sshd|nginx).service
ExecReload=/bin/kill -HUP $MAINPID
KillMode=process
Restart=on-failure
[Install]
WantedBy=multi-user.target

加载配置并启动

[root@prometheus-server node_exporter-1.2.2]# systemctl daemon-reload
[root@prometheus-server node_exporter-1.2.2]# systemctl enable node_exporter --now
Created symlink from /etc/systemd/system/multi-user.target.wants/node_exporter.service to /usr/lib/systemd/system/node_exporter.service.

grafana部署

解压二进制包

[root@prometheus-server grafana-8.0.3]# tar -zxvf grafana-enterprise-8.0.3.linux-amd64.tar.gz

添加systemd管理

[root@prometheus-server grafana-8.0.3]# cat /usr/lib/systemd/system/grafana.service
[Unit]
Description=grafana
[Service]
ExecStart=/usr/local/src/grafana-8.0.3/bin/grafana-server -homepath=/usr/local/src/grafana-8.0.3
ExecReload=/bin/kill -HUP $MAINPID
KillMode=process
Restart=on-failure
[Install]
WantedBy=multi-user.target

加载配置并启动

[root@prometheus-server grafana-8.0.3]# systemctl daemon-reload
[root@prometheus-server grafana-8.0.3]# systemctl enable grafana --now
Created symlink from /etc/systemd/system/multi-user.target.wants/grafana.service to /usr/lib/systemd/system/grafana.service.

grafana模板下载地址

https://grafana.com/grafana/dashboards

### 常用模板
193  docke监控r模板
9276  node节点监控模板
7362  mysql监控模板

默认用户/密码 admin/admin

alertmanager部署

解压二进制包

[root@prometheus-server alertmanager-0.23.0]# tar -zxvf alertmanager-0.23.0.linux-amd64.tar.gz
[root@prometheus-server alertmanager-0.23.0]# mv alertmanager-0.23.0.linux-amd64 alertmanager-0.23.0

添加systemd管理

[root@prometheus-server alertmanager-0.23.0]# cat /usr/lib/systemd/system/alertmanager.service
[Unit]
Description=alertmanager
[Service]
ExecStart=/usr/local/src/alertmanager-0.23.0/alertmanager --config.file=/usr/local/src/alertmanager-0.23.0/alertmanager.yml
ExecReload=/bin/kill -HUP $MAINPID
KillMode=process
Restart=on-failure
[Install]
WantedBy=multi-user.target

加载配置并启动

[root@prometheus-server alertmanager-0.23.0]# systemctl daemon-reload
[root@prometheus-server alertmanager-0.23.0]# systemctl enable alertmanager --now
Created symlink from /etc/systemd/system/multi-user.target.wants/alertmanager.service to /usr/lib/systemd/system/alertmanager.service.

重启alertmanager

systemctl restart alertmanager

cadvisor部署

下载二进制包

[root@prometheus-server ~]# wget https://github.com/google/cadvisor/releases/download/v0.37.5/cadvisor
[root@prometheus-server ~]# mv cadvisor /usr/local/bin/
[root@prometheus-server ~]# chmod +x /usr/local/bin/cadvisor

添加systemd管理

[root@prometheus-server ~]# cat /usr/lib/systemd/system/cadvisor.service
[Service]
# 端口 8080
ExecStart=/usr/local/bin/cadvisor -port=8080

[Install]
WantedBy=multi-user.target

[Unit]
Description=cadvisor
After=network.target

加载配置并启动

[root@prometheus-server ~]# systemctl enable cadvisor --now
Created symlink from /etc/systemd/system/multi-user.target.wants/cadvisor.service to /usr/lib/systemd/system/cadvisor.service.

配置Alertmanager报警

启动 AlertManager 来接受 Prometheus 发送过来的报警信息，并执行各种方式的报警。

alertmanager与prometheus工作流程如下

prometheus收集监测的信息
prometheus.yml文件定义rules文件，rules里包括了告警信息
prometheus把报警信息push给alertmanager ，alertmanager里面有定义收件人和发件人
alertmanager发送文件给邮箱或微信

告警等级

Inactive		### 正常
Pending			### 已触发阈值，但未满足告警持续时间
Firing			### 已触发阈值且满足告警持续时间，警报发送给接受者

AlertManager 默认配置文件为 alertmanager.yml，在容器内路径为/etc/alertmanager/alertmanager.yml

这里 AlertManager 默认启动的端口为 9093，启动完成后，浏览器访问http://:9093 可以看到默认提供的 UI 页面，不过现在是没有任何告警信息的，因为我们还没有配置报警规则来触发报警

[root@prometheus-server alertmanager-0.23.0]# cat alertmanager.yml
#route:
#  group_by: ['alertname']
#  group_wait: 30s
#  group_interval: 5m
#  repeat_interval: 1h
#  receiver: 'web.hook'
#receivers:
#- name: 'web.hook'
#  webhook_configs:
#  - url: 'http://127.0.0.1:5001/'
#inhibit_rules:
#  - source_match:
#      severity: 'critical'
#    target_match:
#      severity: 'warning'
#    equal: ['alertname', 'dev', 'instance']

global:
  resolve_timeout: 5m
  smtp_from: '[email protected]'						### 定义发送的邮箱
  smtp_smarthost: 'smtp.qq.com:465'
  smtp_auth_username: '[email protected]'
  smtp_auth_password: 'xxx'
  smtp_require_tls: false
  smtp_hello: 'qq.com'
route:
  group_by: ['alertname']
  group_wait: 5s
  group_interval: 5s
  repeat_interval: 5m
  receiver: 'email'
receivers:
- name: 'email'
  email_configs:
  - to: '[email protected]'									### 定义接受的邮箱
    send_resolved: true
inhibit_rules:
  - source_match:
      severity: 'critical'
    target_match:
      severity: 'warning'
    equal: ['alertname', 'dev', 'instance']

简单介绍一下主要配置的作用：简单介绍一下主要配置的作用：

global: 全局配置，包括报警解决后的超时时间、SMTP 相关配置、各种渠道通知的 API 地址等等。

route: 用来设置报警的分发策略，它是一个树状结构，按照深度优先从左向右的顺序进行匹配。

receivers: 配置告警消息接受者信息，例如常用的 email、wechat、slack、webhook 等消息通知方式。

inhibit_rules: 抑制规则配置，当存在与另一组匹配的警报（源）时，抑制规则将禁用与一组匹配的报警（目标）。

prometheus添加alertmanager报警规则

在 Prometheus 配置 AlertManager 服务地址以及告警规则，新建报警规则文件 node-up.rules

[root@prometheus-server prometheus-2.28.0]# mkdir rules
[root@prometheus-server prometheus-2.28.0]# cat rules/node-up.rules
groups:
- name: node-up
  rules:
  - alert: node-up
    expr: up{job="docker"} == 0			### job_name 是在 prometheus.yml 里面设置
    for: 15s
    labels:
      severity: 1 
      team: node
    annotations:
      summary: "{{ $labels.instance }} 已停止运行超过 15s！"

修改prometheus.yml文件，添加rules规则

这里 rule_files 为容器内路径，需要将本地 node-up.rules 文件挂载到容器内指定路径，修改 Prometheus 启动命令如下，并重启服务。

[root@prometheus-server prometheus-2.28.0]# cat prometheus.yml 
# my global config
global:
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.

alerting:
  alertmanagers:
  - static_configs:
    - targets:
      # - alertmanager:9093
      - 192.168.169.206:9093

rule_files:
  - "/usr/local/src/prometheus-2.28.0/rules/*.rules"

scrape_configs:
  - job_name: 'prometheus'

    static_configs:
    - targets: ['localhost:9090']

  - job_name: 'linux'
    static_configs:
    - targets: ['192.168.169.206:9100']

  - job_name: 'docker'
    static_configs:
    - targets: ['192.168.169.206:8080']

在prometheus上查看相应的规则

触发报警发送邮件

[root@prometheus-server prometheus-2.28.0]# systemctl stop cadvisor
[root@prometheus-server prometheus-2.28.0]# systemctl status cadvisor
● cadvisor.service - cadvisor
   Loaded: loaded (/usr/lib/systemd/system/cadvisor.service; enabled; vendor preset: disabled)
   Active: inactive (dead) since Mon 2023-12-18 19:54:54 CST; 1h 1min ago
  Process: 14887 ExecStart=/usr/local/bin/cadvisor -port=8080 (code=exited, status=0/SUCCESS)
 Main PID: 14887 (code=exited, status=0/SUCCESS)

Dec 18 10:19:10 prometheus-server systemd[1]: Started cadvisor.
Dec 18 19:54:54 prometheus-server systemd[1]: Stopping cadvisor...
Dec 18 19:54:54 prometheus-server cadvisor[14887]: I1218 19:54:54.883895   14887 manager.go:1185] Exiting thread watching subcontainers
Dec 18 19:54:54 prometheus-server cadvisor[14887]: I1218 19:54:54.884555   14887 manager.go:403] Exiting global housekeeping thread
Dec 18 19:54:54 prometheus-server cadvisor[14887]: I1218 19:54:54.884644   14887 cadvisor.go:245] Exiting given signal: terminated
Dec 18 19:54:54 prometheus-server systemd[1]: Stopped cadvisor.

alertmanager自定义邮件报警

[root@prometheus-server alertmanager-0.23.0]# cat template/email.tmpl
{{ define "email.from" }}[email protected]{{ end }}
{{ define "email.to" }}[email protected]{{ end }}
{{ define "email.to.html" }}
{{ range .Alerts }}
====================start====================<br>
告警程序: prometheus_alert <br>
告警级别: {{ .Labels.severity }} 级 <br>
告警类型: {{ .Labels.alertname }} <br>
故障主机: {{ .Labels.instance }} <br>
告警主题: {{ .Annotations.summary }} <br>
告警详情: {{ .Annotations.description }} <br>
触发时间: {{ (.StartsAt.Add 28800e9).Format "2006-01-02 15:04:05" }} <br>
=====================end=====================<br>
{{ end }}
{{ end }}

[root@prometheus-server alertmanager-0.23.0]# cat alertmanager.yml
global:
  resolve_timeout: 5m
  smtp_from: '[email protected]'
  smtp_smarthost: 'smtp.qq.com:465'
  smtp_auth_username: '[email protected]'
  smtp_auth_password: 'xxx'
  smtp_require_tls: false
  smtp_hello: 'qq.com'

templates:
  - '/usr/local/src/alertmanager-0.23.0/template/*.tmpl'

route:
  group_by: ['alertname']
  group_wait: 5s
  group_interval: 5s
  repeat_interval: 5m
  receiver: 'email'

receivers:
- name: 'email'
  email_configs:
  - to: '[email protected]'
    html: '{{ template "email.to.html" . }}'

inhibit_rules:
  - source_match:
      severity: 'critical'
    target_match:
      severity: 'warning'
    equal: ['alertname', 'dev', 'instance']

测试

Linux文件权限管理 IT摆渡者网络服务器运维 linux
Linux文件权限管理：告别777，掌握核心操作在Linux系统中，文件权限是保障系统安全的基础。不少运维新手图省事，动辄给文件设置777权限，这其实隐藏着巨大安全风险。本文带你快速掌握Linux文件权限的核心知识与实用操作，摆脱对777的依赖。一、文件权限基础概念Linux通过"用户类别+权限类型"实现权限管控，核心要素包括：•三类用户：拥有者（user）、用户组（group）、其他用户（oth
探秘阿里云消息队列：解锁分布式系统的异步通信奥秘云资源服务商阿里云云计算中间件
阿里云消息队列：分布式架构的基石在当今数字化快速发展的时代，分布式系统已成为企业构建高可用、高性能应用的关键架构。而消息队列，作为分布式系统中的重要组件，犹如基石一般，支撑着整个架构的稳定运行。它能够有效地解决分布式系统中的异步通信、解耦、削峰填谷等问题，为系统的可靠性和扩展性提供了强大的保障。阿里云作为云计算领域的领军者，其推出的阿里云消息队列凭借着卓越的性能、高可靠性以及丰富的功能，成为了众多
边缘人工智能与医疗AI融合发展路径：技术融合与应用前景（上） Allen_Lyb 数智化医院2025 人工智能健康医疗算法
引言人工智能技术正以前所未有的速度改变着医疗保健领域，从辅助诊断到个性化治疗，AI应用的广度和深度不断拓展。在这一浪潮中，边缘人工智能（EdgeAI）作为一种新兴技术范式，正成为推动医疗AI创新的关键力量。边缘AI区别于传统的云计算模式，它将数据处理和AI模型部署在数据源头附近，实现快速响应和隐私保护。这种特性使其在医疗保健领域具有独特优势，特别是在实时监测、紧急响应和患者隐私保护等方面。边缘AI
快速掌握Python编程基础张彦峰ZYF python
干货分享，感谢您的阅读！备注：本博客将自己初步学习Python的总结进行分享，希望大家通过本博客可以在短时间内快速掌握Python的基本程序编码能力，如有错误请留言指正，谢谢！（持续更新）一、快速了解Python和环境准备（一）Python快速介绍Python是一种简洁、强大、易读的编程语言，广泛应用于Web开发、数据分析、人工智能、自动化运维等领域。它由GuidovanRossum在1991年设
智慧城市大脑：城市治理的新引擎 Fulima_cloud 智慧城市人工智能
在科技日新月异的今天，智慧城市的概念已经深入人心。而智慧城市大脑，作为智慧城市的中枢神经系统，运用大数据、云计算、物联网、人工智能等先进技术，构建的城市级智能化管理体系，正逐步成为提升城市治理能力、优化城市服务、推动城市可持续发展的重要力量。智慧城市大脑是什么，简而言之，是运用大数据、云计算、物联网、人工智能等先进技术，构建的城市级智能化管理体系。它如同城市的“智慧中枢”，通过对城市全域运行数据的
CentOS服务器SSH远程连接全指南 Sally璐璐运维服务器 centos ssh
CentOS服务器SSH远程连接全攻略｜从安装到安全配置保姆级教程作为运维新手第一次接触CentOS服务器时，被SSH配置搞得焦头烂额！整理了从安装到高级安全设置的全流程，附超详细命令和避坑指南，手把手教你搞定远程连接基础概念扫盲SSH（SecureShell）：Linux服务器最常用的远程管理协议，通过加密传输防止数据窃听。它采用非对称加密技术，在客户端和服务器之间建立安全通道，可以有效防止中间
涨薪技术|Prometheus之PromQL操作符川石课堂软件测试 prometheus python 数据库 postman 测试工具 appium 功能测试
使用PromQL除了能够方便的按照查询和过滤时间序列以外，PromQL还支持丰富的操作符，用户可以使用这些操作符对进一步的对事件序列进行二次加工。这些操作符包括：数学运算符，逻辑运算符，布尔运算符等等。01数学运算例如，我们可以通过指标node_memory_free_bytes_total获取当前主机可用的内存空间大小，其样本单位为Bytes。这是如果客户端要求使用MB作为单位响应数据，那只需要
Docker容器如何实现分布式微服务：从0到1的深度解析 cda2024 docker 分布式微服务
在当今云计算和大数据时代，企业面临的最大挑战之一是如何快速、稳定地部署和管理复杂的软件应用。传统的单体架构已难以满足现代互联网应用的需求，而分布式微服务架构成为了解决这一难题的关键。但问题随之而来：如何高效地构建和管理分布式微服务？Docker容器技术的出现为这个问题带来了新的曙光。它不仅简化了应用程序的打包和部署过程，还为微服务架构提供了强大的支持。本文将深入探讨Docker容器如何实现分布式微
【云计算解决方案面试整理】3-7主流云计算平台、云计算架构、安全防护不太灵光的程序员阿里云云计算工程师ACP认证云计算云计算面试架构
准备面云计算解决方案的岗位，整理了一些，也请大佬们指点。文档分为云计算基础概念、云计算技术原理、主流云计算平台（以天翼云为例）、云计算架构（弹性设计、高可用设计、高性能设计）、安全防护几个方面。三、主流云计算平台1.阿里云云计算平台强大的计算能力：拥有自主研发的飞天操作系统，可提供高效、稳定的计算服务，能够满足大规模数据处理和高并发业务的需求。例如，在应对双11这样的高并发场景时，飞天系统可以快速
Kubernetes日志运维痛点及日志系统架构设计（Promtail+Loki+Grafana）
Kubernetes日志运维痛点及日志系统架构设计（Promtail+Loki+Grafana）运维痛点日志采集的可靠性与复杂性pod生命周期短、易销毁容器重启或Pod被销毁后，日志会丢失（除非已持久化或集中采集）。需要侧重于实时采集和转发，而不能依赖节点本地日志。多样化的日志来源与格式应用日志、系统日志、Kubernetes组件日志（如kubelet、kube-apiserver）、中间件日志（
如何利用AWS Lambda作为Serverless数据库进行大数据处理 AI天才研究院 AI人工智能与大数据自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术Serverless数据库一直是构建数据分析应用的主要选择之一。它能帮助客户节省运行服务所需的服务器成本、快速弹性扩展和自动伸缩能力，并且能提升整体性能，有效减少运维和开发资源投入。但是，在实际生产环境中，它们也面临着很多技术上的挑战，比如如何让Serverless数据库服务可以像传统数据库一样，做到高并发处理、实时计算等。而AWSLambda为Serverless数据
[创业之路-474]：企业经营层 - 小米与华为多维对比分析（2025年视角），以后不要把这两家公司放在同一个维度上进行比较了文火冰糖的硅基工坊创业之路华为跨学科融合架构经营科技重构
一、行业定位与市场角色不同华为：用技术手段解决行业的难题，顺便赚钱技术驱动型硬科技企业：以通信设备起家，延伸至智能手机、芯片、操作系统（鸿蒙）、云计算、智能汽车等领域，构建“云-管-端”全栈技术生态。高端市场主导者：在600美元以上高端手机市场占比29%，PuraX折叠屏系列定位“科技奢侈品”，问界M9成为50万以上车型销冠。政企市场深耕者：通过“华为中国政企业务”独立运营，2023年政企收入占比
AI 正在深度重构软件开发的底层逻辑和全生命周期，从技术演进、流程重构和未来趋势三个维度进行系统性分析
AI正在深度重构软件开发的底层逻辑和全生命周期，从需求分析到运维维护的每个环节都产生了范式级变革。以下从技术演进、流程重构和未来趋势三个维度进行系统性分析：一、AI重构软件开发全栈的技术图谱需求工程智能化NLP驱动的需求解析：GPT-4架构实现用户访谈转录自动转化为UML用例图，准确率达89%（微软2023内部数据）情感计算应用：基于BERT的意图识别模型可捕捉用户需求中的隐性情绪，需求变更预测准
一文读懂主流云厂商的云安全产品对比｜小白也能看懂！
☁️一文读懂主流云厂商的云安全产品对比｜小白也能看懂！云服务器是“家”，安全产品就是“门锁、摄像头、护栏”——你搭了房子，总得保护吧？无论你是初创开发者，还是企业运维，选对安全产品比你想象中更重要。但问题来了，阿里云、腾讯云、华为云这三大厂商的云安全产品看起来都差不多，到底有什么区别？作为一个云安全小白，云安全产品那么多到底是什么以及最后该怎么选？！一、安全防护到底防的是什么？很多人以为“云安全”
Fortinet Security Fabric 解决方案：构建智能化、一体化的网络安全防御体系江苏思维驱动智能研究院有限公司安全 fabric web安全
一、方案背景与核心价值：应对数字化时代的安全挑战在云计算、物联网、远程办公等技术普及的背景下，企业网络边界逐渐模糊，攻击面呈指数级扩展。传统单点安全产品难以应对多维度威胁渗透，而FortinetSecurityFabric（安全架构）以“集成化、自动化、智能化”为核心，通过安全能力的协同联动与威胁情报共享，构建覆盖全网络环境的动态防御体系。其核心价值在于：打破安全孤岛：整合分散的安全组件，避免多产
116、掌握Docker Compose与Kubernetes：Rust应用部署实操多多的编程笔记 Rust之Web开发 docker kubernetes rust
Rust部署与运维：掌握使用DockerCompose、Kubernetes等工具进行应用部署和管理1.引言Rust是一种注重性能、安全和并发的系统编程语言。近年来，随着云计算和微服务架构的普及，如何将Rust应用部署到生产环境中，成为越来越多开发者关注的问题。本文将介绍如何使用DockerCompose和Kubernetes等工具进行Rust应用的部署和管理。2.DockerCompose简介D
自动化运维工程师实操面试题
以下是针对Ansible、Zabbix、ElasticsearchLogstashKibana（ELK）设计的2道综合实操题，难度适中且结合实际应用场景：实操题1：Ansible自动化部署Zabbix监控平台并集成ELK日志分析题目背景某企业需要通过Ansible自动化部署Zabbix监控服务器（含Agent）、Elasticsearch、Logstash、Kibana（ELK）日志分析系统，并实
AI 的出现，是否能替代 IT 从业者？敲代码的苦13 人工智能
在科技浪潮奔涌向前的时代，AI正以惊人的速度渗透进各个领域，IT行业首当其冲。当AI编写代码的效率不断提升，当智能算法能够快速完成系统故障诊断，当自动化工具可以处理大量数据运维工作，IT从业者们不禁心生疑虑：AI真的会成为“职业终结者”，将自己从岗位上彻底替代吗？这场关于AI与IT从业者未来的讨论，充满了争议与悬念，也关乎着无数人的职业命运。一、AI在IT领域的应用现状编程开发中的AIAI在编程开
Linux 磁盘管理、文件系统、VLM和配额：从基础到实战指南燕841 linux 运维服务器
在Linux系统运维中，磁盘管理是保障系统稳定运行的核心环节。无论是服务器扩容、新硬盘挂载，还是灵活调整存储空间，都离不开对磁盘分区、文件系统和逻辑卷的深入理解。本文将从磁盘基础讲起，逐步解析分区策略、文件系统创建、挂载管理及LVM逻辑卷技术，助你轻松驾驭Linux存储管理。一、磁盘基础：机械与固态计算机的存储核心是硬盘，从存储介质上可分为两类：机械硬盘（HDD）：依靠盘片旋转和磁头读写数据，内部
Go项目上线部署最佳实践：Docker容器化从入门到进阶程序员爱钓鱼 qt 开发语言 golang 后端数据库
在《Go语言实战指南》的“构建与部署”章节中，Docker容器化部署是现代Go应用发布与运维的重要方式之一。通过将Go应用打包进Docker容器，我们可以实现“构建一次，处处运行”，无论目标服务器操作系统如何，都可以保持一致的运行环境。一、为什么使用Docker容器部署Go应用？Go原生编译出的可执行文件已具备高度可移植性，但在实际部署中仍会面临以下挑战：•不同环境存在依赖不一致•需要运维脚本或部
Docker快速部署Hive服务长路 ㅤ 运维 Docker配置 Hive环境大数据远程调试
文章目录前言Docker快速配置hive环境资料获取前言博主介绍：✌目前全网粉丝4W+，csdn博客专家、Java领域优质创作者，博客之星、阿里云平台优质作者、专注于Java后端技术领域。涵盖技术内容：Java后端、大数据、算法、分布式微服务、中间件、前端、运维等。博主所有博客文件目录索引：博客目录索引(持续更新)CSDN搜索：长路视频平台：b站-Coder长路Docker快速配置hive环境Ap
mediamtx v1.13.0版本深度解读：全面升级RTSP加密支持及多项关键改进解析
一、引言在现代视频流和实时传输技术迅速发展的背景下，开源流媒体服务器mediamtx的更新备受关注。2025年7月7日，mediamtx发布了v1.13.0版本，此版本带来了大量重要的功能增强和漏洞修复，尤其是在RTSP协议支持、加密传输、KLV元数据路由等方面做出了卓越提升。本文将从新特性、修复与提升、安全机制、依赖库升级等多个角度，详细解读mediamtxv1.13.0版本，助力开发者和运维人
FTP太不安全了？SFTP 替代方案构建企业级文件传输服务全指南
你有没有遇到过这种事？某天凌晨，公司官网突然崩了，运维排查一整圈，最后发现是某个FTP用户密码泄露被人植入了木马网页。那一刻你可能才突然意识到，FTP这玩意儿，居然还在你们系统里悄悄跑着，而且还是“裸奔”。不夸张地说，FTP在今天的互联网环境下已经是“古董级危险品”了。所以，我们今天不讲理论，不聊历史，只聊一件事：用SFTP替换FTP，怎么一步步在企业环境里真正落地？为什么FTP是“老虎凳”，而不
构建企业级大模型运行监控体系：健康度五级指标与实战部署路径全解析
构建企业级大模型运行监控体系：健康度五级指标与实战部署路径全解析关键词：模型运行监控、健康度分级体系、DeepSeek、私有化部署、Prometheus、Grafana、异常检测、推理稳定性、性能观测、可视化大屏摘要：在DeepSeek大模型私有化部署的生产环境中，传统的“是否可用”监控已难以满足对模型稳定性、推理质量与异常风险的精细管理需求。为此，企业必须构建一套基于五级健康度模型的全维监控体系
高压电缆护层安全的智能防线：TLKS-PLGD 监控设备深度解析李子圆圆安全
在现代电力系统庞大复杂的网络中，高压电缆护层是守护电力传输的"隐形铠甲"，其安全直接影响电网稳定。传统监测手段响应慢、精度低，难以满足安全运维需求。TLKS-PLGD高压电缆护层环流监控设备应运而生，提供智能化解决方案。智能监测：全方位守护TLKS-PLGD专为高压电缆护层安全研发，融合实时监测、智能预警、远程管控技术，构建高精度监控体系。其功能强大：能实时监测接地电流，捕捉细微波动预判隐患；支持
云存储的应用场景都包含哪些？
云存储是一种网上在线存储的模式，可以将重要的数据信息存放在由第三方托管的虚拟服务器当中，云存储是在云计算概念上所延伸和衍生出的一个新的概念，保证企业中数据的安全性，同时还帮助企业节省了一定的存储空间，让用户可以更加便捷的存取所需的数据资源，实现文件共享和协作功能。本文将来具有了解一下云存储的应用场景都有哪些吧！云存储所应用的场景也较为广泛，其高度的灵活性和可扩展性成为了各个企业的首要选择，尤其是对
技术支持工程师
OS与云桌面一、核心概念解析操作系统（OS）定义：管理硬件资源（CPU、内存、存储等）并为应用程序提供运行环境的系统软件，如Windows、Linux、UOS、银河麒麟等。作用：承担进程调度、文件管理、设备驱动等基础功能，是任何计算设备的“大脑”。云桌面定义：基于云计算技术的虚拟桌面服务，将传统PC的桌面环境（操作系统、应用、数据）集中部署在远端服务器，用户通过终端设备（如瘦客户机、PC、手机）远
Docker 和 Kubernetes 入门到精通：运维工程师的实战笔记 (近5万字) 运维小贺运维 linux docker 容器 kubernetes 云原生 kubelet
文章目录1.Docker1.1Docker是什么？1.1.1容器服务原理1.2Docker的三大概念1.2.1镜像1.2.2容器1.2.3仓库1.2.4总结1.3Docker常用命令1.3.1镜像常用命令1.3.2容器常用命令1.4Dockerfile1.4.1commit的局限1.4.2Dockerfile是什么？1.4.3如何使用Dockerfile制作镜像?1.4.4Dockerfile中常
30个网络抓包/调试工具-IT运维与网络工程师必会，从零基础到精通，收藏这篇就够了！程序员羊羊黑客网安工程师网络安全网络运维安全数据库压力测试 web安全
运维老兵都知道，网络抓包这活儿，就像给网络做CT，透视内部问题。但工具再多，用不对也是白搭。今天咱就来聊聊30款抓包/调试“神器”，别再只会用Wireshark了！一、协议分析工具：别光看表面，还得懂“潜台词”Wireshark：老牌劲旅，但别迷信它简介：开源界的扛把子，协议分析界的“瑞士军刀”，跨平台支持是基本操作。特点：协议多？那是必须的，2000+协议解析，过滤表达式（tcp.port==8
不止HTTPS：深入理解SSL/TLS证书的实践之道后端
在当今互联网，https://开头的网址和浏览器地址栏的“小锁”图标已成为安全访问的标配。这背后，SSL/TLS证书扮演着至关重要的角色。对于开发者、运维工程师和安全从业者而言，理解其工作原理、选型策略以及部署维护的“坑”，远不止于让网站挂上那把锁那么简单。本文将带你深入SSL/TLS证书的实战世界。一、基石：不只是加密，更是身份与信任核心作用：加密传输(Confidentiality)：这是最广
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts

Prometheus监控系统

基础环境

Prometheus部署

node_exporter部署

grafana部署

alertmanager部署

cadvisor部署

配置Alertmanager报警

prometheus添加alertmanager报警规则

触发报警发送邮件

alertmanager自定义邮件报警

你可能感兴趣的:(prometheus,运维,云计算)