Happy Wang

prometheus+grafana+alertmanager监控系统钉钉告警

Linux监控系统

监控架构

监控系统是由prometheus、grafana 、alertmanage 、netdata模块组成，可以对本机和多台机器进行监控，下面将对各个模块进行简单的介绍
netdata：netdata是用于数据采集，该模块将部署在被监控的机器上，也可以部署在控制机上对本机进行监控；部分人使用的是prometheus官方提供的exporter，如node_exporter等，不管你使用的是什么模块进行数据采集，这个影响不大，只要你能采集到数据就OK了，小编使用的netdata主要原因它采集到的数据比较全面

prometheus：prometheus是一个开源的系统监控和报警的工具包，小编用它主要数据的存储和告警；prometheus会获取netdata采集回来的数据进行计算，然后根据设置的告警阀值进行对比，最后发出告警

grafana ：grafana是用于界面展示，将数据可视化，它将prometheus存储的数据在界面上展示出来，方便我们查看

alertmanager：alertmanager是一个告警机制，更具不同的需要可以设置邮件告警、钉钉告警，这里小编使用的是钉钉告警；钉钉告警需要接入prometheus-webhook-dingtalk

这里是小编画的一个简单的架构图
部署各个模块

一、netdata部署
如果之前有安装，卸载方法：
寻找.environment文件，如果没有就创建，将下面内容写入（/etc/netdata/.environment）

NETDATA_PREFIX="" # put what you used as a parameter to shell installed `–install` flag. Otherwise it should be empty
NETDATA_ADDED_TO_GROUPS="" # Additional groups for a user running netdata process

下载卸载脚本

wget https://raw.githubusercontent.com/netdata/netdata/master/packaging/installer/netdata-uninstaller.sh
chmod +x ./netdata-uninstaller.sh
./netdata-uninstaller.sh --yes --env /etc/netdata/.environment or /opt/netdata/netdata-configs/.environment

安装netdata
netdata依赖项很多，在安装前需要确认一下是否已经安装好了这些依赖项
zlib1g-dev uuid-dev libmnl-dev gcc make autoconf autoconf-archive autogen automake pkg-config curl

$ git clone https://github.com/firehol/netdata.git --depth=1 ~/netdata #下载安装文件
$ cd ~/netdata
$ sudo ./netdata-installer.sh

如果你看到了上面这样的输出，说明你已经安装成功了

netdata的配置文件在/etc/netdata/netdata.conf，需要将配置文件中的这两个地方改成如下所示

[global]
history = 3600(单位：SECONDS)
[plugins]
python.d = yes

启动方式：service netdata start
停止方式：service netdata stop

你可以看一下进程和19999端口
也可以在浏览器上打开http://localhost:19999 查看你的netdata的web端

http://localhost:19999/api/v1/allmetrics 在这里你可以看到数据

二、prometheus部署

wget https://github.com/prometheus/prometheus/releases/download/v2.7.2/prometheus-2.7.2.darwin-amd64.tar.gz
tar -zxvf prometheus-2.7.2.linux-amd64.tar.gz prometheus
cd prometheus
启动
./prometheus --config.file=prometheus.yml

配置说明
配置文件prometheus.yml

{ global: 
   { scrape_interval: '15s',
     evaluation_interval: '15s',
     scrape_timeout: '15s' },
  alerting: { alertmanagers: [ { static_configs: [ { targets: [ 'localhost:9093' ] } ] } ] },
  rule_files: [ '/opt/prometheus/rules.yml' ],   #指明你设定的告警规则文件
  scrape_configs: 
   [ { job_name: 'prometheus',
       static_configs: [ { targets: [ 'localhost:9090' ] } ] },
     { job_name: 'netdata-scrape',
       metrics_path: '/api/v1/allmetrics',  #获取采集数据的路径，在浏览器http://localhost:19999/api/v1/allmetrics 里面可以看到数据，其他采集方式可以进行更改，默认为metrics
       params: { format: [ 'prometheus' ] },
       honor_labels: true,
       static_configs: 
        [ { targets: 
             [ 'localhost:19999', 'xxxxxxxx:19999' ] } ] } ] } #监控的主机，可以自行添加

配置文件rules.yml

groups:
  - name: host_monitoring
    rules:
    - alert: 内存报警
      expr: netdata_system_ram_MiB_average{chart="system.ram",dimension="free",family="ram"} < 800
      for: 2m
      labels:
        team: node
      annotations:
        Alert_type: 内存报警
        Server: '{{$labels.instance}}'
        #summary: "{{$labels.instance}}: High Memory usage detected"
        explain: "内存使用量超过90%，目前剩余量为：{{ $value }}M"
        #description: "{{$labels.instance}}: Memory usage is above 80% (current value is: {{ $value }})"
    - alert: CPU报警
      expr: netdata_system_cpu_percentage_average{chart="system.cpu",dimension="idle",family="cpu"} < 20
      for: 2m
      labels:
        team: node
      annotations:
        Alert_type: CPU报警
        Server: '{{$labels.instance}}'
        explain: "CPU使用量超过80%，目前剩余量为：{{ $value }}"
        #summary: "{{$labels.instance}}: High CPU usage detected"
        #description: "{{$labels.instance}}: CPU usage is above 80% (current value is: {{ $value }})"
    - alert: 磁盘报警
      expr: netdata_disk_space_GiB_average{chart="disk_space._",dimension="avail",family="/"} < 4
      for: 2m
      labels:
        team: node
      annotations:
        Alert_type: 磁盘报警
        Server: '{{$labels.instance}}'
        explain: "磁盘使用量超过90%，目前剩余量为：{{ $value }}G"
    - alert: 服务告警
      expr: up == 0
      for: 2m
      labels:
        team: node
      annotations:
        Alert_type: 服务报警
        Server: '{{$labels.instance}}'
        explain: "netdata服务已关闭"

这个配置文件小编是改过的，yaml文件对格式要求和其他文件不一样，具体的可以自己去看一下，改完之后可以检测一下自己的格式是否正确
这个是一个格式化工具，主要是可以检查一下你的文件是否正确
http://www.bejson.com/validators/yaml_editor/
启动之后可以在浏览器打开http://localhost:9090

在这里你看到了netdata数据，那就说明你的prometheus已经获取到了netdata采集回来的数据信息

在点击Alerts之后你可以看到你的告警信息，点开之后会显示你的告警数据，然后通过钉钉机器人发送给你（请忽略小编的告警有点多）

三、alertmanager部署
配置钉钉告警，alertmanager需要接入prometheus-webhook-dingtalk ，这两个模块是由go语音写的，所以在安装和使用的时候需要用到go语音。那么我们在安装之前就需要配置好golang环境
安装go

下载golang安装包

wget https://dl.google.com/go/go1.10.3.linux-amd64.tar.gz

我们将go安装在/usr/local目录下

tar -C /usr/local -xzf go1.10.3.linux-amd64.tar.gz

将go的二进制目录添加到PATH环境变量

vim /etc/profile

配置go的环境变量

export GOROOT=/usr/local/go
export PATH=$PATH:$GOROOT/bin

然后运行下面的命令以使设置的环境变量立即生效

source /etc/profile

查看一下环境变量的设置

echo $GOROOT

是否输出/usr/local/go

echo $PATH

看一下输出中是否有/usr/local/go/bin

如果golang环境配置有问题，对后面的操作就会有影响，小编在这里踩过坑，所以写的稍微有点多
这里有两篇关于golang的安装和配置文章，希望对你们安装的时候有帮助
https://www.jianshu.com/p/c45f8cdca214
http://www.zhimengzhe.com/linux/64170.html

安装prometheus-webhook-dingtalk
在golang的src目录下新建，并且cd /usr/local/go/src/github.com/timonwong

git clone https://github.com/timonwong/prometheus-webhook-dingtalk.git
cd prometheus-webhook-dingtalk
make

编译安装之后你会得到prometheus-webhook-dingtalk执行文件，编译之后还是没有得到这个执行文件，那你要看一下是什么问题了，小编在编译安装的时候就是golang环境配置有问题导致编译失败，具体问题需要具体对待
你如果是按照小编这样安装的话，prometheus-webhook-dingtalk发送钉钉告警模版文件就是
/usr/local/go/src/github.com/timonwong/prometheus-webhook-dingtalk/template/default.tmpl
源模版文件发送的告警信息小编觉得有点多余，然后进行了更改

{{ define "__subject" }}[{{ .Status | toUpper }}{{ if eq .Status "firing" }}:{{ .Alerts.Firing | len }}{{ end }}] {{ .GroupLabels.SortedPairs.Values | join " " }} {{ if gt (len .CommonLabels) (len .GroupLabels) }}({{ with .CommonLabels.Remove .GroupLabels.Names }}{{ .Values | join " " }}{{ end }}){{ end }}{{ end }}
{{ define "__alertmanagerURL" }}{{ .ExternalURL }}/#/alerts?receiver={{ .Receiver }}{{ end }}
{{ define "__text_alert_list" }}{{ range . }}

{{"*****告警*****"}}
{{ range .Annotations.SortedPairs }}> - {{ .Name }}: {{ .Value | markdown | html }}
{{ end }}
{{"=============="}}
{{ end }}{{ end }}
{{ define "ding.link.title" }}{{ template "__subject" . }}{{ end }}
{{ define "ding.link.content" }}
{{ template "__text_alert_list" .Alerts.Firing }}
{{ end }}

启动prometheus-webhook-dingtalk
nohup ./prometheus-webhook-dingtalk --ding.profile=“ops_dingding=https://oapi.dingtalk.com/robot/send?access_token=xxx” 2>&1 1>dingding.log &
端口是8060
如果不想每次都把机器人加上可以在/etc/systemd/system/prometheus-webhook-dingtalk.service 文件中添加机器人的url。钉钉机器人的url怎么得来的我想应该不需要写出来吧

alertmanger安装
下载安装文件

wget https://github.com/prometheus/alertmanager/releases/download/v0.15.2/alertmanager-0.15.2.linux-amd64.tar.gz

配置文件为：alertmanager.yml

global:
  resolve_timeout: 5m
route:
  receiver: webhook
  group_wait: 3s
  group_interval: 5s
  repeat_interval: 5m
  group_by: [alertname]
  routes:
  - receiver: webhook
    group_wait: 10s
    match:
      team: node
receivers:
- name: webhook
  webhook_configs:
  - url: http://localhost:8060/dingtalk/ops_dingding/send
    send_resolved: true

repeat_interval: 这个字段是发送的频率，可以根据自己的需要进行设置，在调试过程中可以设置稍微短一点
启动：./alertmanager --config.file=alertmanager.yml
端口是：9093，同样是由web端的可以登陆http://localhost:9093
我在网上看到大部分人是在官网下载进行编译安装的，这个不会有什么影响

下面可以看一下钉钉告警效果

四、grafana部署
1、安装stable

wget https://dl.grafana.com/oss/release/grafana_5.4.2_amd64.deb
sudo apt-get install -y adduser libfontconfig
sudo dpkg -i grafana_5.4.2_amd64.deb

APT存储库,创建一个文件/etc/apt/sources.list.d/grafana.list并将以下内容添加到其中。

deb https://packages.grafana.com/oss/deb stable main

添加gpg密钥。这允许您安装签名包

curl https://packages.grafana.com/gpg.key | sudo apt-key add -

更新您的Apt存储库并安装Grafana

sudo apt-get update
sudo apt-get install grafana

在某些旧版本的Ubuntu和Debian上，您可能需要安装apt-transport-https通过HTTPS获取软件包所需的软件包。

sudo apt-get install -y apt-transport-https

启动(init.d service)

sudo service grafana-server start

这将以用户grafana-server身份启动进程，该grafana用户是在程序包安装期间创建的。默认HTTP端口是3000默认用户和组admin。默认登录名和密码admin/admin要将Grafana服务器配置为在引导时启动：

sudo update-rc.d grafana-server defaults

启动(via systemd)

systemctl daemon-reload
systemctl start grafana-server
systemctl status grafana-server

启用systemd服务，以便Grafana在引导时启动

sudo systemctl enable grafana-server.service

启动完成之后可以查看一下进程和3000端口
http://localhost:3000 可以登陆web端查看一下你的界面
默认用户名和密码是：admin/admin

我们打开之后需要配置一下源数据，将prometheus的数据接入进去，然后将数据进行添加，这样才会有数据展示出来。配置数据可以自己在界面上逐个添加，也可以在官网上下载一个配置数据的json文件导入

首先我们添加数据

然后我们导入json文件添加数据

我们可以看一下结果

总结
1、在部署过程中其实没有难点，主要是搞清架构
2、告警调整过程中需要对数据进行处理，对各个配置文件进行理解
主要涉及到的文件：
prometheus模块中的rules.yml，指定告警内容和数据
prometheus-webhook-dingtalk模块中的default.tmpl，发送告警模版样式，第一眼看上去有点无从下手，在仔细看看，变动一下看看发送出来的效果，我们就很快能知道怎么去改动
3、当我们导入grafana添加数据的json文件后，你会发现有些数据是由问题的，需要我们进行调整，这个过程需要一些时间去查看数据源，返回的数据，调整一下公式

kubernetes集群监控 Kube-Prometheus-Stack xiaojinran k8s prometheus docker 运维 kubernetes prometheus 容器 grafana
kubernetes集群监控概述Kubernetes（K8s）集群监控是指对Kubernetes集群中的各个组件和资源进行实时监测和数据收集，以获取对集群健康状态、性能指标和事件的可视化和告警。Kubernetes集群监控的内容通常包括以下几个方面：基础设施监控：监控物理服务器、虚拟机或云实例的资源使用情况，包括CPU、内存、磁盘和网络等指标。这可以帮助确保集群的底层基础设施正常运行，并及时发现资
配置企业微信报警 weixin_43806846 prometheus 企业微信
altermanager.yaml配置文件模板如下：global:resolve_timeout:2m#每2分钟检查一次是否恢复templates:#自定义通知模板‘/opt/monitor/alertmanager/template/wechat.tmpl’#route用来设置报警的分发策略route:采用哪个标签来作为分组依据group_by:[‘alertname’]#组告警等待时间。也就是
2025版自动控制流程_工业级连接_智能重连监控系统_增强型工业连接协议 ‘s Vision+Robot EPSON 资深设备全生命周期管理 python
importtimeimporttkinterastkfromtkinterimportmessageboxfromPILimportImage,ImageTkimportsocketimportthreadingfromdatetimeimportdatetimeimportloggingimportsubprocess#确保导入subprocess库importosimportpyautogu
《架构300讲》学习笔记（201-250） newProxyInstance 笔记架构
前言内容来自B站IT老齐架构300讲内容。201小心selectforupdate，有效规避索引选择性锁表202设计模式之建造者模式的用途20320分钟上手ELK日志监控系统分类：【ELK】204设计模式之门面模式Facade205设计模式之适配器模式Adapter206经典设计！如何让RabbitMQ支持消息延迟投递207Docker容器基于NFS实现跨容器文件共享208数据向上追溯场景该如何优
springboot集成钉钉_钉钉通知机器人与SpringBoot的集成 weixin_39622643 springboot集成钉钉
SpringBootAdmin集成自定义监控告警(2.0.1版本)------钉钉机器人-yuancao24的博客-CSDN博客https://blog.csdn.net/yuancao24/article/details/83576194prometheus-spring-boot-starter:一个管理异常通知的神奇starter，实现了钉钉消息提醒与邮件提醒https://gitee.co
JVM性能调优实战：从理论到线上问题排查 SuperMale-zxq 项目实战 java python c++jvm java-ee
JVM性能调优实战：从理论到线上问题排查线上系统突然变慢，CPU飙升，内存告警，业务超时……面对这些危机时刻，你是束手无策还是胸有成竹？本文将带你掌握JVM性能调优的核心方法，从理论到实战，解决真实环境中的性能难题。为什么大多数JVM调优都失败了？某电商平台的"双11"大促活动，系统突然响应缓慢，交易量锐减。运维团队紧急扩容，开发团队调整GC参数，架构师建议重启服务……一系列"标准操作"后，系统性
百度快速收录2025最新科普 SEORoal 百度
跨境物流的智能突围战宁波某RCEP跨境物流平台接入214维特征矩阵后：✅'智能清关系统’72小时冲进TOP3✅'东盟电子报关’长尾词覆盖量暴涨4.2倍✅日均有效询盘突破300+技术三板斧：标题智能提取引擎（支持38种语义变异）动态阻抗参数混淆（误差≤0.15μΩ）实时工商特征同步（每2小时更新）2025生存指南：采用神经网络语义映射（NLP准确率98.2%）部署质量监控系统（误差率≤0.15%）加
分布式光伏监控系统设计能源数字化创业者分布式能源管理
一、产品简介快控光伏运维云平台软件是针对工商业分布式光伏电站设计研发的一款集控管理系统。他通过智能网关采集现场逆变器、气象站、综合测控装置等各类设备的运行数据和状态，实现对光伏电站的24小时实时在线监控诊断，有效的保障了电站的安全运行。同时系统拉通线上线下运维，可极大的提高电站的运维的效率和质量。该平台软件主要有以下几大功能：1、实时在线监控，实时故障监测，第一时间通知电站运维人员及时消除隐患，确
全国产飞腾+FPGA架构，支持B码+12网口+多串电力通讯管理机解决方案深圳信迈科技DSP+ARM+FPGA 飞腾+FPGA 电力新能源 fpga开发架构电力通讯管理机全国产
行业痛点:中国的电力网络已经成为当今世界覆盖范围最广、结构最为复杂的人造科技系统。随着国家和各部委颁布了一系列法律法规，如国家颁布的《中华人民共和国网络安全法》、工信部颁布的《工业控制系统信息安全防护指南》、发改委颁布的14号令《电力监控系统安全防护规定》、国家能源局颁布的《关于印发电力监控系统安全防护总体方案等安全防护方案和评估规范的通知》，凸显了电力行业的网络安全防护工作的重要性。基于电力行业
MySQL慢SQL优化方案详解：从诊断到根治的完整指南 jiajia651304 mysql sql ffmpeg
MySQL慢SQL优化方案详解：从诊断到根治的完整指南一、慢SQL的致命影响当数据库响应时间超过500ms时，系统将面临三大灾难链式反应：用户体验崩塌页面加载超时率上升37%用户跳出率增加52%核心业务转化率下降29%系统稳定性危机连接池耗尽风险提升4.8倍主从同步延迟突破10秒阈值磁盘IO利用率长期超90%运维成本飙升DBA故障处理时间增加65%硬件扩容频率提高3倍夜间告警量激增80%通过监控系
ClaudeAPi接入 heikeb chatgpt java 人工智能
一，实现目标接入钉钉机器人支持群聊和私聊chatgpt体验：http://me.chat129.comchatgpt学习：http://www.chat129.com网上看了很多方案，因为Claude的api申请难度非常大，大部分都是说使用Slack，但是Slack只能免费使用一个月。作为一个完美主义怎么可能允许这样的事情发生。何如处理，抓网页。只能美，英，魔法这些都是入门小菜，这里不再赘述。自行
工程化与框架系列（30）--前端日志系统实现一进制ᅟᅠ ‌‍‎‏ 前端工程化与框架前端状态模式
前端日志系统实现引言前端日志系统是应用监控和问题诊断的重要工具。本文将深入探讨前端日志系统的设计与实现，包括日志收集、处理、存储和分析等方面，帮助开发者构建完整的前端日志解决方案。日志系统概述前端日志系统主要包括以下方面：日志收集：用户行为、性能指标、错误信息等日志处理：过滤、格式化、压缩等日志存储：本地存储、远程上传等日志分析：统计分析、可视化展示等实时监控：告警、通知等日志系统实现日志管理器/
华为HCIE笔试（一）初级飞行员云计算华为云计算
以下关于统一运维管理平台ManageOne中告警监控功能的描述，错误的是哪一项？A.支持配置屏蔽、汇聚、振荡等监控规则B.提供多样化的告警过滤方式，帮助运维人员快速筛选所关注的告警C.统一监控界面，告警上报接口灵活D.支持本地告警数据分析，自动屏蔽无效告警解析：A.ManageOne确实支持配置多种监控规则，包括屏蔽（即忽略某些特定条件下的告警）、汇聚（将多个相似告警合并为一个）和振荡（处理频繁触
基于 DeepSeek 的自动化运维（适合企业降本增效） Real Man★ 运维自动化
基于DeepSeek的自动化运维解决方案DeepSeek凭借其强大的AI能力（如自然语言处理、时序预测、异常检测），可显著提升运维效率，实现从监控告警到故障自愈的全流程自动化。以下是结合企业级场景的实战方案：一、核心应用场景与实现路径智能监控与告警日志分析：使用DeepSeek-NLP模型自动解析日志，提取关键错误模式（如OutOfMemory、Timeout）。python复制fromdeeps
机器狗监控系统软件工程师面试题道亦无名机器人面试机器狗
大部分企业会使用的面试题一、基础知识编程语言方面请简述C++中多态的实现方式，在机器狗监控系统中，哪里可能会用到多态来提高代码的扩展性？例如不同型号机器狗的运动控制模块。Python作为脚本语言在系统开发中有诸多应用，说说Python的GIL（全局解释锁）对多线程性能的影响，以及在实时数据采集与处理场景下如何规避。数据结构与算法若要实现机器狗的路径规划，你会选择哪种数据结构来存储地图信息，比如栅格
deepseek+ansible实现AI自动化集群部署大囚长 AIOps 大模型 ansible 人工智能自动化
DeepSeek与Ansible协同配置Linux集群的完整机制方案，涵盖架构设计、工具调用链及Agent提示词体系：一、系统架构设计（四层联动）![架构图示意]用户交互层→AI决策层→执行引擎层→数据反馈层││││▼▼▼▼Web/CLI→DeepSeek引擎→Ansible→监控系统用户交互层Web界面：支持自然语言输入（如"部署10节点Kafka集群"）CLI工具：deepseek-ctlcr
【Prometheus】prometheus 架构介绍 Learn Forever Prometheus 架构运维 docker
1.组件说明prometheusserver是Prometheus组件中的核心部分，负责实现对监控数据的获取，存储以及查询。exporter简单说是采集端，通过http服务的形式保留一个url地址，prometheusserver通过访问该exporter提供的endpoint端点，即可获取到需要采集的监控数据。AlertManager在prometheus中，支持基于PromQL创建告警规则，如
三级等保的技术要求和管理制度要求，从零基础到精通，收藏这篇就够了！慕烟疏雨网络网络安全 web安全程序员计算机编程
技术要求，包括物理、网络、主机、应用、数据5个方面；一、物理安全部分；1、机房应区域划分至少分为主机房和监控区两个部分；2、机房应配备电子门禁系统、防盗报警系统、监控系统；3、机房不应该有窗户，应配备专用的气体灭火、备用发；二、网络安全部分；1、应绘制与当前运行情况相符合的拓扑图；2、交换机、防火墙等设备配置应符合要求，例如应进行Vlan划分并各Vlan逻辑隔离，应配置Qos流量控制策略，应配备访
基于 Python + Flask + Echarts 的疫情监控系统程序员奇奇计算机毕设 python flask echarts
项目概况完整代码：https://download.csdn.net/download/pythonyanyan/874287591.1项目名称新冠肺炎疫情实时监控。项目地址：http://121.41.228.239
在线监控+日志分析方案徐福记c 运维运维
1.在线监控系统设计技术选型：Prometheus+Grafana+各ExporterPrometheus：负责定时拉取各服务指标数据并存储。Grafana：可视化仪表盘，支持多数据源（Prometheus、Loki等）。Exporter：SpringBoot应用：通过Micrometer暴露/actuator/prometheus端点。MySQL：部署mysqld_exporter采集数据库性能
ELK Stack 安装教程 - 构建日志存储告警系统运维
介绍“ELK”是三个开源项目的首字母缩写，这三个项目分别是：Elasticsearch、Logstash和Kibana。Elasticsearch是一个搜索和分析引擎。Logstash是服务器端数据处理管道，能够同时从多个来源采集数据，转换数据，然后将数据发送到诸如Elasticsearch等“存储库”中。Kibana则可以让用户在Elasticsearch中使用图形和图表对数据进行可视化。目前最
是时候解决告警事件数据孤岛问题了监控告警告警风暴
大家有没有发现，随着公司发展，慢慢引入了越来越多的监控、可观测性的系统，云上的、云下的，开源的、商业的，通用的、特定产品的，导致告警事件分散在非常多的地方，形成一个一个的数据孤岛。比如下面这些监控系统，你们应该不止用了一个吧：上图中有些系统你可能会困惑，比如OceanBase，明明是个数据库，为啥出现在这里。因为OceanBase自己内置有自己的监控能力，没有复用Prometheus之类的通用监控
多平台 + 多模型 + 可扩展：轻松打造你的 All-in-One AI 聊天机器人 xiaoqiangclub 开源精选人工智能机器人 ai 聊天机器人开源项目
文章目录介绍开发环境打造你的专属AI聊天机器人✨项目亮点获取/使用⚓️相关链接⚓️介绍最近想搞一个能同时在多个平台和不同的大模型对话的工具，最好还能自己扩展功能。找了一圈，发现一个开源项目，它支持多种消息平台，像QQ、微信、飞书、钉钉、Discord、Telegram这些常用的都有，而且还支持ChatGPT、DeepSeek、Dify、Claude、Gemini等等一堆大模型，感觉很强大，今天就来
【shell】简单监控系统cpu、disk、mem、process的信息脚本菜萝卜子 shell编程 linux 运维服务器
脚本如下#!/bin/bash#获取时间get_time=$(date+%Y%m%d%H%M%S)#监控cpu信息cpu_info(){top-bn1|awk'/^%Cpu/{print$2,$4,$8}'|whilereadussyidledoused_cpu=$(echo"100-$idle"|bc)echo"$get_timeCPU使用率userprocess:${us}%systempro
中国CRM变形记：论低价造势与商业逻辑的集体破产刘小奇�多 sass
在中国SaaS行业的黄金十年里，有一家公司仅用几页PPT就铸造了一座空中楼阁。在这过程中，不仅产品定位可以随意切换，而且商业模式还能够在一夜之间“基因突变”，这其中的原因是创始人深谙“融资永动机”的终极奥义——只要故事够新、价格够低、“嗓门”够大，资本市场的掌声就不会停歇。这场荒诞的变形记，起源于一家名为“纷享逍客”的OA协同软件公司，在烧光数亿融资、被钉钉打的丢盔弃甲后，忽然撕掉旧皮囊，摇身变成
【开题报告】springboot基于B_S架构的视频监控系统的设计与实现4jbbp计算机毕设卓越计算机毕设 spring boot 架构课程设计
本项目包含程序+源码+数据库+LW+调试部署环境，文末可获取一份本项目的java源码和数据库参考。开题报告研究背景：随着社会的发展和科技的进步，视频监控系统在各个领域得到了广泛应用。传统的视频监控系统往往采用集中式架构，存在着诸多问题，如单点故障、带宽消耗大、实时性差等。为了解决这些问题，基于B/S架构的视频监控系统应运而生。研究意义：基于B/S架构的视频监控系统具有分布式部署、易于维护、资源共享
Hbase在hdfs上的archive目录占用空间过大宝罗Paul 大数据 hbase
hbase版本：1.1.2hadoop版本：2.7.3Hbase在hdfs上的目录/apps/hbase/data/archive占用空间过大，导致不停地发出hdfs空间使用率告警。【问题】告警信息alert:datanode_storageistriggered告警信息表明某个或某些datanode的HDFS存储空间使用率已超过阈值(我们设置的是80%)，需要清理。[hdfs@master-2r
Nginx日志安全分析脚本寰宇001 shell
nginx_log_check脚本作者：al0ne项目地址：https://github.com/al0ne/nginx_log_checkNginx日志安全分析脚本功能统计Top20地址SQL注入分析扫描器告警分析漏洞利用检测敏感路径访问文件包含攻击Webshell寻找响应长度的urlTop20寻找罕见的脚本文件访问寻找302跳转的脚本文件Usage设置报告保存地址outfile设置日志分析目录
实现整个巡检流程的标准化的智慧能源开源了。 AI服务老曹前端 javascript 人工智能算法
简介AI视频监控平台,是一款功能强大且简单易用的实时算法视频监控系统。愿景在最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，减少企业级应用约95%的开发成本，在强大视频算法加持下的AR使得远程培训和远程操作指导不仅仅能够实现前后场的简单互动，而且能够实现人机结合，最终实现整个巡检流程的标准化。用户仅需在界面上简单操作，即可实现全视频的接入及布控。基础项
消防行业如何借助 TDengine 打造高效的数据监控与分析系统涛思数据（TDengine） tdengine 大数据时序数据库
小T导读：本篇文章来自“2024，我想和TDengine谈谈”征文活动的优秀投稿，深入探讨了如何在消防行业中运用TDengine进行业务建模。文章重点介绍了如何通过TDengine的超级表、标签设计和高效查询功能，有效管理消防监控系统中的时序数据。作者详细阐述了实时监控、报警系统以及历史数据分析在消防行业中的应用，展示了TDengine在数据压缩、保留策略和分布式架构下的强大优势。在TDengin
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

prometheus+grafana+alertmanager监控系统钉钉告警

Linux监控系统

监控架构

部署各个模块

总结

你可能感兴趣的:(prometheus+grafana+alertmanager监控系统钉钉告警)