程序进程掉线后自动发送告警通知的工具——WGCLOUD

WGCLOUD是一款非常优秀的运维监测工具,支持服务器各种指标,进程,端口,日志,docker,文件防篡改等资源的指标采集监测

我们在本文中讲一下,WGCLOUD如何监测服务器上运行的进程,当进程下线或被kill掉后,我们能及时收到通知,比如邮件、钉钉、微信

首先我们需要先下载部署WGCLOUD

在网站下载:http://www.wgstart.com

网站有详细部署步骤说明,我们跳过此步骤,我们直接说如何监测进程程序

1.我们点击菜单【资源管理】->【进程管理】,可以看到如下列表,这些都是正在监测的进程

image.png

2.我们点击【添加】按钮,首先选中监控主机,即我们要监测的进程在哪个主机上,注意哪个主机需要监测,就在哪个主机部署一个探针端agent就可以了,这个网站有详细说明

image.png

选中完监控主机后,我们选中【获取进程方法】,有三种

1、指定进程的进程ID号,如:8982,此种方式进程重启后进程ID会改变,不太方便
2、指定进程的PID文件路径,有些服务启动后会生成一个pid文件,此文件存贮了进程ID号,如:/run/nginx.pid
3、指定进程启动路径的关键字符串,推荐优先使用此种,比如我们想监控wgcloud的sever进程,
我们可以看到server进程的CMD是java -server -Xms256m -Xmx512m -jar wgcloud-server-release.jar,我们只需要取进程的CMD其中的一段字符串,
能唯一定位到server进程就可以,比如我们取wgcloud-server-release.jar作为【进程启动路径的关键字】,就可以了,这样进程重启后,我们依然可以监测到进程

[root@VM-0-14-centos /]# ps -ef | grep wgcloud
root      6901  6246  0 19:29 pts/1    00:00:00 grep --color=auto wgcloud
root      8821     1  0 Oct17 ?        00:45:20 java -server -Xms256m -Xmx512m -jar wgcloud-server-release.jar

如上是linux方式说明,windows下也是一样的操作,我们找到进程的启动路径摘取其中的关键字符串即可

3.监控状态,默认启用,不用管,如果不想监测此进程了,选中停止监控就好了

4.填写完成后保存,等5分钟,因为agent会5分钟同步一次监控资源数据,5分钟后就会按照上报频率来正常上报进程的指标数据

image.png

5.配置邮件告警,当进程下线时候,系统会发送邮件通知

点击左侧菜单【系统管理】->【邮件告警】,在这里设置好邮件告警后,我们可以点击【测试发送】来试试看能否收到邮件,能收到的话就说明配置成功了,进程下线时会自动发送邮件通知

image.png

这是qq告警邮件配置的具体方法
https://blog.csdn.net/tianshiyeben/article/details/120438311

以下是微信和钉钉的告警配置方法
https://www.cnblogs.com/wanghouhou/p/15351988.html
https://www.cnblogs.com/wanghouhou/p/13957336.html

你可能感兴趣的:(程序进程掉线后自动发送告警通知的工具——WGCLOUD)