紫色葡萄

搭建nagios+ncpa监控

ncpa是nagios最近几年推出的监控客户端，已日趋完善，用于替代老旧的nrpe。

首先，nagios的优点在于

1、监控界的工业标准，专注报警近二十年（1999年诞生）
业界的话是这样的，每种监控系统背后都有nagios的影子

2、优秀的设计永不过时，无数据库设计
与zabbix的臃肿相比，nagios是遵循unix哲学的典范，做一件事并把它做好。
无数据库设计，不让数据库拖后腿。

3、c语言编写，超高性能
nagios4.0以前，采用了类似apache prefork模式，性能一度受到影响。在事件模型出现以前，它仍然是当时最好的方案。
nagios4.0之后，采用了类似nginx的事件模型，以极小的内存代价，取得性能上质的提升，10k+不成问题。

4、优秀的插件机制，非常灵活
nagios积累了十余年的由社区贡献的海量插件，自己编写插件也十分容易。

ncpa比nrpe优秀的地方在于

1、支持被动监控，即ncpa主动向nagios上报（通过nrdp）

2、ncpa跟snmp类似，基本不需要配置，自带基本监控项，比如cpu，内存，服务、进程等，
而nrpe需要在客户端定义一堆check，然后还要在nagios服务端再定义一遍，非常繁琐。

3、保留原有的nagios插件

4、通过简单的脚本编程，在nagios服务端用nmap扫描ncpa客户端，可以实现自动添加基本监控

5、环境依赖除了python2.7，对系统没有任何侵入

本文描述基于nagios+ncpa的主动监控，替代nrpe。

环境

服务端：CentOS 7 + nagios 4  IP：192.168.1.200
客户端：CentOS 7 + ncpa 2.0.6   IP：192.168.1.50

客户端配置

1、安装ncpa

rpm -ivh https://assets.nagios.com/downloads/ncpa/ncpa-2.0.6.el7.x86_64.rpm

2、启动ncpa服务

/etc/init.d/ncpa_passive start
/etc/init.d/ncpa_listener start
chkconfig ncpa_listener on
chkconfig ncpa_passive on

3、客户端开启防火墙端口5693

iptables -A INPUT -p tcp --dport 5693 -j ACCEPT

或

iptables -A INPUT -s 192.168.1.200 -p tcp --dport 5693 -j ACCEPT

服务端配置

安装nagios（简略版）

yum install epel-release -y
yum install nagios httpd php php-pecl-zendopcache fping nmap -y
systemctl enable httpd nagios
systemctl start httpd nagios
iptables -A INPUT -p tcp --dport 80 -j ACCEPT

mkdir -p /etc/nagios/bin
mkdir -p /etc/nagios/hosts
mkdir -p /etc/nagios/services
mkdir -p /etc/nagios/template
echo "cfg_dir=/etc/nagios/hosts" >> /etc/nagios/nagios.cfg
echo "cfg_dir=/etc/nagios/services " >>/etc/nagios/nagios.cfg
service nagios restart

一、主机自动发现

所谓自动发现，就是用扫描器扫描局域网，

1、如果IP已在监控之内，则略过；

2、如果是新IP，则按照固定的模板，创建配置文件，并通知管理员；

3、如果某个IP发现后又消失了，nagios会报警，通知管理员。

这样就形成了一个局域网IP管理的闭环。

使用fping配置主机自动发现

创建主机模板文件/etc/nagios/template/host.cfg，内容如下：

define host {
    host_name                       HOST
    address                         HOST
    check_command                   check-host-alive
    max_check_attempts              3
    check_interval                  5
    retry_interval          1
    check_period                    24x7
    contacts             nagiosadmin
    notification_interval        60
    notification_period          24x7
    notifications_enabled          1
}


创建脚本/etc/nagios/bin/find-hosts.sh，内容如下：

#!/usr/bin/env bash

if [ ! -f /usr/sbin/fping ];then
  yum install fping -y
fi

network=$1

echo_usage() {
  echo -e "\e[1;31mUsage: $0 [network] \e[0m"
  echo -e "example: \e[1;32m $0 192.168.0.0/24 \e[0m"
  echo
  exit 3
}

if [ x$network == "x" ];then
  echo_usage
fi

########################################################
########################################################

dir=/etc/nagios/hosts
host_template=/etc/nagios/template/host.cfg
result=$(mktemp -u /tmp/fping-XXXXXX)
mkdir -p $dir
fping -a -q -g $network > $result

i=0
while read host;do
  if [ ! -f /etc/nagios/hosts/$host.cfg ];then
    echo new host found $host
    #mailx -s "new host found :$host" root@localhost 
    sed "s/HOST/$host/g" $host_template > $dir/$host.cfg
    i=$(expr $i + 1)
  fi
done < $result
rm -rf $result

if [ $i -eq 0 ];then
  echo no new host found
  exit 0
fi

if (nagios -v /etc/nagios/nagios.cfg |grep -q "Things look okay");then
  echo "nagios configuration is OK"
  sleep 1
  service nagios restart
  echo "nagios restart successfully"
else
  echo "nagios restart failed.please check"
  exit 1
fi

通过定时任务运行这个脚本，即可自动添加主机监控，也可以修改脚本，让每次发现新机器时发邮件通知管理员。

二、服务自动发现

使用nmap+check_ncpa实现服务自动发现

1、下载check_ncpa

wget https://assets.nagios.com/downloads/ncpa/check_ncpa.tar.gz
tar zxvf check_ncpa.tar.gz
cp check_ncpa.py /usr/lib64/nagios/plugins/
cp check_ncpa.py /usr/bin/

2、配置check_ncpa

创建文件/etc/nagios/conf.d/check_ncpa.cfg，内容如下：

# 'check_ncpa' command definition
define command{
  command_name check_ncpa
  command_line $USER1$/check_ncpa.py -H $HOSTADDRESS$ -P 5693 -t mytoken $ARG1$
}

3、测试check_ncpa.py

python check_ncpa.py -H 192.168.1.50 -p 5693 -t mytoken -l

4、创建服务发现模板

常规的监控项目无外乎两类，一类是基本的CPU、swap、负载、磁盘等，另一种是服务，比如nginx

创建文件/etc/nagios/template/ncpa-service.cfg，内容如下：

define service {
    host_name                              HOST
    service_description                    SERVICE
    check_command                          check_ncpa!-M service/SERVICE
    max_check_attempts                     3
    check_interval                         5
    retry_interval                         1
    check_period                           24x7
    notification_interval                  60
    notification_period                    24x7
    contacts                               nagiosadmin
}

创建文件/etc/nagios/template/ncpa-basic.cfg，内容如下：

#监控uptime，防止机器重启
define service {
    host_name                    HOST
    service_description          system uptime
    check_command                check_ncpa!-M system/uptime -w @60:120 -c @1:60
    max_check_attempts           3
    check_interval               5
    retry_interval               1
    check_period                 24x7
    notification_interval        60
    notification_period          24x7
    contacts                     nagiosadmin
}
#监控CPU使用率
define service {
    host_name                    HOST
    service_description          CPU Usage
    check_command                check_ncpa!-M cpu/percent -w 50 -c 80 -q 'aggregate=avg'
    max_check_attempts           3
    check_interval               5
    retry_interval               1
    check_period                 24x7
    notification_interval        60
    notification_period          24x7
    contacts                     nagiosadmin
}
#监控swap
define service {
    host_name                    HOST
    service_description          swap Usage
    check_command                check_ncpa!-M memory/swap -w 512 -c 1024 -u mb
    max_check_attempts           3
    check_interval               5
    retry_interval               1
    check_period                 24x7
    notification_interval        60
    notification_period          24x7
    contacts                     nagiosadmin
}
#监控进程总数
define service {
    host_name                    HOST
    service_description          Process Count
    check_command                check_ncpa!-M processes -w 500 -c 1000
    max_check_attempts           3
    check_interval               5
    retry_interval               1
    check_period                 24x7
    notification_interval        60
    notification_period          24x7
    contacts                     nagiosadmin
}

#监控磁盘空间
define service {
    host_name                    HOST
    service_description          Disk Usage
    check_command                check_ncpa!-M 'plugins/check_disk' -a "-w 20 -c 10 --local"
    max_check_attempts           3
    check_interval               5
    retry_interval               1
    check_period                 24x7
    notification_interval        60
    notification_period          24x7
    contacts                     nagiosadmin
}

#监控系统负载
define service {
    host_name                    HOST
    service_description          Load average
    check_command                check_ncpa!-M 'plugins/check_load' -a "-w 8,4,4 -c 12,8,8"
    max_check_attempts           3
    check_interval               5
    retry_interval               1
    check_period                 24x7
    notification_interval        60
    notification_period          24x7
    contacts                     nagiosadmin
}

#监控僵尸进程
define service {
    host_name               HOST
    service_description     Load average
    check_command           check_ncpa!-M 'plugins/check_procs' -a "-w 3 -c 5 -s Z"
    max_check_attempts      3
    check_interval          5
    retry_interval          1
    check_period            24x7
    notification_interval   60
    notification_period     24x7
    contacts                nagiosadmin
}

创建自动发现脚本/etc/nagios/bin/find-ncpa.sh，内容如下

#!/usr/bin/env bash

if [ ! -f /usr/bin/nmap ];then
  yum install nmap -y
fi

network=$1

usage() {
  echo -e "\e[1;31mUsage: $0 [ip|ip-rang|network] \e[0m"
  echo -e "example1: \e[1;32m $0 192.168.0.100 \e[0m"
  echo -e "example2: \e[1;32m $0 192.168.1-200 \e[0m"
  echo -e "example3: \e[1;32m $0 192.168.2.0/24 \e[0m"
  echo
  exit 0
}

if [ x$network == "x" ];then
  usage
fi


dir="/etc/nagios/services"
ncpa_basic_template="/etc/nagios/template/ncpa-basic.cfg"
ncpa_service_template="/etc/nagios/template/ncpa-service.cfg"

nmap -sS -p 5693 --open $network |awk '/Nmap scan report for/{print $5}' > /tmp/ncpa_hosts.txt


while read host;do
  if [ ! -f $dir/$host.cfg ];then
	touch $dir/$host.cfg
	sed "s/HOST/$host/g" $ncpa_basic_template >> $dir/$host.cfg
	/usr/local/bin/check_ncpa.py -H $host -t mytoken -M services -l |grep running |awk '/running/{print $1}' |tr -d \" |tr -d \: |egrep -v "@|systemd" > /tmp/$host.servicelist.txt

	while read service;do
		sed -e "s/HOST/$host/g" -e "s/SERVICE/$service/g"  $ncpa_service_template >> $dir/$host.cfg
	done < /dev/shm/$host.servicelist.txt
	rm -rf /dev/shm/$host.servicelist.txt
  fi
done < /tmp/ncpa_hosts.txt

rm -rf /tmp/ncpa_hosts.txt

if (nagios -v /etc/nagios/nagios.cfg |grep -q "Things look okay");then
	echo "nagios configuration is OK"
	sleep 1
	service nagios restart
	echo "nagios restart successfully"
else
	echo "nagios restart failed. please check"
	exit 1
fi

业务监控

自动发现在很大程度上可以减轻工作量，但具体的业务监控仍然需要手动添加。

比如监控nginx是否重启过 (运行时长是否超过1800秒)

#监控进程运行时长
define service {
    host_name                      HOST
    service_description            Load average
    check_command                  check_ncpa!-M plugins/check_procs -a "-a nginx -m ELAPSED -w @1800:3600 -c @1:1800"
    max_check_attempts             3
    check_interval                 5
    retry_interval                 1
    check_period                   24x7
    notification_interval          60
    notification_period            24x7
    contacts                       nagiosadmin
}

对于php-fpm这类动态进程模型，其特点是root身份启动一个master进程，子进程属主是普通用户，且个数是动态的，故只需监控master进程运行时长即可，也可以照葫芦划瓢，

#监控php-fpm
define service {
    host_name                     HOST
    service_description           Load average
    check_command                 check_ncpa!-M plugins/check_procs -a "-u root -a php-fpm -m ELAPSED -w @1800:3600 -c @1:1800"
    max_check_attempts            3
    check_interval                5
    retry_interval                1
    check_period                  24x7
    notification_interval         60
    notification_period           24x7
    contacts                      nagiosadmin
}

【spug】使用勤不了一点 CI/CD python django ci/cd 运维 devops
目录简介下载与安装初始化配置启动与日志版本更新登录与使用工作台主机管理批量执行配置中心应用发布系统管理监控与告警使用问题简介手动部署|Spugwalle的升级版本轻量级无Agent主机管理主机批量执行主机在线终端文件在线上传下载应用发布部署在线任务计划配置中心监控报警如果有测试错误请指出。下载与安装测试环境：Python3.7.8CentOSLinuxrelease7.4.1708(Core)sp
Python工厂模式封装Webhook群聊机器人忆想不到的晖 python 机器人开发语言 webhook 飞书钉钉
引言企业存在给特定群组自动推送消息的需求，比如：监控报警推送、销售线索推送、运营内容推送等。你可以在群聊中添加一个自定义机器人，通过服务端调用webhook地址，即可将外部系统的通知消息即时推送到群聊中。飞书自定义机器人使用指南：https://open.feishu.cn/document/ukTMukTMukTM/ucTM5YjL3ETO24yNxkjN钉钉自定义机器人使用指南：https:/
RabbitMQ消息堆积导致服务崩溃的急救手册：三步止血法+根治方案 Java侥幸弟性能优化 stable diffusion
“凌晨3点，RabbitMQ队列飙到100万条，服务直接瘫痪！”——这是某电商平台技术负责人上周的真实经历。消息堆积引发的雪崩效应，轻则业务卡顿，重则数据丢失。今天这篇实战指南，手把手教你从紧急止血到根治优化，让崩溃的MQ服务快速“起死回生”！一、紧急止血：三步让服务先活过来当监控报警显示队列积压量突破天际，服务已崩溃或即将崩溃时，先做这三件事：1.立即暂停生产者（断流）操作：临时关闭消息生产者或
linux学习第六十篇：Linux监控平台介绍，zabbix监控介绍，安装zabbix，忘记Admin密码如何做_adminstartor密码 2501_90339150 linux 学习 zabbix
Linux监控平台介绍常见开源监控软件:cacti、nagios、zabbix、smokeping、open-falcon等等cacti、smokeping偏向于基础监控，成图非常漂亮cacti、nagios、zabbix服务端监控中心，需要php环境支持，其中zabbix和cacti都需要mysql作为数据存储，nagios不用存储历史数据，注重服务或者监控项的状态，zabbix会获取服务或者监
Windows系统中常用的命令 dawn 日常运维 windows 运维
随着Windows系统的不断改进，维护系统时有时候会因为新系统的更新而找不到对应的模块或者相关的信息入口，这个时候，记住一些命令就可以起到很好的帮助作用。比如，windows11中的网络属性的修改，可能习惯了windows10或者windows7的就不喜欢windows11的模式，期望进入到以前的修改模式，这个时候在通过在运行框中输入“ncpa.cpl”就可以调出原来熟悉的窗口。一、以前我们在程序
Windows系统cpl常用命令 mwl093 windows
sysdm.cpl——系统属性inetcpl.cpl——Internet属性appwiz.cpl——添加或删除程序ncpa.cpl——网络连接controldesk.cpl,@screensaver——屏幕保护程序powercfg.cpl——电源选项desk.cpl——显示属性main.cpl——鼠标属性firewall.cpl——Windows防火墙/ICS设置timedate.cpl——时间和
【区块链 + 智慧文旅】版权链 | FISCO BCOS应用案例 FISCO_BCOS 2023FISCO BCOS产业应用发展报告区块链智慧文旅
区块链具有智能、真实不被篡改的特性，可以有效地完善数字版权的保护。通过区块链实现版权内容的登记、交易、授权分发以及监控报警，能够更好地对版权进行保护，让内容生产者利用版权内容赚取收益。版权链基于FISCOBCOS打造多群组多机构多链的联盟链网络，构建基于区块链技术的数字版权登记、交易、监控和分发平台。具体来讲，平台分为版权链、交易链、监测链和授权链四个模块。数字作品生产者能够将数字版权登录上链、挂
Nagios安装部署全攻略 weixin_34109408 memcached php 操作系统
概述：公司的生产机器一共有12台，2台LVS(主备)、2台nginx、2台tomcat、1台后台服务器(nginx_tomcat)、3台mysql(主+备+异地灾备)、1台图片服务器、2台memcached.可以看出网站的架构就是基于高可用的原理的，每个层面都做了主备、系统的PV不高，对于并发布，高性能没有那么苛求，对于系统安全、稳定有较高要求，前期已经对系统做了各种日志分析，WAF配置，漏洞扫面
MySQL日志故障的处理和分析 Java大生
有一台预上线的服务器最近在做压力测试，也引发了一系列的相关问题，排查思路可以提供参考。问题的起因就是收到同事提醒，根据监控报警提示，磁盘空间满了。上面有一个MySQL服务，现在已经写入不了数据了。>>createtabletest(idint);ERROR14(HY000):Can'tchangesizeoffile(Errcode:28-Nospaceleftondevice)碰到这类问题，直观
使用Prometheus实现监控 Hello_codingMan 开发工具 prometheus
介绍Prometheus是一套开源的系统监控报警框架。它启发于Google的borgmon监控系统，由工作在SoundCloud的google前员工在2012年创建，作为社区开源项目进行开发，并于2015年正式发布。2016年，Prometheus正式加入CloudNativeComputingFoundation，成为受欢迎度仅次于Kubernetes的项目。作为新一代的监控框架，Prometh
【实战】本机用docker搭建elk环境并接入frostmourne，实现监控报警效果段晓慢运维开发 docker elk elasticsearch 运维经验分享
本篇文章着重的是实战方面，基于本机使用docker来搭建elk环境，然后接入frostmourne来实现监控、报警、分析系统，后续会再发文来介绍如何将此监控报警发布到生产环境。本机用docker搭建elk环境并接入frostmourne，实现监控报警效果前言一、ELK是什么？二、搭建ELK1.部署elasticsearch查找elasticsearch镜像拉取镜像查看elasticsearch镜像
zabbix监控MySQL lu9up zabbix mysql 数据库
1PMP介绍PMP（percona-monitoring-pluggins）是高质量的mysql监控组件，以模板、插件和脚本的形式提供我们去应用。可以将企业级MySQL功能添加到现有的本地监控解决方案中，支持如Nagios、Cacti和Zabbix等热门解决方案。更详细介绍请阅读官方文档第三章【TEMPLATESFORZABBIX】：Percona-Monitoring-Plugins-1.1.8
16、prometheus + grafana + alertmanager Linux云计算+运维开发 prometheus grafana java 数据库 kubernetes istio 运维
16、prometheus+grafana+alertmanagerk8s手撕方式安装prometheus+grafana+alertmanagerk8s版本：k8s-1.29.1prometheus+grafana+alertmanager监控报警1、k8s手撕方式安装prometheusmkdir~/prometheus-ymlkubectlcreatensmonitoringcat>~/pr
使用Java实现视频直播解决方案代码人生520 项目实战 java
使用Java实现视频直播解决方案1.概述本博客使用JavaCV开发的rtsp流转rtmp流并进行推流，并使用nginx实现流媒体直播方案1.1网络摄像头协议（一般网络摄像头支持协议有GB/T28181和RTSP协议）1）.GB/T28181国标GB/T28181-2011是由公安部科技信息化局提出，国家标准。该标准规定了城市监控报警联网系统中信息传输、交换、控制的互联结构。该标准适用于安全防范监控
vulnhub靶机midwest-v1.0.1 himobrinehacken vulnhub 安全系统安全网络安全
下载地址：https://download.vulnhub.com/midwest/midwest-v1.0.1.ova主机发现目标144端口扫描服务扫描漏洞扫描访问web咯改一下host接下来用wpscan看一下用户名接下来看一下密码能不能出来扫的时候顺便看了一下网站目录nagios401了那就是又这个东东被拦截了这玩意又是一个waf好好好密码估计是出不来了再用域名扫一下这个也是一样的，只能访问
浅谈电气火灾监控系统在高速公路的应用安科瑞王兰电能管理电气安全能耗管理系统自动化运维网络安全科技
摘要：介绍了高速公路电气火灾行业现状，阐述了GB50116-2013《火灾自动化报警系统设计规范》中对剩余电流式和测温式电气火灾监控探测器的安装要求，分析Acrel-6000电气火灾监控系统的功能，其集监测管理、故障报警、分析记录等功能于一体，可大大降低高速公路场合的电气火灾发生率。关键词：高速公路；电气火灾监控系统；系统功能；监控报警功能；王兰：136//4185//4052引言随着国家大力发展
prometheus监控系统架构原理及组件介绍 devops. promethus从入门到精通 prometheus
目录1.prometheus介绍2.官网地址3.时间序列数据4.prometheus主要特征5.prometheus组件介绍6.prometheus原理及架构1.prometheus介绍prometheus是一套开源的监控报警、时间序列数据库的组合，适合监控docker容器，由于kubernetes的流行带动了prometheus的发展prometheus最初在soundcloud上构建的开源系统
C#与三菱FX5U PLC的通信程序：实现运动控制、读写操作与监控报警 nAQGLSZ 程序人生
自己用C#写的控制三菱FX5UPLC(三菱任何系列都通用，网口，串口都行)的上位机程序，PLC源程序也附上，是学习C#和三菱PLC通信的好例子，有对辅助继电器M,对单字，双子D的读写，IO的监控，报警的显示等功能，亲测可用(C#运动控制;C#与三菱PLC;上位机与PLC通讯)C#与三菱FX5UPLC的通信程序：实现运动控制、读写操作与监控报警摘要：本文主要介绍了如何使用C#编写控制三菱FX5UPL
源码部署zabbix监控详细步骤 Mr Sean zabbix 监控类
由于实际工作中所需要监控的服务器数量之大，人工监控耗时耗力，基于这种情况寻找可用于监控的服务器的开源软件，有三款推荐软件可使用：Cacti、Nagios、Zabbix三款软件各自的特点如下：Cacti:基于SNMP协议的监控软件,强大的绘图能力Nagios:基于Agent监控,强大的状态查验与报警机制,插件极多,自己写监控脚本潜入到Nagios非常方便.Zabbix:基于多种监控机制,支持分布式监
18.云原生可观测性之kubesphere监控报警系统使用实战野心与梦私有云+云原生实战云原生
云原生专栏大纲文章目录kubesphere监控报警系统介绍监控功能与使用监控系统介绍集群状态监控物理资源监控集群资源节点资源Kubernetes核心组件监控APIServer监控Scheduler监控应用资源监控集群层级项目与应用资源统计用量排行企业空间层级项目层级工作负载层级容器组层级容器层级基于租户的告警与通知告警功能介绍集群告警内置告警策咯物理资源（cpu/内存/存储）核心组件（k8s/et
Hack The Box-Monitored 0415i HTB靶场合集网络服务器运维 linux web http
端口扫描&信息收集使用nmap对ip进行扫描nmap10.10.11.248开放了22、80、389、443端口使用dirsearch对网站目录进行扫描dirsearch-u10.10.11.248发现一个/nagios的网页，尝试访问发现需要用户名和密码，这里没有用户名密码，先继续下一步将ip和域名加入到hosts文件中后，访问ipecho'10.10.11.248nagios.monitore
linux运维工程师日常工作 weixin_34419321 运维数据库操作系统
1.操作系统状况检查与告警登录系统或者通过监控报警平台查看系统运转的负载，磁盘空间状态，内存使用状态，有无报错日记，查看报警记录等。2.操作系统故障处理根据检查与监控的情况，对发现的系统故障进行处理，对己知故障进行预防方案部署，在日常运维中，还会有许多其他部分提出的问题返遗，比如客户经验会反应某某地区用户访问网站速度慢，像这种情况要结合南北线路，以及用户的网络环境等综合因素进行处理。3.服务器性能
htb monitored root方式其中的一种（仅作记录）春猿火 linux
快下班时候审出来的，目前root的第5种方式nagios@monitored:~$cat/usr/local/nagiosxi/scripts/backup_xi.sh#!/bin/bash##CreatesaFullBackupofNagiosXI#Copyright(c)2011-2020NagiosEnterprises,LLC.Allrightsreserved.#BASEDIR=$(di
第29关阿里云开源的k8s容器秒级事件监控软件-Kube-eventer 博哥爱运维阿里云开源 kubernetes 云原生运维开发云计算容器
------>课程视频同步分享在今日头条和B站大家好，我是博哥爱运维。这节课给大家分析一款K8S上宝藏级秒级事件监控报警的开源软件kube-eventer，它是由阿里云开源的，并且难得的还一直有在更新。天下武功，唯快不破。对于报警监控也是一样，我们前面的课程有讲到prometheus这款监控软件，但总还觉得缺了些什么，对了，就是K8S上面无处不在的事件监控，博哥在实际的生产工作中，切身体会到事件监
快手营销活动面试 error0318 面试
衡量平台业务结果请求，下发，曝光，点击，点击率，消耗系统QPS？集群：高峰期8万，平峰期5万单机最大多少？性能瓶颈？平峰期：300高峰期：500性能瓶颈：下游的超时时间限制，插件串行（控制并发）机器配置4核8G如何提升曝光量和点击量业务的监控报警系统填充率分析下游超时时间和系统的超时时间算法侧的模型升级POPE活动填充率是如何提升的？计费系统做了什么事计费方式CPMCPCCPT反作弊是做什么的？实
Linux运维日常使用软件和技能寻宝记_楠哥
运维工程师使用的运维平台和工具包括：Web服务器：apache、tomcat、nginx、lighttpd监控：nagios、ganglia、cacti、zabbix自动部署：ansible、sshpt、salt配置管理：puppet、cfengine负载均衡：lvs、haproxy、nginx传输工具：scribe、flume备份工具：rsync、wget数据库：mysql、oracle、sql
MySQL 全文索引触发 OOM 一例爱可生开源社区 mysql
业务监控告警内存不足，笔者进行了全面系统的故障分析并给出解决方案。作者：付祥，现居珠海，主要负责Oracle、MySQL、mongoDB和Redis维护工作。爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。本文约1700字，预计阅读需要6分钟。MySQL版本5.7.34故障现象某业务监控报警内存不足，发现mysqld进程由于内存不足被kill自动重启了。[root@xx
持续运维与监控 Michaelzh
运维的趋势，挑战，事件管理，流程管理运维权限管理开源运维平台云上IAM监控开源监控方案zabbix+短信、邮件、微信、钉钉告警普罗米修斯(容器)Nagiosopen-falconzenoss监控对象服务器、虚拟机监控数据库监控中间件监控容器监控云上监控云上自带服务，例如AWS的cloudwatch+SNS、阿里云的云监控+短信服务等告警消息分级，人性化监控系统运维可视化开源技术grafana云上服
开源监控服务一瞥：Prometheus、Grafana、Zabbix、Nagios、Icinga和Open-Falcon CodeArtisanX 开源监控
前言随着信息技术的发展，监控服务在维护系统稳定性和性能方面变得越来越重要。本文将比较一些流行的开源监控服务，以帮助你选择适合你需求的解决方案。监控服务对比监控服务特点优势不足性能扩展性安全性Prometheus-多维度数据模型-监控容器化环境的强大工具-需要单独设置存储后端-查询性能较高，适用于大规模环境-可通过分布式部署进行横向扩展-支持基于HTTPS的数据传输，提供基本认证-支持服务发现自动发
nagios部署记录 shaoqiu.wu linux centos 运维
nagios主程序部署前期准备工作#关闭防火墙systemctlstopfirewalld#关闭防火墙开启自启systemctldisablefirewalldvi/etc/sysconfig/selinuxSELINUX=disabled#重启#换源cd/etc/yum.repos.d/#备份源mvCentOS-Base.repoCentOS-Base.repo.bak#下载阿里源curl-o/
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

搭建nagios+ncpa监控

你可能感兴趣的:(nagios,nrdp,ncpa,监控报警)