桂族文化

Nagios

监控

在互联网日益发展的今天，监控的重要性已经不言而喻。可能打开一个URL要经过6-7层的处理，如果出了问题而没有监控将很难定位到问题所在。那哪些内容需要监控呢？

1.本地资源

(1) 负载：uptime；
(2) CPU：top,sar，cpu温度；
(3) 磁盘：df；
(4) 内存：free；
(5) IO：iostat；
(6) RAID
(7) passwd文件的变化(本地所有文件指纹识别)。

2.网络服务

端口、URL、ping丢包、进程数、IDC网络流量

3.其他设备

路由器、交换机端口流量、打印机、windows等

4.业务数据

用户登录失败次数，用户登录网站次数，输入验证码失败次数、某个API接口流量并发，电商网站订单，支付交易的数量等。这个获取的过程可能是开发或者架构师完成的，但添加的过程就是运维；

监控软件本身仅仅是一个平台，我们想监控的内容，理论上只要在服务器命令行可以获取到就可以被监控软件监控。

1.1 Nagios简介

Nagios又被称为难够死，因为很难。Nagios是一款开源的网络及服务的监控工具，其功能强大、灵活性强。能有效监控windows、Linux和Unix等系统的主机各种状态信息，交换机、路由器等网络设备，以及主机端口及URL服务等。根据不同业务故障级别发出告警信息(邮件、微信、短信、语音报警、飞信、MSN)给管理员，当故障恢复时也会发出恢复消息给管理员。
Nagios服务端可以在Unix及类Unix系统上运行，目前无法运行在windows。Windows可以作为被监控的主机，但是无法作为监控服务器。

1.2 Nagios构成

Nagios不好的地方在于它只做核心，很多其他功能都是通过插件来实现的。Nagios一般由一个主程序(Nagios)，一个插件程序(Nagios-plugins)和一些可选的附加程序(NRPE,NSClient++,NSCA,NDOUtils)等。Nagios本身就是一个监控的平台而已，其具体的监控工作都是通过插件(Nagios-plugins，也可自己编写)来实现的。因此，Nagios主程序和Nagios-plugins插件都是Nagios服务端必须安装的程序组件，并且Nagios-plugins一般也要安装于被监控端。几个附加程序的描述如下：
1. NRPE：半被动模式
(1) 存在位置：工作在被监控端，操作系统为Linux/Unix；
(2) 作用：用于在被监控的远程Linux/Unix主机上执行脚本插件获取数据回传给服务器端，以实现对这些主机资源的监控。主要用于监控本地资源；
(3) 存在形式：守护进程(agent)模式，开启的端口为5666.
2. NSClient++：半被动模式
(1) 存在位置：监控Windows主机；
(2) 作用：相当于Linux下的NRPE；
3. NDOUtils：不推荐使用
(1) 存在位置：Nagios服务器端；
(2)作用：用于将Nagios的配置信息和各event产生的数据存入数据库以实现对这些数据的检索和处理。但是存入数据库还不如存放在磁盘上，因此推荐使用；
4. NSCA：纯被动模式的监控
(1)存在位置：同时安装在Nagios的服务器端和客户端；
(2) 作用：用于让被监控的远程Linux/Unix主机主动将监控到的信息发送给Nagios服务器。在分布式监控集群模式中要用到，300台服务器以内可以不考虑；

1.3 原理

1.4 安装

三台虚拟机：

1.4.1 服务端

调整字符集，如果不安装后面安装一些插件会有错误：

[root@nagios ~]# echo 'exprot LC_ALL=C' >>/etc/profile[root@nagios ~]# . /etc/profile

关闭防火墙：

[root@nagios ~]# /etc/init.d/iptables stop[root@nagios ~]# chkconfig iptables off

关闭selinux：

[root@nagios ~]# setenforce 0[root@nagios ~]# sed -ri 's#^(SELINUX=).*#\1disabled#g' /etc/selinux/config

时间同步，监控的时间同步很重要：

echo '# time sync' >>/var/spool/cron/rootecho '*/10 * * * * /usr/sbin/ntpdate pool.ntp.org &>/dev/null' >>/var/spool/cron/root

需要安装web展示相关软件：

[root@nagios ~]# yum install -y gcc glibc glibc-common gd gd-devel httpd php php-gd mysql*

gcc glibc glibc-common gcc编译器
gd gd-devel画图用的
httpd php \php-gd php环境，官方推荐LAMP，不要改成Nginx
mysql* 生成MySQL的插件，MySQL不需要启动
准备所需软件：

[root@nagios hadoop]# tree.|-- Class-Accessor-0.31.tar.gz # iostat监控插件所需|-- Config-Tiny-2.12.tar.gz # 同上|-- Math-Calc-Units-1.07.tar.gz # 同上|-- Nagios-Plugin-0.34.tar.gz # 同上|-- Params-Validate-0.91.tar.gz # 同上|-- Regexp-Common-2010010201.tar.gz # 同上|-- check_iostat # 用于监控的插件|-- check_memory.pl # 用于监控的插件|-- check_mysql # 用于监控的插件|-- libart_lgpl-2.3.17.tar.gz # iostat监控插件所需|-- nagios-3.5.1.tar.gz # 主程序|-- nagios-plugins-1.4.16.tar.gz # 插件管理|-- nrpe-2.12.tar.gz # agent|-- pnp-0.4.14.tar.gz # 画图的web程序，这个是展示`-- rrdtool-1.2.14.tar.gz # pnp的辅助程序，这个才是画图的

软件包下载密码：usyr

创建所需用户，并将apache和nagios同属于一个组，方便一起管理：

useradd -m nagiosgroupadd nagcmdusermod -a -G nagcmd nagiosusermod -a -G nagcmd apache

安装：

[root@nagios hadoop]# tar xf nagios-3.5.1.tar.gz[root@nagios hadoop]# cd nagios[root@nagios nagios]# ./configure --with-command-group=nagcmd[root@nagios nagios]# make all[root@nagios nagios]# make install…  make install-init     - This installs the init script in /etc/rc.d/init.d  make install-commandmode     - This installs and configures permissions on the       directory for holding the external command file  make install-config     - This installs sample config files in /usr/local/nagios/etcmake[1]: Leaving directory `/admin/hadoop/nagios'

这是编译后出现的信息提示，可以时候以上三种编译方式生成启动脚本、命令和配置文件样例

[root@nagios nagios]# make install-init && make install-config && make install-commandmode[root@nagios nagios]# make install-webconf # 生成了如何在httpd中显示Nagios的配置文件/usr/bin/install -c -m 644 sample-config/httpd.conf /etc/httpd/conf.d/nagios.conf # 就是这个文件

配置web认证：

htpasswd -cb /usr/local/nagios/etc/htpasswd.users oldboy 123456

# -b：非交互
安装插件：

yum install -y perl-develtar xf nagios-plugins-1.4.16.tar.gzcd nagios-plugins-1.4.16./configure --with-nagios-user=nagios --with-nagios-group=nagios --enable-perl-modulesmake && make installcd ..ls /usr/local/nagios/libexec/|wc -l # 插件有61个，多比少好

安装NRPE，之所以服务端也安装NRPE，一是是因为要在…/nagios/libexec/目录下生成check_nrpe命令；二是服务端也要通过NRPE进行监控：

tar xf nrpe-2.12.tar.gzcd nrpe-2.12./configuremake allmake install-pluginmake install-daemonmake install-daemon-configcd ..

最后启动，Nagios是不会监听端口的，因为不会有程序发数据给它。

/etc/init.d/httpd start/etc/init.d/nagios startlsof -i :80ps aux |grep nagios

1.4.2 被监控端

调整字符集，如果不安装后面安装一些插件会有错误：

echo 'exprot LC_ALL=C' >>/etc/profile. /etc/profile

关闭防火墙：

/etc/init.d/iptables stopchkconfig iptables off

时间同步，监控的时间同步很重要：

echo '# time sync' >>/var/spool/cron/rootecho '*/10 * * * * /usr/sbin/ntpdate pool.ntp.org &>/dev/null' >>/var/spool/cron/root

创建用户：

[root@lamp ~]# useradd -m nagios -s /sbin/nologin

安装perl

yum install -y perl-devel perl-CPAN openssl*yum install -y mysql-server # 这是为了解决报错

安装插件：

tar xf nagios-plugins-1.4.16.tar.gzcd nagios-plugins-1.4.16./configure --prefix=/usr/local/nagios --enable-perl-modules --enable-redhat-pthread-workaround #--with-mysql=/usr/bin/mysql# --enable-redhat-pthread-workaround：如果redhat系统不加这个会很慢# --with-mysql是为了解决make: *** [all] Error 2make && make installcd ..ls /usr/local/nagios/libexec/|wc -l # 结果为59而不是61估计跟MySQL有关

安装NRPE：

tar xf nrpe-2.12.tar.gzcd nrpe-2.12./configuremake allmake install-pluginmake install-daemonmake install-daemon-configcd ..

安装iostat：

tar xf Params-Validate-0.91.tar.gzcd Params-Validate-0.91perl Makefile.PLmakemake installcd ..tar xf Class-Accessor-0.31.tar.gzcd Class-Accessor-0.31perl Makefile.PLmake && make installcd ..tar xf Config-Tiny-2.12.tar.gzcd Config-Tiny-2.12perl Makefile.PLecho $?make && make installcd ..tar xf Math-Calc-Units-1.07.tar.gzcd Math-Calc-Units-1.07perl Makefile.PLmake && make installcd ..tar xf Regexp-Common-2010010201.tar.gzcd Regexp-Common-2010010201perl Makefile.PLmake && make installcd ..tar xf Nagios-Plugin-0.34.tar.gzcd Nagios-Plugin-0.34perl Makefile.PLmakemake installcd ..yum install -y sysstatcp /root/tools/check_memory.pl /usr/local/nagios/libexec/cp /root/tools/check_iostat /usr/local/nagios/libexec/chmod 755 /usr/local/nagios/libexec/check_memory.plchmod 755 /usr/local/nagios/libexec/check_iostatyum install -y dos2unixdos2unix /usr/local/nagios/libexec/check_iostatdos2unix /usr/local/nagios/libexec/check_memory.pl

修改客户端的配置文件：

cd /usr/local/nagios/etc/cp nrpe.cfg{,.bak}sed -ri 's@^allowed_hosts.*@&,10.0.0.1@g' nrpe.cfg # 允许10.0.0.1监控sed -ri '199,203d' nrpe.cfg

# 以下是用来告诉NRPE这个守护进程怎么去监控

echo "command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,6 -c 30,25,20" >>nrpe.cfgecho "command[check_mem]=/usr/local/nagios/libexec/check_memory.pl -w 6% -c 3%" >>nrpe.cfgecho "command[check_disk]=/usr/local/nagios/libexec/check_disk -w 20% -c 8% -p /" >>nrpe.cfgecho "command[check_swap]=/usr/local/nagios/libexec/check_swap -w 20% -c 10%" >>nrpe.cfgecho "command[check_iostat]=/usr/local/nagios/libexec/check_iostat -w 6 -c 10" >>nrpe.cfg

# [check_load]：相当于模块名
# /usr/local/nagios/libexec/check_load：获取资源的命令
# 也就是说通过调用check_load就相当于执行/usr/local/nagios/libexec/check_load这个命令
启动NRPE：

/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d

# -c：指定配置文件
# -d：daemon

echo "# nagios nrpe process cmd" >>/etc/rc.local # 开机自启echo "/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d" >>/etc/rc.localss -lnt|grep 5666

1.5 开始监控

监控之前也要在服务器端安装客户端软件。
Nagios安装生成的文件：

[root@nagios nagios]# pwd/usr/local/nagios[root@nagios nagios]# tree -L 1.|-- bin|-- etc|-- libexec # 插件|-- sbin # CGI程序|-- share # Nagios界面展示的php程序等内容的目录，被Nagios在httpd配置文件目录生成的配置文件所调用 `-- var # 日志和数据6 directories, 0 files

配置文件目录：

[root@nagios nagios]# tree etc/etc/|-- cgi.cfg # 被主配置文件包含|-- nagios.cfg # 主配置文件|-- objects # 被主配置文件包含|   |-- commands.cfg # 存放Nagios命令相关配置(也可指定commands目录)，这里的命令不是系统命令|   |-- contacts.cfg|   |-- localhost.cfg # 对本机的监控，我们不使用它进行监控，而是将本机当成客户端来监控|   |-- printer.cfg # 打印机|   |-- switch.cfg # 交换机|   |-- templates.cfg # 模板配置文件|   |-- timeperiods.cfg|   `-- windows.cfg # windows`-- resource.cfg # 被主配置文件包含，这里面是Nagios内置变量的定义，如$USER1$,$USER2$,$USER3$等

内容解释：

#commands.cfg：存放Nagios命令相关配置(也可指定commands目录)，这里的命令不是系统命令，而是实现把Nagios中定义的命令和Linux系统中的插件命令关联的一个文件。如oldboy=/bin/cat，oldboy就是Nagios命令，而/bin/cat则是系统命令；
services.cfg：存放具体被监控的服务相关的配置内容(对哪些服务进行监控)，上百台以上可指定services目录，默认不存在；
hosts.cfg：存放具体被监控的主机相关配置，上百台以上可指定hosts目录，默认不存在；
contacts.cfg：存放报警联系人相关配置的文件； timeperiods.cfg：存放报警周期时间等相关配置；
template.cfg：模板配置文件，模板的存在是为了方便的配置服务器配置，类似shell里的函数功能

编辑主配置文件：
# 主配置文件是通过cfg_file来包含其他配置文件的，我们可以让其包含上述两个并不存在的配置文件：

[root@nagios etc]# sed -ri '33acfg_file=/usr/local/nagios/etc/objects/hosts.cfg' nagios.cfg[root@nagios etc]# sed -ri '33acfg_file=/usr/local/nagios/etc/objects/services.cfg' nagios.cfg

# 注释掉localhost

[root@nagios etc]# sed -ri 's@cfg_file=/usr/local/nagios/etc/objects/localhost.cfg@#&@g' nagios.cfg

# 主配置文件还可以包含目录，只要目录下面存在以.cfg结尾的文件都会被包含进来。在配置文件很多时还是可以使用的：

[root@nagios etc]# sed -ri 's@#(cfg_dir=/usr/local/nagios/etc/servers)@\1@g' nagios.cfg

创建目录和文件：

mkdir serverschown -R nagios.nagios servers/cd objects/head -51 localhost.cfg >hosts.cfgchown nagios.nagios hosts.cfgtouch services.cfg # 暂时留空chown nagios.nagios services.cfg

加入被监控主机：
# 编辑hosts.cfg配置文件，也就是head localhost文件生成的

[root@nagios objects]# vim hosts.cfgdefine host{        use                                         host_name               02-client1        alias                   02-client1        address                 10.0.0.2        }define host{ # 将本机也加入监控        use                     linux-server        host_name               01-nagios        alias                   01-nagios        address                 10.0.0.1        }

解释：

这一个标签就是一个被监控的主机
use表示一个使用名为linux-server的模板，该模板就是和hosts.cfg在同一个目录下的timeperiods.cfg，在该文件中可以搜索到linux-server定义的属性。可以也可以将该模板中定义的熟悉写在define
host{}标签内，如果在该标签中定义了，那么就以该标签中的内容为准；如果没定义就会模板配置文件中找。使用模板配置文件的好处就在于在现在这个标签内只需定义四行即可。

define hostgroup{ # 再将两个客户端加入一个组        hostgroup_name  linux-servers        alias           Linux Servers        members         02-client1,01-nagios        }

检查配置文件：
# 检查配置文件的方法有两种，第一种为：

/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg

# 第二种：

/etc/init.d/nagios checkconfig

# 其实第二种就是调用第一种的命令，但是它将信息都定义到了/dev/null中了，根本看不出来什么地方出错了，因此我们可以修改启动脚本中的内容：

[root@nagios objects]# vim /etc/init.d/nagios +183    checkconfig)        printf "Running configuration check..."        $NagiosBin -v $NagiosCfgFile # 将后面的重定向去掉

# 执行命令

[root@nagios objects]# /etc/init.d/nagios checkconfig...Error: There are no services defined! # 这就是错误，没有定义服务。下面就是统计的...Total Warnings: 2 # 警告无所谓Total Errors:   1 # 但是错误一定要解决...

# 既然没有定义服务，那我们就定义一个：

define service {    use                    generic-service # 模板    host_name              02-client1,01-nagios # 被监控主机    service_description    Disk Partition # 检查磁盘分区    check_command          check_nrpe!check_disk}

# check_nrpe：Nagios的命令，需要在commands.cfg文件中定义
# check_disk：调用客户端配置文件nrpe.cfg中[check_disk]标签后面的命令

command[check_disk]=/usr/local/nagios/libexec/check_disk -w 20% -c 8%
-p /

# 继续编辑commands.cfg配置文件，在配置文件的结尾加入以下几行：

# 'check_nrpe' command definitiondefine command{    command_name    check_nrpe    command_line    $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$    }

# -c：指定一个参数，这个参数就是check_disk

# 其实定义这么多的参数无非就是为了执行这一条命令：

[root@nagios objects]# /usr/local/nagios/libexec/check_nrpe -H 10.0.0.2 -c check_diskDISK OK - free space: / 57841 MB (95% inode=97%);| /=2760MB;51080;58742;0;63851

# 再次检查配置文件，结果ok：

[root@nagios objects]# /etc/init.d/nagios checkconfig

启动服务并访问web界面：

/etc/init.d/nagios start/etc/init.d/httpd start

我们点击左边的services，会出现报错信息，解决办法就是编辑cgi.cfg：

[root@nagios etc]# pwd  /usr/local/nagios/etc[root@nagios etc]# grep nagiosadmin cgi.cfgauthorized_for_system_information=nagiosadminauthorized_for_configuration_information=nagiosadminauthorized_for_system_commands=nagiosadminauthorized_for_all_services=nagiosadminauthorized_for_all_hosts=nagiosadminauthorized_for_all_service_commands=nagiosadminauthorized_for_all_host_commands=nagiosadmin

# 从以上信息可以看出nagiosadmin就是Nagios的管理员，我们现在是没有权限，因此我们可以将nagiosadmin改为我们一开始添加的认证的用户oldboy。当然也可以使用nagiosadmin作为认证用户：

[root@nagios etc]# sed -i 's/nagiosadmin/oldboy/g' cgi.cfg[root@nagios etc]# grep oldboy cgi.cfgauthorized_for_system_information=oldboyauthorized_for_configuration_information=oldboyauthorized_for_system_commands=oldboyauthorized_for_all_services=oldboyauthorized_for_all_hosts=oldboyauthorized_for_all_service_commands=oldboyauthorized_for_all_host_commands=oldboy

重启服务：

[root@nagios etc]# /etc/init.d/nagios reload

1.5.1 刷新时间的定义

status_update_interval=3 # 默认10s刷新状态之类的数据[root@nagios etc]# sed -ri 's/(^status_u.*=).*/\13/g' nagios.cfgmax_service_check_spread=10 # 最大的服务检查间隔[root@nagios etc]# sed -ri 's/(^max_s.*=).*/\110/g' nagios.cfgauto_rescheduling_interval=5 # 尝试自动检查的时间间隔[root@nagios etc]# sed -ri 's/(^auto_rescheduling_i.*=).*/\15/g' nagios.cfgcommand_check_interval=-1 # -1的意思是尽可能的经常检查，但这不是我们想要的[root@nagios etc]# sed -ri 's/(^command_c.*=).*/\12s/g' nagios.cfg # 改为2sretention_update_interval=10[root@nagios etc]# sed -ri 's/(^rete.*=).*/\110/g' nagios.cfginterval_length=10[root@nagios etc]# sed -ri 's/(^in.*=).*/\110/g' nagios.cfgservice_freshness_check_interval=10[root@nagios etc]# sed -ri 's/(^service_f.*=).*/\110/g' nagios.cfghost_freshness_check_interval=10[root@nagios etc]# sed -ri 's/(^host_f.*=).*/\110/g' nagios.cfg

1.5.2 一些排错的思路

(1) 客户端获取值失败：

[root@client1 ~]# /usr/local/nagios/libexec/check_nrpe -H 10.0.0.2 -c check_diskCHECK_NRPE: Error - Could not complete SSL handshake. # 握手失败

# 这种问题的解决办法很简单，只需要执行下面这条命令即可：

[root@client1 ~]# /usr/local/nagios/libexec/check_nrpe -H 127.0.0.1 -c check_disk

# 如果能够获得值，那就是没有添加网卡地址，在nrpe.cfg中修改allowed_hosts=127.0.0.1这一行
(2) 状态为CRITICAL
{<code>[}EO</code>GAYB~UR{2PXBZ80O.png-4.3kB” title=””></p>
<p style= # 这种问题就是连接失败，要么是服务没起，要么就是防火墙没关。我们可以现在本地执行：

/usr/local/nagios/libexec/check_nrpe -H 10.0.0.2 -c check_disk

# 当然ip和参数都可以改，通过该命令就能得到答案，因为改命令就是Nagios获取监控值的过程
(3) 命令行执行能够获取数值，但是web界面去获取不到。

define service {    use                    generic-service    host_name              02-client1,01-nagios    service_description    Disk Partition    check_command          check_nrpe!check_disk # 肯定是这个参数定义错了}

(4) Unable to read output

# 出现这种问题的原因就是获取值的插件没有执行权限，或者是这插件就是有问题的，总之就是插件的错。

command[check_mem]=/usr/local/nagios/libexec/check_memory.pl -w 6% -c 3% # check_memory.pl就是插件[root@nagios libexec]# chmod +x check_memory.pl # 执行该命令，如果还是不行，那就是插件本身的问题了

总结，当web界面显示出现问题时：
(1) Nagios自身和配置文件；
(2) 在服务器端执行：
/usr/local/nagios/libexec/check_nrpe -H 被监控主机地址-c 获取值的命令
(3) 在客户端本地执行：
/usr/local/nagios/libexec/check_nrpe -H 127.0.0.1 -c获取值的命令
(4) 执行nrpe.cfg配置文件中的获取值的命令：

command[check_disk]=/usr/local/nagios/libexec/check_disk -w 20% -c 8%
-p / # 执行该命令

老男孩老师补几个提醒：
(1) 检查客户端系统自带的防火强，是否drop了5666端口；
(2) nrpe添加完命令后，有没有真正重启；
(3) nrpe.cfg配置文件中的allow_hosts这行的ip千万不要加错了。

1.5.3 添加其他监控项

[root@nagios objects]# cat services.cfgdefine service {    use                    generic-service    host_name              02-client1,01-nagios    service_description    Disk Partition    check_command          check_nrpe!check_disk}define service {    use                    generic-service    host_name              02-client1,01-nagios    service_description    Memory Partition    check_command          check_nrpe!check_mem}define service {    use                    generic-service    host_name              01-nagios,02-client1    service_description    load    check_command          check_nrpe!check_load}define service {    use                    generic-service    host_name              01-nagios,02-client1    service_description    swap    check_command          check_nrpe!check_swap}define service {    use                    generic-service    host_name              01-nagios,02-client1    service_description    iostat    check_command          check_nrpe!check_iostat}

1.6 主动模式

按照监控的行为，老男孩老师把Nagios的监控分为主动监控和被动监控(NRPE半被动和NSCA全被动)。
(1) 主动监控：所谓的主动模式就是Nagios服务器端发起的监控，如URL地址、端口监控等。主动模式获取值的命令无需经过nrpe，Nagios自身能够直接发起，也就是说不需要在客户端安装任何插件。当然，主动监控模式也能配置成被动模式。
(2) 半被动监控：我们把对负载、内存、硬盘、虚拟内存、磁盘IO、温度、风扇转速等这些本地资源而非系统对外提供的服务的监控称为半被动模式。半被动模式的特点是对于这些本地资源的监控一般由Nagios插件定时去连接client的NRPE服务，定期获取信息发回Nagios服务器端。基本上只要安装了类似NRPE的agent端，且通过插件的方式的监控我们都认为是半被动监控。
上面讲到的都是被动模式。

如何选择主动和被动？
(1) 对于本地资源的监控，一般都使用被动模式。如负载、磁盘、内存、虚拟内存、磁盘IO、温度、风扇等的监控(我们也可以通过snmp来监控部分系统资源)；
(2) 对于web服务、数据库这种能对外提供服务的监控，一般采用主动模式。如监控http、ssh、MySQL、rsync等服务；
(3) 主动和被动是相对的，并且是可以相互转换的。即主动模式的服务可以改成被动的；而被动模式有时也可以改为主动。
总之：
(a) 主动模式就和NRPE无关了，就是利用服务端本地插件直接获取信息；
(b) 被动模式则是Nagios主程序通过check_nrpe插件和客户端NRPE进程沟通，调用本地插件获取数据。

主动模式有check_tcp和check_http这两个非常常用的插件，一个是检查端口，另一个则是检查URL，它们都能够使用–help查看使用帮助。

[root@nagios libexec]# ./check_http --help[root@nagios libexec]# ./check_tcp --help

# 以下是最基本的使用方法

[root@nagios libexec]# ./check_tcp -H 10.0.0.2 -p 22TCP OK - 0.000 second response time on port 22|time=0.000299s;;;0.000000;10.000000[root@nagios libexec]# ./check_http -I 10.0.0.2HTTP OK: HTTP/1.1 200 OK - 248 bytes in 0.024 second response time |time=0.023816s;;;0.000000 size=248B;;;0

1.6.1 监控一个域名或URI

先说说使用主配置文件包含一个目录的好处：
(1) 该目录下的所有所有以.cfg为后缀的配置文件都会被Nagios加载，因此当我们不想使用其中的配置文件时，只需要改变其后缀名即可；
(2) 我们一个以一个服务名为目录名，下面的配置文件都是监控这个服务的；还可以以一个主机命名，下面的配置文件都是监控这个主机的。可以根据业务需要进行配置。

1. 添加一个服务：

[root@nagios etc]# vim servers/http.cfg # server是主配置文件中包含的目录define service {    use                  generic-service    host_name            02-client1    service_description  blog_url    check_command        check_weburl!-I 10.0.0.2max_check_attempts   3normal_check_interval   2retry_check_interval    1check_period     24x7notification_interval   30notification_period  24x7notification_options    w,u,c,rcontact_groups   admins}

check_weburl：check_weburl这个可以直接换成check_http，但是也可以在commands.cfg文件中定义，让它和这个check_http关联起来；
-I 10.0.0.2 可以使用域名而非ip，工作中肯定是使用域名的，这里只是测试

2. 编辑commands.cfg，加入check_weburl

[root@nagios etc]# vim objects/commands.cfg# 'check_http' command definition # 这里面已经存在了check_http，因此可以直接替换上面的check_weburldefine command{        command_name    check_http        command_line    $USER1$/check_http -I $HOSTADDRESS$ $ARG1$        }# 'check_weburl' command definitiondefine command{        command_name    check_weburl        command_line    $USER1$/check_http $ARG1$ -w 10 -c 30        }

# 之所以重新定义check_weburl，是为了增加-w 10 -c 30，10秒钟之内返回结果为警告，30秒内返回结果那就很严重了

3. 重新加载配置文件：

[root@nagios etc]# /etc/init.d/nagios checkconfig[root@nagios etc]# /etc/init.d/nagios reload

以上是ip，下面是域名：

[root@nagios etc]# cat servers/http.cfgdefine service {    use                  generic-service    host_name            02-client1    service_description  blog_url    check_command        check_weburl!-I 10.0.0.2max_check_attempts   3normal_check_interval   2retry_check_interval    1check_period     24x7notification_interval   30notification_period  24x7notification_options    w,u,c,rcontact_groups   admins}define service {    use                     generic-service    host_name               02-client1    service_description     blog_url2    check_command           check_weburl!-H blog.etiantian.org # 域名    max_check_attempts      3    normal_check_interval   2    retry_check_interval    1    check_period            24x7    notification_interval   30    notification_period     24x7    notification_options    w,u,c,r    contact_groups          admins}define service {    use                     generic-service    host_name               02-client1    service_description     blog_url3    check_command           check_weburl!-H blog.etiantian.org -u "/exec/test" # URI    max_check_attempts      3    normal_check_interval   2    retry_check_interval    1    check_period            24x7    notification_interval   30    notification_period     24x7    notification_options    w,u,c,r    contact_groups          admins}

# 编辑hosts文件，域名都有公网DNS解析了，为什么还要添加hosts呢？因为使用公网DNS很容易误报，如果监控服务器本身DNS出问题了就会导致误报。缺点是不能监控到DNS导致的域名解析故障。

[root@nagios etc]# vim /etc/hosts127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4 nagios::1         localhost localhost.localdomain localhost6 localhost6.localdomain610.0.0.2    blog.etiantian.org

# curl一下，看看是否有问题

[root@nagios etc]# curl blog.etiantian.orgblog.etiantian.org

# 再次检查：

[root@nagios etc]# /usr/local/nagios/libexec/check_http -H blog.etiantian.orgHTTP OK: HTTP/1.1 200 OK - 249 bytes in 0.001 second response time |time=0.000688s;;;0.000000 size=249B;;;0

# 这是对URL做监控

[root@nagios etc]# /usr/local/nagios/libexec/check_http -H blog.etiantian.org -u /exec/test   HTTP OK: HTTP/1.1 200 OK - 243 bytes in 0.001 second response time |time=0.000784s;;;0.000000 size=243B;;;0

# 重载配置文件：

[root@nagios etc]# /etc/init.d/nagios checkconfig [root@nagios etc]# /etc/init.d/nagios reload

如果不是监控域名而是URI的话，当该URI有特殊符号，也就是没有做伪静态时，使用这个URL一定要用引号一起来不然就会报错：

define service {    use                     generic-service    host_name               02-client1    service_description     blog_url    check_command           check_weburl!-H blog.etiantian.org -u "/main_free.jsp?dirId=32234&gId=3"

我们可以删除URI中的文件，查看监控的反应：

1.6.2 监控端口

监控端口使用的是check_tcp这个插件，这个命令已经在commands.cfg中定义了，我们直接拿来用就行。比如监听80端口：

[root@nagios etc]# vim servers/http.cfgdefine service {    use                     generic-service    host_name               02-client1    service_description     blog_prot_80    check_command           check_tcp!80 # 已经在commands.cfg中定义了    max_check_attempts      3    normal_check_interval   2    retry_check_interval    1    check_period            24x7    notification_interval   30    notification_period     24x7    notification_options    w,u,c,r    contact_groups          admins}

# 重载配置文件

[root@nagios etc]# /etc/init.d/nagios checkconfig [root@nagios etc]# /etc/init.d/nagios reload

所有端口都可以这么监控，只需要改个描述和端口号即可。

1.6.3 集群节点控制

利用别名实现对集群下面同样的节点的URL监控，因为相同的域名下所有节点都是一样的，这是就可以通过别名区分同一个域名解析下的所有主机：

web1 blog.etiantian.org,blog1.etiantian.org
web2 blog.etiantian.org,blog2.etiantian.org

1.6.4 小结

一般客户端对外开启的服务，用主动模式监控。如port,url。

主动模式的监控配置过程：
(1) 在服务端的命令行把要监控的命令先调试好；
(2) 在commands.cfg中定义Nagios命令，同时调用命令行的插件；
(3) 在服务的配置文件中定义要监控的服务，调用commands.cfg中定义Nagios的监控命令。

1.6.5 被动模式监控端口

被动模式就要在客户端进行
1) 先测试命令在命令行是否执行成功：

[root@client1 etc]# /usr/local/nagios/libexec/check_tcp -H 10.0.0.2 -p 80TCP OK - 0.000 second response time on port 80|time=0.000132s;;;0.000000;10.000000

2) 然后加入到nrpe.cfg中：

[root@client1 etc]# echo "command[check_port_80]=/usr/local/nagios/libexec/check_tcp -H 10.0.0.2 -p 80 -w 5 -c 10" >>nrpe.cfg

3) 重启服务：

ps aux|grep nrpepkill nrpeps aux|grep nrpe/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -dps aux|grep nrpe

4) 在服务端命令测试：

[root@nagios libexec]# ./check_nrpe -H 10.0.0.2 -c check_port_80TCP OK - 0.000 second response time on port 80|time=0.000162s;5.000000;10.000000;0.000000;10.000000

5) 添加一个services：

[root@nagios etc]# vim servers/http.cfgdefine service {    use                     generic-service    host_name               02-client1    service_description     blog_prot_80_passive    check_command           check_nrpe!check_port_80    max_check_attempts      3    normal_check_interval   2    retry_check_interval    1    check_period            24x7    notification_interval   30    notification_period     24x7    notification_options    w,u,c,r    contact_groups          admins}

6) 重载配置文件

[root@nagios etc]# /etc/init.d/nagios checkconfig [root@nagios etc]# /etc/init.d/nagios reload

1.7 服务分组

先定义一个配置文件，然后写入配置：

[root@nagios etc]# vim servers/servergroup.cfgdefine servicegroup{servicegroup_name swap # 这个swap要和前面定义的服务名对应上alias   Linux Serversmembers 02-client1,swap,01-nagios,swap # 监控的主机,服务的组名,第二个监控主机,服务的组名... 这样就达到了服务分组的目的}

重载服务后，在哪里查看呢？点击左侧栏的Service Groups：

今后就能够通过这种方式进行分组了，比如将所有要监控swap、cpu、磁盘等等的主机放在一个组里面。但是这个并不是太重要。

1.8 Nagios日志

Nagios也可以通过日志排查问题，日志所在位置为/usr/local/nagios/var/nagios.log，但是排错的思路前面已经讲到了，无需看日志。

1.9 主机和服务监控的重要参数

主机：

define host { # 定义主机    use                  linux-server # 主机使用的模板，详见templates.cfg    host_name            02-client1 # 这个主机名和关键，很多监控的定义都会引用这个主机名alias    02-client1 # 主机别名address  10.0.0.2 # ip    check_command        check-host-alive # 检测主机存活的命令，来自commands.cfgmax_check_attempts   3 # 故障后的最大检测次数normal_check_interval   2 # 正常的检查间隔，默认单位为分钟retry_check_interval    1 # 故障后重试的检查间隔，默认单位为分钟check_period     24x7 # 检查周期24x7，具体详见timeperiods.cfgnotification_interval   30 # 故障后，两次报警的通知间隔，默认单位为分钟notification_period  24x7 # 一天之内通知的周期，如全天、半天等，详见timeperiods.cfgnotification_options    d,u,r # 哪些问题会报警，d-down,u-unreachable(不可达),r-recovery(主机恢复)contact_groups   admins # 报警到admins用户组，在contacts.cfg中定义}

服务：

define service {    use                     generic-service    host_name               02-client1    service_description     blog_prot_80_passive # 报警服务的描述    check_command           check_nrpe!check_port_80 # 检查服务的命令    max_check_attempts      3    normal_check_interval   2    retry_check_interval    1    check_period            24x7    notification_interval   30    notification_period     24x7    notification_options    w,u,c,r # w-warning,u-unknown(状态不知道),c-critical(特别严重),r-recovery(恢复)    contact_groups          adminsprocess_perf_data    1 # PNP出图记录数据相关}

1.9.1 服务模板

不管是服务还是主机，一半只会定义前四项，其他参数都会定义在模板文件中。如果我们对监控的服务进行分类的话，甚至可以只写两行。我们来看看模板文件中的内容：

[root@nagios objects]# vim templates.cfgdefine service{        name                            generic-service # 这就是服务的模板        active_checks_enabled           1        passive_checks_enabled          1        parallelize_check               1        obsess_over_service             1        check_freshness                 0        notifications_enabled           1        event_handler_enabled           1        flap_detection_enabled          1        failure_prediction_enabled      1        process_perf_data               1        retain_status_information       1        retain_nonstatus_information    1        is_volatile                     0          check_period                    24x7        max_check_attempts              3            normal_check_interval           10          retry_check_interval            2            contact_groups                  admins           notification_options            w,u,c,r        notification_interval           60               notification_period             24x7             register                        0                 }

1.9.2 监控周期模板

查看监控周期timeperiods.cfg文件：

define timeperiod{        timeperiod_name 24x7 # 24x7只是一个名字而已，真正的时间在下面定义        alias           24 Hours A Day, 7 Days A Week        sunday          00:00-24:00        monday          00:00-24:00        tuesday         00:00-24:00        wednesday       00:00-24:00        thursday        00:00-24:00        friday          00:00-24:00        saturday        00:00-24:00        }# 'workhours' timeperiod definitiondefine timeperiod{timeperiod_name workhours # 这是工作时间的，老外真爽alias    Normal Work Hoursmonday   09:00-17:00tuesday  09:00-17:00wednesday   09:00-17:00thursday    09:00-17:00friday   09:00-17:00}

# workhours用于监控磁盘的报警，也就是说磁盘的监控是7x24小时的，但是报警时间一般为8点到23点。

1.9.3 联系人模板

模板文件名为contacts.cfg，记录报警信息发送的对象：

[root@nagios objects]# vim contacts.cfgdefine contact{    contact_name    nagiosadmin # 联系人的名字    use  generic-contact # 使用的模板    alias    Nagios Admin        email    nagios@localhost}define contactgroup{ # 联系人组contactgroup_name   admins # 可以向这个组内的所有成员报警alias    Nagios Administratorsmembers  nagiosadmin # 组中的成员}

# 可以添加一个运维组，将所有运维人员都添加到该组中；还可以添加一个老大的邮箱，当某些报警信息不希望老大收到时就不把他写上去。

1.10 报警的过程

templates.cfg：[root@nagios objects]# cat templates.cfgdefine contact{name     generic-contact # 这是联系人的模板service_notification_period 24x7host_notification_period     24x7service_notification_options    w,u,c,r,f,shost_notification_options      d,u,r,f,sservice_notification_commands   notify-service-by-email # 这是服务发送Email的命令，在command.cfg中定义host_notification_commands   notify-host-by-email # 这是主机报警的命令，同上register     0}contacts.cfg：[root@nagios objects]# vim contacts.cfgdefine contact{    contact_name    nagiosadmin    use  generic-contact # 联系人模板从这里引用    alias    Nagios Admin        email    nagios@localhost}commands.cfg：[root@nagios objects]# vim commands.cfg# 'notify-host-by-email' command definitiondefine command{    command_name    notify-host-by-email # 主机报警的命令，最终调用的是系统的mail命令    command_line    /usr/bin/printf "%b" "***** Nagios *****\n\nNotification Type: $NOTIFICATIONTYPE$\nHost: $HOSTNAME$\nState: $HOSTSTATE$\nAddress: $HOSTADDRESS$\nInfo: $HOSTOUTPUT$\n\nDate/Time: $LONGDATETIME$\n" | /bin/mail -s "** $NOTIFICATIONTYPE$ Host Alert: $HOSTNAME$ is $HOSTSTATE$ **" $CONTACTEMAIL$    }# 'notify-service-by-email' command definitiondefine command{    command_name    notify-service-by-email # 服务报警的命令    command_line    /usr/bin/printf "%b" "***** Nagios *****\n\nNotification Type: $NOTIFICATIONTYPE$\n\nService: $SERVICEDESC$\nHost: $HOSTALIAS$\nAddress: $HOSTADDRESS$\nState: $SERVICESTATE$\n\nDate/Time: $LONGDATETIME$\n\nAdditional Info:\n\n$SERVICEOUTPUT$\n" | /bin/mail -s "** $NOTIFICATIONTYPE$ Service Alert: $HOSTALIAS$/$SERVICEDESC$ is $SERVICESTATE$ **" $CONTACTEMAIL$    }

1.11 自定义开发插件

自定义插件可以使用任意语言开发，只要能在命令行给出结果，就能够使用Nagios监控。什么是插件呢？我们在前文安装的nagios-plugins-1.4.16.tar.gz，这个软件包就是Nagios的插件安装包，插件都安装…/nagios/libexec目录下。只所以使用自定义插件的原因有：
(1) Nagios自带的插件满足不了需要；
(2) 由于插件是我们写的，因此它有哪些缺点和BUG我们都清楚。

写自定义插件的规则：
(1) 插件要有一个退出状态码，它用于被Nagios主程序作为判断被监控系统服务状态的依据；
(2) 插件在控制台打印的第一行数据，该数据可以被Nagios主程序作为被监控系统服务状态的补充说明，会显示在管理界面。

Nagios主程序可识别的状态码和说明如下：
OK：退出状态码0，表示服务正常工作；
WARNING：退出状态码1，表示服务处于警告状态；
CRITICAL：退出状态码2，表示服务处于严重状态；
UNKNOWN：退出状态码3，表示服务处于未知状态。
状态码定义的方法可以在libexec目录下执行head -7 utils.sh：

[root@nagios libexec]# head -7 utils.sh#! /bin/shSTATE_OK=0STATE_WARNING=1STATE_CRITICAL=2STATE_UNKNOWN=3STATE_DEPENDENT=4

不同语言的系统退出函数示例如下：

Java：System.exit(int status)

php：exit(status)

python：sys.exit(int status)

C/C++：return int status

bash：exit int status

不同语言打印第一行数据：

Java：System.out.println(String msg)

php：echo msg

python：printf msg

C/C++：printf(“%s”,msg)

bash：echo msg(printf)

使用shell开发第一个插件，监控passwd文件的变化：
# 先写脚本

[root@client1 ~]# md5sum /etc/passwd >/etc/oldboy.md5[root@client1 ~]# cd /usr/local/nagios/libexec/[root@client1 libexec]# vim check_passwd#!/bin/bashchar=`md5sum -c /etc/oldboy.md5|grep "OK"|wc -l`if [ $char -eq 1 ];then    echo "passwd is ok"    exit 0else    echo "passwd is changed"    exit 2fi[root@client1 libexec]# chmod +x check_passwd

# 添加到监控，只能使用被动监控

[root@client1 ~]# echo "command[check_passwd]=/usr/local/nagios/libexec/check_passwd" >>/usr/local/nagios/etc/nrpe.cfg[root@client1 libexec]# pkill nrpe[root@client1 libexec]# ps aux|grep nrpe[root@client1 libexec]# /usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d[root@nagios nagios]# ./libexec/check_nrpe -H 10.0.0.2 -c check_passwd # 在服务器端先测试[root@nagios nagios]# vim etc/objects/services.cfg # 在服务端配置define service {    use                    generic-service    host_name              02-client1    service_description    passwd    check_command          check_nrpe!check_passwd}[root@nagios nagios]# /etc/init.d/nagios checkconfig[root@nagios nagios]# /etc/init.d/nagios reload

# 最终结果：

1.12 图形显示和管理

虽然能显示能报警，但是企业工作中需要一个历史趋势图。Nagios本身只是实现了核心功能，因此它不具备出图的能力，和Nagios配合出图的工具有很多，但是最好的还是pnp。想要使用pnp出图，但是也需要其他软件的支持。我们先安装图形显示管理的依赖库：

[root@nagios ~]# yum install -y cairo pango zlib zlib-devel freetype freetype-devel gd gd-devel

1.12.1 安装软件

pnp出图实际上是利用rrdtool(轮询的数据库工具)这个软件，但是安装之前我们先安装rrdtool的依赖库。我们可以使用yum install libart_lgpl libart_lgpl-devel安装，这里我们使用编译安装的方式(软件包中都有)：

tar xf libart_lgpl-2.3.17.tar.gzcd libart_lgpl-2.3.17./configuremake && make installcp -r /usr/local/include/libart-2.0/ /usr/include/cd ..

安装rrdtools，rrdtools是真正画图的软件，这个工具虽然冷门，但是很多软件的画图都是靠它：

tar xf rrdtool-1.2.14.tar.gzcd rrdtool-1.2.14./configure --prefix=/usr/local/rrdtool --disable-python --disable-tclmake && make installcd ..ll /usr/local/rrdtool/bin/ # 3个程序

现在才是真正的安装pnp，pnp的作用就是收集数据然后告诉rrdtool，然后rrdtool画完图后还要通过pnp进行展示：

tar xf pnp-0.4.14.tar.gzcd pnp-0.4.14./configure \--with-rrdtool=/usr/local/rrdtool/bin/rrdtool \ # 画图的命令--with-perfdata-dir=/usr/local/nagios/share/perfdata # 出图的路径make allmake installmake install-configmake install-initll /usr/local/nagios/libexec/|grep process

# configure出现WARNING不用理会

1.12.2 修改配置

软件都准备好了，接下来要做的就是编辑主配置文件：

cd /usr/local/nagios/etc/cp nagios.cfg nagios.cfg.baksed -ri 's@(^pro.*=).*@\11@g' nagios.cfgsed -ri 's@^#(host_perfdata_c.*)@\1@g' nagios.cfgsed -ri 's@^#(service_perfdata_c.*)@\1@g' nagios.cfg

# 这是修改后的内容

process_performance_data=1host_perfdata_command=process-host-perfdataservice_perfdata_command=process-service-perfdata

修改commands.cfg文件：
# 将这两段内容删除：

# 'process-host-perfdata' command definitiondefine command{    command_name    process-host-perfdata    command_line    /usr/bin/printf "%b" "$LASTHOSTCHECK$\t$HOSTNAME$\t$HOSTSTATE$\t$HOSTATTEMPT$\t$HOSTSTATETYPE$\t$HOSTEXECUTIONTIME$\t$HOSTOUTPUT$\t$HOSTPERFDATA$\n" >> /usr/local/nagios/var/host-perfdata.out    }# 'process-service-perfdata' command definitiondefine command{    command_name    process-service-perfdata    command_line    /usr/bin/printf "%b" "$LASTSERVICECHECK$\t$HOSTNAME$\t$SERVICEDESC$\t$SERVICESTATE$\t$SERVICEATTEMPT$\t$SERVICESTATETYPE$\t$SERVICEEXECUTIONTIME$\t$SERVICELATENCY$\t$SERVICEOUTPUT$\t$SERVICEPERFDATA$\n" >> /usr/local/nagios/var/service-perfdata.out    }

# 替换成：

# 'process-host-perfdata' command definitiondefine command{    command_name    process-host-perfdata    command_line    /usr/local/nagios/libexec/process_perfdata.pl # 其实就是该这一行    }# 'process-service-perfdata' command definitiondefine command{    command_name    process-service-perfdata    command_line    /usr/local/nagios/libexec/process_perfdata.pl    }

# /usr/local/nagios/libexec可以用 $USER1$ 进行替换
重载配置文件后访问10.0.0.1/nagios/pnp/index.php，出现以下界面表示安装成功：

/etc/init.d/nagios checkconfig/etc/init.d/nagios reload

只要等一会，图上就有数据显示了，只所以会有数据出现在图上，是因为模板配置文件中一个参数决定的：

[root@nagios etc]# vim objects/templates.cfgdefine service{        name                            generic-service        active_checks_enabled           1        passive_checks_enabled          1        parallelize_check               1        obsess_over_service             1        check_freshness                 0        notifications_enabled           1        event_handler_enabled           1        flap_detection_enabled          1        failure_prediction_enabled      1        process_perf_data               1 # 就是这个参数

1.12.3 将二者结合

目前监控和趋势图二者是分离的，我们现在要将它们结合起来。

在主机监控中整合：

[root@nagios objects]# vim hosts.cfgdefine host{        use         linux-server        host_name   02-client1        alia        02-client1        address     10.0.0.2        action_url  /nagios/pnp/index.php?host=$HOSTNAME$ # 增加这一行，定义URL        }

# 在模板中添加更省事
重载配置文件后访问10.0.0.1/nagios，可以看到多了一个按钮，点进去就是该主机所有的趋势图了：

服务出图：

[root@nagios objects]# vim services.cfgdefine service {    use                    generic-service    host_name              02-client1,01-nagios    service_description    Disk Partition    check_command          check_nrpe!check_disk    action_url  /nagios/pnp/index.php?host=$HOSTNAME$&srv=$SERVICEDESC$ # 增加一行}

# 同样可以写在模板中

1.13 报警

邮件报警：这是必须会的，生产环境中应尽量使用自己公司的信箱作为报警信箱，或者建立一个邮箱组(邮件列表)。尽量不用非公司信箱作为报警信箱，如126、qq等，因为这些信箱是免费的，对报警的频率等会有限制，很有可能会拒收或当成垃圾邮件，导致报警延时或无法收到。适用于重要且不紧急的业务报警；
邮件转短信报警：收到邮件会短信提醒，就相当于短信报警的功能。这是由邮箱提供商提供的一个功能，但报警内容长度有限制；
http短信网关：有专门的公司提供直接发送信息到手机的短信网关，常用的报警就是一个URL地址携带信息，收短信费。这是推荐的报警方式；
购买短信猫：类似于手机终端一样的客户端硬件设备，早期报警选用的方式，收短信费；
电话语音报警：先将报警语音录下来，报警时直接打电话到报警负责人，播放报警语音；也可以用语音识别软件，将文字识别为语音；
QQ/微信：模拟QQ，微信发信息的功能，QQ不太稳定；微信实际上就是将微信和邮箱绑定，当邮箱收到邮件时，微信会提醒

在生产环境中，一般会根据业务的紧急程度不同，多个报警策略结合使用。对于不需要紧急处理的业务一般选择邮件报警，如内存、磁盘空间的剩余率；对于重要且紧急的业务，会使用邮件加上短信同时报警。使用邮件报警便于记录故障详细信息，短息报警时及时提醒，优点是及时。短信报警的缺点是报警内容有限，所以在工作中如果接到严重报警时，我们紧急处理之前也会开启邮件系统先查看邮件细节。

其中http短信网关是老男孩老师最优先推荐使用的短信报警方式，原因：
(1) 简单、易用；
(2) 稳定、可靠；
(3) 收费合理，类似个人手机一样，收取发送费用。

老男孩老师的思想：花一定的费用把业务做到最好是正常工作的思维，如果总想着免费，那么如果业务报警收不到，损失可能会更大。

1.13.1 报警分级

A类：磁盘空间、cpu、内存报警等为一般报警，运维内部采取常规处理方式；
B类：网站域名不能打开为严重报警，需协调技术部相关人员会诊处理。
若收到A类报警，原则上限制处理时间，但以不影响服务为前提，进行即使处理；或收到B类报警短信，值班人员需在10分钟内邮件周知运维全体同事及相关技术人员，并解决。纯值班人员可能没有处理权限，只能电话及邮件周知运维人员，有的公司根据业务分配好报警的人。

1.13.2 配置报警

配置报警就是配置contacts.cfg文件。可以将公司所有的运维人员都加入到这个文件中，如果有需要还可以分组。

配置报警的步骤：
(1) 添加联系人及联系组contacts.cfg；

define contact{contact_name    oldboy-pager    use  generic-contactalias    Nagios usersemail    18901398229}

(2) 添加报警的命令commands.cfg

define command {command_name    notify-host-by-pagercommand_line    $USER1$/sms_send "$HOSTSTATE$ alert for $HOSTNAME$" $CONTACTOAGER$}define command {command_name    notify-service-by-pagercommand_line    $USER1$/sms_send "$HOSTALIAS$/$SERVICEDESC$ is $SERVICESTATE$" $CONTACTOAGER$}

(3) 调整联系人模板，添加报警的命令(来自于commands.cfg)：

define contact{name                            generic-contactservice_notification_period     24x7host_notification_period        24x7service_notification_options    w,u,c,r,f,shost_notification_options       d,u,r,f,sservice_notification_commands   notify-service-by-email,notify-service-by-pagerhost_notification_commands      notify-host-by-email,notify-host-by-pagerregister                        0}

(4) 在hosts.cfg和service.cfg配置文件中添加报警联系人及组，或者在模板中添加

contact_groups          admins,group1,group2,user1

总结：总体来说nagios还是不错的一款监控软件，但是相比zabbix 就没有zabbix那样配置简单。只需要在图形化界面点点就可以完成。

你可能感兴趣的:(NAGIOS,NAGIOS)

Nagios安装部署全攻略 weixin_34109408 memcached php 操作系统
概述：公司的生产机器一共有12台，2台LVS(主备)、2台nginx、2台tomcat、1台后台服务器(nginx_tomcat)、3台mysql(主+备+异地灾备)、1台图片服务器、2台memcached.可以看出网站的架构就是基于高可用的原理的，每个层面都做了主备、系统的PV不高，对于并发布，高性能没有那么苛求，对于系统安全、稳定有较高要求，前期已经对系统做了各种日志分析，WAF配置，漏洞扫面
zabbix监控MySQL lu9up zabbix mysql 数据库
1PMP介绍PMP（percona-monitoring-pluggins）是高质量的mysql监控组件，以模板、插件和脚本的形式提供我们去应用。可以将企业级MySQL功能添加到现有的本地监控解决方案中，支持如Nagios、Cacti和Zabbix等热门解决方案。更详细介绍请阅读官方文档第三章【TEMPLATESFORZABBIX】：Percona-Monitoring-Plugins-1.1.8
vulnhub靶机midwest-v1.0.1 himobrinehacken vulnhub 安全系统安全网络安全
下载地址：https://download.vulnhub.com/midwest/midwest-v1.0.1.ova主机发现目标144端口扫描服务扫描漏洞扫描访问web咯改一下host接下来用wpscan看一下用户名接下来看一下密码能不能出来扫的时候顺便看了一下网站目录nagios401了那就是又这个东东被拦截了这玩意又是一个waf好好好密码估计是出不来了再用域名扫一下这个也是一样的，只能访问
源码部署zabbix监控详细步骤 Mr Sean zabbix 监控类
由于实际工作中所需要监控的服务器数量之大，人工监控耗时耗力，基于这种情况寻找可用于监控的服务器的开源软件，有三款推荐软件可使用：Cacti、Nagios、Zabbix三款软件各自的特点如下：Cacti:基于SNMP协议的监控软件,强大的绘图能力Nagios:基于Agent监控,强大的状态查验与报警机制,插件极多,自己写监控脚本潜入到Nagios非常方便.Zabbix:基于多种监控机制,支持分布式监
Hack The Box-Monitored 0415i HTB靶场合集网络服务器运维 linux web http
端口扫描&信息收集使用nmap对ip进行扫描nmap10.10.11.248开放了22、80、389、443端口使用dirsearch对网站目录进行扫描dirsearch-u10.10.11.248发现一个/nagios的网页，尝试访问发现需要用户名和密码，这里没有用户名密码，先继续下一步将ip和域名加入到hosts文件中后，访问ipecho'10.10.11.248nagios.monitore
htb monitored root方式其中的一种（仅作记录）春猿火 linux
快下班时候审出来的，目前root的第5种方式nagios@monitored:~$cat/usr/local/nagiosxi/scripts/backup_xi.sh#!/bin/bash##CreatesaFullBackupofNagiosXI#Copyright(c)2011-2020NagiosEnterprises,LLC.Allrightsreserved.#BASEDIR=$(di
Linux运维日常使用软件和技能寻宝记_楠哥
运维工程师使用的运维平台和工具包括：Web服务器：apache、tomcat、nginx、lighttpd监控：nagios、ganglia、cacti、zabbix自动部署：ansible、sshpt、salt配置管理：puppet、cfengine负载均衡：lvs、haproxy、nginx传输工具：scribe、flume备份工具：rsync、wget数据库：mysql、oracle、sql
持续运维与监控 Michaelzh
运维的趋势，挑战，事件管理，流程管理运维权限管理开源运维平台云上IAM监控开源监控方案zabbix+短信、邮件、微信、钉钉告警普罗米修斯(容器)Nagiosopen-falconzenoss监控对象服务器、虚拟机监控数据库监控中间件监控容器监控云上监控云上自带服务，例如AWS的cloudwatch+SNS、阿里云的云监控+短信服务等告警消息分级，人性化监控系统运维可视化开源技术grafana云上服
开源监控服务一瞥：Prometheus、Grafana、Zabbix、Nagios、Icinga和Open-Falcon CodeArtisanX 开源监控
前言随着信息技术的发展，监控服务在维护系统稳定性和性能方面变得越来越重要。本文将比较一些流行的开源监控服务，以帮助你选择适合你需求的解决方案。监控服务对比监控服务特点优势不足性能扩展性安全性Prometheus-多维度数据模型-监控容器化环境的强大工具-需要单独设置存储后端-查询性能较高，适用于大规模环境-可通过分布式部署进行横向扩展-支持基于HTTPS的数据传输，提供基本认证-支持服务发现自动发
nagios部署记录 shaoqiu.wu linux centos 运维
nagios主程序部署前期准备工作#关闭防火墙systemctlstopfirewalld#关闭防火墙开启自启systemctldisablefirewalldvi/etc/sysconfig/selinuxSELINUX=disabled#重启#换源cd/etc/yum.repos.d/#备份源mvCentOS-Base.repoCentOS-Base.repo.bak#下载阿里源curl-o/
pnp4nagios 配置 nagios nextflying java 前端服务器
/root/software/pnp4nagios-0.6.26/sample-config/nagios.cfg-sample.in/root/software/pnp4nagios-0.6.26/sample-config/misccommands.cfg-sample.in/root/software/pnp4nagios-0.6.26/sample-config/nagios.cfg-sa
nagios php-fpm,nagios平台从apache迁移到nginx weixin_39907762 nagios php-fpm
nginx的性能远远优于apache，但由于nagios的web界面中包含php和c-cgi程序，因此需要两套fcgi管理工具(并非必须)和两套解释器(必须)。php用php-cgi跑就可以，c-cgi我选用fcgiwrap。下面介绍安装/配置步骤。php-fpm：是为PHP打的一个FastCGI管理补丁，可以平滑变更php.ini配置而无需重启php-cgiSpawn-fcgi：是lighttp
《高性能Linux服务器构建实战》笔记 SkTj
系统安全、故障排查、自动化运维、集群架构1、账号安全，安装完后可以删除的账号：adm,lp,sync,shutdown,halt,news,uucp,operator,games,gopher禁用登录功能：usermod-s/sbin/nologinnagios2、关闭不需要的服务:anacronauditdautofsavahi-daemonavahi-dnsconfdbluetoothcpus
L2tp客户端 jameslord makefile nagios linux ubuntu file 服务器
root@ubuntu:~/download/backfire$lsfeeds/packages/net/xd/feeds里面放了很多Makefile，编译时怎么没把xd编译出来呢?filesMakefilepatchesREADMEroot@ubuntu:~/download/backfire$lsdl/|grepxfeeds/packages/admin/nagios/Makefilenagi
16、Mysql用户工具 geek-wmy Mysql高性能学习 mysql 数据库 java 后端面试
接口工具MysqlWorkbenchSQLyogphpMyAdminAdminer命令行工具集PerconaToolkitMaatkitandAspersaTheopenarkkitMysqlWorkbench工具集SQL实用集common_schemamysql-sr-libMysqlUDF库MysqlForge监测工具开源的监控工具NagiosZabbixZenossHypericHQOpen
k8s实战之部署Prometheus+Grafana可视化监控告警平台诸葛钢铁云 K8S
写在前面之前部署web网站的时候，架构图中有一环节是监控部分，并且搭建一套有效的监控平台对于运维来说非常之重要，只有这样才能更有效率的保证我们的服务器和服务的稳定运行，常见的开源监控软件有好几种，如zabbix、Nagios、open-flcon还有prometheus,每一种有着各自的优劣势，感兴趣的童鞋可以自行百度，但是与k8s集群监控，相对于而已更加友好的是Prometheus，今天我们就看
《中小银行运维架构：解密与实战》李丙洋_2021 hotwater99 #运维运维
目录传统IT基础架构IT基础设施网络架构灾备架构运维日常系统监控基础设施层监控系统层监控应用层监控业务层监控用户体验层监控事件管理事件管理流程事件应急处理事件管理制度及分级事件管理优化运维标准化域名化安全基线基础运行环境标准化操作系统中间件运行规范中间件编码规范网络标准化数据库标准化立体化监控体系监控体系流行监控系统NagiosGangliaZabbixOpen-FalconPrometheusE
分布式下有哪些好用的监控组件？小小哭包分布式解决方案分布式监控组件
在之前的内容中，分析了分布式系统下的线上服务监控的常用指标，那么在实际开发中，如何收集各个监控指标呢？线上出现告警之后，又如何快速处理呢？本文我们就来看下这两个问题。常用监控组件目前分布式系统常用的监控组件主要有OpenFalcon、Nagios、Zabbix、CAT等，下面一起来看看这几款组件的应用及相关特性。好钢要用在刀刃上，由于各类监控组件的应用和配置更偏向基础运维，所以本课时的目的是希望你
监控系统看这一篇就够了！Zabbix、Prometheus等常见监控教程开源Linux zabbix prometheus 运维大数据
监控俗称「第三只眼」，几乎是我们每天都会打交道的系统，俗话说：无监控、不运维，监控的地位不言而喻，尤其是在运维自动化时代，传统运维、DevOps，亦或是SRE，监控都是一项必备的技能。我们先来认识一下主流的开源监控系统，Zabbix、Open-Falcon、Prometheus等，今天就简单介绍一下【Zabbix】【Prometheus】【Cacti】【Nagios】【Garafana】等5种主流
Nagios NRPE安装（官方文档）瑷护你
NagiosNRPE官方文档1、安装并启动xinetd服务yuminstallxinetd-ysystemctlstartxinetd2、下载nrpe源码文件wgethttps://github.com/NagiosEnterprises/nrpe/releases/download/nrpe-3.2.1/nrpe-3.2.1.tar.gz3、编译安装tarxzfnrpe-3.2.1.tar.gz
grafana zabbix 模板_Zabbix+Grafana打造高逼格监控系统执行机器人 grafana zabbix 模板
目录正文第一章zabbix监控的意义1.1为什么要监控业务安全性的保障系统的保障产品持续性的运行1.2监控的内容1.3zabbix的选择性[x]纯命令监控太局限性[x]监控三剑客(Nagios、zabbix、Cacti)[x]可及时发现故障，并在故障恢复的第一时间得到通知[x]灵活运用，包括zabbix的阈值定义，自动发现，API接口，触发动作等功能1.4zabbix的工作组件及告警流程数据采集：
Zabbix 6.0 详细基础介绍 Stars.Sky Zabbix zabbix
目录一、如何选择自己的运维监控平台1.1常用的开源运维监控工具1.1.1Cacti1.1.2Nagios1.1.3Ganglia1.1.4Centreon1.1.5Grafana1.1.6Prometheus1.1.7Zabbix1.2监控工具选型经验1.2.1中小企业传统监控选择Zabbix1.2.2云原生监控选择Prometheus二、Zabbix版本发布与安装需求2.1Zabbix版本发布计
Ambari 基本架构 cpuCode Ambari ambari 架构前端 hadoop 大数据
Ambari利用了已有的优秀开源软件，并结合起来:agent端，采用了puppet管理节点在web端，采用ember.js作为前端MVC框架和NodeJS相关工具，用handlebars.js作为页面渲染引擎，在CSS/HTML方面还用了Bootstrap框架在Server端，采用了Jetty、Spring、JAX-RS等同时利用了Ganglia、Nagios的分布式监控能力Ambari框架采用的
从零开始运维之旅：如何监控你的 Windows？ weixin_30347335 操作系统运维
小弟乃刚刚踏入运维圈的资深小白一枚，正所谓完事开头难，公司里怕我把生产系统搞坏就让我先在测试环境上先练练手。巧的是测试环境又是我熟悉的Windows环境，心中窃喜啊。但问题随之而来，运维从何下手呢。同事正巧解囊相助，告诉我可以先从监控开始多了解下系统的性能参数等数据。这时有一种拨开云雾见光明的感觉啊，哈哈。不过选择什么来监控呢。向大神们用的Zabbix和Nagios这等开源神器我这入门小弟暂时也不
一个用于监控Dell PowerEdge服务器硬件状态的nagios/icinga插件 weixin_34032827 运维开发工具 awk
一个用于监控DellPowerEdge服务器硬件状态的nagios/icinga插件手头有几台dell服务器，分别是PE2850和PER710，想把硬件状态监控加入icinga中，但是网上提供的大多是依赖dellopenmanager的snmp服务，用起来有些不对劲，自己对snmp所知较少，尤其是那些OID，一大串数字，不知道具体代表什么。前几天发现openmanager自带的命令omreport
nagios 监控dell设备（网上相关内容较少，特意留档）王Sir_yt nagios 运维
#创作灵感#记录工作实践、项目复盘错误信息：a.Unabletogetstatusinformationduetotechnicalissues.b.DellEMCdevicediscoveryisinprogress...Error:EmptyorInvalidPassphraseisconfiguredc.Error:Pathnotconfiguredforthemacro$OMINAGIOS
lightOps（一个轻量级运维管理系统）软件研发漫谈工具运维运维监控监控系统
lightOps（轻量级运维管理系统）源码地址https://gitee.com/joshho/lightOps需求背景在开发过程中修改数据库数据或表结构，但是在上线时需要将变动的sql脚本刷到N个表结构相同的库中，如何方便的更新过去？如果你只需要监控相关系统URL的状态，但是zabbix、nagios的安装又太复杂，怎么办？如果你想监控相关服务器的端口状态，又不想用zabbix、nagios怎么
MySQL数据的备份与导入 tangpy
备份：mysqldump-uroot-p--all-databases>all.sql#备份所有库表mysqldump-uroot-pnagios>nagios.sql#备份nagios库导入：需要先创建nagios库才能导入：usenagios;sourcenagios.sql;#导入备份的所有数据或者在外面执行：[root@VM_36_201_centos~]mysql-uroot-pnagi
Prometheus监控服务-上程序源~ 监控服务器运维网络
目录一、监控介绍1、cacti2、Nagios3、Zabbix4、Prometheus二、运维监控平台设计思路三、prometheus监控体系1、系统层监控(需要监控的数据）2、中间件及基础设施类监控3、应用层监控4、业务层监控5、Prometheus支持通过三种抓取类型6、安装Prometheus四、Prometheus工作流程一、监控介绍1、cactiCacti(英文含义为仙人掌）是一套基于P
企业级 Zabbix 监控大不牛 linux 云计算
一、监控介绍1.你用过哪些监控软件？2.zabbix和nagios的区别3.zabbix和nagios、cacti、ganglia有什么区别4.zabbix的好处5.zabbix的监控流程6.常见监控项使用SNMP协议获取主机CPU、内存、磁盘、网卡流量等数据. 用脚本将获取到的SNMP数据存入数据库中,然后再使用一种名为MRTG的软件根据获取的数据绘制图表来分析数据的变化。MRTG(
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S