guzhoujiexing

Nagios监控系统详解

1 Nagios简介

Nagios 全名为（Nagios Ain’t Goona Insist on Saintood），最初项目名字是 NetSaint。它是一款免费的开源 IT 基础设施监控系统，其功能强大，灵活性强，能有效监控 Windows 、Linux、VMware 和 Unix 主机状态，交换机、路由器等网络设置等。一旦主机或服务状态出现异常时，会发出邮件或短信报警第一时间通知 IT 运营人员，在状态恢复后发出正常的邮件或短信通知。Nagios 结构简单，可维护性强，越来越受中小企业青睐，以及运维和管理人员的使用。同时提供一个可选的基于浏览器的 Web 界面，方便管理人员查看系统的运行状态，网络状态、服务状态、日志信息，以及其他异常现象。

Nagios利用其众多的插件实现对本机和远端服务的监控，当被监控对象出现异常，Nagios就会及时给管理人员告警。它是一个基于TCP/IP协议的软件包，包含有nagios主程序和它的各个插件。

Nagios的主要功能特点简介：

- 监视网络服务(SMTP, POP3, HTTP, NNTP, PING等)

- 监视主机资源(进程,磁盘等)

- 简单的插件设计可以轻松扩展Nagios的监视功能

- 服务等监视的并发处理

- 错误通知功能(通过email,pager, 或其他用户自定义方法)

- 可指定自定义的事件处理控制器

-可选的基于浏览器的WEB界面以方便系统管理人员查看网络状态，各种系统问题，以及日志等等

- 可以通过手机查看系统监控信息

2 Nagios工作原理

Nagios 软件需安装在一台独立的服务器上运行，这台服务器称为监控中心，监控中心服务器可以采用 Linux 或 Unix 操作系统；每一台被监视的硬件主机或服务都运行一个与监控中心服务器进行通信的 Nagios 软件后台程序，也可以理解为 Agent 或插件均可。监控中心服务器读取配置文件中的指令与远程的守护程序进行通信，并且指示远程的守护程序进行必要的检查。虽然 Nagios 软件必须在 Linux 或 Unix 操作系统上运行，但是远程被监控的机器可以是任何能够与其进行通信的主机，根据远程主机返回的应答，Naigos 将依据配置进行回应；接着 Nagios 将通过本地的机器进行测试，如果检测返回值不正确，Nagios 将通过一种或多种方式报警；具体原理如下图所示：

3 Nagios监控系统搭建

3.1 部署规划

监控主机 rango 192.168.56.1

被监控机1 vm1 192.168.56.101

被监控机2 vm2 192.168.56.102

3.2 Nagios安装

1. 安装前准备：

在编译安装前需确保安装以下包：gdgd-devel png png-devel jpeg

jpeg-devel zlib zlib-devel,使nagiosweb界面的Maps、Trends等功能有效：

yum install gd fontconfig-devel libjpeg-devel libpng-devel gd-devel perl-GD openssl-devel php mailx postfix cpp gcc gcc-c++ libstdc++ glib2-devel

2. 创建用户和组：

groupadd nagios

groupadd nagcmd

useradd -g nagios -G nagcmd -d /home/nagios -c "Nagios Admin" nagios

3. 在监控主机上编译安装Nagios主程序Nagios-4.0.1.tar.gz：

[root@rango ~]# tar zxvf Nagios-4.0.1.tar.gz ; cd nagios-4.0.1

[root@rango nagios-4.0.1]#./configure --prefix=/usr/local/nagios --with-nagios-user=nagios \
--with-nagios-group=nagios --with-command-user=nagios
--with-command-group=nagcmd --enable-event-broker --enable-nanosleep 
--enable-embedded-perl --with-perlcache --with-gd-lib=/usr/lib --with-gd-inc=/usr/include

[root@rango nagios-4.0.1]#make all

[root@rango nagios-4.0.1]#make install

[root@rango nagios-4.0.1]#make install-init

[root@rango nagios-4.0.1]#make install-commandmode

[root@rango nagios-4.0.1]#make install-webconf

[root@rango nagios-4.0.1]#make install-config

4. 安装与配置apache：

编辑apache 的httpd.conf

最后面添加:

ScriptAlias /nagios/cgi-bin"/usr/local/nagios/sbin"

# SSLRequireSSL

Options ExecCGI

AllowOverride None

Order allow,deny

Allow from all

AuthName "Nagios Access"

AuthType Basic

AuthUserFile/usr/local/nagios/etc/htpasswd.users

Require valid-user

</Directory>

Alias /nagios "/usr/local/nagios/share"

<Directory"/usr/local/nagios/share">

# SSLRequireSSL

Options None

AllowOverride None

Order allow,deny

Allow from all

# Order deny,allow

# Deny from all

# Allow from 127.0.0.1

AuthName "Nagios Access"

AuthType Basic

AuthUserFile/usr/local/nagios/etc/htpasswd.users

Require valid-user

</Directory>

再次验证配置文件：/usr/local/nagios/bin/nagios -v/usr/local/nagios/etc/nagios.cfg

设置用户访问权限：

htpasswd -c /usr/local/nagios/etc/htpasswd.users nagiosadmin

重新启动nagios 和apache：

service httpd restart

service nagios restart

5. 安装Postfix邮件服务：

Nagios 监控平台支持邮件报警功能，所以需要安装邮件服务。这里采用互联网比较主流的 MTA ―Postfix. 也可根据自己的生产环境去定义，如： Sendmail、Qmail 等。由于 Nagios 只用到了 Postfix 的邮件发送功能，所以这里不需要对 Postfix 邮件服务作过多配置，安装 Postfix 套件，启动服务并在下次服务器重启自动加载即可。具体如下命令：

#yum install postifx#chkconfig postfix on; /etc/init.d/postfix restart

3.3 安装Nagios插件

Naigos 提供的各种监控功能基本上是通过插件来完成的，而 Nagios 的核心指提供了很少的功能，因此安装插件是非常有必要的。Nagios 官网提供了很多不同版块的插件应用，同时插件版本与 Nagios 版本也没有什么关联。

在监控系统的所有节点上安装Nagios插件：nagios-plugins-1.5.tar.gz

tar zxvf nagios-plugins-1.5.tar.gz && cd nagios-plugins-1.5

./configure --with-nagios-user=nagios --with-nagios-group=nagios --with-command-user=nagios --with-command-group=nagcmd --prefix=/usr/local/nagios

make all

make install

chmod 755 /usr/local/nagios

ll /usr/local/nagios/libexec/
total 5428
-rwxr-xr-x 1 nagios nagios 318368 Nov 8 21:19 check_apt
-rwxr-xr-x 1 nagios nagios 2248 Nov 8 21:19 check_breeze
-rwxr-xr-x 1 nagios nagios 121055 Nov 8 21:19 check_by_ssh
lrwxrwxrwx 1 nagios nagios 9 Nov 8 21:19 check_clamd -> check_tcp
-rwxr-xr-x 1 nagios nagios 84743 Nov 8 21:19 check_cluster
-r-xr-xr-x 1 nagios nagios 116277 Nov 8 21:19 check_dhcp
-rwxr-xr-x 1 nagios nagios 115838 Nov 8 21:19 check_dig
-rwxr-xr-x 1 nagios nagios 330608 Nov 8 21:19 check_disk
-rwxr-xr-x 1 nagios nagios 9286 Nov 8 21:19 check_disk_smb
-rwxr-xr-x 1 nagios nagios 122763 Nov 8 21:19 check_dns
-rwxr-xr-x 1 nagios nagios 64375 Nov 8 21:19 check_dummy
-rwxr-xr-x 1 nagios nagios 3050 Nov 8 21:19 check_file_age
-rwxr-xr-x 1 nagios nagios 6312 Nov 8 21:19 check_flexlm
lrwxrwxrwx 1 nagios nagios 9 Nov 8 21:19 check_ftp -> check_tcp
-rwxr-xr-x 1 nagios nagios 116722 Nov 8 21:19 check_hpjd
-rwxr-xr-x 1 nagios nagios 406658 Nov 8 21:19 check_http
-r-xr-xr-x 1 nagios nagios 122480 Nov 8 21:19 check_icmp
-rwxr-xr-x 1 nagios nagios 90529 Nov 8 21:19 check_ide_smart
-rwxr-xr-x 1 nagios nagios 15131 Nov 8 21:19 check_ifoperstatus
-rwxr-xr-x 1 nagios nagios 12592 Nov 8 21:19 check_ifstatus
lrwxrwxrwx 1 nagios nagios 9 Nov 8 21:19 check_imap -> check_tcp
-rwxr-xr-x 1 nagios nagios 6884 Nov 8 21:19 check_ircd
-rwxr-xr-x 1 nagios nagios 102018 Nov 8 21:19 check_ldap
lrwxrwxrwx 1 nagios nagios 10 Nov 8 21:19 check_ldaps -> check_ldap
-rwxr-xr-x 1 nagios nagios 103094 Nov 8 21:19 check_load
-rwxr-xr-x 1 nagios nagios 6017 Nov 8 21:19 check_log
-rwxr-xr-x 1 nagios nagios 20281 Nov 8 21:19 check_mailq
-rwxr-xr-x 1 nagios nagios 90563 Nov 8 21:19 check_mrtg
-rwxr-xr-x 1 nagios nagios 90820 Nov 8 21:19 check_mrtgtraf
-rwxr-xr-x 1 nagios nagios 102902 Nov 8 21:19 check_nagios
lrwxrwxrwx 1 nagios nagios 9 Nov 8 21:19 check_nntp -> check_tcp
-rwxrwxr-x 1 nagios nagios 65913 Nov 17 15:19 check_nrpe
-rwxr-xr-x 1 nagios nagios 119556 Nov 8 21:19 check_nt
-rwxr-xr-x 1 nagios nagios 119658 Nov 8 21:19 check_ntp
-rwxr-xr-x 1 nagios nagios 112690 Nov 8 21:19 check_ntp_peer
-rwxr-xr-x 1 nagios nagios 109906 Nov 8 21:19 check_ntp_time
-rwxr-xr-x 1 nagios nagios 145777 Nov 8 21:19 check_nwstat
-rwxr-xr-x 1 nagios nagios 8779 Nov 8 21:19 check_oracle
-rwxr-xr-x 1 nagios nagios 103337 Nov 8 21:19 check_overcr
-rwxr-xr-x 1 nagios nagios 124240 Nov 8 21:19 check_ping
lrwxrwxrwx 1 nagios nagios 9 Nov 8 21:19 check_pop -> check_tcp
-rwxr-xr-x 1 nagios nagios 325061 Nov 8 21:19 check_procs
-rwxr-xr-x 1 nagios nagios 100621 Nov 8 21:19 check_real
-rwxr-xr-x 1 nagios nagios 9578 Nov 8 21:19 check_rpc
-rwxr-xr-x 1 nagios nagios 1451 Nov 8 21:19 check_sensors
-rwxr-xr-x 1 nagios nagios 328529 Nov 8 21:19 check_smtp
-rwxr-xr-x 1 nagios nagios 381507 Nov 8 21:19 check_snmp
-rwxr-xr-x 1 nagios nagios 98154 Nov 8 21:19 check_ssh
-rwxr-xr-x 1 nagios nagios 88321 Nov 8 21:19 check_swap
-rwxr-xr-x 1 nagios nagios 112126 Nov 8 21:19 check_tcp
-rwxr-xr-x 1 nagios nagios 100527 Nov 8 21:19 check_time
lrwxrwxrwx 1 nagios nagios 9 Nov 8 21:19 check_udp -> check_tcp
-rwxr-xr-x 1 nagios nagios 110765 Nov 8 21:19 check_ups
-rwxr-xr-x 1 nagios nagios 83131 Nov 8 21:19 check_users
-rwxr-xr-x 1 nagios nagios 2933 Nov 8 21:19 check_wave
-rwxr-xr-x 1 nagios nagios 104604 Nov 8 21:19 negate
-rwxr-xr-x 1 nagios nagios 98773 Nov 8 21:19 urlize
-rwxr-xr-x 1 nagios nagios 1936 Nov 8 21:19 utils.pm
-rwxr-xr-x 1 nagios nagios 2917 Nov 8 21:19 utils.sh

重启Nagios服务：

/etc/init.d/nagios restart

/etc/init.d/httpd restart

chkconfig httpd on

chkconfig naigos on

3.4 防火墙和SELinux设置

Selinux 和 Iptables 是 Linux 系统提供的安全防护机制，主要用来防护 Linux 系统下的服务或应用程序不受外界安全攻击等。一般企业考虑到 Nagios 监控平台的安全可靠性，都会采用硬件的防火墙或其他安全设备来对服务器进行防护，故此处禁用SELinux和iptables

3.5 其他插件的安装和说明

nrpe_2.12.tar.gz ――监控Linux 需要（被监控的Linux服务器安装）

nsclient++0.3.5――监控windows 需要（被监控的Windows服务器安装）

ndoutils：ndoutils是将Nagios的配置及监控信息存储到数据库里，NPC通过调用ndo所存储的数据来展现Nagios的信息。启动：/usr/local/nagios/bin/ndo2db-c /usr/local/nagios/etc/ndo2db.cfg。

ps：ndoutils最新版本为1.5.2，只兼容Nagios3.x和NagiosXI,4.x版本不兼容，会报Error:Could not load module '/usr/local/nagios/bin/ndomod-3x.o' ->/usr/local/nagios/bin/ndomod-3x.o: undefined symbol:servicedependency_list的错误。

NPC：(NagiosPlugin for Cacti)是一个Cacti插件，安装后可以在Cacti界面里使用Nagios的功能。

3.6 Nagios Web访问

通过浏览器，在地址栏输入： http://192.168.56.1/nagios，输入用户名及密码即可访问 Naigos 登录界面。

3.7 Nagios配置

1. Nagios目录与相关配置文件

Nagios 安装完成后，/usr/local/nagios/目录下会生成 nagios 相关目录及配置文件，默认的的配置文件在/usr/local/nagios/etc 目录下，如下表为Nagios 相关目录的名称及用途

目录名称	作用
bin	Nagios 可执行程序所在目录
etc	Nagios 配置文件目录
sbin	Nagios cgi 文件所在目录，也就是执行外部命令所需要文件所在的目录
share	Nagios 网页存放路径
libexec	Nagios 外部插件存放目录
var	Nagios 日志文件、Lock 等文件所在的目录
var/archives	Nagios 日志自动归档目录
var/rw	用来存放外部命令文件的目录

下表为配置文件作用

配置文件	说明
cgi.cfg	控制 CGI 访问的配置文件
nagios.cfg	Nagios 主配置文件
resource.cfg	变量定义文件，又称为资源文件，在此文件中定义变量，以便由其他配置文件引用，如$USER1$
objects	objects 是一个目录，在此目录下有很多配置文件模板，用于定义 Nagios 对象
objects/commands.cfg	命令定义配置文件，其中定义的命令可以被其他配置文件引用
objects/contacts.cfg	定义联系人和联系人组的配置文件
objects/localhost.cfg	定义监控本地主机的配置文件
objects/printer.cfg	定义监控打印机的一个配置文件模板，默认没有启用此文件
objects/switch.cfg	监控路由器的一个配置文件模板，默认没有启用此文件
objects/templates.cfg	定义主机和服务的一个模板配置文件，可以在其他配置文件中引用
objects/timeperiods.cfg	定义 Nagios 监控时间段的配置文件
objects/windows.cfg	监控 Windows 主机的一个配置文件模板，默认没有启用此文件
备注:	Nagios 在配置方面非常灵活，默认的配置文件并不是必需的。可以使用这些默认的配置文件，也可以创建自己的配置文件，然后在主配置文件 nagios.cfg 中引用即可。

2. Nagios配置文件之间的关联

Nagios 的配置过程涉及几个定义有:主机、主机组、服务、服务组、联系人、联系人组、监控时间和监控命令等，从这些定义可以看出，Nagios 的各个配置文件之间是互为关联、彼此引用的。成功配置一台 Nagios 监控系统，需要掌握每个配置文件之间依赖与被依赖的关系，可从下面四个步骤来入手，第一步：定义哪些主机、主机组、服务和服务组，第二步：要定义这个监控要通过什么命令实现，第三步：要定义监控的时间段，第四步：要定义主机或服务出现问题时要通知的联系人和联系人组；强烈建议依据以上顺序对 Nagios 系统进行相关配置。

3. 主要配置文件详解

templates.cfg文件

define contact{
name generic-contact #联系人名称
service_notification_period 24x7 #当服务出现异常时，发送通知的时间段，时间段是 7x24 小时
host_notification_period 24x7 #当主机出现异常时，发送通知的时间段，时间段是 7x24 小时
service_notification_options w,u,c,r #这个定义的是“通知可以被发出的情况”。w 即 warning，表示警告状态，u 即 unknown，表示不明状态，c 即 criticle，表示紧急状态，r 即 recover，表示恢复状态
host_notification_options d,u,r #定义主机在什么状态下需要发送通知给使用者，d 即 down，表示宕机状态，u 即 unreachable，表示不可到达状态，r 即 recovery，表示重新恢复状态。
service_notification_commands notify-service-by-email #服务故障时，发送通知的方式，可以是邮件和短信，这里发送的方式是邮件，其中“notify-service-by-email”在 commands.cfg 文件中定义。
host_notification_commands notify-host-by-email #主机故障时，发送通知的方式，可以是邮件和短信，这里发送的方式是邮件，其中“notify-host-by-email”在 commands.cfg 文件中定义。
}

define host{
name linux-server #主机名称
use generic-host #use 表示引用，也就是将主机 generic-host 的所有属性引用到 linux-server 中来，在 nagios 配置中，很多情况下会用到引用。
check_period 24x7 #这里的 check_period 告诉 nagios 检查主机的时间段
check_interval 5 #nagios 对主机的检查时间间隔，这里是 5 分钟。
retry_interval 1 #重试检查时间间隔，单位是分钟。
max_check_attempts 10 #nagios 对主机的最大检查次数， check_command check-host-alive #指定检查主机状态的命令，其中“check-host-alive”在 commands.cfg 文件中定义。
notification_period workhours #主机故障时，发送通知的时间范围，其中“workhours”在 timeperiods.cfg 中进行了定义，下面会陆续讲到。

notification_interval 30 #在主机出现异常后，故障一直没有解决，nagios 再次对使用者发出通知的时间。单位是分钟
notification_options d,u,r #定义主机在什么状态下可以发送通知给使用者，d 即 down，表示宕机状态，u 即 unreachable，表示不可到达状态，r 即 recovery，表示重新恢复状态。
contact_groups admins #指定联系人组，这个“admins”在 contacts.cfg 文件中定义。

define service{
name local-service #定义一个服务名称
use generic-service #引用服务 local-service 的属性信息，local-service 主机在 templates.cfg 文件中进行了定义
max_check_attempts 4 #最大检测 4 次，为了确定服务最终状态
normal_check_interval 5 #每 5 分钟检测一次
retry_check_interval 1 #每 1 分钟重新检测服务，最终的状态能被确定
}

hosts.cfg文件

此文件默认不存在，需要手动创建，主要用来指定被监控的主机地址及相关属性信息，比如以下定义的vm1的主机信息：

define host{
use linux-server
host_name vm1
alias vm1
address 192.168.56.101
}

......

services.cfg文件

此文件默认不存在，需要手动创建。主要用于定义监控的服务和主机资源，例如监控 HTTP 服务、FTP 服务、主机磁盘空间、主机系统负载等。比如定义监控vm1的http和ftp等服务的配置如下：

define service{
use generic-service
host_name vm1
service_description HTTP
check_command check_http
}

define service{
use generic-service
host_name vm1
service_description FTP
check_command check_ftp
}

......

nagios.cfg文件

Nagios的主配置文件，包括Nagios日志文件、cfg文件、Nagios用户，组、lock文件等等Nagios的所有全局设置均在此设置，其中本例需要添加以下设置来指定三个被监控的主机的配置文件的位置：

# Definitions for monitoring the local (Linux) host
cfg_file=/usr/local/nagios/etc/objects/localhost.cfg
cfg_file=/usr/local/nagios/etc/objects/vm1.cfg
cfg_file=/usr/local/nagios/etc/objects/vm2.cfg

4. 实例配置

Nagios允许单独定义某个主机的主机信息和服务配置信息到一个cfg文件中，比如vm1的配置文件如下：vm1.cfg

define host{
use linux-server
host_name vm1
alias vm1
address 192.168.56.101
}

define service{
use generic-service
host_name vm1
service_description HTTP
check_command check_http
}

define service{
use generic-service
host_name vm1
service_description FTP
check_command check_ftp
}
define service{
use generic-service
host_name vm1
service_description SSH
check_command check_ssh
}

define service{
use generic-service
host_name vm1
service_description check-load
check_command check_nrpe!check_load
}

define service{
use generic-service
host_name vm1
service_description zombie_procs
check_command check_nrpe!check_zombie_procs
}
define service{
use generic-service
host_name vm1
service_description check-users
check_command check_nrpe!check_users
}
define service{
use generic-service
host_name vm1
service_description total_procs
check_command check_nrpe!check_total_procs
}

此处定义监控ip地址为192.168.56.101的主机vm1的SSH、FTP等服务信息。

3.8 Nagios启动运行

1. 验证配置文件的正确性

/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg

Nagios 提供的这个验证功能非常有用，如果你的配置文件有语法或配置错误，它会显示出错的配置文件及在文件中哪一行。检测结果中的报警信息通常是可以忽略的，因为一般只是建议性的提示。

此处可以利用别名机制来简化Nagios配置检测机制：在当前用户的.bashrc文件下增加别名设置：

alias nagioscheck='/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg'

使生效：source ./.bashrc

2. 启动Nagios服务

通过初始化脚本启动Nagios：

/etc/init.d/nagios start|restart|stop 或者 service nagios start

手动方式启动Nagios：

通过 Nagios 命令的-d 参数来启动 nagios 过护进程。

/usr/local/nagios/bin/nagios -d /usr/local/nagios/etc/nagios.cf

4 Nagios性能分析图标

Nagios 对服务或主机监控的是一个瞬时状态，有时候系统管理员需要了解主机在一段时间内的性能及服务的响应状态，并且形成图表，这就需要通过查看日志数据来分析。但是这种方式不仅烦琐，而且抽象。为了能更直观的查看主机运行状态，这里采用 PNP 来实现此功能。PNP 是一个小巧的开源软件包，它是基于 PHP 和 Perl 脚本编写，PNP 可以利用 rrdtool 工具将 Nagios 采集的数据绘制成图表，然后显示主机或者服务在一段时间内运行的状况。以下详细介绍 PNP 安装配置流程：

1. 安装RDDtool：yum install rrdtool

2. 编译安装PNP:

下载PNP http://pkgs.fedoraproject.org/repo/pkgs/pnp4nagios/pnp-0.4.14.tar.gz/9dbbf08191a258f6798c9516b3821ff0/

tar zxvf pnp-0.4.14.tar.gz

cd pnp-0.4.14

#通过./configure --help查看configure的选项设置

./configure --with-nagios-user=nagios --with-nagios-group=nagios --with-rrdtool=/usr/bin/rrdtool --with-perfdata-dir=/usr/local/nagios/share/perfdata

#最后一项指明存储rrd数据文件的目录

make all

make install

make install-config

make install-init

注解：configure可能出现以下错误：

checking for Perl Module Time::HiRes… no
configure: error: Perl Module Time::HiRes not available

解决办法：安装相应的模块：yum install perl-Time-HiRes

3. 配置PNP：

3.1 PNP 配置文件定义

在 PNP 安装完成后，默认安装目录下回自带相应的模板配置文件，因此只需要参考相应的模板文件进行修改即可:

cd /usr/local/nagios/etc/pnp/

cp process_perfdata.cfg-sample process_perfdata.cfg

cp npcd.cfg-sample npcd.cfg

cp rra.cfg-sample rra.cfg

chown -R nagios:nagios /usr/local/nagios/etc/pn

3.2 修改 process_perfdata.cfg 文件

打开 Nagios 下的 process_perfdata.cfg 文件，修改相关内容。将数字 0 变更为 2 是开启了日志的调试功能，操作如下:

LOG_FILE = /usr/local/nagios/var/perfdata.log
#
# Loglevel 0=silent 1=normal 2=debug
#
LOG_LEVEL = 2

3.3 修改 Nagios 相关配置文件

增加数据图标识：修改 templates.cfg,增加一个定义 PNP 的 host 和 service：
#pnp host set
define host{
name hosts-pnp
register 0
action_url /nagios/pnp/index.php?host=$HOSTNAME$&srv=_HOST_
process_perf_data 1
}
# pnp service set
define service{
name services-pnp
register 0
action_url /nagios/pnp/index.php?host=$HOSTNAME$&srv=$SERVICEDESC$
process_perf_data 1
}
修改 nagios.cfg
如果想让 nagios 将数据输出，首先要修改 nagios 的主配置文件 nagios.cfg，找到如下几项，如有注释的将其去掉。修改后的信息如下：#vim /usr/local/nagios/etc/nagios.cfgprocess_performance_data=1
host_perfdata_command=process-host-perfdataservice_perfdata_command=process-service-perfdata
修改 commands.cfg
process-host-perfdata 和 process-service-perfdata 指令声明了 nagios 输出哪些值到输出文件中。不过这些定义相对简单，而 PNP 提供了一个 Perl 脚本，非常详细地定义了一个输出数据的方法，process_perfdata.pl 其实是 PNP 自带的一个脚本，这个脚本在 PNP 安装完成后会自动生成。因此，可以将 process-host-perfdata 和 process-service-perfdata 指令中对应的执行命令的内容替换成此脚本。增加下图的内容：
define command{
command_name process-host-perfdata
command_line /usr/bin/perl /usr/local/nagios/libexec/process_perfdata.pl -d HOSTPERFDATA
}
define command{
command_name process-service-perfdata
command_line /usr/bin/perl /usr/local/nagios/libexec/process_perfdata.pl
}
修改 hosts.cfg 与 services.cfg(此处为vm1.cfg、vm2.cfg)
将 hosts-pnp 和 services-pnp 引用到 vm1.cfg 和 vm2.cfg 中，修改后的 vm1.cfg 内容为
define host{
use linux-server,hosts-pnp
host_name vm1
alias vm1
address 192.168.56.101
}

define service{
use generic-service,services-pnp
host_name vm1
service_description HTTP
check_command check_http
}
.......

3.4 查看性能图标功能

访问Nagios的Web界面，点击数据图标查看相应的性能图示。

5 利用NRPE扩展Nagios功能

监控linux本地主机时，我们可以直接更改配置文件进行监控，如果需要监控的主机与nagios不在同一机器上，即监控远程linux主机时，我们需要借助NRPE插件实现。通过在远程服务器上安装 NRPE 构件及 Nagios 插件程序来向 Nagios 监控平台提供该服务器的一些本地情况，如 CPU 负载、内存使用、硬盘使用，服务等。这里将 Nagios 监控平台称为 Nagios 服务器端，而将远程被监控的服务器称为 Nagios 客户端。如下为NRPE原理图，

5.1 NRPE的组成部分和监测类型

NRPE 总共由两部分组成:

check_nrpe 插件，位于监控主机上

NRPE daemon,运行在远程被监控的 Linux 主机上

当监控远程 Linux/UNIX 主机服务或资源时，工作流程如下：

nagios 会运行 check_nrpe 这个插件，并且会告诉它需要检查什么；
check_nrpe 插件会连接到远程的 NRPE daemon，所用的方式是 SSL；
NRPE daemon 会运行相应的 Nagios 插件来执行检查动作；
NPRE daemon 将检查的结果返回给 check_nrpe 插件，插件将其递交给 Nagios 做处理。

NRPE daemon 需要 Nagios 插件安装在远程的 Linux 主机上，否则 daemon 不能做任何的监控。

NRPE 的检测类型分为两种:

直接检测：检测的对象是运行 NRPE 的那台 Linux 主机的本地资源，原理如下:

直接使用 NRPE 插件监控远程 Linux/UNIX 主机的本地或者私有资源；如 CPU 负载、内存使用、SWAP 空间使用、硬盘等运行状况。如下为直接检测工作原理图，

间接检测：当运行 Nagios 的监控主机无法访问到某台被监控主机，但是运行 NRPE 的机器可以访问得到的时候，运行 NRPE 的主机就充当一个中间代理，将监控请求发送到被监控对象上。如下为间接检测图，

5.2 服务器端安装配置NRPE

1. 安装NRPE

tar zxvf nrpe-2.15.tar.gz ; cd nrpe-2.15

./configure

make all

make install-plugin

make install-daemon

make install-daemon-config

2. 定义check_nrpe命令

在文件/usr/local/nagios/etc/objects/commands.cfg后面增加：

# check nrpe
define command{
command_name check_nrpe
command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -t 30 -c $ARG1$
}

3. 创建/usr/local/nagios/etc/objects/remotehost.cfg，比如vm1.cfg文件的定义：

host定义示例：

define host{

use linux-server

host_name vm1

address 192.168.56.101

}

Service定义示例：

define service{

use generic-service

service_description Root Partition

check_command check_nrpe!check_disk

}

查看配置文件是否正确：nagioscheck

重新加载配置文件：/etc/init.d/nagios reload

5.3 Linux客户端安装NRPE

1. 安装Nagios插件nagios-plugin

添加 nagios 用户名，且不允许 nagios 用户登录，此用户用于与 Nagios 服务器通信所用:

useradd -s /sbin/nolgin nagios

tar zxvf nagios-plugins-1.5.tar.gz ; cd nagios-plugin-1.5

./configure

make && make install

2. 安装NRPE

tar zxvf nrpe-2.15.tar.gz

cd nrpe-2.15

./configure

make all

make install-plugin

make install-daemon

make install-daemon-config

yum install xinetd

make install-xinetd

3. 配置NRPE

定义被监控的 Linux 主机的对象，监控此主机的 CPU 负载、登录用户数、磁盘分区、进程、swap 使用情况等，编辑/usr/local/nagios/etc/nrpe.cfg 文件，示例如下，

command[check_users]=/usr/local/nagios/libexec/check_users -w 5 -c 10
command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20
command[check_hda1]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/hda1
command[check_zombie_procs]=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Z
command[check_total_procs]=/usr/local/nagios/libexec/check_procs -w 150 -c 200

4. 定义xinetd服务支持NRPE

修改 only_from 项，增加 Ngaios 服务器的地址，这样一来服务器与客户端就可进行 nrpe 会话，监控到 Linux 客户端相关信息，被监控端也更加容易维护管理：

# default: on
# description: NRPE (Nagios Remote Plugin Executor)
service nrpe
{
flags = REUSE
socket_type = stream
port = 5666
wait = no
user = nagios
group = nagios
server = /usr/local/nagios/bin/nrpe
server_args = -c /usr/local/nagios/etc/nrpe.cfg --inetd
log_on_failure += USERID
disable = no
only_from = 127.0.0.1 localhost 192.168.56.1
}

5. 定义服务端口

在 Linux 客户端"/etc/services" 文件增加一行：

nrpe 5666/tcp #NRPE

6. 测试NRPE功能

由于 NRPE 相应的插件已经安装成功，这里使用 check_nrpe 命令来验证是否 nrpe 是否正常运行，如果执行以下命令能够显示 NRPE 的具体版本信息，则表示 nrpe 运行正常，加载重启 xinetd 服务即可：

/usr/local/nagios/libexec/check_nrpe -H localhost
NRPE v2.15

/etc/init.d/xinetd restart

6 Nagios管理平台简介

通过上面所有的软件及插件的安装与配置，Nagios 监控系统架构成功的完成了；若想进一步扩展，如监控 Windows 平台，则需要在 Windowns 系统安装 NSClient 软件，并在 Nagios 服务器定义 windows.cfg 等文件，VMware 则需要 Nagios 官网下载相应的插件及模块文件，并在 Nagios 服务器编辑 command.cfg、hosts.cfg、services.cfg 文件，示例如下，

Window 平台

vim /usr/local/nagios/etc/monitor/windows.cfg

define host{ use windows-server,hosts-pnp host_name Windowns Server 2003_192 alias Remote win2003 192 address 192.168.1.192 } define service{ use generic-service,services-pnp host_name Windowns Server 2003_192 service_description NSClient++ Version check_command check_nt!CLIENTVERSION } } ………

VMware 平台

vim/usr/local/nagios/etc/monitor/commands.cfg

define command{ command_name check_esx3_host_net_usage command_line $USER1$/check_esx3 -H $HOSTADDRESS$ -u $ARG1$ -p $ARG2$ -l net -s usage -w $ARG3$ -c $ARG4$ } define command{ command_name check_esx3_host_runtime_issues command_line $USER1$/check_esx3 -H $HOSTADDRESS$ -u $ARG1$ -p $ARG2$ -l runtime -s issues ……

7 Nagios邮件报警功能设置

Nagios的报警系统主要有以下三种方式：
一、声音报警
二、电子邮件报警
三、手机短讯报警

以下为邮件报警系统的设置过程（以sendmail为邮件服务器）

1. 开启系统自带的sendmail服务

/etc/init.d/sendmail start

注解：若未安装，可：yum install -y sendmail* ; /etc/init.d/sendmail start

测试服务：echo "test" | mail youraddress

2. 配置Nagios报警邮箱

vim /usr/local/nagios/etc/objects/contacts.cfg：

define contact{
contact_name nagiosadmin ; Short name of user
use generic-contact ; Inherit default values from generic-contact template (defined above)
alias Nagios Admin ; Full name of user

email [email protected] ; <<***** CHANGE THIS TO YOUR EMAIL ADDRESS ******
}

3. 设置报警方式

vim /usr/local/nagios/etc/objects/templates.cfg：

define contact{
name generic-contact ; The name of this contact template
service_notification_period 24x7 ; service notifications can be sent anytime
host_notification_period 24x7 ; host notifications can be sent anytime
service_notification_options w,u,c,r,f,s ; send notifications for all service states, flapping events, and scheduled downtime events
host_notification_options d,u,r,f,s ; send notifications for all host states, flapping events, and scheduled downtime events
service_notification_commands notify-service-by-email ; send service notifications via email
host_notification_commands notify-host-by-email ; send host notifications via email
register 0 ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL CONTACT, JUST A TEMPLATE!
}

注解：此处的notify-service-by-email和notify-host-by-email是在command.cfg那里定义的，使用默认定义即可。

重新加载配置文件使生效：/etc/init.d/nagios reload

至此完成邮件报警功能设置，可以通过停掉某些服务来测试功能是否正常。

8 总结

通过此篇文章描述了 Nagios 监控管理平台的工作原理，以及如何在 Linux 平台部署开源软件的管理平台，掌握 Naigos 配置管理，通过外部插件的方式来对服务对象 Windows 、Linux、 Unix 、 VMware 等平台进行有效的管理与监控，适合运行部门及管理部门的 IT 人员使用，不仅提高了效率同时减少了管理人员未能及时发现问题所带来的的困绕，也提高了生产的环境的可用性。

――Rango Chen

你可能感兴趣的:(nagios,linux监控,nrpe)

Nagios安装部署全攻略 weixin_34109408 memcached php 操作系统
概述：公司的生产机器一共有12台，2台LVS(主备)、2台nginx、2台tomcat、1台后台服务器(nginx_tomcat)、3台mysql(主+备+异地灾备)、1台图片服务器、2台memcached.可以看出网站的架构就是基于高可用的原理的，每个层面都做了主备、系统的PV不高，对于并发布，高性能没有那么苛求，对于系统安全、稳定有较高要求，前期已经对系统做了各种日志分析，WAF配置，漏洞扫面
HertzBeat赫兹节拍 v1.0.beta.6 发布，Linux监控来啦 TanCloud探云
HertzBeat赫兹跳动是由Dromara孵化，TanCloud开源的一个支持网站，API，PING，端口，数据库，操作系统，全站等监控类型，支持阈值告警，告警通知(邮箱，webhook，钉钉，企业微信，飞书机器人)，拥有易用友好的可视化操作界面的开源监控告警项目。官网:hertzbeat.com|tancloud.cn此升级版本包含了很多同学需要的Linux操作系统监控支持，支持其CPU，内存
zabbix监控MySQL lu9up zabbix mysql 数据库
1PMP介绍PMP（percona-monitoring-pluggins）是高质量的mysql监控组件，以模板、插件和脚本的形式提供我们去应用。可以将企业级MySQL功能添加到现有的本地监控解决方案中，支持如Nagios、Cacti和Zabbix等热门解决方案。更详细介绍请阅读官方文档第三章【TEMPLATESFORZABBIX】：Percona-Monitoring-Plugins-1.1.8
vulnhub靶机midwest-v1.0.1 himobrinehacken vulnhub 安全系统安全网络安全
下载地址：https://download.vulnhub.com/midwest/midwest-v1.0.1.ova主机发现目标144端口扫描服务扫描漏洞扫描访问web咯改一下host接下来用wpscan看一下用户名接下来看一下密码能不能出来扫的时候顺便看了一下网站目录nagios401了那就是又这个东东被拦截了这玩意又是一个waf好好好密码估计是出不来了再用域名扫一下这个也是一样的，只能访问
小猿圈分享-监控 Linux 服务器活动的几个命令小猿圈IT教育
在Linux监控过程中我们经常会用到一些命令，这些命令是我们的工作更高效，缩短了工作时间，使我们在获取行动时更加轻松。watch命令watch是一个用来轻松地重复检测Linux系统中一系列数据命令，例如用户活动、正在运行进程、登录、内存使用等。这个命令实际上是重复地运行一个特定的命令，每次都会重写之前显示的输出，它提供了一个比较方便的方式用以监测在你的系统中发生的活动。首先以一个基础且不是特别有用
node linux监控,使用node_exporter监控服务器状态 weixin_39922151 node linux监控
目标监控主机操作系统：UbuntuServer20.04一键安装脚本：sudouseradd--no-create-home--shell/bin/falsenode_exporter\&&cd/opt&&wgethttps://github.com/prometheus/node_exporter/releases/download/v0.18.1/node_exporter-0.18.1.li
源码部署zabbix监控详细步骤 Mr Sean zabbix 监控类
由于实际工作中所需要监控的服务器数量之大，人工监控耗时耗力，基于这种情况寻找可用于监控的服务器的开源软件，有三款推荐软件可使用：Cacti、Nagios、Zabbix三款软件各自的特点如下：Cacti:基于SNMP协议的监控软件,强大的绘图能力Nagios:基于Agent监控,强大的状态查验与报警机制,插件极多,自己写监控脚本潜入到Nagios非常方便.Zabbix:基于多种监控机制,支持分布式监
Hack The Box-Monitored 0415i HTB靶场合集网络服务器运维 linux web http
端口扫描&信息收集使用nmap对ip进行扫描nmap10.10.11.248开放了22、80、389、443端口使用dirsearch对网站目录进行扫描dirsearch-u10.10.11.248发现一个/nagios的网页，尝试访问发现需要用户名和密码，这里没有用户名密码，先继续下一步将ip和域名加入到hosts文件中后，访问ipecho'10.10.11.248nagios.monitore
htb monitored root方式其中的一种（仅作记录）春猿火 linux
快下班时候审出来的，目前root的第5种方式nagios@monitored:~$cat/usr/local/nagiosxi/scripts/backup_xi.sh#!/bin/bash##CreatesaFullBackupofNagiosXI#Copyright(c)2011-2020NagiosEnterprises,LLC.Allrightsreserved.#BASEDIR=$(di
Linux运维日常使用软件和技能寻宝记_楠哥
运维工程师使用的运维平台和工具包括：Web服务器：apache、tomcat、nginx、lighttpd监控：nagios、ganglia、cacti、zabbix自动部署：ansible、sshpt、salt配置管理：puppet、cfengine负载均衡：lvs、haproxy、nginx传输工具：scribe、flume备份工具：rsync、wget数据库：mysql、oracle、sql
持续运维与监控 Michaelzh
运维的趋势，挑战，事件管理，流程管理运维权限管理开源运维平台云上IAM监控开源监控方案zabbix+短信、邮件、微信、钉钉告警普罗米修斯(容器)Nagiosopen-falconzenoss监控对象服务器、虚拟机监控数据库监控中间件监控容器监控云上监控云上自带服务，例如AWS的cloudwatch+SNS、阿里云的云监控+短信服务等告警消息分级，人性化监控系统运维可视化开源技术grafana云上服
开源监控服务一瞥：Prometheus、Grafana、Zabbix、Nagios、Icinga和Open-Falcon CodeArtisanX 开源监控
前言随着信息技术的发展，监控服务在维护系统稳定性和性能方面变得越来越重要。本文将比较一些流行的开源监控服务，以帮助你选择适合你需求的解决方案。监控服务对比监控服务特点优势不足性能扩展性安全性Prometheus-多维度数据模型-监控容器化环境的强大工具-需要单独设置存储后端-查询性能较高，适用于大规模环境-可通过分布式部署进行横向扩展-支持基于HTTPS的数据传输，提供基本认证-支持服务发现自动发
nagios部署记录 shaoqiu.wu linux centos 运维
nagios主程序部署前期准备工作#关闭防火墙systemctlstopfirewalld#关闭防火墙开启自启systemctldisablefirewalldvi/etc/sysconfig/selinuxSELINUX=disabled#重启#换源cd/etc/yum.repos.d/#备份源mvCentOS-Base.repoCentOS-Base.repo.bak#下载阿里源curl-o/
pnp4nagios 配置 nagios nextflying java 前端服务器
/root/software/pnp4nagios-0.6.26/sample-config/nagios.cfg-sample.in/root/software/pnp4nagios-0.6.26/sample-config/misccommands.cfg-sample.in/root/software/pnp4nagios-0.6.26/sample-config/nagios.cfg-sa
nagios php-fpm,nagios平台从apache迁移到nginx weixin_39907762 nagios php-fpm
nginx的性能远远优于apache，但由于nagios的web界面中包含php和c-cgi程序，因此需要两套fcgi管理工具(并非必须)和两套解释器(必须)。php用php-cgi跑就可以，c-cgi我选用fcgiwrap。下面介绍安装/配置步骤。php-fpm：是为PHP打的一个FastCGI管理补丁，可以平滑变更php.ini配置而无需重启php-cgiSpawn-fcgi：是lighttp
《高性能Linux服务器构建实战》笔记 SkTj
系统安全、故障排查、自动化运维、集群架构1、账号安全，安装完后可以删除的账号：adm,lp,sync,shutdown,halt,news,uucp,operator,games,gopher禁用登录功能：usermod-s/sbin/nologinnagios2、关闭不需要的服务:anacronauditdautofsavahi-daemonavahi-dnsconfdbluetoothcpus
L2tp客户端 jameslord makefile nagios linux ubuntu file 服务器
root@ubuntu:~/download/backfire$lsfeeds/packages/net/xd/feeds里面放了很多Makefile，编译时怎么没把xd编译出来呢?filesMakefilepatchesREADMEroot@ubuntu:~/download/backfire$lsdl/|grepxfeeds/packages/admin/nagios/Makefilenagi
16、Mysql用户工具 geek-wmy Mysql高性能学习 mysql 数据库 java 后端面试
接口工具MysqlWorkbenchSQLyogphpMyAdminAdminer命令行工具集PerconaToolkitMaatkitandAspersaTheopenarkkitMysqlWorkbench工具集SQL实用集common_schemamysql-sr-libMysqlUDF库MysqlForge监测工具开源的监控工具NagiosZabbixZenossHypericHQOpen
k8s实战之部署Prometheus+Grafana可视化监控告警平台诸葛钢铁云 K8S
写在前面之前部署web网站的时候，架构图中有一环节是监控部分，并且搭建一套有效的监控平台对于运维来说非常之重要，只有这样才能更有效率的保证我们的服务器和服务的稳定运行，常见的开源监控软件有好几种，如zabbix、Nagios、open-flcon还有prometheus,每一种有着各自的优劣势，感兴趣的童鞋可以自行百度，但是与k8s集群监控，相对于而已更加友好的是Prometheus，今天我们就看
《中小银行运维架构：解密与实战》李丙洋_2021 hotwater99 #运维运维
目录传统IT基础架构IT基础设施网络架构灾备架构运维日常系统监控基础设施层监控系统层监控应用层监控业务层监控用户体验层监控事件管理事件管理流程事件应急处理事件管理制度及分级事件管理优化运维标准化域名化安全基线基础运行环境标准化操作系统中间件运行规范中间件编码规范网络标准化数据库标准化立体化监控体系监控体系流行监控系统NagiosGangliaZabbixOpen-FalconPrometheusE
分布式下有哪些好用的监控组件？小小哭包分布式解决方案分布式监控组件
在之前的内容中，分析了分布式系统下的线上服务监控的常用指标，那么在实际开发中，如何收集各个监控指标呢？线上出现告警之后，又如何快速处理呢？本文我们就来看下这两个问题。常用监控组件目前分布式系统常用的监控组件主要有OpenFalcon、Nagios、Zabbix、CAT等，下面一起来看看这几款组件的应用及相关特性。好钢要用在刀刃上，由于各类监控组件的应用和配置更偏向基础运维，所以本课时的目的是希望你
监控系统看这一篇就够了！Zabbix、Prometheus等常见监控教程开源Linux zabbix prometheus 运维大数据
监控俗称「第三只眼」，几乎是我们每天都会打交道的系统，俗话说：无监控、不运维，监控的地位不言而喻，尤其是在运维自动化时代，传统运维、DevOps，亦或是SRE，监控都是一项必备的技能。我们先来认识一下主流的开源监控系统，Zabbix、Open-Falcon、Prometheus等，今天就简单介绍一下【Zabbix】【Prometheus】【Cacti】【Nagios】【Garafana】等5种主流
Nagios NRPE安装（官方文档）瑷护你
NagiosNRPE官方文档1、安装并启动xinetd服务yuminstallxinetd-ysystemctlstartxinetd2、下载nrpe源码文件wgethttps://github.com/NagiosEnterprises/nrpe/releases/download/nrpe-3.2.1/nrpe-3.2.1.tar.gz3、编译安装tarxzfnrpe-3.2.1.tar.gz
grafana zabbix 模板_Zabbix+Grafana打造高逼格监控系统执行机器人 grafana zabbix 模板
目录正文第一章zabbix监控的意义1.1为什么要监控业务安全性的保障系统的保障产品持续性的运行1.2监控的内容1.3zabbix的选择性[x]纯命令监控太局限性[x]监控三剑客(Nagios、zabbix、Cacti)[x]可及时发现故障，并在故障恢复的第一时间得到通知[x]灵活运用，包括zabbix的阈值定义，自动发现，API接口，触发动作等功能1.4zabbix的工作组件及告警流程数据采集：
Zabbix 6.0 详细基础介绍 Stars.Sky Zabbix zabbix
目录一、如何选择自己的运维监控平台1.1常用的开源运维监控工具1.1.1Cacti1.1.2Nagios1.1.3Ganglia1.1.4Centreon1.1.5Grafana1.1.6Prometheus1.1.7Zabbix1.2监控工具选型经验1.2.1中小企业传统监控选择Zabbix1.2.2云原生监控选择Prometheus二、Zabbix版本发布与安装需求2.1Zabbix版本发布计
实时监控gpu LANWENBING 人工智能
Linux监控服务器GPU状态_linux监控gpu_LiQiang33的博客-CSDN博客当outofmemory时，修改环境变量：setPYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:50参考文章：通过设置PYTORCH_CUDA_ALLOC_CONF中的max_split_size_mb解决Pytorch的显存碎片化导致的CUDA:OutOfMemory问
Ambari 基本架构 cpuCode Ambari ambari 架构前端 hadoop 大数据
Ambari利用了已有的优秀开源软件，并结合起来:agent端，采用了puppet管理节点在web端，采用ember.js作为前端MVC框架和NodeJS相关工具，用handlebars.js作为页面渲染引擎，在CSS/HTML方面还用了Bootstrap框架在Server端，采用了Jetty、Spring、JAX-RS等同时利用了Ganglia、Nagios的分布式监控能力Ambari框架采用的
从零开始运维之旅：如何监控你的 Windows？ weixin_30347335 操作系统运维
小弟乃刚刚踏入运维圈的资深小白一枚，正所谓完事开头难，公司里怕我把生产系统搞坏就让我先在测试环境上先练练手。巧的是测试环境又是我熟悉的Windows环境，心中窃喜啊。但问题随之而来，运维从何下手呢。同事正巧解囊相助，告诉我可以先从监控开始多了解下系统的性能参数等数据。这时有一种拨开云雾见光明的感觉啊，哈哈。不过选择什么来监控呢。向大神们用的Zabbix和Nagios这等开源神器我这入门小弟暂时也不
一个用于监控Dell PowerEdge服务器硬件状态的nagios/icinga插件 weixin_34032827 运维开发工具 awk
一个用于监控DellPowerEdge服务器硬件状态的nagios/icinga插件手头有几台dell服务器，分别是PE2850和PER710，想把硬件状态监控加入icinga中，但是网上提供的大多是依赖dellopenmanager的snmp服务，用起来有些不对劲，自己对snmp所知较少，尤其是那些OID，一大串数字，不知道具体代表什么。前几天发现openmanager自带的命令omreport
nagios 监控dell设备（网上相关内容较少，特意留档）王Sir_yt nagios 运维
#创作灵感#记录工作实践、项目复盘错误信息：a.Unabletogetstatusinformationduetotechnicalissues.b.DellEMCdevicediscoveryisinprogress...Error:EmptyorInvalidPassphraseisconfiguredc.Error:Pathnotconfiguredforthemacro$OMINAGIOS
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，