一.从GIT获取源码,建立eclipse工程
1.mkdir ~/rcs; cd ~/rcs
2. git clone git://opennms.git.sourceforge.net/gitroot/opennms/opennmss
3. git branch -a (查看所有的分支)
4. git checkout -b 1.8 remotes/origin/1.8 (创建本地分支)
5. git reset --hard HEAD
6. git clean -f -d -x (5-6创建分支后的清理工作)
7. git pull (更新)
8.compile.pl (编译)此过程须要修改顶级目录下POM中maven-get-plugin版本(2.3.0-1-SNAPSHOT),此插件的官方包有bug,目前没有解决,在opennms上一个开发人员自己提供了一个修改过的版本(http://www.stroppykitten.com/gwt-maven-plugin-2.3.0-1-SNAPSHOT.tar.gz)将此版本放到maven的本地库中在编译即可。
9.eclipse Import 编译完后导入eclipse,即可做二次开发
二. 从源码安装OpenNMS
安装前确保JAVA环境使用的是sun-jdk 版本1.5以上
Ubuntu11.10环境下安装:
1.安装jicmp
下载地址: http://sourceforge.net/projects/opennms/files/JICMP/
版本:stable-1.2
cd jicmp
autoreconf -fvi
./configure
make
sudo make install
2.从源码安装OpenNMS
(1).在OpenNMS源码目录下,通过./compile.pl编译源码。
(2).完成编译后运行./assemble.pl -Dbuild.profile=dir 将OpenNMS安装到/target目录下
3.安装PostgreSql
(1).sudo apt-get install postgresql 安装postgresql
(2).sudo vim /etc/postgresql/9.1/main/pg_hba.conf 修改数据库密码验证方式.修改为
# "local" is for Unix domain socket connections only
local all all peer
# IPv4 local connections:
host all all 127.0.0.1/32 trust
# IPv6 local connections:
host all all ::1/128 md5
4.运行OpenNMS
(1).进入OpenNMS安装目录,修改目录中权限BUG
cd
chmod +x bin/*
chmod +x contrib/*
chmod -x contrib/*.README
chmod -x contrib/opennms.mib
(2).运行 ./bin/runjava -s 设置JVM
(3).运行 ./bin/install -dis 设置数据库
(4).运行 ./bin/opennms start 运行opennms
访问http://localhost:8980/opennms即可
CentOS6.2中源码安装:
安装步骤与Ubuntu中安装相同,过程中可能遇到以下几个问题:
1.安装JICMP时make、autoconfig、libtool未安装
解决方法:分别在下列网址中下载安装:
http://www.gnu.org/software/automake
http://www.gnu.org/software/autoconf
http://www.gnu.org/software/libtool
2.PostgreSQL数据库安装与启动方式不同
yum install postgresql postgresql-server 安装数据库
/sbin/service postgresql initdb 初始化数据库
/sbin/service postgresql start 启动数据库服务
/sbin/chkconfig postgresql on 设置数据库服务开机自动启动
3.运行./bin install -dis 初始化数据库设置时报错an error occurred getting the version from the database,language "plpgsql" does not exist
解决方法:参考:http://www.opennms.org/wiki/QuickStart#Initialize_OpenNMS_and_the_Database
执行下列语句 : createlang -U postgres plpgsql opennms
4.启动OpenNMS时,报错:DHCP服务冲突
解决方法: 参考:http://www.opennms.org/wiki/FAQ-Troubleshooting#Q:_Why_doesn.27t_the_dhcpd_process_ever_start.3F
修改$OPENNMS_HOME/etc/service-configuration.xml 文件中的配置,将以下内容注释掉。
重启OpenNMS即可。 注意:修改配置后,OpenNMS无法监控DHCP服务
CentOS6.2 YUM安装
1.rpm -Uvh http://yum.opennms.org/repofiles/opennms-repo-stable-rhel6.noarch.rpm
2.yum -y install opennms
3./opt/opennms/bin/runjava -s
4.yum install postgresql postgresql-server
5./sbin/service postgresql start
6.vi /var/lib/pgsql/data/pg_hba.conf
7./sbin/service postgresql restart
8./opt/opennms/bin/install -dis
CentOS6.2 RPM安装centos
安装脚本:install_opennms.sh
需要的RPM包:
#!/bin/bash -
rpm -vih postgresql-libs-8.4.9-1.el6_1.1.x86_64.rpm
rpm -vih postgresql-8.4.9-1.el6_1.1.x86_64.rpm
rpm -vih postgresql-server-8.4.9-1.el6_1.1.x86_64.rpm
service postgresql initdb
/etc/init.d/postgresql start
file="/var/lib/pgsql/data/pg_hba.conf"
mv ${file} ${file}.bak
sed 's/ident/trust/g' ${file}.bak>>${file}
/etc/init.d/postgresql restart
rpm -vih jdk-6u24-linux-amd64.rpm
rpm -vih jicmp-1.2.1-1rhel6.x86_64.rpm
rpm -vih jicmp6-1.0.1-1rhel6.x86_64.rpm
rpm -vih opennms-core-1.10.0-2.noarch.rpm
rpm -vih opennms-webapp-jetty-1.10.0-2.noarch.rpm
rpm -vih opennms-1.10.0-2.noarch.rpm
/opt/opennms/bin/runjava -s
/opt/opennms/bin/install -dis
/opt/opennms/bin/opennms start
如果在安装过程中遇到如下错误:
错误:代理抛出异常: java.net.MalformedURLException: Local host name unknown: java.net.UnknownHostException: centos62virtualProduct: centos62virtualProduct
修改/etc/hosts文件,在其中加入本机的hostname即可解决,如:
127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4 “YOUR HOST NAME”
三.OpenNMS邮件通知配置
打开通知功能:Admin页面中Operations下放的Notification Status 选项设置为On,点击Update。
1.邮件服务器的配置:
配置文件:$opennms_home/etc/javamail-configuration.properties
配置方案:
org.opennms.core.utils.useJMTA=false //是否使用JMTA,如果适用JMTA则将使用本机代理发送邮件
org.opennms.core.utils.mailHost=mail.360buy.com //邮件服务器地址
org.opennms.core.utils.transport=smtp //发送协议
org.opennms.core.utils.smtpport=25 //SMTP协议端口
org.opennms.core.utils.debug=true //打印错误日志,日志文件 $opennms_home//logs/daemon/notifd.log
org.opennms.core.utils.smtpssl.enable=true //使用SSL链接服务器,starttls和SSL需根据邮件服务器来设置
org.opennms.core.utils.quitwait=true //等待服务器返回
org.opennms.core.utils.authenticate=true //启用验证
[email protected]
org.opennms.core.utils.authenticatePassword=*******your password*****
org.opennms.core.utils.starttls.enable=false //使用TLS连接服务器,使用京东邮件服务器应设置为false。
org.opennms.core.utils.messageContentType=text/html
org.opennms.core.utils.charset=UTF-8
[email protected] //邮件中显示的发送者,须同authenticateUser一致。
2.用户配置:
webUI配置路径:Admin->Configure Users, Groups and Roles->Configure Users->AddNew User->
输入ID和password->在用户信息中输入Email(用户的邮件接收地址)->Finsh
如果需要修改用户信息,可以在Configure Users中点击Modify按钮修改。
3.Destination Paths配置(发送路径,配置需要接收通知的群组、用户、角色和E-mail)
webUI配置路径:Admin->Configure Notifications->Configure Destination Paths->New path
->输入路径名称(如:testEmail-path)->点击Initial Targets右边的Edit,配置需要接受邮件的目标;
在这个页面中共有四个个选框:User、Groups、Roles、Email选中需要接收邮件的目标即可。Email中
可以添加任意邮箱来接收邮件。->next配置用户之间的发送延迟时间->next发送方式,选择javaEmail即用邮件发送。
配置文件:$opennms_home/etc/destinationPaths.xml也可在配置文件中配置路径
4.event配置
WebUI配置路径:Admin->Configure Notifications->Configure Event Notifications->点击上方的Add New Event Notification
添加新的Event->在events列表中选择一个事件->Next->Skip results validation->编辑事件邮件内容,在choose A path 中选择一个发送路径。->Finish
四.NET-SNMP包的安装与配置
1.安装net-snmp:
Ubuntu11.10:apt-get install snmp snmpd
CentOS6.2: yum install net-snmp net-snmp-devel net-snmp-utils
启动SNMP服务:/etc/init.d/snmpd start
查看SNMP版本:snmpget --version
2.SNMP配置:/etc/snmp/snmpd.conf(需要root权限)
(1)对于SNMP V3版本,默认设置是监听本机的snmp请求,应该将其修改成成监听所有设备的请求,V2c版本不用修改。
# Listen for connections from the local system only
#agentAddress udp:127.0.0.1:161
# Listen for connections on all interfaces (both IPv4 *and* IPv6)
agentAddress udp:161,udp6:[::1]:161
(2)配置SNMP的访问权限,
默认的访问权限设置如下,这个设置只能收集到系统的基本信息。
view systemonly included .1.3.6.1.2.1.1
view systemonly included .1.3.6.1.2.1.25.1
# group context sec.model sec.level prefix read write notif access notConfigGroup "" any noauth exact systemonly none none
可以修改成:
view all included .1
# group context sec.model sec.level prefix read write notif access notConfigGroup "" any noauth exact all none none
(3)如果需要修改默认的Community String可以将public替换掉:
com2sec notConfigUser 0.0.0.0 public
配置完成后,检查snmp是否能够访问:snmpwalk -v 2c -c public YourIpAddress
(4)如果完成以上配置后依然无法访问SNMP服务,可以尝试
#sudo lsof-i:161
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
snmpd 1212 root 6u IPv4 11012 0t0 UDP *:snmp
PS:如果这里显示为snmpd 9641snmp 6u IPv4 29940 0t0 localhost:snmp:snmp
说明161端口是监听在localhost上的,也就是说不对外开放,只能访问本地的161端口。
iptables -A INPUT -p udp -i eth0 --dport 161 -j ACCEPT 将161端口开放
或关闭掉iptables
五.SNMP数据收集,RRD数据存储方式配置。
(1).SNMP version与Community配置
默认的SNMP版本和是V2c,密码是piblic。添加节点时可以在页面修改。
或者在Admin->Configure SNMP Community Names by IP中根据不同的IP配置
配置文件:($OPENNMS_HOME/etc/snmp-config.xml)
配置文件中的标签和属性含义:
retry:重连次数,默认为1
timeout:等待时间,单位是毫秒,默认为3000
read-community:利用SNMP读取数据的密码,默认为public
write-community:利用SNMP写数据的密码,当前版本没有实现。
port:SNMP的端口,默认161
(2).配置数据收集colletd进程
配置文件:$OPENNMS_HOME/collectd-configuration.xml
配置文件中的标签和属性含义:
collectd-configuration.xml
threads:用于收集数据的线程数量
name:服务的名字,如SNMP、OpenNMS-JVM
interval:收集数据的时间间隔,单位为毫秒,默认为300000(5分钟)
user-defined:当前的版本还没有实现这个功能
parameter:设置变量
(3)SNMP数据收集配置以及RRD配置
配置文件:$OPENNMS_HOME/datacollection.xml
RRD
rrdRepository:属性定义了RRD存储目录,如果修改这一属性,因同时修改一下配置文件中的内容:
poller-configuration.xml
thresholds.xml
http-datacollection-config.xml
jmx-datacollection-config.xml
nsclient-datacollection-config.xml
step;步长,以秒为单位,默认值是300。
RRA:Cf:xff:steps:rows
RRA:表明这是一个RRD数据的配置命令。
Cf:存储内容统计函数,包含AVERAGE, MAX, MIN, LAST四种。
xff是一个影响因子,用于防止一个统计周期内大量数据丢失的情况,默认值是0.5,即允许有50%的数据丢失
steps,即多少个步长进行一次统计,并将数据存储为一行。
rows,表示RRD总共存储多少行数据。
如:step=300 RRA:AVERAGE:0.5:1:2016 表示,存储5分钟内的平均值,允许有50%的数据丢失,总共存储2016条数据
SNMP
每一个组都在$OPENNMS_HOME/etc/datacoll ection中有一个对应的配置文件。
其中配置了每个数据的ID和名字,系统已经自动配置好了大部分的数据,如果有需求可以手动在其中添加。
六.阀值Thresholds
1.配置流程
(1)首先,必须要收集你想要监控阀值的数据。
(2)然后,在 thresholds.xml中为你想要监控的数据配置一个阀值。
(3)然后在threshd-configuration.xml中设置需要监控阀值的设备、IP段、接口。
(4)最后为阀值监控创建报警或通知。
2.阀值监控的种类(type)
按照data source分类有两种。
Basic Threshold——直接对data source进行监控。
Expression based Threshold——监控按照表达式进行处理后的data source
(1).high:当数据高于设定的阀值时,触发一个'highthreshold'事件,直到数据低于re-arm值时,事件才被取消。
(2).low:与high相反。
(3).relativeChange:监控数据的相对变化,如下配置数据上涨了50%将引发事件(rearm值relativeChange无效)
(4)absoluteChange:监控数据的绝对变化,如下配置数据上涨或下降3将引发事件。
3.配置文件中的标签和属性含义:
thresholds.xml
type:阀值监控的类型:‘high’ ‘low’ ‘relativeChange' 'absoluteChange'
rrdRepository:rrd数据存放目录,指向SNMP收集到的数据存放地址
expression:对数据源进行计算处理的数学表达式
ds-name:data source的名称
ds-type:data source类型,节点数据对应“node",接口数据对应‘if’
ds-label:data source的标签
value:阀值,对不同的type有不同的意义,如果设置为负数,将取其绝对值
rearm:The value at which the threshold will reset itself. Not used for relativeChange thresholds.
trigger:设置数据超过阀值的多少次才会引发事件,对 relativeChange 不适用
triggeredUEI:当阀值监控被触发时,向event发送事件时的UEI,如果设置为空,将默认生成一个标准thresholds UEIs.
rearmedUEI:threshold rearm时发送事件时的UEI
filters:一个正则表达式,用于对data source进行过滤
filterOperator:多个filter之间的连接符,可用or和and,默认值为or
threshd-configuration.xml
在thresholds.xml中,为每一个thresholds配置了相关的阀值、过滤、数据源等,并将其分到不同的group中,而在threshd-configuration.xml中为每一个group建立一个package,可以在其中配置被监控的设备IP段、
filter:对IP地址进行过滤,符合条件的设备才进行监控
include-range:将一个IP段加入到监控中
4.在web UI中管理thresholds
Admin->Manage Thresholds->选择一个Group,点击Edit进行编辑
NOTE:早期的OpenNMS中,threshd进行阀值监控和collectd不是同步的,threshd取出的数据可能是错误。后期OpenNMS将threshd和collectd进行了同步,collected收集到数据后,立即由threshd将数据与阀值进行比较,对于ICMP的数据,threshd和poller是同步的,如果需要开启SNMP同步功能可以在collectd-configuration.xml中,添加一个parameter
5.配置举例:为disk设置阀值
在threshd-configuration.xml中添加一个group:
在thresholds.xml中为group配置阀值:
rrdRepository = "/var/opennms/rrd/snmp/">
note:ds-name可以在$OPENNMS_HOME/etc/datacollection/*.xml中查找到
七.事件events
1.event种类
(1).由OpenNMS内部产生的“internal event”. (2).通过SNMP traps 生成的event
2.配置文件:eventconf.xml
UEI:Universal Event Identifier 用于辨识事件
event-label:web UI 中显示的时间标签
dscr:对事件的描述,支持html标签
logmsg:对事件的简短描述,包含一个“dest”属性,用于指明是否在数据库中log或在web Ui中展现,dest包含以下几个选项
logndisplay:在数据库中记录,并在web UI中展示
logonly:只记录,不展示
suppress:不记录也不展示
donotpersist:不在数据库中记录,但依然想其余进程发送event
discardtraps:只适用与trapd进程抛出trap的时候 ,trapd将不生成事件,直接忽略trap
severity:事件的严重程度,包含七个级别,并用不同颜色区分
Critical (dark red):表明网络中大量设备被这个event影响,应立即得到修正
Major (light red):设备完全down或有down的风险,事件应收到重视
Minor (orange):部分服务或功能损坏
Warning (yellow):不太紧要的,事件有可能需要得到注意,但是不用立即解决。
Normal (green):正常的事件
Cleared (light grey):表明之前的一个错误事件已经被纠正,服务已经恢复
Indeterminate (yellow-green):事件的影响无法预测
operinstruct:给管理员的操作提示
mouseovertext:web Ui中鼠标停留在event上时的文本提示
event-file:包含其他文件中的event
修改eventconf.xml文件后应用以下命令通知OpenNMS事件配置已经修改:
$OPENNMS_HOME/bin/send-event.pl uei.opennms.org/internal/eventsConfigChange
可以利用一下脚本来测试event配置:
$OPENNMS_HOME/bin/send-event.pl
$OPENNMS_HOME/bin/send-trap.pl
3.Event translator
event translator 允许对已经生成的event进行更改,它将clone一个相同的事件,并按照配置文件修改event中的一部份属性。使用这个功能的原因是:
创建被动状态事件。
将事件与不同的节点关联起来。
配置文件为:$OPENNMS_HOME/etc/translator-configuration.xml
可以利用从数据库取出的数据、正则表达式匹配的数据、String来替换event原有的属性,并生成一个新的event
4.事件发生时调用bean shell script
事件触发时,可以通过调用bean shell脚本来处理事件,脚本可以在$OPENNMS_HOME/etc/scriptd-configuration.xml中针对不同的UEI配置,也可以配置针对所有事件全局的脚本。
5.通过XML-RPC远程发送event
OpenNMS有一个个xmlrpcd进程,允许通过xml-RPC向远程系统转发event,配置文件为:$OPENNMS_HOME/etc/xmlrpcd-configuration.xml
1.配置举例:
标签和属性含义:
max-event-queue-size:存储队列的最大值
generic-msgs:默认是false,表示仅转发默认的六种basic event(node/service/interface +down/up)。设置为true时,表示转发所有订阅的event
external-servers:需要转发的xmlrpc服务器地址
retries:重试次数
elapse-time:重试等待时间
subscription:一组订阅的需要转发的事件,可以设置一个name
subscirption-event:一个订阅的需要转发的事件
OpenNMS系统将对external-servers中配置的所有服务器转发event,如果所有服务器都不可达,系统将存储5000条数据(max-event-queue-size)
2.激活xmlrpcd:
该进程默认是关闭的,如果需要开启这个功能,应该编辑$OPENNMS_HOME/etc/service-configuration.xml 解除以下配置代码的注释:
3.运行流程
xmlrpcd初始化时,为每一个XMLRPC server创建一个EventListener和queue,当EventListener监听到一个被订阅的event时,将将event加入到queue中等待处理。当事件被处理时,xmlrpcd先检查generic-msgs属性,如果为false,只有默认的6种事件会被转发给XMLRPC server。
6.Automation 自动化
automation是opennms从1.3版本开始提供的功能,它由一个trigger和一个操作数据库的action statement构成,它可以完成一系列自动化的动作,比如定期清楚过期数据或当一个event长事件没有acknowledged,自动的将其severity级别升级。
配置文件:$OPENNMS_HOME/etc/vacuumd-configuration.xml
1.automation的属性:
name(required):用于区别automation的String
interval(required):整数,单位为毫秒,指明多长事件允许一次automation
trigger-name:通过名字来引用trigger
action-name(required):通过名字来引用action
action-event:需要发送的action-event名字
2.trigger:包含下列三个属性,并球有一个SQL statement,SQL语句的结果将由action中的语句进行处理。
name:名字 row-count和operator:两个属性一起使用,共同决定是否应该执行action
如:
select
distinct(ipaddr) as _ipaddr,
count(nodeid),
nodeid as _nodeid
from events
where
eventuei='uei.opennms.org/test/blafasel' and
eventtime >= now()-'2 minutes'::INTERVAL
group by nodeid,ipaddr
having count(nodeid) > 10;
当statement中的查询结果数量大于1时才执行action
3.action:action是automation中必须的一个组成部分,包括name和可以处理trigger中结果或独立执行的SQL statement。如:
UPDATE alarms SET severity = least(7, severity+1)
WHERE alarmid = ${alarmid}
AND alarmAckUser is NULL
automation将对语句进行解析,并确定trigger中的result set包含语句中所需的字段,然后执行语句,更新数据库。
4.action-event:当automation运行时生成一个或多个event,但不是必须的。
八.警报 Alarms
Alarms是由event衍生出来的,它的配置同event整合在一起,在$OPENNMS_HOME/etc/eventconf.xml中.在event中添加alarm-data标签来配置alarm:
1.alarm-data的属性:
reduction-key:用于区分警报,对事件进行过滤,防止重复报警。如一下配置:
alarm将把event中的uei和nodeid存储到报警列表中,对之后的生成的有相同uei和nodeid的event将不会产生报警,而是只更新alarm的lastEventTime, lastEventID,这样就防止了重复警报
alarm-type:这个属性共有三个可能值 “1”表示需要解决,“2”表示警报已解决方案,“3”表示可能没有解决方案。
auto-clean:如果设置为true将自动从数据库删除满足 reduction-key中的条件的event
clear-key:仅当alarm-type设置为2的时有效,用于在故障恢复后,自动将满足clear-key的alarm清除