由于公司要上oracle数据库,需要对这个东西惊醒监控,于是去网上淘资料,发现有一个套件orabbix监控oracle的效果还不错,于是拿来试验了一下。orabbix是由JAVA写的一个套件,需要在oracle服务器上面安装JAVA环境才能运行。这里为了简便,可以使用yum -y install java来安装JAVA环境。

安装完java环境之后可以通过下面命令来检测是否安装成功:

[root@test ~]# java -version
java version "1.7.0_45"
OpenJDK Runtime Environment (rhel-2.4.3.3.0.1.el6-x86_64 u45-b15)
OpenJDK 64-Bit Server VM (build 24.45-b08, mixed mode)

如我上面这样显示就证明java环境已经安装成功了。

之后,我们就需要在oracle服务器上面安装orabbix套件了,可以去官网下载,目前最新版本是1.2.3,下载地址为:http://www.smartmarmot.com/downloads/orabbix-1.2.3.zip

下载完之后将其解压到/opt目录下,接下来,需要配置orabbix的配置文件了。先将配置文件的模板复制一份出来,然后开始配置:

cp orabbix/conf/config.props.sample orabbix/conf/config.props
vi !$
#comma separed list of Zabbix servers
ZabbixServerList=ZabbixServer1
ZabbixServer1.Address=10.6.0.180              #zabbix服务器的IP地址
ZabbixServer1.Port=10051                      #zabbix服务器的监听端口
#pidFile
OrabbixDaemon.PidFile=./logs/orabbix.pid
#frequency of item's refresh
OrabbixDaemon.Sleep=300
#MaxThreadNumber should be >= than the number of your databases
OrabbixDaemon.MaxThreadNumber=100
#put here your databases in a comma separated list
DatabaseList=DB_QM                            #这个名字可以自行命名,但是需要和下面的名字保持一致,并且在zabbixserver上面配置的主机名要和这个保持一致
#Configuration of Connection pool
#if not specified Orabbis is going to use default values (hardcoded)
#Maximum number of active connection inside pool
DatabaseList.MaxActive=10
#The maximum number of milliseconds that the pool will wait
#(when there are no available connections) for a connection to be returned
#before throwing an exception, or <= 0 to wait indefinitely.
DatabaseList.MaxWait=100
DatabaseList.MaxIdle=1
#define here your connection string for each database
DB_QM.Url=jdbc:oracle:thin:@10.6.0.207:1521:test        #orabbix是通过jdbc链接oracle数据库的,orcl指定的是被监控服务器的连接信息(例如采用jdbc的联接方式,服务器地址是10.6.0.207,oracle的端口是1521,test指的是数据库的实例)
DB_QM.User=zabbix                                       #链接oracle数据库的账号密码,这个需要在oracle数据库中配置
DB_QM.Password=123456
#Those values are optionals if not specified Orabbix is going to use the general values
DB_QM.MaxActive=10                                      #删除用不到的多余的配置,保留这些就可以了。
DB_QM.MaxWait=100
DB_QM.MaxIdle=1
DB_QM.QueryListFile=./conf/query.props
#DB2.Url=jdbc:oracle:thin:@server2.domain.example.com::DB2

然后在oracle数据库中创建zabbix用户:

CREATE USER ZABBIX IDENTIFIED BY 123456  DEFAULT TABLESPACE USERS TEMPORARY TABLESPACE TEMP;
     GRANT CONNECT TO ZABBIX;
     GRANT RESOURCE TO ZABBIX;
     ALTER USER ZABBIX DEFAULT ROLE ALL;
     GRANT SELECT ANY TABLE TO ZABBIX;
     GRANT CREATE SESSION TO ZABBIX;
     GRANT SELECT ANY DICTIONARY TO ZABBIX;
     GRANT UNLIMITED TABLESPACE TO ZABBIX;
     GRANT SELECT ANY DICTIONARY TO ZABBIX;

如果是Oracle 11g,则需要添加如下命令

execdbms_network_acl_admin.create_acl(acl => 'resolve.xml',description =>'resolve acl', principal =>'ZABBIX', is_grant => true, privilege =>'resolve');
exec dbms_network_acl_admin.assign_acl(acl=> 'resolve.xml', host =>'*');
commit;

复制orabbix启动文件到etc目录下:

cp /opt/orabbix/init.d/orabbix/etc/init.d/orabbix
chmod 755 !$

启动orabbix

systemctl start orabbix
chkconfig --add orabbix
chkconfig orabbix on

启动orabbix之后,没有报错,证明启动成功,如果有报错,一般是配置文件的问题,仔细排查一下应该就没问题。

启动之后,还需要安装上zabbix agentd客户端,至于怎样安装agentd客户端在我的另一篇博客中有介绍,这里就不赘述了。传送门在这里

安装完之后,将模板导入到zabbixserver中:

导入模版,模版放置在/opt/orabbix/template下

Orabbix_export_full.xml   全部导入(图表 监控项 触发器)

Orabbix_export_graphs.xml  图表

Orabbix_export_items.xml   监控项

Orabbix_export_triggers.xml 触发器

这里导入所有的模板,导入模版之后,将oracle主机添加进zabbixserver中,如下图所示

zabbix通过orabbix和自定义脚本监控oracle数据库_第1张图片

配置完之后,正常的话就能够监控oracle数据库的信息了。

下面是出图后的效果:

zabbix通过orabbix和自定义脚本监控oracle数据库_第2张图片

本来到这里就结束了,但是前面这些都不是重点,重点是后面同事需求监控oracle数据库的tablespace的使用量,于是,为了实现这个需求,我在原先的模板中进行了修改。,使用自动发现功能实现监控tablespace的使用情况。

首先,需要创建脚本,获取到oracle数据库中的数据,下面是脚本:

[root@test opt]# cat /home/oracle/oracle_cron.sh 
#!/bin/bash
source /home/oracle/.bash_profile
sqlplus -s zabbix/123456  > /tmp/tablespace.log< 
  

通过执行这个脚本可以获取到moracle数据库中的tablespace列表,并输出到/tmp/tablespace.log日志中去,这个执行脚本需要修改属主属组为oracle.oracle,并且需要给于执行权限,在crontab中设置每一分钟执行一次,下面是执行得到的结果:

[root@test opt]# cat /tmp/tablespace.log 
Status   Name      TypeExtentSize (M)     Used (M)  Used %
---------- ------------------------- ---------- --------------- -------------------- -------------------- --------------------
ONLINE   UNDOTBS1     UNDOLOCAL280       12     4.38
ONLINE   QWERTY     PERMANENTLOCAL 101    10.00
ONLINE   USERS     PERMANENTLOCAL  51    20.00
ONLINE   SYSTEM     PERMANENTLOCAL700      377    53.88
ONLINE   TEMP      TEMPORARYLOCAL 20       11    55.00
ONLINE   SYSAUX     PERMANENTLOCAL550      400    72.78
6 rows selected.

上面就是取出来的数据,既然数据取出来了,那么剩下的要做的就是把数据弄到zabbix中去咯。

下面将使用下面两个脚本来对取出的这些数据进行格式化转换和取值:

[root@test opt]# cat /usr/local/zabbix/scripts/oracle_discovery.sh 
#!/bin/bash
TABLESPACE=`cat /tmp/tablespace.log |awk '{print$2}'|awk 'NR>3{print}'`
COUNT=`echo "$TABLESPACE" |wc -l`
INDEX=0
echo '{"data":['
echo "$TABLESPACE" | while read LINE; do
    echo -n '{"{#TABLENAME}":"'$LINE'"}'
    INDEX=`expr $INDEX + 1`
    if [ $INDEX -lt $COUNT ]; then
        echo ','
    fi
done
echo ']}'

这个脚本的功能是从tablespace.log文件中取出Name那一列,并进行JSON格式化输出(因为zabbix的自动发现功能获取的数据类型是JSON格式的),下面是执行效果:

[root@test opt]# sh /usr/local/zabbix/scripts/oracle_discovery.sh 
{"data":[
{"{#TABLENAME}":"UNDOTBS1"},
{"{#TABLENAME}":"QWERTY"},
{"{#TABLENAME}":"USERS"},
{"{#TABLENAME}":"SYSTEM"},
{"{#TABLENAME}":"TEMP"},
{"{#TABLENAME}":"SYSAUX"},
{"{#TABLENAME}":""},
{"{#TABLENAME}":"rows"}]}
[root@test opt]#

 还有一个脚本是获取tablespace.log中的最后三列数据,脚本内容如下:

[root@test opt]# cat /usr/local/zabbix/scripts/oracle_check.sh
#!/bin/bash
EQ_DATA="$2"
ZBX_REQ_DATA_TAB="$1"
SOURCE_DATA=/tmp/tablespace.log
case $2 in
  maxmb)        grep -E "$ZBX_REQ_DATA_TAB" $SOURCE_DATA |awk '{print $5*1024*1024}';;
  used)   grep -E "$ZBX_REQ_DATA_TAB" $SOURCE_DATA |awk '{print $6*1024*1024}';;
  autopercent)  grep -E "$ZBX_REQ_DATA_TAB" $SOURCE_DATA |awk '{print $7}';;
  *) echo $ERROR_WRONG_PARAM; exit 1;;
esac
exit 0

其中maxmb和used取出的值是M,所以这里给转换成了byte,方便zabbix取值,下面是举例取出来的值:

[root@test opt]# sh /usr/local/zabbix/scripts/oracle_check.sh SYSAUX maxmb
576716800
[root@test opt]#

这里配置完成之后就需要在zabbixagentd的配置文件中添加监控key了:

[root@test opt]# tail -3 /usr/local/zabbix/etc/zabbix_agentd.conf
UserParameter=ora.tab.discovery,/usr/local/zabbix/scripts/oracle_discovery.sh
UserParameter=tablespace[*],/usr/local/zabbix/scripts/oracle_check.sh $1 $2

添加key之后需要重启zabbix agentd服务。

然后我们就需要在zabbixserver中添加监控模板了,首先创建一个发现规则:

zabbix通过orabbix和自定义脚本监控oracle数据库_第3张图片

其中的键值ora.tab.discovery就是我们在agentd的配置文件中定义的,由这个发现规则获取到的是一个JSON格式的返回值。要注意其中的数据更新间隔,这个值指的是你的发现规则执行的时间间隔,我这里暂时设置为60s

然后我们开始创建项目原型了,下面是创建的详细内容:

zabbix通过orabbix和自定义脚本监控oracle数据库_第4张图片

按照上面的项目原型依次创建{#TABLENAME}used和{#TABLENAME}autopercent,对应的键值是tablespace[{#TABLENAME},used]和tablespace[{#TABLENAME},autopercent],创建完发现规则后,开始创建图形原型了,下面是图形原型的详细内容:

zabbix通过orabbix和自定义脚本监控oracle数据库_第5张图片

保存完成后,该发现规则就做好了,之后等待大约一分钟之后就可以看到采集到的数据了,这和上面设定的60s的数据更新间隔是一致的。下面是获取到的监控tablespace的结果:

zabbix通过orabbix和自定义脚本监控oracle数据库_第6张图片

好了,监控tablespace的目标暂时实现了,具体的一些细节还有待改进。附件中将会附上我的根据官网模板修改后的模板,好了,结束了,希望该教程能够帮助到大家!