数据库监控模板

 

目前系统中,主要是对同步的订单信息和短息信息的异常数据进行监控,以下将分两个方面对数据的监控规则进行描述:

一、             订单信息异常数据监控规则

主要分两个方面对数据进行监控,一是监控NETS数据库中同步出现异常的数据,二是监控数据已同步到LDS数据库临时表,但在进行数据处理时发生错误的异常数据,监控规则如下:

1、              监控NETS数据库表life_order_info表中字段lds_eai_flag状态,监控状态为13的数据,相关信息见下表:

监控数据库

Nets生产数据库

监控表

Life_order_info

监控表字段

lds_eai_flag

监控表字段值

1

监控时间

每天早上800

监控SQL语句

Select t.order_no, t.polno, t.eai_flag
  from Life_order_info t
 where t.lds_eai_flag =
'1'
   and t.created_date >= sysdate -
60
   and t.created_date <= sysdate

产生原因

主要是因为EAI程序发布了数据,但是接收端没有收到数据或收到数据但没有返回同步状态,一般EAI服务出现故障才会产生这种情况

处理办法

将这些数据更新状态为0,可参照如下sql语句进行数据修改:

update life_order_info t set t.lds_eai_flag = '0' where t.order_no = ?

1.1

监控数据库

Nets生产数据库

监控表

Life_order_info

监控表字段

lds_eai_flag

监控表字段值

3

监控时间

每天早上800

监控SQL语句

Select t.order_no, t.polno, t.eai_flag
  from Life_order_info t
 where t.lds_eai_flag =
'3'
   and t.created_date >= sysdate -
60
   and t.created_date <= sysdate

产生原因

一般是因为程序问题或数据问题导致

处理办法

NETSLDS开发人员同时进行分析和处理

1.2

2、              监控LDS数据库表lds_policy_info_temp表中字段syn_status状态,监控状态为2的数据,相关信息见下表:

监控数据库

lds生产数据库

监控表

lds_policy_info_temp

监控表字段

syn_status

监控表字段值

2

监控时间

每天早上830

监控SQL语句

select t.policy_no, t.syn_status
  from lds_policy_info_temp t
 where t.syn_status =
'2'

产生原因

一般是因为数据问题导致,如主外键关联,字段类型不匹配等

处理办法

可查看出错日志表lds_syn_policyinfo_error_log对出错的保单信息分析,如运营人员不能处理,可交于LDS开发人员进行分析和处理

1.3

3、              监控LDS数据库表lds_user_to_tl_map_temp表中字段syn_status状态,监控状态为2的数据,相关信息见下表:

监控数据库

lds生产数据库

监控表

lds_user_to_tl_map_temp

监控表字段

syn_status

监控表字段值

2

监控时间

每天早上830

监控SQL语句

select t.user_id, t.team_id
  from lds_user_to_tl_map_temp t
 where t.syn_status =
'2'

产生原因

数据问题或数据库环境问题导致

处理办法

可查看出错日志表lds_syn_policyinfo_error_log对出错的信息分析,如运营人员不能处理,可交于LDS开发人员进行分析和处理

1.4

注:目前EAI平台的schedulercluster环境下存在不执行的隐患,因此对于上述两个同步,如客户反映昨天的数据没有被同步到LDS数据库,则由运营人员联系EAI运营人员进行问题检查并讨论处理方案。

二、             短信信息异常数据监控规则

1、每天定时对同步和发送异常的短信信息记录进行监控,监控规则如下:

监控数据库

lds生产数据库

监控表

lds_sms_info

监控表字段

status

监控表字段值

03

监控时间

每天凌晨进行监控,尽量选择在业务空闲期执行。

监控SQL语句

select * from lds_sms_info t where t.status = '03'

产生原因

短信数据问题或短信平台故障导致

处理办法

LDSPSCP开发人员进行分析和处理

2.1

2、根据EAI组同事时提醒,目前EAI平台的schedulercluster环境下存在不执行的隐患,因此需对实时性要求较高的信息进行监控,以防止定时同步任务没有执行,监控规则如下:

监控数据库

lds生产数据库

监控表

lds_sms_info

监控表字段

created_date

监控表字段值

根据此字段判断数据是否被EAI平台取走

监控时间

每天凌晨进行监控,尽量选择在业务空闲期执行,这里监控两天之内没有被EAI平台取走的数据。

监控SQL语句

select *
  from ldsdata.lds_sms_info t
 where
2 < (sysdate - t.created_date)
   and t.eai_fetch_date is null;

产生原因

EAI平台故障导致

处理办法

运营人员联系EAI运营人员进行问题检查并讨论处理方案

2.2

你可能感兴趣的:(数据库监控模板)