记一次Weblogic连接池泄露的修复过程

问题描述

从weblogic控制台上,可以看到连接泄露已经达到了6K+,应用已经变得非常不稳定。

根据以往的经验,连接池出现泄漏情况一般为代码申请了一个数据库连接,使用后未正常关闭,导致连接一致被占用,应用运行长时间后,累积的泄漏连接越来越多,导致应用在申请数据库连接时出现无可用连接的情况,从而出现应用报异常的情况。

排查过程

从PLSQL中 工具 -会话
记一次Weblogic连接池泄露的修复过程_第1张图片

可以看到 存在的sql,然后对应到了具体的代码中,发现问题。

出现这种情况后,我们可以从数据库查询一下当前sessions和processes配置情况,都在1600以上;

select count (*) from v$session;

记一次Weblogic连接池泄露的修复过程_第2张图片

select count(*) from v$process;

记一次Weblogic连接池泄露的修复过程_第3张图片

查询当前占用数据库连接较多的主机和登录用户名
select count(*),SCHEMANAME,machine from v$session group by SCHEMANAME,machine;(注:截图中的数据不是出现问题时的情况反映)

记一次Weblogic连接池泄露的修复过程_第4张图片

如果某一主机占用连接数很大,明显不正常,进一步,检查造成这种情况的sql:

select count(*),v.PREV_SQL_ADDR,v.PREV_HASH_VALUE from v$session v group by v.PREV_SQL_ADDR,v.PREV_HASH_VALUE order by count(*) desc ;

记一次Weblogic连接池泄露的修复过程_第5张图片

查询相关的SQL内容:

select * from v$sql s where s.ADDRESS='C0000013B573D278' and s.HASH_VALUE='32127143';

查询得到语句:

insert into onu_oper_record ( id,order_id , wo_id,oper_type,accnbr,create_time,staff_id,staff_name,area_id,org_id,bccode,crm_ret_code,crm_ret_msg,crm_bcd_code)  values ( onu_oper_record_seq.nextval ,:1,:2,:3,:4,:5,:6,:7,:8,:9,:10,:11,:12,:13)

检查发现 java 类中存在两次获得连接未正常关闭的情况

思考

之前排查代码的时候,仅仅考虑了看是否有未关闭的连接,却没有注意到 获取的时候 并没有将获取的连接 赋值给 connecition,导致虽然最后关闭了连接,其实传入的是null。

记一次Weblogic连接池泄露的修复过程_第6张图片

你可能感兴趣的:(【万花筒】,Oralce手札)