oracle 进程已经Kill,但仍然存在的孤立会话(orphan session)的彻底清理

文章目录

  • 1.问题描叙
  • 2.Solution
    • 2.1 尝试唤醒pmon
    • 2.2 尝试alter system disconnect方式,会话依然存在
    • 2.3 从 oracle 文档 ID 387077.1 获取帮助。
    • 2.4 oracle 10g中的处理

1.问题描叙

不久前看到了一个问题:
有许多会话正在等待对象上的锁,并且有一个会话阻止了其他会话。
为了解决这个问题,使用命令“alter system Kill session…”kill了阻塞进程,并且会话被标记为“killed"。一段时间后,会话仍然显示为killed状态,server列为PSEUDO, 但会话仍然存在,并且未真正从数据库中释放。

SQL> select sid,serial#,osuser,type,status,server from v$session where status='KILLED';

       SID    SERIAL# OSUSER                         TYPE       STATUS   SERVER
---------- ---------- ------------------------------ ---------- -------- ---------
       133      53570 weboaid                        USER       KILLED   PSEUDO
       573       2831 oracle                         USER       KILLED   PSEUDO

现在,为了终止会话,尝试在 v$process 视图中获取相应的进程,但没有将 v s e s s i o n 的 p a d d r 列与 v session 的 paddr 列与 v sessionpaddr列与vprocess 的 addr 列相匹配的条目。

SQL> select spid from v$process where addr in (select paddr from v$session where status='KILLED');
no rows selected

也没有匹配的transaction

SQL> select * from v$transaction where  addr in (select saddr from v$session where status='KILLED');
no rows selected

v$process 中没有该会话的匹配行。因此无法使用命令kill -9 终止该进程,这就是传说中的orphan session.

2.Solution

2.1 尝试唤醒pmon

由于某种原因,pmon 无法清理该会话,并且它仍然作为孤立会话存在于数据库中

SQL> SELECT pid FROM v$process
WHERE addr = 
(
    SELECT paddr FROM v$bgprocess
    WHERE name = 'PMON'
); 
ORADEBUG WAKEUP 2

会话仍然存在

SQL> select sid,serial#,osuser,type,status,server from v$session where status='KILLED';

       SID    SERIAL# OSUSER                         TYPE       STATUS   SERVER
---------- ---------- ------------------------------ ---------- -------- ---------
       133      53570 weboaid                        USER       KILLED   PSEUDO
       573       2831 oracle                         USER       KILLED   PSEUDO

2.2 尝试alter system disconnect方式,会话依然存在


SQL> select 'alter system disconnect session ''' || SID || ',' || SERIAL# || ''' immediate;' from v$session where STATUS not in ('ACTIVE','INACTIVE');

'ALTERSYSTEMDISCONNECTSESSION'''||SID||','||SERIAL#||'''IMMEDIATE;'
--------------------------------------------------------------------------------
alter system disconnect session '133,53570' immediate;
alter system disconnect session '573,2831' immediate;
SQL> alter system disconnect session '133,53570' immediate;
System altered.
SQL> alter system disconnect session '573,2831' immediate;
System altered.

会话仍然存在:

SQL> select sid,serial#,osuser,type,status,server from v$session where status='KILLED';

       SID    SERIAL# OSUSER                         TYPE       STATUS   SERVER
---------- ---------- ------------------------------ ---------- -------- ---------
       133      53570 weboaid                        USER       KILLED   PSEUDO
       573       2831 oracle                         USER       KILLED   PSEUDO

2.3 从 oracle 文档 ID 387077.1 获取帮助。

如果并且使用的是 11g,那么可以使用此 MOS 说明来尝试解决。
基本上,当会话被终止时会发生什么,然后创建一个新的进程 ID,并且 v$process 中与先前存在的会话的 addr 行相匹配的 addr 行将不再存在。相反,将出现一个新行。 识别进程并修复此问题,在 11g 中添加了几个附加列到 V$SESSION 中:
V$SESSION:
1.CREATOR_ADDR - 创建进程的状态对象地址
2.CREATOR_SERIAL# - 创建进程的序列号
其中,CREATOR_ADDR 是可以与 V$PROCESS 中的 ADDR 列连接的列,以唯一标识与前一个会话对应的被杀死的进程。
使用这些列,我们可以识别被终止会话的进程 ID。为了识别新的进程 ID,可以使用以下查询。

select * from v$process where addr in (select Creator_addr from v$session where status='killed');

一旦从上面的查询中获得了进程ID,剩下的任务就很简单了。现在我们只需要从操作系统中杀死相应的进程ID。
-> kill -9
现在只需要耐心等待,pmon 进程需要一些时间才能完成清理工作。

2.4 oracle 10g中的处理

很遗憾,我使用的版本是oracle 10g,无法按照2.3中MOS文档步骤来处理此问题,但是从上述的思路中,可以知道会话会创建新的进程,因此我们受用如下sql找出新增的进程

SQL>SELECT addr,pid,spid,username,serial#,terminal,program FROM V$PROCESS WHERE 
PROGRAM NOT IN ('PSEUDO')
AND ADDR NOT IN (SELECT PADDR FROM V$BGPROCESS)
AND ADDR NOT IN (SELECT PADDR FROM V$SESSION)
AND ADDR NOT IN (SELECT PADDR FROM V$SHARED_SERVER)
AND ADDR NOT IN (SELECT PADDR FROM V$DISPATCHER)
ADDR                    PID SPID         USERNAME                SERIAL# TERMINAL             PROGRAM
---------------- ---------- ------------ -------------------- ---------- -------------------- --------------------
0000000B9F3591D0        289 17892        oracle                       21 UNKNOWN              oracle@hrisdb_prod
0000000B9930D0E8        291 17894        oracle                      132 UNKNOWN              oracle@hrisdb_prod

知道spid后,就好处理了

[oracle@hrisdb_prod ~]$ kill -9 17892
[oracle@hrisdb_prod ~]$ kill -9 17894

再次查询,已经消失

SQL> select sid,serial#,osuser,type,status,server from v$session where status='KILLED';
no rows selected

你可能感兴趣的:(Oracle,oracle,数据库)