不久前看到了一个问题:
有许多会话正在等待对象上的锁,并且有一个会话阻止了其他会话。
为了解决这个问题,使用命令“alter system Kill session…”kill了阻塞进程,并且会话被标记为“killed"。一段时间后,会话仍然显示为killed状态,server列为PSEUDO, 但会话仍然存在,并且未真正从数据库中释放。
SQL> select sid,serial#,osuser,type,status,server from v$session where status='KILLED';
SID SERIAL# OSUSER TYPE STATUS SERVER
---------- ---------- ------------------------------ ---------- -------- ---------
133 53570 weboaid USER KILLED PSEUDO
573 2831 oracle USER KILLED PSEUDO
现在,为了终止会话,尝试在 v$process 视图中获取相应的进程,但没有将 v s e s s i o n 的 p a d d r 列与 v session 的 paddr 列与 v session的paddr列与vprocess 的 addr 列相匹配的条目。
SQL> select spid from v$process where addr in (select paddr from v$session where status='KILLED');
no rows selected
也没有匹配的transaction
SQL> select * from v$transaction where addr in (select saddr from v$session where status='KILLED');
no rows selected
v$process 中没有该会话的匹配行。因此无法使用命令kill -9 终止该进程,这就是传说中的orphan session.
由于某种原因,pmon 无法清理该会话,并且它仍然作为孤立会话存在于数据库中
SQL> SELECT pid FROM v$process
WHERE addr =
(
SELECT paddr FROM v$bgprocess
WHERE name = 'PMON'
);
ORADEBUG WAKEUP 2
会话仍然存在
SQL> select sid,serial#,osuser,type,status,server from v$session where status='KILLED';
SID SERIAL# OSUSER TYPE STATUS SERVER
---------- ---------- ------------------------------ ---------- -------- ---------
133 53570 weboaid USER KILLED PSEUDO
573 2831 oracle USER KILLED PSEUDO
SQL> select 'alter system disconnect session ''' || SID || ',' || SERIAL# || ''' immediate;' from v$session where STATUS not in ('ACTIVE','INACTIVE');
'ALTERSYSTEMDISCONNECTSESSION'''||SID||','||SERIAL#||'''IMMEDIATE;'
--------------------------------------------------------------------------------
alter system disconnect session '133,53570' immediate;
alter system disconnect session '573,2831' immediate;
SQL> alter system disconnect session '133,53570' immediate;
System altered.
SQL> alter system disconnect session '573,2831' immediate;
System altered.
会话仍然存在:
SQL> select sid,serial#,osuser,type,status,server from v$session where status='KILLED';
SID SERIAL# OSUSER TYPE STATUS SERVER
---------- ---------- ------------------------------ ---------- -------- ---------
133 53570 weboaid USER KILLED PSEUDO
573 2831 oracle USER KILLED PSEUDO
如果并且使用的是 11g,那么可以使用此 MOS 说明来尝试解决。
基本上,当会话被终止时会发生什么,然后创建一个新的进程 ID,并且 v$process 中与先前存在的会话的 addr 行相匹配的 addr 行将不再存在。相反,将出现一个新行。 识别进程并修复此问题,在 11g 中添加了几个附加列到 V$SESSION 中:
V$SESSION:
1.CREATOR_ADDR - 创建进程的状态对象地址
2.CREATOR_SERIAL# - 创建进程的序列号
其中,CREATOR_ADDR 是可以与 V$PROCESS 中的 ADDR 列连接的列,以唯一标识与前一个会话对应的被杀死的进程。
使用这些列,我们可以识别被终止会话的进程 ID。为了识别新的进程 ID,可以使用以下查询。
select * from v$process where addr in (select Creator_addr from v$session where status='killed');
一旦从上面的查询中获得了进程ID,剩下的任务就很简单了。现在我们只需要从操作系统中杀死相应的进程ID。
-> kill -9
现在只需要耐心等待,pmon 进程需要一些时间才能完成清理工作。
很遗憾,我使用的版本是oracle 10g,无法按照2.3中MOS文档步骤来处理此问题,但是从上述的思路中,可以知道会话会创建新的进程,因此我们受用如下sql找出新增的进程
SQL>SELECT addr,pid,spid,username,serial#,terminal,program FROM V$PROCESS WHERE
PROGRAM NOT IN ('PSEUDO')
AND ADDR NOT IN (SELECT PADDR FROM V$BGPROCESS)
AND ADDR NOT IN (SELECT PADDR FROM V$SESSION)
AND ADDR NOT IN (SELECT PADDR FROM V$SHARED_SERVER)
AND ADDR NOT IN (SELECT PADDR FROM V$DISPATCHER)
ADDR PID SPID USERNAME SERIAL# TERMINAL PROGRAM
---------------- ---------- ------------ -------------------- ---------- -------------------- --------------------
0000000B9F3591D0 289 17892 oracle 21 UNKNOWN oracle@hrisdb_prod
0000000B9930D0E8 291 17894 oracle 132 UNKNOWN oracle@hrisdb_prod
知道spid后,就好处理了
[oracle@hrisdb_prod ~]$ kill -9 17892
[oracle@hrisdb_prod ~]$ kill -9 17894
再次查询,已经消失
SQL> select sid,serial#,osuser,type,status,server from v$session where status='KILLED';
no rows selected