什么是等待事件 ?
Oracle 的等待事件是衡量 Oracle运行状况的重要依据及指标。等待事件的概念是在 Oracle7.0.1.2 中引入的,大致有 100 个等待事件。在 Oracle 8.0 中这个数 目增加到了大约 150 个,在 Oracle8i 中大约有 200 个事件,在 Oracle9i 中大约有 360 个等待事件。
主要有两种类别的等待事件,即空闲(idle)等待事件和非空闲(non-idle)等待事件。
空闲事件指 Oracle正等待某种工作,在诊断和优化数据库的时候,我们不用过多注意这部分事件。
常见的空闲事件有:
• dispatcher timer
• lock element cleanup
• parallel query dequeue wait
• parallel query idle wait - Slaves
• pipe get
• PL/SQL lock timer
• pmon timer- pmon
• rdbms ipc message
• slave wait • smon timer
• SQL*Net break/reset to client
• SQL*Net message from client
• SQL*Netmessage to client
• SQL*Net more data to client
• virtual circuit status
• client message
非空闲等待事件专门针对 Oracle的活动,指数据库任务或应用运行过程中发生的等待,这些等待事件是我们在调整数据库的时候应该关注与研究的。
一些常见的非空闲等待事件有:
• db file scattered read
• db file sequential read
• buffer busy waits
• free buffer waits
• enqueue
• latch free
• log file parallel write
• log file sync
1. db file scattered read-DB 文件分散读取
这种情况通常显示与全表扫描相关的等待。当数据库进行全表扫时,基于性能的考虑,数据会分散(scattered)读入 BufferCache。如果这个等待事件比较显著,可能说明对于某些全表扫描的表,没有创建索引或者没有创建合适的索引,我们可能需要检查这些数据表已确定是否进行了正确的设置。然而这个等待事件不一定意味着性能低下,在某些条件下Oracle会主动使用全表扫描来替换索引扫描以提高性能,这和访问的数据量有关,在CBO下 Oracle 会进行更为智能的选择,在RBO下Oracle更倾向于使用索引。因为全表扫描被置于 LRU(Least Recently Used,最近最少适用)列表的冷端(cold end),对于频繁访问的较小的数据表,可以选择把他们Cache到内存中,以避免反复读取。当这个等待事件比较显著时,可以结合v$session_longops动态性能视图来进行诊断,该视图中记录了长时间(运行时间超过 6 秒的)运行的事物,可能很多是全表扫描操作(不管怎样, 这部分信息都是值得我们注意的)。
2. db file sequential read-DB 文件顺序读取。
这一事件通常显示与单个数据块相关的读取操作(如索引读取)。如果这个等待事件比较显著,可能表示在多表连接中,表的连接顺序存在问题,可能没有正确的使用驱动表;或者可能说明不加选择地进行索引。在大多数情况下我们说,通过索引可以更为快速的获取记录,所以对于一个编码规范、调整良好的数据库,这个等待很大是很正常的。但是在很多情况下,使用索引并不是最佳的选择,比如读取较大表中大量的数据,全表扫描可能会明显快于索引扫描,所以在开发中我们就应该注意,对于这样的查询应该进行避免使用索引扫描。
3. Free Buffer-释放缓冲区
这个等待事件表明系统正在等待内存中的可用空间,这说明当前 Buffer 中已经没有 Free 的内存空间。 如果应用设计良好,SQL书写规范,充分绑定变量,那这种等待可能说明BufferCache设置的偏小,你可能需要增大DB_BUFFER_CACHE。Free Buffer 等待可能说明DBWR 的写出速度不够,或者磁盘存在严重的竞争,可以需要考虑 增加检查点、使用更多的 DBWR 进程,或者增加物理磁盘的数量,分散负载,平衡 IO。
4. Buffer Busy-缓冲区忙
该等待事件表示正在等待一个以unshareable方式使用的缓冲区,或者表示当前正在被读入buffer cache。一般来说Buffer Busy Wait不应大于1%检查缓冲等待统计部分(或V$WAITSTAT),看一下等待是否位于段头(Segment Header)。如果是,可以考虑增加自由列表(freelist,对于 Oracle8i DMT)或者增加 freelist groups(在很多 时候这个调整是立竿见影的,在 8.1.6 之前,这个 freelists 参数不能动态修改;在 8.1.6 及以后 版本,动态修改 feelists 需要设置COMPATIBLE至少为8.1.6)。如果这一等待位于undoheader,可以通过增加回滚段(rollback segment)来解决缓冲区的问题。如果等待位于 undo block 上,我们可能需要检查相关应用,适当减少大规模的一致性读取,或者降低一致性读取(consistent read)的表中的数据密度或者增大DB_CACHE_SIZE。如果等待处于data block,可以考虑将频繁并发访问的表或数据移到另一数据块或者进行更大范 围的分布(可以增加 pctfree 值 ,扩大数据分布,减少竞争),以避开这个”热点”数据块,或者可以考虑增加表中的自由列表或使用本地化管理的表空间(Locally Managed Tablespaces)。如果等待处于索引块,应该考虑重建索引、分割索引或使用反向键索引。为了防止与数据块相关的缓冲忙等待,也可以使用较小的块:在这种情况下,单个块中的记录就较少,所以这个块就不是那么繁忙;或者可以设置更大的pctfree,使数据扩大物理分布,减少记录间的热点竞争。在执行DML(insert/update/delete)时,Oracle 向数据块中写入信息,对于多事务并发访问的数 据表,关于 ITL 的竞争和等待可能出现,为了减少这个等待,可以增加initrans,使用多个ITL槽。在Oracle9i中,引入了一个新概念:ASSM(Segment Space Management Auto)。通过这个 新特性 Oracle 使用位图来管理空间使用。ASSM 结合 LMT 彻底改变了 Oracle 的存储机制,位图 freelist 能够减轻缓冲区忙等待(buffer busy wait),这个问题在Oracle9i 以前的版本里曾是一个严重的问题。Oracle宣称ASSM显著地提高了DML并发操作的性能,因为(同一个)位图的不同部分可以 被同时使用,这样就消除了寻找剩余空间的串行化。根据Oracle的测试结果,使用位图 freelist 会消除所有分段头部(对资源)的争夺,还能获得超快的并发插入操作。在Oracle9i之中,Buffer Busy wait 不再常见!
5.latch free-latch 释放
latch 是一种低级排队机制,用于保护 SGA 中共享内存结构。latch 就像是一种快速地被获取和释放的内存锁。用于防止共享内存结构被多个用户同时访问。如果 latch 不可用,就会记录 latch 释放失败(latch free miss )。 有两种与闩有关的类型: ■ 立刻 ■ 可以等待。假如一个进程试图在立刻模式下获得闩,而该闩已经被另外一个进程所持有,如果该闩不能立可 用的话,那么该进程就不会为获得该闩而等待。它将继续执行另一个操作。大多数 latch 问题都与以下操作相关:没有很好的是用绑定变量(library cache latch)、重作生成问题(redo allocation latch)、缓冲存储竞争问题(cache buffers LRU chain)以及 buffer cache 中的存在”热点”块,(cache buffers chain)。通常我们说,如果想设计一个失败的系统,不考虑绑定变量,这一个条件就够了,对于异构性强的系统,不使用绑定变量的后果是极其严重的。另外也有一些 latch 等待与bug有关,应当关注 Metalink 相关 bug 的公布及补丁的发布。当 latch miss ratios 大于 0.5%时,就应当研究这一问题。Oracle 的 latch 机制是竞争,其处理类似于网络里的 CSMA/CD,所有用户进程争夺 latch,对于愿意等待类型(willing-to-wait)的 latch,如果一个进程在第一次尝试中没有获得 latch,那么它会 等待并且再尝试一次,如果经过_spin_count 次争夺不能获得 latch, 然后该进程转入睡眠状态,持续一段指定长度的时间,然后再次醒来,按顺序重复以前的步骤.在 8i/9i 中默认值是_spin_count=2000。 如果 SQL 语句不能调整,在 8.1.6 版本以上,Oracle 提供了一个新的初始化参数: CURSOR_SHARING 可以通过设置 CURSOR_SHARING = force 在服务器端强制绑定变量。设置该参数可能会带来一定的副作用,对于 Java 的程序,有相关的 bug,具体应用应该关注 Metalink 的 bug 公告。
6. Log Buffer Space-日志缓冲空间
当你将日志缓冲(log buffer)产生重做日志的速度比 LGWR 的写出速度快,或者是当日志切换(log switch)太慢时,就会发生这种等待。这个等待出现时,通常表明 redo log buffer过小,为解决这个问题,可以考虑增大日志文件的大小,或者增加日志缓冲器的大小。另外一个可能的原因是磁盘I/O存在瓶颈,可以考虑使用写入速度更快的磁盘。在允许的条件下设置可以考虑使用裸设备来存放日志文件,提高写入效率。在一般的系统中,最低的标准是,不要把日志文件和数据文件存放在一起,因为通常日志文件只写不读,分离存放可以获得性能提升。
7. Log File Switch-日志文件切换
当这个等待出现时,表示所有的提交(commit)的请求都需要等待”日志文件切换”的完成。
Log file Switch主要包含两个子事件:
log file switch (archiving needed)
log file switch (checkpoint incomplete)
log file switch (archiving needed)这个等待事件出现时通常是因为日志组循环写满以后,第一个日志归档尚未完成,出现该等待。出现该等待,可能表示 io存在问题。解决办法:可以考虑增大日志文件和增加日志组移动归档文件到快速磁盘调整log_archive_max_processes。
log file switch (checkpoint incomplete)-日志切换(检查点未完成)当你的日志组都写完以后,LGWR试图写第一个 log file,如果这时数据库没有完成写出记录在第一个 log file中的 dirty块时(例如第一个检查点未完成),该等待事件出现。该等待事件通常表示你的DBWR写出速度太慢或者IO存在问题。为解决该问题,你可能需要考虑增加额外的DBWR或者增加你的日志组或日志文件大小。
8. log file sync-日志文件同步
当一个用户提交或回滚数据时,LGWR将会话期的重做由日志缓冲器写入到重做日志中。日志文件同步过程必须等待这一过程成功完成。为了减少这种等待事件,可以尝试一次提交更多的记录(频繁的提交会带来更多的系统开销)。将重做日志置于较快的磁盘上,或者交替使用不同物理磁盘上的重做日志,以降低归档对 LGWR的影响。对于软 RAID,一般来说不要使用 RAID 5,RAID5对于频繁写入得系统会带来较大的性能损失,可以考虑使用文件系统直接输入/输出,或者使用裸设备(raw device),这样可以获得写入的性能提高。
9. log file single write
该事件仅与写日志文件头块相关,通常发生在增加新的组成员和增进序列号时。头块写单个进行,因为头块的部分信息是文件号,每个文件不同。更新日志文件头这个操作在后台完成,一般很少出现等待,无需太多关注。
10. log file parallel write
从 log buffer写 redo记录到 redo log文件,主要指常规写操作(相对于 log file sync)。如果你的 Log group存在多个组成员,当 flush log buffer时,写操作是并行的,这时候此等待事件可能出现。尽管这个写操作并行处理,直到所有 I/O操作完成该写操作才会完成(如果你的磁盘支持异步IO或者使用 IO SLAVE,那么即使只有一个 redo log file member,也有可能出现此等待)。这个参数和 log file sync时间相比较可以用来衡量 log file的写入成本。通常称为同步成本率。
11. control file parallel write-控制文件并行写
当 server进程更新所有控制文件时,这个事件可能出现。如果等待很短,可以不用考虑。如果等待时间较长,检查存放控制文件的物理磁盘 I/O是否存在瓶颈。多个控制文件是完全相同的拷贝,用于镜像以提高安全性。对于业务系统,多个控制文件应该存放在不同的磁盘上,一般来说三个是足够的,如果只有两个物理硬盘,那么两个控制文件也是可以接受的。在同一个磁盘上保存多个控制文件是不具备实际意义的。减少这个等待,可以考虑如下方法:减少控制文件的个数(在确保安全的前提下)如果系统支持,使用异步 IO转移控制文件到 IO负担轻的物理磁盘
12. control file sequential read/ control file single write
控制文件连续读/控制文件单个写对单个控制文件 I/O存在问题时,这两个事件会出现。如果等待比较明显,检查单个控制文件,看存放位置是否存在 I/O瓶颈。
13. direct path write-直接路径写
该等待发生在,系统等待确认所有未完成的异步 I/O都已写入磁盘。对于这一写入等待,我们应该找到 I/O操作最为频繁的数据文件(如果有过多的排序操作,很有可能就是临时文件),分散负载,加快其写入操作。如果系统存在过多的磁盘排序,会导致临时表空间操作频繁,对于这种情况,可以考虑使用 Local管理表空间,分成多个小文件,写入不同磁盘或者裸设备。
14. Idle Event-空闲事件
最后我们来看几个空闲等待事件。一般来说,空闲等待是指系统因为无事可做的等待,或者等待用户的请求或响应等,通常我们可以忽略这些等待事件。空闲事件可以通过 stats$idle_event表查询得到。我们看一下系统的主要空闲等待事件,对这些事件大家应该有个大致的印象,如果你的 Top 5等待事件中,主要都是这些事件,那么一般来说你的系统是比价清闲的。