为了使系统吞吐量最大化,I/O管理器希望驱动程序推迟其耗时IRP的完成。驱动程序通过在某个派遣例程中调用IoMarkIrpPending函数并返回STATUS_PENDING来表示完成操作被推迟。(注意:以下讨论未加说明均指在操作被推迟情况下)
I/O管理器的原始调用者通常希望在继续执行之前等待操作完成,所以I/O管理器在处理推迟完成时有下面类似的逻辑(不代表真正的Microsoft源代码):
Irp->UserEvent = pEvent; // don't do this yourself
status = IoCallDriver(...);
if (status == STATUS_PENDING)
KeWaitForSingleObject(pEvent, ...);
以上内容可总结为:顶级驱动程序安装了一个完成例程(附注:也可不安装完成例程)并调用IoCallDriver。这个过程被重复几次,经过中间的驱动程序(中间驱动程序也可以选择安装完成例程),当IRP到达能处理它的那个驱动程序级时,派遣例程就调用IoMarkIrpPending并返回STATUS_PENDING。然后该STATUS_PENDING值按原路返回到顶级驱动程序,最后回到IRP的发起者。IRP发起者检查从IoCallDriver得到的任何值,若检查到STATUS_PENDING从而发起者将立即在那个事件上等待,直到某个代码使那个事件变为通知状态。
系统是通过让IoCompleteRequest调度APC来使那个事件变成通知状态的,对于某些IRP,IoCompleteRequest会毫无条件地调度APC,而对于某些IRP,IoCompleteRequest会检查堆栈顶部IO_STACK_LOCATION中是否设置了SL_PENDING_RETURNED标志,只有这个标志被设置时才调度APC。
调度APC的作用:该APC会做很多清理工作,比如调用IoFreeIrp释放IRP、调用KeSetEvent使IRP发起者等待的事件为通知状态等等。
“被推迟的操作”结束后的处理过程:某个能处理IRP的派遣例程返回STATUS_PENDING前会首先调用IoMarkIrpPending函数在当前的堆栈单元中设置一个名为SL_PENDING_RETURNED的标志;当被推迟的操作在将来某个时候结束时,该派遣例程中的IoCompleteRequest函数会检查到SL_PENDING_RETURNED被设置,同时它会检查上层驱动是否安装了完成例程,若未设置,则它会把当前堆栈单元的SL_PENDING_RETURNED标志复制到上一层堆栈单元中,若设置了,则在调用完成例程前它不会把当前堆栈单元的SL_PENDING_RETURNED标志复制到上一层堆栈单元中,而仅仅在IRP中设置PendingReturned标志为SL_PENDING_RETURNED标志(Windows NT就是这么设计的…),因此上层驱动的完成例程就有义务在自己的堆栈单元中设置SL_PENDING_RETURNED标志。这就是为什么我们经常在完成例程中看到这2行代码:
if (Irp->PendingReturned)
IoMarkIrpPending(Irp);
上面的过程是从堆栈下层开始逐步向上层执行的,随着SL_PENDING_RETURNED逐步向上层堆栈传递,最终最顶层堆栈单元中的SL_PENDING_RETURNED标志会被设置,从而可以保证IoCompleteRequest函数会调度APC来使IRP发起者等待的事件变为通知状态。
总结:调用IoMarkPending的作用是设置当前堆栈的SL_PENDING_RETURNED标志,最终目的是使SL_PENDING_RETURNED标志可以从下层堆栈单元逐步传递到堆栈顶部单元,这样就可以保证IoCompleteRequest函数会调度APC使IRP发起者免于永久阻塞。