浅谈linux进程调度

       Linux是一种分时操作系统,也就是实现进程到进程的快速切换,让用户感到好像同时进行了多个线程。类似于操作系统中说到的时间片轮转调度算法。

进程调度时机与进程切换

       进程调度的时机有哪些呢?一般来说有三种情况。

       • 中断处理过程(包括时钟中断、I/O中断、系统调用和异常)中,直接调用schedule(),或者返回用户态时根据need_resched标记调用schedule();

        内核线程可以直接调用schedule()进行进程切换,也可以在中断处理过程中进行调度,也就是说内核线程作为一类的特殊的进程可以主动调度,也可以被动调度;

        用户态进程无法实现主动调度,仅能通过陷入内核态后的某个时机点进行调度,即在中断处理过程中进行调度。

      那进程是如何切换的呢?

  • 为了控制进程的执行,内核必须有能力挂起正在CPU上执行的进程,并恢复以前挂起的某个进程的执行,这叫做进程切换、任务切换、上下文切换;

  • 挂起正在CPU上执行的进程,与中断时保存现场是不同的,中断前后是在同一个进程上下文中,只是由用户态转向内核态执行;

  • 进程上下文包含了进程执行需要的所有信息

    • 用户地址空间: 包括程序代码,数据,用户堆栈等

    • 控制信息 :进程描述符,内核堆栈等

    • 硬件上下文(注意中断也要保存硬件上下文只是保存的方法不同)

  • schedule()函数选择一个新的进程来运行,并调用context_switch进行上下文的切换,这个宏调用switch_to来进行关键上下文切换

    • next = pick_next_task(rq, prev);//进程调度算法都封装这个函数内部
    • context_switch(rq, prev, next);//进程上下文切换
    • switch_to利用了prev和next两个参数:prev指向当前进程,next指向被调度的进程


Linux一般执行过程

       

       最一般的情况:正在运行的用户态进程X切换到运行用户态进程Y的过程

     正在运行的用户态进程X

     发生中断——save cs:eip/esp/eflags(current) to kernel stack,then load cs:eip(entry of a specific ISR) and ss:esp(point to kernel stack).

     SAVE_ALL //保存现场

      中断处理过程中或中断返回前调用了schedule(),其中的switch_to做了关键的进程上下文切换

     标号1之后开始运行用户态进程Y(这里Y曾经通过以上步骤被切换出去过因此可以从标号1继续执行)

     •   restore_all //恢复现场

    •  iret - pop cs:eip/ss:esp/eflags from kernel stack

     继续运行用户态进程Y


       几种特殊情况


  • 通过中断处理过程中的调度时机,用户态进程与内核线程之间互相切换和内核线程之间互相切换,与最一般的情况非常类似,只是内核线程运行过程中发生中断没有进程用户态和内核态的转换;

  • 内核线程主动调用schedule(),只有进程上下文的切换,没有发生中断上下文的切换,与最一般的情况略简略;

  • 创建子进程的系统调用在子进程中的执行起点及返回用户态,如fork;

  • 加载一个新的可执行程序后返回到用户态的情况,如execve;


schedule()函数分析


浅谈linux进程调度_第1张图片

浅谈linux进程调度_第2张图片

    schedule()函数实现了进程的调度。它的任务就是从运行队列的链表里找到一个进程,然后将cpu的资源分配给他。有直接调用和延迟调用两种。

        schedule()函数的任务之一是用另外一个进程来替换当前正在执行的进程。因此,该函数的关键结果是设置一个叫做next的变量,使它指向被选中的进程,该进程将取代当前进程。如果系统中没有优先权高于当前进程的可运行进程,最终next与current相等,不发生任何进程切换。schedule( )函数在一开始,先禁用内核抢占并初始化一些局部变量。下一步,schedule( )要保证prev不占用大内核锁。接下来,schedule()检查prev的状态。

    现在schedule( )函数已经要让next 进程投入运行。内核将立刻访问next 进程的thread_info数据结构,它的地址存放在next进程描述符的接近顶部的位置。

    schedule( )函数中在switch_to宏之后紧接着的指令并不由next进程立即执行,而是稍后当调度程序选择prev又执行时由prev执行。然而,在那个时刻,prev局部变量并不指向我们开始描述schedule( )时所替换出去的原来那个进程,而是指向prev被调度时由prev替换出的原来那个进程。

switch_to宏


浅谈linux进程调度_第3张图片

       

       进程切换的第二步由switch_to宏执行。它是内核中与硬件关系最密切的例程之一。

       首先,该宏有三个参数,它们是prev,nextlastprevnext的作用是输入参数,分别表示被替换进程和新进程描述符的地址在内存中的位置。那第三个参数last呢?在任何进程切换中,涉及到三个进程而不是两个。假设内核决定暂停进程A而激活里程B。schedule()函数中,prev指向A的描述符而next指向B的描述符。switch_to宏一但使A暂停,A的执行流就冻结。schedule()执行过程中,参数last指向A的局部变量prev,所以prevC的地址覆盖。

       switch_to汇编代码解读:在eaxedx寄存器中分别保存prevnext的值。eflagsebp寄存器的内容保存在prev内核栈中。必須保存它们的原因是编译器认为在switch_to结束之前它们的值应当保持不变。esp的内容保存到prev->thread.esp中以使该字段指向prev内核栈的栈顶:next->thread.esp装入esp.此时,内核开始在next的内核栈上操作,因此这条指令实际上完成了从prevnext的切换。由于进程描述符的地址和内核栈的地址紧挨着,所以改变内核栈意味着改变进程。把标记为1的地址存入prev->thread.eip。当被替换的进程重新恢复执行时,进程执行被标记为1的那条指令:宏把next->thread.eip的值压入next的内核栈。跳到__switch_to()C函数这里被进程B替换的进程A再次获得CPU;它执行一些保存eflagsebp寄存器内容的指令,这两条指令的第一条指令被标记为1拷贝eax寄存器的内容到switch_to宏的第三个参数lash标识的内存区域中。


总结

       借用这样一张图来说明linux系统一般执行过程。其中以最常见的ls命令为例。
        浅谈linux进程调度_第4张图片
       
        卢鹏  原创作品转载请注明出处  
      (部分内容引用网上资源,如有不当之处,可与本人联系)


你可能感兴趣的:(linux课程)