Linux ps命令及进程状态简介

查看进程状态


在Linux常用以下两个命令查看进程状态:

ps -ef
ps aux

这两个命令都可以列出所有进程及其状态,具体各命令的含义可以参考man手册。

下文以使用ps aux为例,会列出 USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND各列。

本文主要探讨列出的信息中的STAT列,它表示的是当前进程的状态。

进程状态


进程的状态可能是R(task_running)、S(task_interruptible)、D(task_uninterruptible)、T(task_stopped/task_traced)、Z(task_dead/exit_zombie)、X(task_dead/exit_dead),具体如下:

  • R: 可执行状态。

    • 只有在该状态的进程才可能在CPU上运行。
    • 同一时刻可能有多个进程处于可执行状态,这些进程的task_struct结构(进程控制块)被放入对应CPU的可执行队列中(一个进程最多只能出现在一个CPU的可执行队列中)。
    • 进程调度器的任务就是从各个CPU的可执行队列中分别选择一个进程在该CPU上运行。
  • S: 可中断的睡眠状态。

    • 处于这个状态的进程因为等待某某事件的发生(比如等待socket连接、等待信号量),而被挂起。
    • 这些进程的task_struct结构被放入对应事件的等待队列中。
    • 当这些事件发生时(由外部中断触发、或由其他进程触发),对应的等待队列中的一个或多个进程将被唤醒。
    • 一般情况下,进程列表中的绝大多数进程都处于TASK_INTERRUPTIBLE状态(除非机器的负载很高)。
  • D: 不可中断的睡眠状态。

    • 与TASK_INTERRUPTIBLE状态类似,进程处于睡眠状态,但是此刻进程是不可中断的。
    • 不可中断,指的并不是CPU不响应外部硬件的中断,而是指进程不响应异步信号,如kill -9将不能杀死该进程。
    • TASK_UNINTERRUPTIBLE状态存在的意义就在于,内核的某些处理流程是不能被打断的(一般是底层操作,并且该状态通常非常短暂,ps基本捕获不到)。
  • T: 暂停状态或跟踪状态。

    • 当进程正在被跟踪时,它处于TASK_TRACED这个特殊的状态。“正在被跟踪”指的是进程暂停下来,等待跟踪它的进程对它进行操作(如gdb中对进程下一个断点)。
    • 向进程发送一个SIGSTOP信号,它就会因响应该信号而进入TASK_STOPPED状态(除非该进程本身处于TASK_UNINTERRUPTIBLE状态而不响应信号)。
    • 向进程发送一个SIGCONT信号,可以让其从TASK_STOPPED状态恢复到TASK_RUNNING状态。
    • 对于进程本身来说,TASK_STOPPED和TASK_TRACED状态很类似,都是表示进程暂停下来。
    • 而TASK_TRACED状态相当于在TASK_STOPPED之上多了一层保护,处于TASK_TRACED状态的进程不能响应SIGCONT信号而被唤醒。只能等到调试进程通过ptrace系统调用执行PTRACE_CONT、PTRACE_DETACH等操作(通过ptrace系统调用的参数指定操作),或调试进程退出,被调试的进程才能恢复TASK_RUNNING状态。
  • Z: 退出状态,进程成为僵尸进程。

    • 进程在退出的过程中,处于TASK_DEAD状态。
    • 退出过程中,进程占有的所有资源将被回收,除了task_struct结构(以及少数资源)以外。于是进程就只剩下task_struct这么个空壳,故称为僵尸。
    • 之所以保留task_struct,是因为task_struct里面保存了进程的退出码、以及一些统计信息。而其父进程很可能会关心这些信息(如shell中的$?变量)。
    • 父进程可以通过wait系列的系统调用(如wait4、waitid)来等待某个或某些子进程的退出,并获取它的退出信息。然后wait系列的系统调用会顺便将子进程的尸体(task_struct)也释放掉。
    • 子进程在退出的过程中,内核会给其父进程发送一个信号,通知父进程来“收尸”。这个信号默认是SIGCHLD,但是在通过clone系统调用创建子进程时,可以设置这个信号。
    • 当进程退出的时候,会将它的所有子进程都托管给别的进程(可能是退出进程所在进程组的下一个进程,或者是1号进程)。所以每个进程、每时每刻都有父进程存在。除非它是1号进程。
    • 1号进程,pid为1的进程,又称init进程。系统启动后,第一个被创建的用户态进程就是init进程。它不会被暂停、也不会被杀死(这是由内核来保证的)。它在等待子进程退出的过程中处于TASK_INTERRUPTIBLE状态,“收尸”过程中则处于TASK_RUNNING状态。
    • 对于用户应用程序,如果进程退出后仍然存在僵尸进程,则说明程序内有bug,有进程退出后没有被清理。
  • X: 退出状态,进程即将被销毁。

    • 而进程在退出过程中也可能不会保留它的task_struct。比如这个进程是多线程程序中被detach过的线程,或者父进程通过设置SIGCHLD信号的handler为SIG_IGN,显式的忽略了SIGCHLD信号。
    • 此时,进程将被置于EXIT_DEAD退出状态,这意味着接下来的代码立即就会将该进程彻底释放
    • EXIT_DEAD状态是非常短暂的,几乎不可能通过ps命令捕捉到。

进程状态的变迁


进程是通过fork系列的系统调用(fork、clone、vfork)来创建的,内核(或内核模块)也可以通过kernel_thread函数创建内核进程。

这些创建子进程的函数本质上都完成了相同的功能——将调用进程复制一份,得到子进程。(可以通过选项参数来决定各种资源是共享、还是私有。)

尽管进程状态有好几种,但是进程状态的变迁却只有两个方向:

  • 从TASK_RUNNING状态变为非TASK_RUNNING状态
  • 从非TASK_RUNNING状态变为TASK_RUNNING状态

具体来说:

  • 进程从非TASK_RUNNING状态变为TASK_RUNNING状态,是由别的进程(也可能是中断处理程序)执行唤醒操作来实现的。执行唤醒的进程设置被唤醒进程的状态为TASK_RUNNING,然后将其task_struct结构加入到某个CPU的可执行队列中。于是被唤醒的进程将有机会被调度执行。
  • 进程从TASK_RUNNING状态变为非TASK_RUNNING状态,则有两种途径:
    • 响应信号而进入TASK_STOPED状态、或TASK_DEAD状态
    • 执行系统调用,如主动进入TASK_INTERRUPTIBLE状态(如nanosleep系统调用)、或TASK_DEAD状态(如exit系统调用);或由于执行系统调用需要的资源得不到满足,而进入TASK_INTERRUPTIBLE状态或TASK_UNINTERRUPTIBLE状态(如select系统调用)。
小结

查看进程状态是调试Linux程序的必备技能,一般情况下,进程状态会是前三种情况。

在程序调试中,处于Z状态的程序也不少见,通过查看进程状态,方便定位问题。

参考资料

Linux进程状态解析 之 R、S、D、T、Z、X (主要有三个状态)

你可能感兴趣的:(Linux基础学习)