目录
一、程序和进程的关系
1.程序
2.进程
2.1线程
2.2协程
3.进程与线程的区别
4.总结
4.1延伸
5.进程使用内存的问题
5.1内存泄漏——Memory Leak
5.2内存溢出——Memory Overflow
5.3内存不足——OOM(out of memory)
5.4进程使用内存出现的问题原因以及解决办法
二、进程状态
1.进程的基本状态
2.状态之间转换六种情况
3.进程更多的状态
3.1举例
4.进程之间通讯
4.1同一主机
4.2不同主机
5.进程的优先级os
6.进程分类
6.1操作系统分类
6.2进程类型:
6.3按进程资源使用的分类
三、进程管理相关命令
1.PS命令
1.1ps aux输出显示的详解
1.2ps命令常用选项
1.3ps -ef命令输出信息详解
1.4ps命令延伸
2.top命令
2.1在 top 命令的显示窗口中,还可以使用如下按键,进行一下交互操作:
2.2首部信息显示/隐藏
2.3top命令详解
3.pgrep命令
3.1想知道当前系统root一共运行了多少个进程
4.pidof命令
5.pstree命令进程树
6.lsof命令
7.Vmstat——监控系统资源
8.free
9.iostat
内核作用:进程管理、内存管理、文件系统、网络功能、驱动程序、安全功能
进程是一个具有一定独立功能的程序在一个数据集上的一次动态执行的过程,是操作系统进行资源分配和调度的一个独立单位,是应用程序运行的载体。进程是一种抽象的概念,从来没有统一的标准定义。
进程的组成/特征
进程一般由程序、数据集合和进程控制块三部分组成。
进程是硬件资源分配的最小单位;进程只负责接收任务,不处理任务;线程是真正参与到实际应用当中的;pstree -p查看到的进程及pid号情况,并不能区分出主进程下是子进程还是线程
在早期的操作系统中并没有线程的概念,进程是能拥有资源和独立运行的最小单位,也是程序执行的最小单位。任务调度采用的是时间片轮转的抢占式调度方式,而进程是任务调度的最小单位,每个进程有各自独立的一块内存,使得各个进程之间内存地址相互隔离。
协程,英文Coroutines,是一种基于线程之上,但又比线程更加轻量级的存在,这种由程序员自己写程序来管理的轻量级线程叫做『用户空间线程』,具有对内核来说不可见的特性。
每开启一个进程会消耗相应的硬件资源(内存,cpu,磁盘io(读写),磁盘剩余) ;
内存不足,及时关闭没有用的进程;硬件资源不足要对进程进行清理
pstree 可以查看进程PID号(ps=process );yum install epel-release.noarch -y(会生成一个额外源 )
如何确定一个程序多线程还是单线程
要去/proc找到程序进程号
使用cat /proc/该程序的pid号文件夹/status,可以查看该进程的线程数量
或grep -i threads /proc/该程序的pid号文件夹/status,可以查看该进程的线程数量
或 prtstat 该程序的pid号,可以查看该进程的线程数量
或prtstat 该进程的pid号 | grep -i threads,可以查看该进程的线程数量
指程序中用malloc或new申请了一块内存,但是没有用free或delete将内存释放,导致这块内存一直处于占用状态
指程序申请了10M的空间,但是在这个空间写入10M以上字节的数据,就是溢出,类似红杏出墙
OOM(out of memory)表示内存用完了,在Java程序中比较常见。系统会选一个进程将之杀死,在日志messages中看到类似下面的提示’Jul 10 10:20:30 kernel: Out of memory: Kill process 9527 (java) score 88 or sacrifice child ‘
当JVM(虚拟机)因为没有足够的内存来为对象分配空间并且垃圾回收器也已经没有空间可回收时,就会抛出这个error,因为这个问题已经严重到不足以被应用处理)。
pmap 进程id
#可以显示该进程所有进程占用信息
创建状态:进程在创建时需要申请一个空白PCB(process control block进程控制块),向其中填写控制和管理进程的信息,完成资源分配。如果创建工作无法完成,比如资源无法满足,就无法被调度运行,把此时进程所处状态称为创建状态
就绪状态:进程已准备好,已分配到所需资源,只要分配到CPU就能够立即运行
执行状态:进程处于就绪状态被调度后,进程进入执行状态
阻塞状态:正在执行的进程由于某些事件(I/O请求,申请缓存区失败)而暂时无法运行,进程受到阻塞。在满足请求时进入就绪状态等待系统调用
终止状态:进程结束,或出现错误,或被系统终止,进入终止状态。无法再执行
运行——>就绪
就绪——>运行
运行——>阻塞
阻塞——>就绪
以下两种状态是不可能发生的
阻塞——>运行
就绪——>阻塞
当一个进程结束的时候,父进程会回收子进程的硬件资源;如果子进程出现意外关闭,父进程无法收回资源,这样只回收了父进程,子进程资源无法回收就是僵尸进程。
找到STAT列为Z(表示僵尸状态)。
恢复父进程kill -18 父进程pid,使用ps aux再次查看STAT列并无Z出现,恢复成功
pipe 管道
单向传输 cmd1 | cmd 2
socket 套接字文件
双工通信
Memory-maped file 文件映射
将文件中的一段数据映射到物理内存,多个进程共享这片内存
shm shared memory 共享内存
signal 信号
Lock 对资源上锁
如果资源已被某进程锁住,则其它进程想修改甚至读取这些资源,都将被阻塞,直到锁被打开
semaphore 信号量,一种计数器
socket=IP和端口号
RPC remote procedure call 远程调用
进程优先级调整
注意:两者可相互转化
号代号 | 信号名称 | 说明 |
1 | SIGHUP | 该信号让进程立即关闭.然后重新读取配置文件之后重启 |
2 | SIGINT | 程序中止信号,用于中止前台进程。相当于输出 Ctrl+C 快捷键 |
3 | SIGQUIT | 退出 |
8 | SIGFPE | 在发生致命的算术运算错误时发出。不仅包括浮点运算错误,还包括溢出及除数为 0 等其他所有的算术运算错误 |
9 | SIGKILL | 用来立即结束程序的运行。本信号不能被阻塞、处理和忽略。般用于强制中止进程 |
14 | SIGALRM | 时钟定时信号,计算的是实际的时间或时钟时间。alarm 函数使用该信号 |
15 | SIGTERM | 正常结束进程的信号,kill 命令的默认信号。如果进程已经发生了问题,那么这 个信号是无法正常中止进程的,这时我们才会尝试 SIGKILL 信号,也就是信号 9 |
18 | SIGCONT | 该信号可以让暂停的进程恢复执行。本信号不能被阻断 |
19 | SIGSTOP | 该信号可以暂停前台进程,相当于输入 Ctrl+Z 快捷键。本信号不能被阻断 |
PS,即Process State,可以查看静态的进程当前状态的快照,默认显示当前终端中的进程,Liunx系统各进程的相关信息均保存在/proc/数字目录/status下的文件中
ps aux是查看静态的进程统计信息(默认按PID号排序)
ps -le 可以查看系统中所有的进程,而且还能看到进程的父进程PID和进程优先级
ps -l 只能看到当前Shell产生的进程
USER:该进程是由哪个用户产生的
PID :进程的 ID
%CPU :该进程占用 CPU 资源的百分比,占用的百分比越高,进程越耗费资源
%MEM :该进程占用物理内存的百分比,占用的百分比越高,进程越耗费资源
VSZ:Virtual memory SiZe,虚拟内存集,线性内存;该进程占用虚拟内存的大小,单位为 KB
RSS: ReSident Size, 常驻内存集;该进程占用实际物理内存的大小,单位为 KB
TTY :该进程是在哪个终端运行的。其中,tty1 ~ tty7 代表本地控制台终端(可以通过 Alt+F1 ~ F7 快捷键切换不同的终端),tty1~tty6 是本地的字符界面终端,tty7 是图形终端。pts/0 ~ 255 代表虚拟终端,一般是远程连接的终端,第一个远程连接占用 pts/0,第二个远程连接占用 pts/1,依次増长。?代表和终端无关,系统进程
STAT:进程状态
字母 | 含义 |
R | running该进程正在运行 |
S | interruptable sleeping该进程处于睡眠状态,可被唤醒 |
D | uninterruptable sleeping不可被唤醒的睡眠状态,通常用于 I/O 情况 |
T | stopped停止状态,可能是在后台暂停或进程处于除错状态 |
W | 内存交互状态(从 2.6 内核开始无效) |
X | 死掉的进程(应该不会出现) |
Z | zombie僵尸进程。进程已经中止,但是还是占用硬件资源 |
+ | 前线进程 |
l | 多线程进程;多线程(小写 L) |
L | 内存分页并带锁 |
N | 低优先级进程 |
< | 高优先级进程 |
s | session leader会话(子进程)发起者;包含子进程 |
I | Idle kernel thread,Centos 8新特性 |
START:该进程的启动时间
TIME:该进程占用CPU的运算时间,注意不是系统时间
COMMAND:产生此进程的命令名
ni:nice值
pri:priority 优先级
rtprio:实时优先级
psr:processor cpu编号
ps axo pid/cmd/psr/ni/pri/rtprio
选项 | 说明 |
a | 显示当前终端下的所有进程信息,包括其他用户的进程。与“x”选项结合时将示系统中所有的进程信息。 |
u | 使用以用户为主的格式输出进程信息 |
x | 显示当前用户在所有终端下的进程信息 |
-e | 显示系统内的所有进程信息 |
-l | 使用长(Long)格式显示进程信息 |
-f | 使用完整的(Full)格式显示进程 |
k --sort属性 | 对属性排序,属性前加 - 表示倒序 ps aux k -%cpu |
o属性 | 显示定制的信息 pid、cmd、%cpu、%mem |
F:进程标志,说明进程的权限,常见的标志有两个: 1:进程可以被复制,但是不能被执行;4:进程使用超级用户权限;
S:进程状态。具体的状态和"psaux"命令中的 STAT 状态一致
UID:运行此进程的用户的 ID
PID:进程的ID
PPID:父进程的ID
C:该进程的CPU使用率,单位是百分比
PRI :进程的优先级,数值越小,该进程的优先级越高,越早被 CPU 执行;系统定义不可以人为修改
NI :进程的优先级,数值越小,该进程越早被执行;可以人为修改
ADDR :该进程在内存的哪个位置
SZ :该进程占用多大内存
WCHAN :该进程是否运行。"-"代表正在运行
TTY :该进程由哪个终端产生
TIME :该进程占用 CPU 的运算时间,注意不是系统时间
CMD :产生此进程的命令名
ps axo pid,cmd,%mem,%cpu
ps aux k -%cpu
dd if=/dev/zero of=/dev/null
ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%mem | head
ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%cpu | head
ps axo pid,cmd,%cpu,%mem --sort %mem
prtstat pid号
top 命令可以动态地持续监听进程地运行状态,与此同时,该命令还提供了一个交互界面,用户可以根据需要,人性化地定制自己的输出,进而更清楚地了进程的运行状态。
选项 | 含义 |
-d 秒数 | 指定 top 命令每隔几秒更新。默认是 3 秒 |
-b | 使用批处理模式输出。一般和"-n"选项合用,用于把 top 命令重定向到文件中 |
-n 次数 | 指定 top 命令执行的次数。一般和"-"选项合用 |
-p 进程pid | 仅查看指定 ID 的进程 |
-s | 使 top 命令在安全模式中运行,避免在交互模式中出现错误 |
-u 用户名 | 只监听某个用户的进程 |
top 命令的输出内容是动态的,默认每隔 3 秒刷新一次。命令的输出主要分为两部分:
第一行 任务队列信息 | |
内容 | 说明 |
17:56:19 | 系统当前时间 |
UP 3:54 | 系统的运行时间.本机己经运行 3 小时 54分钟 |
1 user | 当前登录了一个用户 |
load average:0.00,,0.01,0.04 | 系统在之前 1 分钟、5 分钟、15 分钟的平均负载。如果 CPU 是单核的,则这个数值超过 1 就是高负载:如果 CPU 是四核的,则这个数值超过 4 就是高负载 (这个平均负载完全是依据个人经验来进行判断的,一般认为不应该超过服务器 CPU 的核数) |
第二行 进程信息 | |
内容 | 说明 |
Tasks:146 total | 系统中的进程总数 |
1 running | 正在运行的进程数 |
145 sleeping | 睡眠的进程数 |
0 stopped | 正在停止的进程数 |
0 zombie | 僵尸进程数。如果不是 0,则需要手工检查僵尸进程 |
第三行 CPU 信息 | |
内容 | 说明 |
%Cpu(s) 0.0 us | 用户模式占用的 CPU 百分比 个人用户开启的进程占用的 cpu 率 |
0.0 sy | 系统模式占用的 CPU 百分比 |
0.0 ni | 改变过优先级的用户进程占用的 CPU 百分比 |
100.0 id | 空闲 CPU 占用的 CPU 百分比 |
0.0 wa | 等待输入/输出的进程占用的 CPU 百分比 |
0.0 hi | 硬中断请求服务占用的 CPU 百分比 |
0.0 si | 软中断请求服务占用的 CPU 百分比 |
0.0 st | st(steal time)意为虚拟程序占用 cpu 时间百分比,就是当有虚拟机时,虚拟 CPU 等待实际 CPU 的时间百分比 |
第四行 物理内存信息 | |
内容 | 说明 |
Mem:1867048 total | 物理内存的总量,单位为KB |
1210112 free | 空闲的物理内存数量 |
289224 used | 己经使用的物理内存数量 |
367712 buff/cache | 作为缓冲的内存数量 |
第五行为交换分区(swap) | |
内容 | 说明 |
Swap 4194300 total | 交换分区(虚拟内存)的总大小 |
4194300 free | 空闲交换分区的大小 |
0 used | 已经使用的交换分区的大小 |
1387184 avail Mem | 作为缓存的交换分区的大小 |
缓冲(buffer)和缓存(cache)的区别
简单来说,缓存(cache)是用来加速数据从硬盘中"读取"的,而缓冲(buffer)是用来加速数据"写入"硬盘的。
表头 | 含义 |
PID | 进程的ID |
USER | 该进程所属的用户 |
PR | 优先级,数值越小优先级越高 |
NI | 优先级,数值越小优先级越高 |
VIRT | 该进程使用的虚拟内存的大小,单位为KB |
RES | 该进程使用的物理内存的大小,单位为KB |
SHR | 共享内存大小,单位为KB |
S | 进程状态 |
%CPU | 该进程占用CPU的百分比 |
%MEM | 该进程占用内存的百分比 |
TIME+ | 该进程共占用的CPU时间 |
COMMAND | 进程的命令名 |
根据特定条件查询进程PID信息
选项 | 含义 |
-U | 指定用户 |
-l | 显示进程名 |
-a | 显示完整格式的进程名 |
-p pid | 显示指定进程的子进程 |
可以通过查询程序名,找到其pid号
[root@localhost ~]#pidof nginx
#查看 nginx进程的 pid 号
以树形结构列出进程信息
选项 | 含义 |
-a | 显示启动每个进程对应的完整指令,包括启动进程的路径、参数等 |
-p | 显示PID |
-T | 不显示线程thread,默认显示线程 |
-u | 显示用户切换 |
-H | pid 高亮显示指定进程及其前辈进程 |
[root@test ~]# pstree 1
#查看进程号为1的进程
[root@test ~]# pstree lisi
#查看用户lisi的进程
[root@test ~]# pstree -pH 1780
#高亮
lsof 命令,“list opened files”的缩写,直译过来,就是列举系统中已经被打开的文件。通过 lsof 命令,我们就可以根据文件找到对应的进程信息,也可以根据进程信息找到进程打开的文件。
选项 | 含义 |
-c字符串 | 只列出以字符串开头的进程打开的文件 |
+d目录名 | 列出某个目录中所有被进程调用的文件 |
-u用户名 | 只列出某个用户的进程打开的文件 |
-p pid | 列出某个PID进程打开的文件 |
-i 端口号 | 查看哪些进程占用了端口 |
[root@localhost ~]# lsof | more
#查询系统中所有进程调用的文件
误删文件可以找回
有人在使用
lsof |grep delete
cupsd 1144(pid) root 10r REG 253,0 2337 9381005 /etc/passwd+ (deleted)
ll /proc/1144/fd
fd 是文件描述符
[root@localhost data]#ll /proc/1144/fd
总用量 0
lr-x------. 1 root root 64 11月 29 11:26 0 -> /dev/null
lrwx------. 1 root root 64 11月 29 11:26 1 -> socket:[20288]
lr-x------. 1 root root 64 11月 29 11:26 10 -> /etc/passwd+ (deleted)
lrwx------. 1 root root 64 11月 29 11:26 11 -> socket:[24022]
lrwx------. 1 root root 64 11月 29 11:26 12 -> socket:[24023]
cat /proc/1144/fd/10
如果你想动态的了解一下系统资源的使用状况,以及查看当前系统中到底是哪个环节最占用系统资源,就可以使用 vmstat 命令。
vmstat命令,是 Virtual Meomory Statistics(虚拟内存统计)的缩写,可用来监控 CPU 使用、进程状态、内存使用、虚拟内存使用、硬盘输入/输出状态等信息。
字段 | 含义 |
procs | 进程信息字段: -r:等待运行的进程数,数量越大,系统越繁忙。 -b:不可被唤醒的进程数量,数量越大,系统越繁忙。 |
memory | 内存信息字段: -swpd:虚拟内存的使用情况,单位为 KB。 -free:空闲的内存容量,单位为 KB。 -buff:缓冲的内存容量,单位为 KB。 -cache:缓存的内存容量,单位为 KB。 |
swap | 交换分区信息字段: -si:从磁盘中交换到内存中数据的数量,单位为 KB。 -so:从内存中交换到磁盘中数据的数量,单位为 KB。 这两个数越大,表明数据需要经常在磁盘和内存之间进行交换,系统性能越差。 |
io | 磁盘读/写信息字段: -bi:从块设备中读入的数据的总量,单位是块。 -bo:写到块设备的数据的总量,单位是块。 这两个数越大,代表系统的 I/O 越繁忙。 |
system | 系统信息字段: -in:每秒被中断的进程次数。 -cs:每秒进行的事件切换次数。 这两个数越大,代表系统与接口设备的通信越繁忙。 |
cpu | CPU信息字段: -us:非内核进程消耗 CPU 运算时间的百分比。 -sy:内核进程消耗 CPU 运算时间的百分比。 -id:空闲 CPU 的百分比。 -wa:等待 I/O 所消耗的 CPU 百分比。 -st:被虚拟机所盗用的 CPU 百分比 。 |
通过分析 vmstat 命令的执行结果,可以获得一些与当前 Linux 运行性能相关的信息。比如说:
总的来说,vmstat 命令的输出结果中,我们应该重点注意 procs 项中 r 列的值,以及 CPU 项中 us 列、sy 列和 id 列的值。
查看内存占用情况
iostat 可以提供更丰富的IO性能状态数据
选项 | 含义 |
-c | 只显示cpu行 |
-d | 显示设备(磁盘)使用状态 |
-k | 以千字节为单位显示输出 |
-t | 在输出中包含时间戳 |
-x | 在输出中包含扩展的磁盘指标 |