程序:是完成特定任务的一串代码
运行中的程序的一个副本,是被载入内存的一个指令集合,是分配资源的单位
进程ID(Process ID,PID)号码被用来标记各个进程
UID、GID语境决定对文件系统的存取和访问权限
通常从执行进程的用户来继承
存在生命周期
都由其父进程创建
进程创建:centos6 的第一个进程是init,centos7的第一个进程是systemd
进程的特性:动态性 并发性 独立性 结构性
动态性:进程是程序的一次执行过程,是临时的,有生命周期的,是动态生成,动态消亡的
并发性:任何进程都可以同其他进程一起并发执行
独立性:进程是系统进行资源分配和调度的一个独立单位
结构性:进程由程序,数据和进程控制块三部分组成
僵尸进程:一个进程结束了,如果该进程的父进程已经结束了,那么该进程就变成了僵尸进程。
父进程退出了,子进程没有退出,那么这些子进程就没有父进程来管理了,就变成了僵尸进程
如何过滤僵尸进程:ps aux |grep -v |grep Z
如果结束僵尸进程:最快的方法,重启
注意:僵尸进程本身所占的资源很小,不处理也行
进程使用内存的一些问题 :
内存泄漏:Memory Leak
指程序中用malloc或new申请了一块内存,但是没有用free或delete将内存释放,导致这块内存一直处于占用状态
内存溢出:Memory Overflow
指程序申请了10M的空间,但是在这个空间写入10M以上字节的数据,就是溢出,类似红杏出墙
内存不足:OOM
OOM 即 Out Of Memory,“内存用完了”
ps(process state)
可以查看进程当前状态的快照,默认显示当前终端中的进程,linux系统的各进程的相关信息均保存在/proc/pid号/status下的文件中
常用选项:
a:显示当前终端下的所有进程信息,包括其他用户的信息。与x选项结合时将显示系统中所有的进程信息
u:使用以用户为主的格式输出进程信息
x:显示当前用户在所有终端下的进程信息
-e:显示系统内的所有进程信息
-l:使用长格式显示进程信息
-e:显示系统内的所有进程信息
-f:使用完整的格式显示进程信息
k: 对属性排序,属性前加-表示倒序 ps aux -%cpu cpu的倒序显示
o:属性 选项 显示定制的信息 pid,cmd,%cpu,%mem
查看静态的进程统计信息
ps aux 可以查看系统中所有的进程
ps -le 可以查看系统中所有的进程,而且还能看到进程的父进程的PID和进程优先级
ps -l 只能看到当前的登录产生的进程
支持三种选项:
UNIX选项 如: -A -e
GNU选项 如: --help
BSD选项 如: a
ps的输出属性
ps aux
USER :该进程是由哪个用户产生的
PID:进程的ID
%CPU:该进程占用cpu资源的百分比,占有的百分比越高,进程越消耗资源
%MEM:该进程占用物理内存的百分比,占有的百分比越高,进程越消耗资源
VSZ:该进程占用虚拟内存的大小,单位为 KB。
RSS:该进程占用实际物理内存的大小,单位为 KB
TTY:该进程是在哪个终端运行的
tty1-7代表本地控制台终端(可以通过 Alt+F1 ~ F7 快捷键切换不同的终端 )
tty1-6是本地的字符界面终端,tty7是图形终端
pts/0-255代表虚拟终端,一般是远程连接的终端,第一个远程连接占用的是pts/0,第二个是pts/1,依次增长
?代表和终端无关,系统进程
STAT:进程状态
R:该进程正在运行
S:该进程处于睡眠状态,可被唤醒
D:不可被唤醒的睡眠状态,通常用于I/O情况
T:停止状态,可能是在后台暂停或进程处于除错状态
W:内存交换状态(2.6内核开始失效)
X:死掉的进程(应该不会出现)
Z:僵尸进程
<:高优先级(一下状态会在BSD格式中出现)
N:低优先级
L:被缩入内存
s:包含子进程
l:多线程(小写L)
+:位于后台
START:该进程的启动时间
TIME:该进程占用CPU的运算时间,注意不是系统时间
COMMAND:产生该进程的命令名
ps -l
F:进程标志,说明进程的权限
常见的标志有两个:
1:进程可以被复制,但是不能被执行 4:进程使用超级用户权限
S:进程状态。具体的状态和"psaux"命令中的 STAT 状态一致
UID:运行此进程的用户ID
PID:进程的ID
PPID:父进程的ID
C:该进程的CPU使用率,单位是百分比
PRI:进程的优先级,数值越小,该进程的优先级越高,越早被 CPU 执行;系统定义不可以人为修改
NI:进程的优先级,数值越小,该进程越早被执行;可以人为修改
ADDR:该进程在内存的哪个位置
SZ:该进程占用多大内存
WCHAN:该进程是否运行。"-"代表正在运行
TTY:该进程由哪个终端产生
TIME:该进程占用 CPU 的运算时间,注意不是系统时间
CMD:产生此进程的命令名
linux中,表示进程优先级的有两个参数:PRI 和 NI
其中,PRI 代表 Priority,NI 代表 Nice。这两个值都表示优先级,数值越小代表该进程越优先被 CPU 处理。不过,PRI值是由内核动态调整的,用户不能直接修改
所以我们只能通过修改 NI 值来影响 PRI 值,间接地调整进程优先级
修改 NI 值时有几个注意事项:
NI 范围是 -20~19。
普通用户调整 NI 值的范围是 0~19,而且只能调整自己的进程。
普通用户只能调高 NI 值,而不能降低。如原本 NI 值为 0,则只能调整为大于 0。
只有 root 用户才能设定进程 NI 值为负值,而且可以调整任何用户的进程。
查看进程信息 prtstat
prtstat pid号
ps 命令可以一次性给出当前系统中进程状态,但使用此方式得到的信息缺乏时效性,并且,如果管理员需要实时监控进程运行情况,就必须不停地执行 ps 命令,这显然是缺乏效率的。
为此,Linux 提供了 top 命令。top 命令可以动态地持续监听进程地运行状态,与此同时,该命令还提供了一个交互界面,用户可以根据需要,人性化地定制自己的输出,进而更清楚地了进程的运行状态。
选项:
-d:秒数,指定top命令每隔几秒更新。默认是3秒
-b:使用批处理模式输出。一般和 -n 选项合用,用于把top命令重定向到文件中
-n:次数 指定top命令执行的次数。一般和-b合用
-p:进程PID:仅查看指定ID的进程
-s:使top命令在安全模式中运行,避免在交互模式中出现错误
-u:用户名:只监听某个用户的进程
在top命令的显示窗口中,还可以使用如下按键,进行一下交互操作:
?或 h:显示交互模式的帮助
c:按照cpu的使用率排序,默认就是此选项
m:按照内存的使用率排序
n:按照PID排序
t:按照CPU的累积运算时间排序,也就是按照TIME+排序
k:按照PID给予某个进程一个信号。一般用于中止某个进程,信号9就是强制中止的信号
r:按照PID给某个进程重设优先级值
q:退出top命令
top 命令的输出内容是动态的,默认每隔 3 秒刷新一次。命令的输出主要分为两部分:
第一部分是前五行,显示的是整个系统的资源使用状况,我们就是通过这些输出来判断服务器的资源使用状态的
第二部分从第六行开始,显示的是系统中进程的信息
第一部分
top - 10:06:37 up 5:36, 3 users, load average: 0.00, 0.01, 0.05
Tasks: 204 total, 1 running, 202 sleeping, 1 stopped, 0 zombie
%Cpu(s): 0.0 us, 0.0 sy, 0.0 ni,100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 1867048 total, 74348 free, 755112 used, 1037588 buff/cache
KiB Swap: 4194300 total, 4191856 free, 2444 used. 878688 avail Mem
第一行为任务队列信息,具体内容如表 所示。
内 容 | 说 明 |
---|---|
12:26:46 | 系统当前时间 |
up 1 day, 13:32 | 系统的运行时间.本机己经运行 1 天 13 小时 32 分钟 |
2 users | 当前登录了两个用户 |
load average: 0.00,0.00,0.00 | 系统在之前 1 分钟、5 分钟、15 分钟的平均负载。如果 CPU 是单核的,则这个数值超过 1 就是高负载:如果 CPU 是四核的,则这个数值超过 4 就是高负载 (这个平均负载完全是依据个人经验来进行判断的,一般认为不应该超过服务器 CPU 的核数) |
第二行为进程信息,具体内容如表
内 容 | 说 明 |
---|---|
Tasks: 95 total | 系统中的进程总数 |
1 running | 正在运行的进程数 |
94 sleeping | 睡眠的进程数 |
0 stopped | 正在停止的进程数 |
0 zombie | 僵尸进程数。如果不是 0,则需要手工检查僵尸进程 |
第三行为 CPU 信息,具体内容如表
内 容 | 说 明 |
---|---|
Cpu(s): 0.1 %us | 用户模式占用的 CPU 百分比 个人用户开启的进程占用的 cpu 率 |
0.1%sy | 系统模式占用的 CPU 百分比 |
0.0%ni | 改变过优先级的用户进程占用的 CPU 百分比 |
99.7%id | 空闲 CPU 占用的 CPU 百分比 |
0.1%wa | 等待输入/输出的进程占用的 CPU 百分比 1 |
0.0%hi | 硬中断请求服务占用的 CPU 百分比 |
0.1%si | 软中断请求服务占用的 CPU 百分比 |
0.0%st | st(steal time)意为虚拟程序占用 cpu 时间百分比,就是当有虚拟机时,虚拟 CPU 等待实际 CPU 的时间百分比 |
第四行为物理内存信息,具体内容如表buff cache
内 容 | 说 明 |
---|---|
Mem: 625344k total | 物理内存的总量,单位为KB |
571504k used | 己经使用的物理内存数量 |
53840k&free | 空闲的物理内存数量。我们使用的是虚拟机,共分配了 628MB内存,所以只有53MB的空闲内存 |
65800k buffers | 作为缓冲的内存数量 |
第五行为交换分区(swap)信息,如表
内 容 | 说 明 |
---|---|
Swap: 524280k total | 交换分区(虚拟内存)的总大小 |
Ok used | 已经使用的交换分区的大小 |
524280k free | 空闲交换分区的大小 |
409280k cached | 作为缓存的交换分区的大小 |
通过 top 命令的第一部分就可以判断服务器的健康状态。如果 1 分钟、5 分钟、15 分钟的平均负载高于你的cpu核数的1.5倍,则证明系统压力较大。如果 CPU 的使用率过高或空闲率过低,则证明系统压力较大。如果物理内存的空闲内存过小,则也证明系统压力较大
这时,我们就应该判断是什么进程占用了系统资源。如果是不必要的进程,就应该结束这些进程;如果是必需进程,那么我们该増加服务器资源(比如増加虚拟机内存),或者建立集群服务器
缓冲(buffer)和缓存(cache)的区别:
缓存(cache)是在读取硬盘中的数据时,把最常用的数据保存在内存的缓存区中,再次读取该数据时,就不去硬盘中读取了,而在缓存中读取。
缓冲(buffer)是在向硬盘写入数据时,先把数据放入缓冲区,然后再一起向硬盘写入,把分散的写操作集中进行,减少磁盘碎片和硬盘的反复寻道,从而提高系统性能。
第二部分
top 命令的第二部分输出,主要是系统进程信息,各个字段的含义如下:
PID:进程的 ID。
USER:该进程所属的用户。
PR:优先级,数值越小优先级越高。
NI:优先级,数值越小、优先级越高。
VIRT:该进程使用的虚拟内存的大小,单位为 KB。
RES:该进程使用的物理内存的大小,单位为 KB。
SHR:共享内存大小,单位为 KB。
S:进程状态。
%CPU:该进程占用 CPU 的百分比。
%MEM:该进程占用内存的百分比。
TIME+:该进程共占用的 CPU 时间。
COMMAND:进程的命令名。
pgrep 查看指定的进程
选项:-U 指定用户
-l 显示进程名
-a 显示完整格式的进程名
-P pid:显示指定进程的子进程
已知程序名不知道pid号
pidof 程序名
以树形结构列出进程信息
选项:
-a 显示启动每个进程对应的完整指令,包括启动进程的路径、参数等
-p 显示PID
-T 不显示线程thread,默认显示线程
-u 显示用户切换
-H pid 高亮显示指定进程及其前辈进程
lsof(list opened files)列举系统中已经被打开的文件
选项:
-c 字符串 只列出以字符串开头的进程打开的文件
+d 目录名 列出某个目录中所有被进程调用的文件
-u 用户名 只列出某个用户的进程打开的文件
-p pid 列出某个 PID 进程打开的文件
free 内存
free -h
free -m #以m为单位查看
echo 3 > /proc/sys/vm/drop_caches 清除缓存
pmap 1073
查看进程占用 内存的详细信息
前台运行:会影响当前终端的操作
后台运行:不影响当前终端的操作
命令 & :将尚未执行的命令放入后台运行
运行中的命令:Ctrl+z 放到后台,但会停止运行
jobs:看后台的任务列表
fg 数字:把指定数字的任务调回前台
bg 数字:开启后台指定数字的任务
kill 结束进程
kill [信号] PID
kill 命令是按照 PID 来确定进程的,所以 kill 命令只能识别 PID,而不能识别进程名。Linux 定义了几十种不同类型的信号,读者可以使用 kill -l 命令查看所有信号及其编号,这里仅列出几个常用的信号
信号编号 | 信号名 | 含义 |
---|---|---|
0 | EXIT | 程序退出时收到该信息。 |
1 | HUP | 挂掉电话线或终端连接的挂起信号,这个信号也会造成某些进程在没有终止的情况下重新初始化。 |
2 | INT | 表示结束进程,但并不是强制性的,常用的 "Ctrl+C" 组合键发出就是一个 kill -2 的信号。 |
3 | QUIT | 退出。 |
9 | KILL | 杀死进程,即强制结束进程。 |
11 | SEGV | 段错误。 |
15 | TERM | 正常结束进程,是 kill 命令的默认信号。 |
killall
killall 范围结束进程
killall [选项] [信号] 进程名
选项:
-i:交互式,询问是否要杀死某个进程;
-I:忽略进程名的大小写;
killall 也是用于关闭进程的一个命令,但和 kill 不同的是,killall 命令不再依靠 PID 来杀死单个进程,而是通过程序的进程名来杀死一类进程,也正是由于这一点,该命令常与 ps、pstree 等命令配合使用
一次性的计划任务 at
at 时间
ctrl +d 提交
atq 可以查看任务列表
atrm 任务序列号 可以删除任务
/etc/at.allow 默认所有用户不可以使用 at 只有在at.allow文件中的用户才可以使用at命令
/etc/at.deny 默认所有用户可以使用at 只有在里面的不可以写
周期性的计划任务 crontab
crontab -e 编辑计划任务
crontab -l 查看任务列表
* * * * *
第一个* 哪一分钟 0-59
第二个* 哪一个小时 0-23
第三个* 哪一个天 1-31
第四个* 哪一个月 1-12
第五个* 星期几 0-7 0和7代表星期天
在书写 crontab 定时任务时,需要注意以下几个事项:
5 个选项都不能为空,必须填写。如果不确定,则使用“*”代表任意时间。
crontab 定时任务的最小有效时间是分钟,最大有效时间是月。像 2018 年某时执行、3 点 30 分 30 秒这样的时间都不能被识别。
在定义时间时,日期和星期最好不要在一条定时任务中出现,因为它们都以天为单位,非常容易让管理员混淆。
在定时任务中,不管是直接写命令,还是在脚本中写命令,最好都使用绝对路径。有时使用相对路径的命令会报错。