目录
1.什么是进程
2.进程的属性
3.ps查看系统进程
(1)常用的选项组合是 ps -aux
(2)ps常用的参数: ps -ef
4.uptime查看系统负载
5.top命令
(1)top执行后各行内容含义
(2)top快捷键:
6.lsof命令
7.pstree
8.kill关闭进程
9.进程的优先级管理
10.实战:使用screen后台实时执行命令备份命令
(1) screen概述和安装
(2)screen使用方法
进程是已启动的可执行程序的运行实例,进程有以下组成部分:
程序: 二进制文件,静态 如/bin/date, /usr/sbin/sshd
进程: 是程序运行的过程, 动态,有生命周期及运行状态。
下图所示的是进程的生命周期:
描述如下:
父进程复制自己的地址空间(fork [fɔ:k] 分叉)创建一个新的(子)进程结构。每个新进程分配一个唯一的进程 ID (PID),满足跟踪安全性之需。PID 和 父进程 ID (PPID)是子进程环境的元素,任何进程都可以创建子进程,所有进程都是第一个系统进程的后代。
centos5或6PID为1的进程是: init
centos7 PID为1的进程是: systemd
僵尸进程:一个进程使用fork创建子进程,如果子进程退出,而父进程并没有调用wait或waitpid获取子进程的状态信息,那么子进程的进程描述符仍然保存在系统中。这种进程称之为僵尸进程。
用自己的话表达:父进程退出了, 子进程没有退出, 那么这些子进程就没有父进程来管理了,就变成僵尸进程。
- 进程ID(PID):是唯一的数值,用来区分进程
- 父进程的ID(PPID)
- 启动进程的用户ID(UID)和所归属的组(GID)
- 进程状态:状态分为运行R、休眠S、僵尸Z
- 进程执行的优先级
- 进程所连接的终端名
- 进程资源占用:比如占用资源大小(内存、CPU占用量)
参数解释:
- a: 显示跟当前终端关联的所有进程
- u: 基于用户的格式显示(U: 显示某用户ID所有的进程)
- x: 显示所有进程,不以终端机来区分
注: 最后一列[xxxx] 使用方括号括起来的进程是内核态的进程。 没有括起来的是用户态进程。
上面的参数输出每列含意:
- USER: 启动这些进程的用户
- PID: 进程的ID
- %CPU 进程占用的CPU百分比;
- %MEM 占用内存的百分比;
- VSZ:进程占用的虚拟内存大小(单位:KB)
- RSS:进程占用的物理内存大小(单位:KB)
- STAT:该程序目前的状态,Linux进程有5种基本状态:
- R :该程序目前正在运作,或者是可被运作;
- S :该程序目前正在睡眠当中 (可说是 idle 状态啦!),但可被某些讯号(signal) 唤醒。
- T :该程序目前正在侦测或者是停止了;
- Z :该程序应该已经终止,但是其父程序却无法正常的终止他,造成 zombie (疆尸) 程序的状态
- D 不可中断状态.
- 5个基本状态后,还可以加一些字母,比如:S<、Ss,如下图:
- 它们含意如下:
- <: 表示进程运行在高优先级上
- N: 表示进程运行在低优先级上
- L: 表示进程有页面锁定在内存中
- s: 表示进程是控制进程
- l: 表示进程是多线程的
- +: 表示当前进程运行在前台
参数说明:
包含的信息如下
- UID: 启动这些进程的用户
- PID: 进程的ID
- PPID: 父进程的进程号
- C: 进程生命周期中的CPU利用率
- STIME: 进程启动时的系统时间
- TTY: 表明进程在哪个终端设备上运行。如果显示 ?表示与终端无关,这种进程一般是内核态进程。另外, tty1-tty6 是本机上面的登入者程序,若为 pts/0 等,则表示运行在虚拟终端上的进程。
- TIME: 运行进程一共累计占用的CPU时间
- CMD: 启动的程序名称
注:
弹出消息含意如下:
07:26:43 |
当前时间 |
up 58min |
系统运行时间 ,说明此服务器连续运行58分钟了 |
2 user |
当前登录用户数 |
load average: 0.00, 0.02, 0.05 |
系统负载,即任务队列的平均长度。 三个数值分别为 1分钟、5分钟、15分钟前到现在的平均值。 |
任务队列的平均长度是什么?
上图任务队列的长度为3
问题:找出当前系统中,CPU负载过高的服务器?
- 服务器1: load average: 0.15, 0.08, 0.01 1核
- 服务器2: load average: 4.15, 6.08, 6.01 1核
- 服务器3: load average: 10.15, 10.08, 10.01 4核
答案:服务器2
解释:
如果服务器的CPU为1核心,则load average中的数字 >=3 负载过高,而对于多CPU的平均负载的计算,是在单CPU的情况下再除以CPU的个数。如果服务器的CPU为4核心,则load average中的数字 >=12 负载过高。
经验:单核心,1分钟的系统平均负载不要超过3,这只是经验值,有时候大于5也不一定是严重性能问题,有可能是的确主机提供的服务超过了他能够提供的能力,需要扩容了。要具体看看。
第一行:和uptime弹出的信息一样
第二、三行:进程和CPU的信息(当有多个CPU时,这些内容可能会超过两行)
Tasks: 217 total |
进程总数 |
1 running |
正在运行的进程数 |
3 sleeping |
睡眠的进程数 |
0 stopped |
停止的进程数 |
0 zombie |
僵尸进程数 |
Cpu(s): 0.0% us |
系统用户进程使用CPU百分比。 |
0.0% sy |
内核中的进程占用CPU百分比 |
0.0% ni |
用户进程空间内改变过优先级的进程占用CPU百分比 |
100.0% id |
空闲CPU百分比 |
0.0% wa |
cpu等待I/0完成的时间总量。 测试: 终端1:执行:top 终端2:dd if=/dev/zero of=/a.txt count=10 bs=100M 终端3:dd if=/dev/zero of=/a.txt count=10 bs=100M 两个dd进程对磁盘进行大量写,发现IO等待会占很多CPU,如果wa占用很多CPU,原因磁盘性能有问题,建议升级磁盘 如下:
|
0.0% hi(了解) 硬中断消耗时间
|
硬中断,占的CPU百分比。1. 硬中断是由硬件产生的,比如,像磁盘,网卡,键盘,时钟等。每个设备或设备集都有它自己的IRQ(中断请求)。基于IRQ,CPU可以将相应的请求分发到对应的硬件驱动上(注:硬件驱动通常是内核中的一个子程序,而不是一个独立的进程)。# hi -> Hardware IRQ: The amount of time the CPU has been servicing hardware interrupts. |
0.0% si(了解) 软中断消耗时间 |
软中断,占的CPU百分比。1. 通常,软中断是一些对I/O的请求。这些请求会调用内核中可以调度I/O发生的程序。对于某些设备,I/O请求需要被立即处理,而磁盘I/O请求通常可以排队并且可以稍后处理。根据I/O模型的不同,进程或许会被挂起直到I/O完成,此时内核调度器就会选择另一个进程去运行。I/O可以在进程之间产生并且调度过程通常和磁盘I/O的方式是相同。# si -> Software Interrupts.: The amount of time the CPU has been servicingsoftware interrupts. |
0.0 st (steal 偷) |
st:虚拟机偷取物理的时间。比如:物理机已经运行了KVM,XEN虚拟机。KVM虚拟机占用物理机的cpu时间 |
第四五行:内存信息
Mem: 2031912k total |
物理内存总量 |
175984k free |
空闲内存总量 |
366216k used |
使用的物理内存总量 |
1489712k buff/cache |
用作内核缓存的内存量。 和free -k 一个意思
|
Swap: 2097148k total |
交换区总量 |
2097148k free |
空闲交换区总量 |
0k used |
使用的交换区总量 |
1433176 avail Mem |
总的可利用内存是多少 |
注:如果swap分区,被使用,那么你的内存不够用了。
第7行进程信息
列名 |
含义 |
PID |
进程id |
USER |
进程所有者的用户名 |
PR |
优先级(由内核动态调整),用户不能 |
NI |
进程优先级。 nice值。负值表示高优先级,正值表示低优先级,用户可以自己调整 |
VIRT(virtual memoryusage) |
虚拟内存,是进程正在使用的所有内存(ps中标为VSZ) VIRT:virtual memory usage 虚拟内存 1、进程“需要的”虚拟内存大小,包括进程使用的库、代码、数据等 2、假如进程申请100m的内存,但实际只使用了10m,那么它会增长100m,而不是实际的使用量 |
RES(resident memory usage) |
是进程所使用的物理内存。实际实用内存(ps中标为RSS) RES:resident memory usage 常驻内存 1、进程当前使用的内存大小,但不包括swap out 2、包含其他进程的共享 3、如果申请100m的内存,实际使用10m,它只增长10m,与VIRT相反 4、关于库占用内存的情况,它只统计加载的库文件所占内存大小 |
SHR |
共享内存大小,单位kb SHR:shared memory 共享内存 1、除M了自身进程的共享内存,也包括其他进程的共享内存 2、虽然进程只使用了几个共享库的函数,但它包含了整个共享库的大小 3、计算某个进程所占的物理内存大小公式:RES – SHR 4、swap out后,它将会降下来 |
S |
进程状态。 |
%CPU |
上次更新到现在的CPU时间占用百分比 |
%MEM |
进程使用的物理内存百分比 |
TIME+ |
进程使用的CPU时间总计,单位1/100秒 |
COMMAND |
命令名/命令行 |
- 默认3s刷新一次,按s修改刷新时间
- 按空格 :立即刷新。
- q退出
- P:按CPU排序
- M:按内存排序
- T:按时间排序
- p:进程IP,查看某个进程状态
- 数字键1:显示每个内核的CPU使用率
- u/U:指定显示的用户
- h:帮助
示例1:使用TOP动态只查看某个或某些进程的信息
先使用ps找到PID
使用top -p PID来动态查看该进程
示例2:找出系统中使用CPU最多的进程
运行top , 找出使用CPU最多的进程 ,按大写的P,可以按CPU使用率来排序显示
在linux系统中一个进程,最多可以使用100%cpu对吗?
dirtycow(脏牛漏洞,用于提权) 进程使用超过100%,如果你的4核心的cpu,你可以运行400%
lsof命令用于查看你进程打开的文件,打开文件的进程,进程打开的端口(TCP、UDP)
pstree:(display a tree of processes)以树状图显示进程,只显示进程的名字,且相同进程合并显示。
格式:pstree 或 pstree -p
以树状图显示进程,还显示进程PID。
关闭进程3个命令:kill killall pkill
kill关闭进程:kill 进程号 关闭单个进程
killall和pkill:用于杀死指定名字的进程
通过信号的方式来控制进程的
kill -l =====> 列出所有支持的信号 用最多的是: 9 信号
常用信号:
信号编号 信号名
1) SIGHUP 重新加载配置
2) SIGINT 键盘中断 crtl+c
3) SIGQUIT 退出
9) SIGKILL 强制终止
15) SIGTERM 终止(正常结束),缺省信号
18) SIGCONT 继续
19) SIGSTOP 停止
20) SIGTSTP 暂停 crtl+z
示例:
优先级取值范围为(-20,19),越小优先级越高, 默认优先级是0
示例:指定运行vim的优先级为5
输入内容,然后ctrl+z 挂起
通过ps查看这个文件的PID号
通过top命令查看优先级
通过renice改变正在运行的进程的优先级
实战场景:公司晚上需要备份1T数据,我在secureCRT上直接执行备份脚本back.sh可以吗? 或直接运行back.sh & 放到后台运行可以吗? 当关了secureCRT后,back.sh & 还在后台执行吗?
答案:secureCRT长时间连接,如果本地网络偶尔断开或xshell不小心关闭,都会让后台运行的备份命令停止运行的。
如我用secureCRT挂起如下进程
断开连接:
再次连接查看进程:
原来挂起的进程已不在
正确做法使用: srceen
Screen中有会话的概念,,用户可以在一个screen会话中创建多个screen窗口,在每一个screen窗口中就像操作一个真实的telnet/SSH连接窗口那样。
安装screen软件包
rpm -ivh /mnt/Packages/screen-4.1.0-0.23.20120314git3c2946.el7_2.x86_64.rpm
或
yum -y install screen
直接在命令行键入screen命令回车,会打开新的会话:
CentOS自带终端下:
SecureCRT下:
执行命令, 或执行你自己需要运行的备份命令
此时想离开一段时间,但还想让这个命令继续运行
在screen当前窗口键入快捷键Ctrl+a+d
表示已经分离出来独立的一个会话
回来后,找到该screen会话:
重新连接会话:
又进入前面的编辑界面:
不想使用screen 会话了,执行:exit退出。
通过这种方式即使断网重连也能重新回到该会话
附:常用screen参数