在我们的电脑开机的时候,操作系统会被加载到内存中,点击多个应用进行时,那么将有多个应用的进程会被加载到内存中的操作系统上。说明一个操作系统不仅仅可以运行一个进程,而且可以运行多个进程!既然,有多个进程了,那么就需要将这些进程有条不紊地管理起来,那操作系统是如何管理进程的呢?
先描述,在组织
:任何一个进程加载到内存中形成真正的进程时,操作系统要创建描述
进程的结构体对象;接下来便是将这些进程信息块组织起来
,使用双链表的数据结构进行管理!
在很多人的理解中,一个加载到内存中的程序叫做进程,或者正在运行的程序叫做进程,其实这些都是片面的理解!假如你被复旦大学录取了,难道就可以说你是复旦大学的学生了吗?当然不是的!你被录取了表明你的档案信息已经被该大学收录了,而要想真正成为该大学的学生!到开学的时候,你要拿着录取通知书到复旦大学入学报到,这个时候你才真正成为了复旦大学的学生!同理,进程应该包括描述进程的信息和需要处理的代码和数据!
进程属性的集合
PCB
数据结构对象+自己的数据和代码
- 在
Linux
中描述进程的结构体叫做task_struct
。- 课本上称之为
PCB(process control block)
,Linux
操作系统下的PCB
:task_struct
标示符
:描述本进程的唯一标示符,用来区别其他进程。状态
:任务状态,退出代码,退出信号等。优先级
:相对于其他进程的优先级。程序计数器
:程序中即将被执行的下一条指令的地址。内存指针
:包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针上下文数据
:进程执行时处理器的寄存器中的数据[休学例子,要加图CPU,寄存器]。I/O状态信息
:包括显示的I/O
请求,分配给进程的I/O
设备和被进程使用的文件列表。记账信息
:可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。其他信息
创建myprocess.c
文件,如下:
#include
#include
int main()
{
while(1)
{
printf("我是一个进程....\n");
sleep(1);
}
return 0;
}
创建自动化构建文件Makefile
文件,如下:
myprocess:myprocess.c
gcc -o $@ $^
.PHONY:clean
clean:
rm -rf myprocess
Xshell代码运行的结果如下:
在另一个窗口输入如下指令:
$ ps ajx | head &&ps ajx | grep myprocess//获取含myprocess的进程PID
./myprocess
为正在运行的可执行程序,grep --color=auto myprocess
为刚才我们运行的获取PID指令中包含了myprocess
,说明输入的指令在系统中变成了进程运行。
可以使用如下指令过滤掉grep myprocess
进程:
$ ps ajx | head -1 && ps ajx | grep myprocess | grep -v grep
关闭进程的指令:
$ ps -9 进程的PID//杀进程
$ ls /proc/4356/ -l //获取PID为4356的进程文件详细信息
在前面操作系统的学习中,操作系统通过数据结构将描述
的进程信息组织起来
管理,我们作为普通用户很难和操作系统打交道,所以不能直接获取当前进程PID;但是可以通过操作系统上层封装的系统调用接口,获取PCB结构描述的信息,接下来让我们认识两个系统调用接口:
创建proc.c
文件,写入如下代码:
#include
#include
#include
int main()
{
printf("我是一个子进程,pid为:%d\n",getpid());
printf("我是一个父进程,ppid为:%d\n",getppid());
return 0;
}
重新运行
./proc
文件,其子进程一直在变(比如某学生高考失利进入复旦大学时,他可以获得一个学号,当他第二年复读再次考入复旦大学时,他又获得一个学号,而这两个学号是不同的),而父进程一直都不变。
$ ps ajx | head -1 && ps ajx | grep 3216 //父进程
父进程
ppid
为bash
命令行进程,给我们输入指令的!
fork函数创建一个新的进程,让当前的父进程返回当前的子进程,创建新的子进程返回0。
eg1:
#include
#include
#include
int main()
{
printf("我是使用fork()之前的语句\n");
pid_t ret=fork();
printf("我是使用fork()之后的语句\n");
return 0;
}
可以发现
fork()
函数创建新的子进程,当前的进程执行了printf
语句,创建的进程执行了一遍的printf
语句,所以fork()
后面的语句被执行两遍。
eg2:
#include
#include
#include
int main()
{
printf("begin: 我是一个进程,pid:%d,ppid:%d\n",getpid(),getppid());
pid_t ret=fork();
if(ret==0)
{
while(1)
{
printf("我是子进程,pid:%d,ppid:%d\n",getpid(),getppid());
sleep(1);
}
}
else if(ret>0)
{
while(1)
{
printf("我是父进程,pid:%d,ppid:%d\n",getpid(),getpid());
sleep(1);
}
}
return 0;
}
while :; do ps ajx | head -1 ; ps ajx | grep proc |grep -v grep;sleep 1;done
使用fork函数创建新的进程,使用
if
语句,根据父进程返回当前的子进程(返回的值大于0),旧的子进程返回0,实现分流执行不同的代码。
问题1:为什么fork函数返回子进程,父进程返回当前的子进程?
一般而言fork函数之后的代码,父子进程共享;返回不同的值,让不同的执行流,执行不同的代码!
问题2:fork函数如何做到返回两次?
①创建子进程
PCB
;②填充PCB
的内容;③让父子进程共享同一份代码;④父子进程的task_struct
,可以被CPU调用…最后执行return
语句返回,return
语句之前fork
函数的主要工作已经完成了(即创建新的子进程),所以return
语句为父子进程共享的语句,所以父进程返回一次,子进程返回一次。
问题3:fork干了什么事?
进程之间是不会相互影响,相互独立
:①fork
创建了子进程,子进程依据父进程为模板PCB模板创建自己的PCB
,指向父进程的代码;②那指向的数据是否相同呢?子进程和父进程刚开始指向的数据相同,当操作系统检测到子进程要修改数据时会开空间,会发生写时拷贝,但不是把父进程的数据全部拷贝,子进程只会拷贝自己能使用的数据,避免造成资源浪费。
问题4:一个变量怎么会有不同的内容?
我们已经知道了fork函数可以返回两次,并且同一个变量可以接收两次不同的值(即访问不同的内存)!那是怎么做到一块地址空间是怎么接收呢?我们后面再进行学习
问题5:如果父子进程被创建好,fork往后,哪个进程被先运行呢?
哪个进程先运行,是由调度器(挑选进程)决定的,我们是不能确定的!
问题6:执行不同命令时子进程不同,但这些子进程的父进程都为bash进程,为什么呢?
bash
内部也是通过fork函数创建子进程的,bash
进程执行接收新的命令、打印出命令行提示符等任务,而bash
创建的子进程执行解释新的命令,所以我们当前运行的所有的命令都是bash
的进程。