课本概念
:程序的一个执行实例,正在执行的程序等内核观点
:担当分配系统资源(CPU时间,内存)的实体。以前我们的任何启动并允许程序的行为,都是由操作系统帮助我们将程序转换成为进程,来完成特定的任务。(在Linux中,./运行一个程序。在windows中,鼠标双击运行一个程序。他们都将一个程序转换成了进程)
如图,我们将磁盘中的程序加载到了内存当中,形成了代码和数据。
但这并不算一个进程,操作系统为了管理这些加载到内存当中的代码和数据,需要先描述再组织
,在内核当中为这些代码和数据创建一个个的数据结构对象。(操作系统书中叫PCB,Linux操作系统下是task_struct)
因此:
对进程的管理转化为对PCB链表进行增删查改。
进程 = 加载到内存中的代码和数据 + 内核关于进程的相关数据结构
可以在内核源代码里找到它。所有运行在系统里的进程都以task_struct双链表的形式存在内核里。
ps -axj
通过对grep指令的搭配,可以查找想要查看的进程信息
ps -axj | head -1 && ps -axj |grep myprocess | grep -v grep
进程的信息可以通过 /proc 系统文件夹查看
其中有很多文件夹都是以数字命名,这些数字其实就是对应进程的PID,对应文件夹当中记录着对应进程的各种信息。
当我们创建一个进程后,就会在/proc目录下创建对应的文件夹保存进程的信息。一旦我们关闭掉这个进程,/proc目录下相应的进程文件夹就会被删除。
通过使用系统调用函数getpid和getppid
即可分别获取进程的PID和PPID。
运行结果,通过getpid获取的pid值与ps命令查询的值是相同的。
其次,通过不断启动终止进程,我们发现每次启动进程的pid都会改变,但是ppid并不会改变,这个ppid又是什么呢?
21615是我们的bash(命令行解释器)。
我们可以得到一些结论:
bash命令行解释器,本质上它也是一个进程!
命令行解释器启动的所有程序,最终都会变成进程,而该进程对应的父进程都是bash
//创建子进程
//有两个返回值,创建成功给父进程返回子进程PID,给子进程返回0
//创建失败返回-1
#include
int fork(void)
fork 函数能在当前进程下主动创建 子进程 ,用于代码程序中。
#include
#include
#include
#include
#include
#include
int main()
{
printf("AAAAAAAAAAAA\n");
int ret = fork();
printf("BBBBBBBBBBBB,PID: %d \n",getpid());
sleep(1);
return 0;
}
运行结果:
BBBBBBBB被打印了两次,可见fork系统调用之后程序就变成了两个执行流,即一个父进程一个子进程。
但通常我们可以根据fork的不同返回值,搭配if完成分流,使父子进程执行不同的代码。
#include
#include
#include
int main()
{
int ret = fork();
if(ret < 0)
{
perror("fork");
return 1;
}
else if(ret == 0)
{
//child
printf("I am child : %d!, ret: %d\n", getpid(), ret);
}else
{
//father
printf("I am father : %d!, ret: %d\n", getpid(), ret);
}
sleep(1);
return 0;
}
运行结果:
其中,fork之后的两个执行流,谁先执行由调度器决定
fork函数工作原理:
子进程的PCB
,然后把父进程 PCB 的大部分数据拷贝进子进程的PCB中
,即子进程和父进程的PCB中的数据绝大部分是相同的。两个进程的PCB指向同一份代码和数据即两者共享一份代码和数据
我们知道进程是具有独立性的,父子进程同样具有独立性。
但父子进程两者共享同一份代码和数据,他们的独立性从何谈起?
写时拷贝
机制如何理解fork函数有两个返回值?
当return时,函数的主体功能已经完成,此时子进程已经被创建,所以两个进程都停留在fork函数中,等待返回。因此fork函数会返回两次,一次是在父进程中返回,另一次是在子进程中返回,这两次的返回值是不一样的。