Linux系统编程之进程概述

进程概述

进程是一个可执行程序的实例;说个直白的例子,当你编译你的c源码后产生的如a.out的可执行文件(一般都是ELF格式的)那个就是你的程序,当你在终端中输入./a.out时,系统就会执行你的程序,而这个执行的过程就是进程,你也可以打开很多终端执行一样的程序,你的程序在磁盘中,而你创建的进程在内存中有很多...

  • 程序:就是磁盘上的可执行文件文件,并且只占用磁盘上的空间,是一个静态的概念。
  • 进程:被执行之后的程序叫做进程,不占用磁盘空间,需要消耗系统的内存,CPU资源,每个运行的进程的都对应一个属于自己的虚拟地址空间,这是一个动态的概念

从内核的角度来看,进程是由用户内存空间和一系列内核数据结构组成(PCB),其中用户内存空间包含了程序代码及代码所使用的变量,而内核数据结构则用于维护进程状态信息。

刚才我们了解到了,进程在内存中有用户空间和用于维护进程状态信息的一些数据结构,我们接下来探索探索这个数据结构

PCB(Processing Control Block 进程控制块)

我通过查阅资料了解到,在Linux系统里面,进程和线程到了内核,统一叫做任务(Task),每个 task 都有一个数据接口task_struct,用来保存task 状态。linux 内核中有一个包含所有 task 的链表,把所有的 task_struct 连起来,这个就是任务列表吧;
Linux 内核的进程控制块本质上是一个叫做 task_struct 的结构体。在这个结构体中记录了进程运行相关的一些信息,下面介绍一些常用的信息:
进程 id:每一个进程都一个唯一的进程 ID,类型为 pid_t, 本质是一个整形数

  • 进程的状态:进程有不同的状态,状态是一直在变化的,有就绪、运行、挂起、停止等状态。
  • 进程对应的虚拟地址空间的信息。
  • 描述控制终端的信息,进程在哪个终端启动默认就和哪个终端绑定。
  • 当前工作目录:默认情况下,启动进程的目录就是当前的工作目录
  • umask 掩码:在创建新文件的时候,通过这个掩码屏蔽某些用于对文件的操作权限。
  • 文件描述符表:每个被分配的文件描述符都对应一个已经打开的磁盘文件
  • 和信号相关的信息:在 Linux 中 调用函数 , 键盘快捷键 , 执行shell命令等操作都会产生信号。
  • 阻塞信号集:记录当前进程中阻塞哪些已产生的信号,使其不能被处理
  • 未决信号集:记录在当前进程中产生的哪些信号还没有被处理掉。
  • 用户 id 和组 id:当前进程属于哪个用户,属于哪个用户组
  • 会话(Session)和进程组:多个进程的集合叫进程组,多个进程组的集合叫会话。
  • 进程可以使用的资源上限:可以使用 shell 命令 ulimit -a 查看详细信息。

进程内存分布(用户空间)

每个进程所分配的内存由很多部分组成,通常成为"段(segment)",对!就是你总遇见的Segmentation fault段错误就是这个地方的段,就是你非法访问内存之类的问题造成的..言简意赅的说,就是将内存分成各个段落,进行存储数据(程序中声明的变量啊,函数啊,函数中的局部变量啊之类的巴拉巴拉)接下来让我们了解一下各个段因该存储什么类型的数据

  • 文本段(Text):
    也称为代码段。进程启动时会将程序的代码加载到物理内存中,文本段映射到这片物理内存。

  • 数据段(Data):
    包含程序显式初始化的全局变量和静态变量,即已初始化且初值不为0的全局变量(也包括静态全局变量)和静态局部变量,这些数据是在程序真正运行前就已经确定的数据,所以可以提前加载到内存保存好。

  • 未初始化数据(BSS):
    未初始化的全局变量和静态变量,这些变量的值是在程序真正运行起来并为其赋值后才能确定的,所以程序加载之初,只需要记录它的内存地址和所需大小。出于历史原因,这段空间也称为 BSS 段。

  • 栈(Stack):
    位于用户空间的顶部,是一个可以动态增长和收缩的内存段落,由栈帧(Stack Frames)组成,进程每调用一次函数,都将为该函数分配一个栈帧,栈帧中保存了该函数的局部变量、参数值和返回值。栈帧会在函数返回时被清理掉。注意,编译器会将函数参数放入寄存器来优化程序,只有寄存器放不下的参数才使用栈帧来保存。由于栈中数据严格的遵守 FIFO 的顺序,这个简单的设计意味着不必使用复杂的数据结构来追踪栈中的内容,只需要一个简单的指针指向栈的顶端即可,因此压栈(pushing)和出栈(popping)过程非常迅速、准确。

  • 堆(Heap):
    与栈一样,堆用于运行时内存分配;但不同的是,堆用于存储那些生存期与函数调用无关的数据。如用系统调用 malloc 申请的内存便在堆上,这些申请的内存在不需要时必须手动释放,否则便会出现内存泄漏。栈的内存地址向下增长,堆得内存地址向上增长。

可以参考以下几张图

image.png

image.png
image.png

参考

https://zhuanlan.zhihu.com/p/348171413
https://lishiwen4.github.io/linux/linux-process-memory-location
https://blog.konghy.cn/2018/01/20/linux-process-memory-space/
《Linux/UNIX系统编程手册》

你可能感兴趣的:(Linux系统编程之进程概述)