Linux系列文章 —— 进程地址空间(图解虚拟地址、物理地址的映射)

系列文章目录

vim-操作篇
进程概念篇
进程地址空间篇


文章目录

  • 系列文章目录
  • 前言
  • 一、虚拟地址空间
  • 二、物理地址与虚拟地址
  • 三、进程地址空间
  • 四、地址映射


前言

Linux,是一种免费使用和自由传播的类UNIX操作系统,是一个基于POSIX的多用户、多任务、支持多线程和多CPU的操作系统。它能运行主要的Unix工具软件、应用程序和网络协议。Linux继承了Unix以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。博主将全程带领大家学习Linux的相关知识,本系列文章参考《鸟哥的Linux私房菜》推荐大家进行阅读学习。


一、虚拟地址空间

下面的代码对子进程的全局变量进行了修改。

问题:为什么会出现这种结果(我将在 <四、地址映射> 中进行解答)

#include 
#include 
using namespace std;
int global_value = 100;
int main() {
    //创建子进程
    pid_t id = fork();
    if (id == 0) {			//子进程
        int cnt = 0;
        while(true) {
            //打印子进程
            printf("子进程 - pid:%5d, ppid:%5d | global_value:%d, &global_value:%p\n", getpid(), getppid(), global_value, &global_value);
            sleep(1);
            if (++cnt == 4) {		//修改子进程的全局变量
                global_value = 300;	//将值修改为300
                cout << "子进程的全局变量已进行更改............" << endl;
            }
        }
    } else if (id > 0) {	 //父进程
        while(true) {
            //打印父进程
            printf("父进程 - pid:%5d, ppid:%5d | global_value:%d, &global_value:%p\n", getpid(), getppid(), global_value, &global_value);
            sleep(2);
        }
    } else {
        printf("fork error!");
    }
    return 0;
}

Linux系列文章 —— 进程地址空间(图解虚拟地址、物理地址的映射)_第1张图片

由运行结果我们可以发现

  • 开始时,子进程父进程指向同一个地址
  • 子进程的全局变量发生改变父进程的全局变量没有改变
  • 变更后,子进程父进程仍然指向同一个地址

基本结论:这不是物理地址(硬件支持的地址空间),而是虚拟地址(逻辑地址)

二、物理地址与虚拟地址

物理地址:主存是一个有M个连续的字节大小的单位组成的数组。每个字节都有自己对应的一个地址,就是物理地址。物理地址大小就是实际的主存的大小。

物理寻址:CPU使用物理地址直接到主存中找对应的数据。

Linux系列文章 —— 进程地址空间(图解虚拟地址、物理地址的映射)_第2张图片

虚拟地址:虚拟内存是一个由存放在磁盘上的N个连续的字节大小的单元组成的数组。每个字节都有一个唯一的地址,就是虚拟地址。通常,虚拟地址由页号偏移量组成,页号就是抽象的虚拟页的编号,偏移量用于计算实际的物理地址。

虚拟地址:CPU通过虚拟地址来访问主存,访问内存使用的物理地址,MMU通过将虚拟地址进行翻译,转化为物理地址,然后再用这个物理地址去访问内存数据。

Linux系列文章 —— 进程地址空间(图解虚拟地址、物理地址的映射)_第3张图片

三、进程地址空间

基本概念

进程地址空间:

  • 限定了一段地址,这段地址属于某一个进程,并不是这个进程随时都在使用这个空间,而是在某一段时间内只属于某个进程。

  • 进程地址空间 ≠ 内存

  • 进程地址空间将伴随进程的整个进程生命周期一直存在,直至进程退出。

基本分布

Linux系列文章 —— 进程地址空间(图解虚拟地址、物理地址的映射)_第4张图片

区域 功能
内核 负责管理系统的进程、内存、设备驱动程序、文件和网络系统,决定着系统的性能和稳定性。
环境变量 环境变量是一个动态命名的值,可以影响运行进程在计算机上的行为方式。它们是进程运行环境的一部分。
命令行参数 在启动这个程序的时候可以给这个程序从命令行中传递的参数。
栈区 存储函数调用时的临时信息的结构,存放为运行时函数分配的局部变量、函数参数、返回数据、返回地址等。
共享区 共享内存允许两个不相关的进程访问同一段物理内存。
堆区 通常由申请空间者分配、和释放,用来存储程序运行时分配的变量。
静态区 存放全局变量、静态数据。全局区分为已初始化全局区(data)和未初始化全局区(bss)。
常量区 存放常量字符串。
代码区 存放函数体(类成员函数、静态函数和全局函数)的二进制代码。

分布检验

#include
#include

using namespace std;

//全局变量
int g_unval;        //未初始化数据
int g_val = 300;    //已初始化数据

int main(int argc, char* argv[], char* env[]) {
    const char* p = "hello world!"; //p是指针变量(栈区),p指向字符常量h(字符常量区)
    char* q = new char[10];
    //环境变量
    printf("env addr:            %p\n", env[0]);
    //命令行参数
    printf("args addr            %p\n", argv[0]);
    printf("args addr            %p\n", argv[argc - 1]);
    //栈
    printf("stack addr:          %p\n", &p);    //p先定义,先入栈
    printf("stack addr:          %p\n", &q);    //q后定义,后入栈
    //堆
    printf("heap addr:           %p\n", q);
    //未初始化数据
    printf("g_unval addr:        %p\n", &g_unval);
    //已初始化数据
    printf("g_val addr:          %p\n", &g_val);
    //字符串常量区
    printf("read addr:           %p\n", p);
    //代码区
    printf("code addr:           %p\n", main);//代码区起始地址
    return 0;
}

Linux系列文章 —— 进程地址空间(图解虚拟地址、物理地址的映射)_第5张图片

四、地址映射

有了前面的基本知识我们来解决文章最开始的问题,这段代码为什么会是这样的运行结果

#include 
#include 
using namespace std;
int global_value = 100;
int main() {
    //创建子进程
    pid_t id = fork();
    if (id == 0) {			//子进程
        int cnt = 0;
        while(true) {
            //打印子进程
            printf("子进程 - pid:%5d, ppid:%5d | global_value:%d, &global_value:%p\n", getpid(), getppid(), global_value, &global_value);
            sleep(1);
            if (++cnt == 4) {		//修改子进程的全局变量
                global_value = 300;	//将值修改为300
                cout << "子进程的全局变量已进行更改............" << endl;
            }
        }
    } else if (id > 0) {	 //父进程
        while(true) {
            //打印父进程
            printf("父进程 - pid:%5d, ppid:%5d | global_value:%d, &global_value:%p\n", getpid(), getppid(), global_value, &global_value);
            sleep(2);
        }
    } else {
        printf("fork error!");
    }
    return 0;
}

每个进程都由PCB控制,将PCB看作一个类,那么task_struct就是PCB实例化出的一个对象,而task_struck中有内存指针,指向虚拟地址,虚拟地址通过页表映射指向对应的物理内存中的地址。

首先,当创建一个子进程时,父子进程共用一段代码,且子进程进程地址空间,是通过父进程进程地址空间拷贝过来的,所以它们具有相同的虚拟地址——&global_value。

Linux系列文章 —— 进程地址空间(图解虚拟地址、物理地址的映射)_第6张图片

然后,我们对子进程的值进行修改。不改变页表中的虚拟地址,通过更改页表的映射,在物理内存中开辟一个新的空间,并初始化赋值为300。

Linux系列文章 —— 进程地址空间(图解虚拟地址、物理地址的映射)_第7张图片

这时,我们查看global_value的地址发现,父进程和子进程的虚拟地址相同,但实际上映射在物理内存中的物理地址却不同,从而存储的值也不同。

这就解释了运行结果父子进程的global_value存储的值不同,却拥有相同的虚拟地址。
Linux系列文章 —— 进程地址空间(图解虚拟地址、物理地址的映射)_第8张图片

你可能感兴趣的:(Linux,linux,服务器,运维,开发语言,c语言)