【Linux】进程地址空间


文章目录

  • 进程地址空间
    • 1.写时拷贝与虚拟地址
    • 2.地址空间引入
    • 3.地址空间的意义
      • ⭐3.1 虚拟地址寻址
      • ⭐3.2 虚拟地址意义


进程地址空间

地址空间(address space)表示任何一个计算机实体所占用的内存大小。比如外设、文件、服务器或者一个网络计算机。地址空间包括物理空间以及虚拟空间。在32位平台下,程序地址空间大小是2^32也就是4GB.

【Linux】进程地址空间_第1张图片

补充:

命令:set / unset
功能:查看环境变量 / 取消用户环境变量

set可以显示当前用户环境变量(通常比env显示的更详细),unset可以取消用户自己设置的本地变量和环境变量

1.写时拷贝与虚拟地址

先来看一段测试代码:

test.c:

#include 
#include 
#include 

int g_value = 100; //全局变量

int main()
{
    pid_t id = fork();
    assert(id >= 0);
    if(id == 0)
    {
        //child
        while(1)
        {
            printf("我是子进程, 我的id是: %d, 我的父进程是: %d, g_value: %d, &g_value : %p\n",\
                    getpid(), getppid(), g_value, &g_value);
            sleep(1);
            g_value=200; // 只有子进程会进行修改
        }
    }
    else
    {
        //father
        while(1)
        {
            printf("我是父进程, 我的id是: %d, 我的父进程是: %d, g_value: %d, &g_value : %p\n",\
                    getpid(), getppid(), g_value, &g_value);
            sleep(1);
        }
    }
}

【Linux】进程地址空间_第2张图片
可以看到对于全局变量g_value,父子进程的地址相同,即使子进程改变了g_value的值,父进程的该变量值依然没变,而且地址也跟子进程一样!所以说该地址是物理地址吗?如果是,那么怎么可能对于同一个地址,读取到不同的数值?显然,我们语言级别上打印出来的地址绝对不是物理地址,而是——虚拟地址,关于写时拷贝和虚拟地址已经讲过——进程描述与进程状态.

2.地址空间引入

假如有一个大富翁,他总共有10亿的资产,他一共有四个私生子,他对每个私生子说以后等他老了,就把这10亿的资产送给他,可实际上这真能实现吗,这其实也是我们所说的画饼,每个私生子并不知道其它人的存在,每个人都以为自己将来能继承10亿的资产。
【Linux】进程地址空间_第3张图片
实际上,操作系统也是如此,操作系统也就是大富翁,而内存就是它拥有的资产,而私生子就是进程,在每个进程的视角看来,它们都是独自享有所有的内存,可实际上这是操作系统为它们画的饼,而这个饼也就是进程地址空间,也被称为虚拟地址、线性地址,在Linux下叫struct mm_struct

那么上图中的堆区,栈区,代码区,数据区该如何理解呢?每个进程分的地址空间,实际上就是对线性地址空间的划分,即:

struct area{
	int start;
	int end;
}

即对线性地址空间的划分也就是对结构体内start和end的修改,栈区的向下调整和堆区的扩大即修改对应的边界值

3.地址空间的意义

地址空间相当于一层媒介,它的本质实际上也是软件层,操作系统先通过虚拟地址找到物理地址。

⭐3.1 虚拟地址寻址

虚拟地址最终会转换为物理地址,那么是怎么转换的呢?

【Linux】进程地址空间_第4张图片

这样便对我们上面的例子有了解释,子进程在修改g_value的值的时候,操作系统会写时拷贝,即将该变量拷贝到一块新的物理地址上,但是虚拟地址并没有发生变化,而寻址的过程是OS通过虚拟地址,查找页表和MMU(内存管理单元),,通过其映射到两块不同的物理地址块上

而fork()函数的双返回值问题也就有了答案,返回的本质就是写入,谁先返回,OS就让谁通过虚拟地址发生写时拷贝

⭐3.2 虚拟地址意义

为什么要有地址空间呢?原因有以下三点:

1. 防止地址随意访问,保护物理内存与其他进程

试想,如果没有地址空间,那么进程的PCB指针就会随意的访问内存,如果因为人工代码失误,造成野指针问题,恰好访问了另一个进程的物理内存,修改了下一个进程的数据,那么就可能导致该进程故障,安全性较低.

而有了虚拟地址,即使恶意访问,页表在寻址的时候也会匹配该物理块是否能被该用户访问,如果不能,页表将会终止访问,这时,我们的编译器控制台就会提示野指针越界,所以,虚拟地址的引入提高了安全性.

2. 将进程管理与内存管理进行解耦合

我们先思考一个问题,当向系统申请空间的时候,OS是立即分配给你,还是需要的时候再给你?

  • OS一般不允许任何的浪费或者不高效
  • 进程在申请内存后不一定立马使用
  • 在申请成功后,如果这个进程不立即使用,那么是不是在这一段时间内就会有一小段物理块处于闲置状态(自己不用,其它进程也不能用)

如果不止一个进程这样,成千上万个进程都这样,是不是就会造成大量内存空间的浪费,所以,当我们使用malloc分配空间的时候,OS一般不会立即分配给你,而是在虚拟地址上分配一块空间,但实际上这块空间并没有映射到物理地址上,而是在使用的时候页表才会映射到物理内存上分配空间。这就实现了进程管理和内存的管理的解耦合

3. 可以让进程以统一的视角,看待自己的数据和代码

程序在被编译的时候没有被加载到内存,我们程序内部也是有地址的,这个地址也是虚拟地址,源代码在被编译的时候,就是按照虚拟地址空间的方式进行,对代码和数据早就已经编好了对应的编址.OS通过虚拟地址寻址找到代码和数据存放的物理地址,在进程的视角看来,自己都享有整个内存空间,视角相同,进程的代码和数据必须一直在内存吗?可以边加载边执行,因为有虚拟地址的空间的存在,需要加载到内存时缺页中断,换出内存

你可能感兴趣的:(Linux,linux,运维,服务器)