vim-操作篇
进程概念篇
进程地址空间篇
Linux,是一种免费使用和自由传播的类UNIX操作系统,是一个基于POSIX的多用户、多任务、支持多线程和多CPU的操作系统。它能运行主要的Unix工具软件、应用程序和网络协议。Linux继承了Unix以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。博主将全程带领大家学习Linux的相关知识,本系列文章参考《鸟哥的Linux私房菜》推荐大家进行阅读学习。
下面的代码对子进程的全局变量进行了修改。
问题:为什么会出现这种结果(我将在 <四、地址映射> 中进行解答)
#include
#include
using namespace std;
int global_value = 100;
int main() {
//创建子进程
pid_t id = fork();
if (id == 0) { //子进程
int cnt = 0;
while(true) {
//打印子进程
printf("子进程 - pid:%5d, ppid:%5d | global_value:%d, &global_value:%p\n", getpid(), getppid(), global_value, &global_value);
sleep(1);
if (++cnt == 4) { //修改子进程的全局变量
global_value = 300; //将值修改为300
cout << "子进程的全局变量已进行更改............" << endl;
}
}
} else if (id > 0) { //父进程
while(true) {
//打印父进程
printf("父进程 - pid:%5d, ppid:%5d | global_value:%d, &global_value:%p\n", getpid(), getppid(), global_value, &global_value);
sleep(2);
}
} else {
printf("fork error!");
}
return 0;
}
由运行结果我们可以发现
基本结论:这不是物理地址(硬件支持的地址空间),而是虚拟地址(逻辑地址)。
物理地址:主存是一个有M个连续的字节大小的单位组成的数组。每个字节都有自己对应的一个地址,就是物理地址。物理地址大小就是实际的主存的大小。
物理寻址:CPU使用物理地址直接到主存中找对应的数据。
虚拟地址:虚拟内存是一个由存放在磁盘上的N个连续的字节大小的单元组成的数组。每个字节都有一个唯一的地址,就是虚拟地址。通常,虚拟地址由页号和偏移量组成,页号就是抽象的虚拟页的编号,偏移量用于计算实际的物理地址。
虚拟地址:CPU通过虚拟地址来访问主存,访问内存使用的物理地址,MMU通过将虚拟地址进行翻译,转化为物理地址,然后再用这个物理地址去访问内存数据。
基本概念
进程地址空间:
限定了一段地址,这段地址属于某一个进程,并不是这个进程随时都在使用这个空间,而是在某一段时间内只属于某个进程。
进程地址空间 ≠ 内存
进程地址空间将伴随进程的整个进程生命周期一直存在,直至进程退出。
基本分布
区域 | 功能 |
---|---|
内核 | 负责管理系统的进程、内存、设备驱动程序、文件和网络系统,决定着系统的性能和稳定性。 |
环境变量 | 环境变量是一个动态命名的值,可以影响运行进程在计算机上的行为方式。它们是进程运行环境的一部分。 |
命令行参数 | 在启动这个程序的时候可以给这个程序从命令行中传递的参数。 |
栈区 | 存储函数调用时的临时信息的结构,存放为运行时函数分配的局部变量、函数参数、返回数据、返回地址等。 |
共享区 | 共享内存允许两个不相关的进程访问同一段物理内存。 |
堆区 | 通常由申请空间者分配、和释放,用来存储程序运行时分配的变量。 |
静态区 | 存放全局变量、静态数据。全局区分为已初始化全局区(data)和未初始化全局区(bss)。 |
常量区 | 存放常量字符串。 |
代码区 | 存放函数体(类成员函数、静态函数和全局函数)的二进制代码。 |
分布检验
#include
#include
using namespace std;
//全局变量
int g_unval; //未初始化数据
int g_val = 300; //已初始化数据
int main(int argc, char* argv[], char* env[]) {
const char* p = "hello world!"; //p是指针变量(栈区),p指向字符常量h(字符常量区)
char* q = new char[10];
//环境变量
printf("env addr: %p\n", env[0]);
//命令行参数
printf("args addr %p\n", argv[0]);
printf("args addr %p\n", argv[argc - 1]);
//栈
printf("stack addr: %p\n", &p); //p先定义,先入栈
printf("stack addr: %p\n", &q); //q后定义,后入栈
//堆
printf("heap addr: %p\n", q);
//未初始化数据
printf("g_unval addr: %p\n", &g_unval);
//已初始化数据
printf("g_val addr: %p\n", &g_val);
//字符串常量区
printf("read addr: %p\n", p);
//代码区
printf("code addr: %p\n", main);//代码区起始地址
return 0;
}
有了前面的基本知识我们来解决文章最开始的问题,这段代码为什么会是这样的运行结果
#include
#include
using namespace std;
int global_value = 100;
int main() {
//创建子进程
pid_t id = fork();
if (id == 0) { //子进程
int cnt = 0;
while(true) {
//打印子进程
printf("子进程 - pid:%5d, ppid:%5d | global_value:%d, &global_value:%p\n", getpid(), getppid(), global_value, &global_value);
sleep(1);
if (++cnt == 4) { //修改子进程的全局变量
global_value = 300; //将值修改为300
cout << "子进程的全局变量已进行更改............" << endl;
}
}
} else if (id > 0) { //父进程
while(true) {
//打印父进程
printf("父进程 - pid:%5d, ppid:%5d | global_value:%d, &global_value:%p\n", getpid(), getppid(), global_value, &global_value);
sleep(2);
}
} else {
printf("fork error!");
}
return 0;
}
每个进程都由PCB控制,将PCB看作一个类,那么task_struct就是PCB实例化出的一个对象,而task_struck中有内存指针,指向虚拟地址,虚拟地址通过页表映射指向对应的物理内存中的地址。
首先,当创建一个子进程时,父子进程共用一段代码,且子进程的进程地址空间,是通过父进程的进程地址空间拷贝过来的,所以它们具有相同的虚拟地址——&global_value。
然后,我们对子进程的值进行修改。不改变页表中的虚拟地址,通过更改页表的映射,在物理内存中开辟一个新的空间,并初始化赋值为300。
这时,我们查看global_value的地址发现,父进程和子进程的虚拟地址相同,但实际上映射在物理内存中的物理地址却不同,从而存储的值也不同。