CODE、RO、RW、ZI Data 域及堆栈空间
Keil MDK编译器完成编译链接后,在调试窗口会出现Code,RO,RW,ZI 四种内存分配区域,下面说明其中的意思。
Code区:即代码区。该区域除了存放指令外,还包括指令数据(inc .data),如局部变量数组的初始化值。当函数被调用时,该函数用code区内指令数据来初始化堆栈区内分配的局部变量数组。注:局部变量用立即数来赋值初始化。
RO区:Read Only data,即只读数据域,它指程序中用到的只读数据,这些数据被存储在ROM区,因而程序不能修改其内容。在MDK中,const修饰的全局数组变量放在这个区域里面,该区域数据是绝对不可变的 ,指向只读变量的指针能够访问该区域,但是不能改变该区域数据。
RW区:Read Write data,即可读写数据域,它指初始化为“非0值”的可读写数据,程序刚运行时,这些数据具有非0的初始值,且运行的时候它们会常驻在RAM 区,因而应用程序可以修改其内容。例如C语言中使用定义的全局变量和静态变量,且定义时赋予“非0值”给该变量进行初始化。
ZI-data:Zero Initialie data,即0初始化数据,它指初始化为“0值”的可读写数据域,它与RW-data 的区别是程序刚运行时这些数据初始值全都为0,而后续运行过程与RW-data的性质一样,它们也常驻在RAM区,因而应用程序可以更改其内容。例如C语言中使用定义的全局变量和静态变量,且定义时赋予“0值”给该变量进行初始化(若定义该变量时没有赋予初始值,编译器会把它当ZI-data来对待,初始化为0);
ZI-data的栈空间(Stack)及堆空间(Heap):在C语言中,函数内部定义的局部变量属于栈空间,进入函数的时候从向栈空间申请内存给局部变量,退出时释放局部变量,归还内存空间。而使用malloc动态分配的变量属于堆空间。在程序中的栈空间和堆空间都是属于ZI-data区域的,这些空间都会被初始值化为0值。编译器给出的ZI-data占用的空间值中包含了堆栈的大小(经实际测试,若程序中完全没有使用malloc 动态申请堆空间,编译器会优化,不把堆空间计算在内)。
综上所述,以程序的组成构件为例,它们所属的区域类别见下表:
程序组件 | 所属类别 |
机器代码指令 | Code |
常量 | RO-data |
初值非0 的全局变量 | RW-data |
初值为0 的全局变量 | ZI-data |
局部变量 | ZI-data 栈空间 |
使用malloc 动态分配的空间 | ZI-data 堆空间 |
程序的存储与运行
程序在静止与运行的时候它在存储器中的表现是不一样的,如上图所示。
图中的左侧是应用程序的存储状态,右侧是运行状态,而上方是RAM存储器区域,下方是ROM存储器区域。
程序在存储状态时,RO节(RO section)及RW节都被保存在ROM区。当程序开始运行时,内核直接从ROM中读取代码,并且在执行主体代码前,会先执行一段加载代码,它把RW节数据从ROM复制到RAM, 并且在RAM加入ZI节,ZI节的数据都被初始化为0。加载完后RAM区准备完毕,正式开始执行主体程序。
编译生成的RW-data的数据属于图中的RW 节,ZI-data的数据属于图中的ZI节。是否需要掉电保存,这就是把RW-data与ZI-data区别开来的原因,因为在RAM创建数据的时候,默认值为0,但如果有的数据要求初值非0,那就需要使用ROM记录该初始值,运行时再复制到RAM。
STM32 的RO区域不需要加载到SRAM,内核直接从FLASH读取指令运行。计算机系统的应用程序运行过程很类似,不过计算机系统的程序在存储状态时位于硬盘,执行的时候甚至会把上述的RO区域(代码、只读数据)加载到内存,加快运行速度,还有虚拟内存管理单元(MMU)辅助加载数据,使得可以运行比物理内存还大的应用程序。而STM32没有MMU,所以无法支持Linux和Windows系统。
当程序存储到STM32芯片的内部FLASH 时(即ROM区),它占用的空间是Code、RO-data 及RW-data 的总和,所以如果这些内容比STM32芯片的FLASH空间大,程序就无法被正常保存了。当程序在执行的时候,需要占用内部SRAM空间(即RAM区),占用的空间包括RW-data和ZI-data。应用程序在各个状态时各区域的组成见下表。
程序状态与区域 | 组成 |
程序执行时的只读区域(RO) | Code + RO data |
程序执行时的可读写区域(RW) | RW data + ZI data |
程序执行时的可读写区域(RW) | Code + RO data + RW data |
注:RO节(RO section)的顶部为指令数据(inc .data)。在程序中,能够被调用的函数,函数内全局变量被使用了才加到RW区或ZI区,也就是说定义了没使用,使用在函数中,但该函数没有被调用都不会被放在RW区或ZI区内。
示例
下面的例子是由stm32f4基于MDK平台上进行验证的。
声明为函数体内的局部变量,其示例如下:
void fun(void)
{
const unsigned char str[] = "12345678"; //str在栈中,初始值即为Code区的指令数据(inc .data)
static const unsigned char str[] = "12345678"; //str在RO-data区
static unsigned char str[] = "12345678"; //str在RW-data区
}
声明为全局变量,其示例如下:
const unsigned char str[] = "12345678"; //str在RO-data区
static const unsigned char str[] = "12345678"; //str在RO-data区
static unsigned char str[] = "12345678"; //str在RW-data区
声明为函数体内的局部变量,其示例如下:
void fun(void)
{
const unsigned int i = 5; //i在栈中
static const unsigned int i = 5; //i在RO-data区
}
声明为全局变量,其示例如下:
unsigned int i = 5; //i在RW-data区
const unsigned int i = 5; //i在RO-data区
static const unsigned int i = 5; //i在RO-data区
声明为函数体内的局部变量,其示例如下:
void fun(void)
{
unsigned char *p ="12345678"; //p在栈中,初始值即为Code区的指令数据(inc .data)
static unsigned char *p ="12345678"; //p在RW-data区,初始值在RO-data区
}
声明为全局变量,其示例如下:
unsigned char *p ="12345678"; //p在RW-data区,初始值在RO-data区
static unsigned char *p ="12345678"; //p在RW-data区,初始值在RO-data区
int main(void)
{
const int a = 1;
int *b = (int*)&a;
int c =3;
const int *d = &c;
*b = 2;
c = 4;
printf("a=%d,*b=%d,c=%d,*d=%d",a,*b,c,*d);
}
上面的程序输出为:1,2,4,4。a值等于1的原因是由于编译器优化造成的,向printf传参的时候直接为数值1。
volatile const int a = 1;
当为上述语句时,程序输出为:2,2,4,4。
const int a = 1;
int main(void)
{
int *b = (int*)&a;
int c =3;
const int *d = &c;
*b = 2;
c = 4;
printf("a=%d,*b=%d,c=%d,*d=%d",a,*b,c,*d);
}
上面的程序输出为:1,1,4,4。尽管*b = 2可以访问该地址,但由于a存在RO-data区,使得此次修改无法成功。
volatile const int a = 1;
当为上述语句时,程序输出为:2,2,4,4。经查看变量a存在于RW-data区,其原因也许该变量经常被未知的因素修改,为提高效率。