STM32编程:是时候深入理解栈了

[导读] 从这篇文章开始,将会不定期更新关于嵌入式C语言编程相关的个人认为比较重要的知识点,或者踩过的坑。

为什么要深入理解栈?做C语言开发如果栈设置不合理或者使用不对,栈就会溢出,溢出就会遇到无法预测乱飞现象。所以对栈的深入理解是非常重要的。

啥是栈

栈是一种受限的数据结构模型,其数据总是只能在顶部追加,利用一个指针进行索引,顶端叫栈顶,相对的一端底部称为栈底。栈是一种LIFO后入先出的数据结构。

栈就两种操作:

  • PUSH,压栈,向栈顶压入数据,
  • POP,出栈,从栈顶弹出数据

再进一步探讨:

首先将栈与堆分清,从看到这篇文章开始,我建议你不要把堆和栈连在一起叫,栈是栈,堆是堆,这是两回事,别混为一谈!(堆本文不深入讨论)

从C/C++编程语言的角度来看:

  • 相同点:都是一片内存区,在链接时指定栈区/堆区的位置以及大小。

  • 不同点:

    • 栈:由编译器分配,存放函数的参数值,局部变量,寄存器组(不同的单片机/处理器各有不同)、函数调用参数传递、中断异常产生时须保存处理器状态的寄存器值等
    • 堆:由程序员分配释放,对于C而言,malloc、realloc/free进行分配/释放,对C++而言,由new/delete分配/释放。

为啥用

栈这个数据模型的应用价值是什么呢?先来看一下单片机内部的可能有哪些栈应用?以STM32为例,参考IAR C/C++ Development
Guide,P207

处理器模式 建议段名 描述
Supervisor SVC_STACK 操作系统栈
IRQ IRQ_STACK 通用(IRQ)中断处理程序的堆栈。
FIQ FIQ_STACK 用于高速(FIQ)中断处理程序的堆栈。
Undefined UND_STACK 堆栈用于未定义的指令中断。 支持硬件协处理器和指令集扩展的软件仿真。
Abort ABT_STACK 用于指令获取和数据访问存储器中止中断处理程序的堆栈。

如果使用RTOS还有任务栈,如果是Linux,其内核线程同样也需要栈的支持,等等这一切的一切栈,其本质上都是利用了栈数据模型的LIFO后入先出的特性,一个典型应用场景就是比如做一件事情做到一半而要转而去做另外一件事,对于芯片编程而言,就需要将当前的工作做个暂存,等另外一件事情做完了,再接着回来继续做。那么怎么做到呢,以一个中断处理为例,要记住当前的工作态有哪些信息需要暂存呢?PC指针,局部变量等就被压入栈,再将中断服务程序地址导入PC指针,进而去执行中断服务程序,待中断处理完毕,在将栈里的内容按照后入先出弹出到对应的寄存器就恢复了原程序的现场,进而继续执行。

怎么用

栈在哪里定义大小,定多大合适?这可能很多刚接触单片机开发的同学不是太清楚,下面就将比较常见的IAR开发环境为例如何定义栈定义栈大小的地方说明一下,这里以IAR8.4.1为例,有两种方式可以进行栈大小设置。

IDE设置

为了更加清楚明了,制作了一个GIF操作展示视频,在stack/heap中就可以设置了,其中stack用于设置栈区大小,heap用于设置堆大小。

这个demo中设置了其栈的大小为0x200,堆的大小为0x400,全编译后,检查map文件就印证了栈/堆的大小如预期所修改。

链接配置文件

其实对于比较熟悉的开发人员,上一种方式并非推荐用法。用链接配置文件将具有更好的灵活性,比如可以指定一个段的对齐方式,存储位置,某个符号的存储位置等等。这里同样为了直观也做了一个GIF动画,介绍如何通过链接文件进行栈/堆的大小配置。

其最终的效果也一样如预期将栈区的大小设置好了。

栈溢出

这里为了比较容易的展示栈溢出的问题,在main函数利用递归方法计算阶乘,代码如下:

#include 
#include "main.h"
static uint32_t spSatte[200];
static uint32_t spIndex = 0;
/*为什么要用浮点数,因为数据非常大整型很快就会溢出*/
float factorial(uint32_t n)
{
    uint32_t sp = __get_MSP();    
    /*记录栈指针的变化情况*/
    spSatte[spIndex++] = sp;
    if(n==0 || n==1)
        return 1;
    else
        return (float)n*factorial(n-1);
}

int main(void)
{
    float  x = 0;
    uint32_t  n = 20;
    printf("stack test:\n");
    x = factorial(n);
    /*打印栈指针变化情况*/
    for(int i = 0;i%08X\n",spSatte[i]);
    
    /*打印阶乘结果*/
    printf("factorial(%d)=%f\n",n,x);    
    while (1)
    {
    }
}

为方便观察,将stm32f407xx_flash.icf 将栈改为256字节

/*stm32f407xx_flash.icf 将栈改为256字节*/
define symbol __ICFEDIT_size_cstack__ = 0x200;
define symbol __ICFEDIT_size_heap__   = 0x200;

全编译后通过map文件来看下栈/堆的分配情况:

"P2", part 3 of 3:                          0x400
  CSTACK                      0x2000'05d8   0x200  
    CSTACK           uninit   0x2000'05d8   0x200  
  HEAP                        0x2000'07d8   0x200  
    HEAP             uninit   0x2000'07d8   0x200  
                            - 0x2000'09d8   0x400

直观些,翻译成下图,CSTACK段分配在0x2000 05D8-0x2000 07D8,堆分配在0x2000 07D8-0x2000 09D8。
STM32编程:是时候深入理解栈了_第1张图片

图为什么没有将0x2000 07D8画在栈区呢?通过调试发现,这个字空间没有用做栈的实际存储。将工程设置成simulation模式,debug进入main.o勾选掉,我们来计算20的阶乘,来具体看一下:

对这个动图解读一下:

  • 进入复位是,SP_main为0x200007D8,指向栈底,为空栈。那么这是怎么实现的呢?
__vector_table                ;向量表
        DCD     sfe(CSTACK)   ;这条命令会将程序的CSTACK起始地址装载给SP_main
        DCD     Reset_Handler ; Reset Handler复位向量
  • 前面说0x200007D8并没有用到,怎么证明呢,在函数进入mian时,第一次压栈的情况如下:

  • 可见STM32栈的增长方向是向下增长的,也即顶在小地址端一侧

  • 栈存储元素是四字节对齐的,因为STM32的字长是4字节,如果深入想想,如果不是四字节对齐会怎么样?留给感兴趣的思考一下。

  • 0x200007D8--0x200007DB 这个字存储单元并不是栈的有效存储空间。

栈的变化情况:


MSP->200007A8 
MSP->20000790
MSP->20000778
MSP->20000760
MSP->20000748
MSP->20000730
MSP->20000718
MSP->20000700
MSP->200006E8
MSP->200006D0
MSP->200006B8
MSP->200006A0
MSP->20000688
MSP->20000670
MSP->20000658
MSP->20000640
MSP->20000628
MSP->20000610
MSP->200005F8
MSP->200005E0
factorial(20)=2432902023163674771.785700 /*结算结果与用计算器一致*/

每调用一次阶乘函数,栈就压入4个字,由上面还可以看到第20次进入时,栈指针为0x200005E0,如果再压入4个字栈指针会变成0x200005C8,是这样吗,结果还对吗?将n改为21编译运行,来看一看:
STM32编程:是时候深入理解栈了_第2张图片

看到了吧,惊喜来了,栈溢出了,程序已经不听话了,完全不知道在干嘛了。所以栈溢出的后果是极端危险的,完全无法预期,程序会带来什么后果。

总结一下

  • 栈是一种LIFO后入先出的数据结构模型,是C/C++程序运行时基础,没这个栈,C/C++玩不转
  • 栈在嵌入式编程领域随处可见,比如C栈,中断栈、异常栈、任务栈等等,但其基本工作原理都一样。支持两种基本数据操作:压栈、出栈。
  • 栈溢出程序的结果无法预期,所以合理的设置栈区大小是个永恒的话题,过大则浪费内存,过小则程序会飞。
  • 嵌入式编程递归函数要慎用,个人建议不用。比如IEC61508 功能安全标准中强行规定不可使用递归函数。
  • STM32中__get_MSP可以得到当前栈指针的值,据此可以做一定程度的栈溢出保护措施。防止程序跑飞。
  • 通过上面递归调用测试,还可以得到一个启示,嵌入式编程函数嵌套的层级不宜过深,过深则需要相对较大的栈开销。
  • .......

文章出自微信公众号:嵌入式客栈,更多内容,请关注本人公众号
STM32编程:是时候深入理解栈了_第3张图片

你可能感兴趣的:(STM32编程:是时候深入理解栈了)