HardFault_Handler中断,按照经验来说进入HardFault_Handler故障的原因主要有两个方面:
1:内存溢出或则访问越界。
2:堆栈溢出。
发生异常后我们可以首先查看LR寄存器的值,确认当前使用的堆栈是MSP还是PSP,然后找到相对应的堆栈指针,并在内存中查看相对应堆栈的内容,内核将R0~R3,R12,LR,PC,XPRS寄存器依次入栈,其中LR即为发生异常前PC将要执行的下一条指令地址。那么Cortex-M3 内核HardFault错误调试定位方法有:
方法1 如何精确定位出问题代码的所在位置:
以访问越界为例:(对STM32F103C8T6内部flash模拟EEPROM)
#define STM32_FLASH_SIZE 64
#define STM32_FLASH_WREN 1
#define FLASH_SAVE_ADDR 0X08078000
#define FLASH_HIS_ADDR 0X08078002
...
FLASH_SAVE_ADDR是开始存储的基地址,STM32F103C8T6内部flash大小是64K,在STM32的内部闪存(FLASH)地址起始于0x08000000,一般情况下,程序就从此地址开始写入。因此STM32F103C8T6的结束地址应该是64*1024转换成16进制后加上单片机flash的基地址得到的结果就是0x08010000,那么以上代码设置了FLASH_SAVE_ADDR为0X08078000已经超出了该单片机的范围,因此如果在用此单片机操作flash是如果对这个地址进行写和读的会发生错误。现在假设你在不知情的状况下对这个地址进行了操作,然后程序运行时进入HardFault_Handler中断中。那么要找出错误代码在哪个地方,可以使用以下方法(调试软件MDK):
1:进入调试调试界面在HardFault_Handler的while(1)处打上断点。
2:等待代码运行到此,这时查看LR寄存器,如果是正常运行那么显示的寄存器类似下图所示:
如果进入HardFault_Handler中断,那么显示的寄存器如下图所示:
发生异常之后可首先查看LR寄存器中的值,确定当前使用堆栈为MSP或PSP,然后找到相应堆栈的指针,并在内存中查看相应堆栈里的内容。
在Cortex_M3权威指南中可以看到如下图所示:
看到LR寄存器中的值是0xFFFFFFF9,因此我应该去看MSP的地址,找到该地址的地址然后如下图所示打开内存,输入上面找到的寄存器地址,右键选择以long型查看地址如下所示:
然后查看这个地址向下数六个long地址,为什么是6个long地址呢,因为由于异常发生时,内核将R0~R3、R12、Returnaddress、PSR、LR寄存器依次入栈,其中Returnaddress即为发生异常前PC将要执行的下一条指令地址;大概是0x08xxxxxx这样开始的即为出错的代码位置,然后可以反汇编查看,如下图所示:
可以看到是对应的C语言程序是在读FLASH函数中发生了错误,因此可以判断为访问越界的问题。
方法2 :
①首先更改startup.s的启动文件,把里面的HardFault_Handler代码段换成下面的代码
②然后把HardFault_Handler_c的函数放在c文件的代码中,代码如下:
void hard_fault_handler_c(unsigned int * hardfault_args)
{
static unsigned int stacked_r0;
static unsigned int stacked_r1;
static unsigned int stacked_r2;
static unsigned int stacked_r3;
static unsigned int stacked_r12;
static unsigned int stacked_lr;
static unsigned int stacked_pc;
static unsigned int stacked_psr;
static unsigned int SHCSR;
static unsigned char MFSR;
static unsigned char BFSR;
static unsigned short int UFSR;
static unsigned int HFSR;
static unsigned int DFSR;
static unsigned int MMAR;
static unsigned int BFAR;
stacked_r0 = ((unsigned long) hardfault_args[0]);
stacked_r1 = ((unsigned long) hardfault_args[1]);
stacked_r2 = ((unsigned long) hardfault_args[2]);
stacked_r3 = ((unsigned long) hardfault_args[3]);
stacked_r12 = ((unsigned long) hardfault_args[4]);
stacked_lr = ((unsigned long) hardfault_args[5]);
stacked_pc = ((unsigned long) hardfault_args[6]);
stacked_psr = ((unsigned long) hardfault_args[7]);
SHCSR = (*((volatile unsigned long *)(0xE000ED24)));
MFSR = (*((volatile unsigned char *)(0xE000ED28)));
BFSR = (*((volatile unsigned char *)(0xE000ED29)));
UFSR = (*((volatile unsigned short int *)(0xE000ED2A)));
HFSR = (*((volatile unsigned long *)(0xE000ED2C)));
DFSR = (*((volatile unsigned long *)(0xE000ED30)));
MMAR = (*((volatile unsigned long *)(0xE000ED34)));
BFAR = (*((volatile unsigned long *)(0xE000ED38)));
printf("\n\n[Hard fault handler - all numbers in hex]\n\n");
printf("R0 = %x\n",stacked_r0);
printf("R1 = %x\n",stacked_r1);
printf("R2 = %x\n",stacked_r2);
printf("R3 = %x\n",stacked_r3);
printf("R12 = %x\n",stacked_r12);
printf("LR[R14] = %x subroutine call return address\n",stacked_lr);
printf("PC[R15] = %x program counter\n",stacked_pc);
printf("PSR = %x\n",stacked_psr);
printf("SHCSR = %x\n",(*((volatile unsigned long*)(0xE000ED24))));
printf("BFAR = %x\n",(*((volatile unsigned long*)(0xE000ED38))));
printf("CFSR = %x\n",(*((volatile unsigned long*)(0xE000ED28))));
printf("HFSR = %x\n",(*((volatile unsigned long*)(0xE000ED2C))));
printf("DFSR = %x\n",(*((volatile unsigned long*)(0xE000ED30))));
printf("AFSR = %x\n",(*((volatile unsigned long*)(0xE000ED3C))));
printf("SCB_SHCSR = %x\n",SCB->SHCSR);
while (1);
}
③执行程序后,若发生内核错误,则程序会运行到最后while(1);处。此时观察相应的堆栈和故障寄存器值,stacked_lr即为故障发生时进入故障中断前PC的值,在MDK软件调试状态下,假如stacked_lr的值为0x1a002d08,在左下方的命令窗口输入“PC = 0x1a002d08”回车,即可定位发生错误的代码位置。
④根据内核错误状态寄存器的值,对应下面的说明,可以看出是发生了何种内核错误。同样的在Cortex_M3权威指南中可以找到对应的寄存器
方法3
在调试状态下,当进入HardFault断点后,菜单栏Peripherals> Core Peripherals> FaultReports打开异常发生的报告,查看发生异常的原因。
跳出如下表格:
上面的报告发生了BUS FAULT,并将Fault的中断服务转向Hard Fault相对于检测发生了什么异常,定位异常发生位置显得更重要。
(1)打开Call Stack窗口(如下图,断点停在Hard Fault服务程序中)
(2)在Call Stack的HardFault_Handler上右键Show CallerCode
这时将跳转到发生异常的源代码位置(如上图),即发生错误的地方在读FLASH处,可以想到应该是刚刚设置的FLASH地址越界问题