ZYNQ包括一个 FPGA 和两个 ARM,多个 ARM 核心相对独立的运行不同的任务,每个核心可能运行不同的操作系统或裸机程序,但是有一个主要核心,用来控制整个系统以及其他从核心的允许。因此我们可以在 CPU0 和 CPU1 中独立跑不同的应用程序,发挥双核的非对称性架构的优势和性能。
从软件的角度来看,多核处理器的运行模式主要有三种:
① AMP(非对称多进程):多个核心相对独立的运行不同的任务,每个核心可能运行不同的操作系统或裸机程序,但是有一个主要核心,用来控制整个系统以及其它从核心的运行。
② SMP(对称多进程):一个操作系统同等的管理各个内核,例如 PC 机。
③ BMP(受约束多进程):与 SMP 类似,但开发者可以指定将某个任务仅在某个指定内核上执行默认情况下。
裸机程序 ZYNQ 仅运行一个 CPU,这里主要讲解 AMP 模式下,两个 CPU 同时运行的裸机程序开发方法。
一、核间中断原理(软中断SGI)
软中断的 ID 都是从0到15,并且都是上升沿触发,主要用于核间中断或者 CPU 自己中断自己。
中断函数如下:
XScuGic_SoftwareIntr(&InterruptController, //指向GIC指针 INTC_CPU0, //需要中断的CPU ID XSCUGIC_SPI_CPU0_MASK); //使能该CPU会接受中断
二、ARM启动过程
1.ARM 里有个 ROM,存储了一段程序,ROM起来后从 SD 卡读取数据 2.启动 FSBL(First Boot Loader)第一启动项(有模板) 3.加载 bit(FPGA配置程序),同时加载 elf(ARM应用程序),如果是操作系统则 elf 替换成 uBoot
三、搭建软件 CPU0 和 CPU1 非对称环境
1.创建 amp_fsbl 用于生成烧写镜像的时候加载 core0 和 core1的代码。
①启动 Vivado,创建 ZYNQ,勾选 SD卡 和 UART 即可,并加载 SDK 开发环境
②进到 SDK ,点击 File --- New --- Application Project,命名为 amp_fsbl 并选择 CPU0
③选择 FSBL,finish
④修改 main.c 函数来启动 core1,需要两个步骤,首先把 CPU1 应用程序地址写入到 0xfffffff0地址中,这是启动 CPU1 命令的地址,然后执行 sev 指令加载 CPU1 应用程序。具体参考 UG585 的启动代码章节。
在 main.c 函数的 main 函数上方插入这段代码:
1 #define sev() __asm__("sev") 2 #define CPU1STARTADR 0xFFFFFFF0 3 #define CPU1STARTMEM 0x2000000 4 5 void StartCpu1(void) 6 { 7 #if 1 8 fsbl_printf(DEBUG_GENERAL,"FSBL: Write the address of the application for CPU 1 to 0xFFFFFFF0\n\r"); 9 Xil_Out32(CPU1STARTADR, CPU1STARTMEM); 10 dmb(); //waits until write has finished 11 fsbl_printf(DEBUG_GENERAL,"FSBL: Execute the SEV instruction to cause CPU 1 to wake up and jump to the application\n\r"); 12 sev(); 13 #endif 14 }
在 main.c 函数的 load镜像位置加入代码: StartCpu1();
2.创建 app_cpu0 应用程序
①重新创建一个新的 File --- New --- Application Project,命名为 app_cpu0,这时选择的是 CPU0
②选择 helloworld 模板即可
③将 helloworld.c 改名为 mian.c,并且用如下代码替换掉内容
1 #include2 #include "platform.h" 3 #include "xil_printf.h" 4 5 #define COMM_VAL (*(volatile unsigned long *)(0xFFFF0000)) //无优化无符号长整形地址转成指针 6 7 int main() 8 { 9 COMM_VAL=0; 10 11 //Disable cache on OCM 12 Xil_SetTlbAttributes(0xFFFF0000,0x14de2); 13 while(1) 14 { 15 print("Hello World cpu0 \n\r"); 16 COMM_VAL =1; 17 while(COMM_VAL == 1) 18 { 19 } 20 } 21 return 0; 22 }
该指针指向的地址为片上存储的共享内存(OCM)。可以指定这里面的任意一个地址。定义的指针变量如下所示: #define COMM_VAL (*(volatile unsigned long *)(0x00020000)) 该变量CPU0和CPU1都可以在里面读写数据,可以达到CPU0和CPU1的数据交互。OCM的地址如下图所示。
④打开 Scr 目录中的文件 lscript.ld,点击下方的 Source 做如下修改:CPU0 的代码空间改为 1E00000
CPU1运行程序的地址改为fsbl里面指定的起始地址。后面为长度,有一点需要注意:CPU0的起始地址加上CPU0的长度之后不能超过CPU1的起始地址。也就是两个CPU占用的DDR的地址不能重叠。若程序很大,则CPU0需要的LENGTH就大,因此CPU1的起始地址数值就大。DDR地址范围如下所示:
3.创建 app_cpu1 应用程序
①重新创建一个新的 File --- New --- Application Project,命名为 app_cpu1,这时选择的是 CPU1
②选择 helloworld 模板即可
③将 helloworld.c 改名为 mian.c,并且用如下代码替换掉内容
1 #include2 #include "platform.h" 3 #include "xil_printf.h" 4 5 #define COMM_VAL (*(volatile unsigned long *)(0xFFFF0000)) 6 int main() 7 { 8 //Disable cache on OCM 9 Xil_SetTlbAttributes(0xFFFF0000,0x14de2); 10 while(1) 11 { 12 while(COMM_VAL == 0) 13 { 14 } 15 print("Hello World cpu1 \n\r"); 16 sleep(2); 17 COMM_VAL=0; 18 } 19 return 0; 20 }
④打开 Scr 目录中的文件 lscript.ld 点击下方的 Source 做如下修改起始地址改为 0x2000000 长度 0x1F00000
4.增加编译选项(设置 CPU1 的BSP setting 为 AMP 模式)
app_cpu1_bps --- 右键 --- Board Suport Package Setting,点击 driver --- ps7_cortexa9_0,添加指令
5.让双核跑起来
①点击 app_cpu0 --- 右键 --- Debug As --- Debug Configurations...
② 点击选项卡的 Application,勾选 0 和 1,然后点击 Debug,yes
③默认停到第一行,连接好串口,选择APU --- ARM --- #0,单步慢慢走可以看到有信息打印出,#2也是一样的。如果让 #0 和 #1 都一直执行,则串口会一直交替打印。
四、软中断的注册和使用
参考资料:
[1]威三学院FPGA教程