dzsc.com文章出处:微计算机信息 发布时间: 2009/07/24 | 1514 次阅读 | 0次推荐 | 0条留言
摘要:为了满足嵌入式系统快速启动、低能高效和节省成本的要求,本文将就地执行(eXecute In Place)技术引进Linux 2.6.12内核。通过分析ARM Linux的启动过程,获得不同内核映像的相互关系和启动过程中的KFT函数调用图,完成基于XIP的Linux 2.6.12内核在XSBase255上的移植,制作合适的根文件系统类型,最后完成系统启动时间及内存使用测试。
1 研究背景
ARM Linux 嵌入式系统在不同应用领域应用的日趋广泛,它们存储容量相对较小、系统的电能消耗及启动速度要求严格。为了满足它们对启动速度和低能耗的要求,本文采用内核XIP 方式运行ARM Linux 系统,避免把内核从NorFlash 拷贝到主存SDRAM 空间,让内核运行在低功耗的NORflash 上,节省系统启动时间,降低系统对SDRAM 的需要,减少电能消耗,使产品能够持续使用更长时间。
2 开发工具及相关技术介绍
2.1 硬件平台
本文选择深圳亿道公司的XSBase255 开发板,其处理器采用的是Intel? XScalePXA255,400MHz,SDRAM 为Samsung 64Mbyte,Flash 为Intel?STrata flash 32Mbyte。
2.2 软件工具
Linux-2.6.12 linux-2.6.13-kgdb-2.3 Cramfs-Linear-xip-4-patch busybox-1.10.0 ramust-arm2.3XIP 技术介绍XIP 全称eXecute-In-Place(就地执行),是一种代码执行方式,分为Kernel XIP[1]和ApplicatiON XIP[2]两种。Kernel XIP 适用于操作系统启动过程,而Application XIP 主要用于系统启动后应用程序的执行。
Kernel XIP 原理如下,内核映像在Flash 设备上执行以后,只把映像中要读写的.data和.bss 拷贝到SDRAM 主存中,同时设置好系统的MMU,内核运行过程中,代码段.text 指向Flash 空间,.data 和.bss 指向SDRAM 主存空间。相对于全映射的执行方式,系统节省了解压缩和拷贝代码段的时间,节省了代码段占用的RAM 主存空间。
Application XIP 原理与Kernel XIP 类似,管理NOR Flash 空间的文件系统必须具有线性的一致的地址空间,可执行的应用程序的代码段在NOR Flash 中线性连续,且地址能够从文件系统知晓。操作系统执行应用程序时,系统的程序加载器(loader)在建立虚拟进程空间后,只需要把应用程序的数据段和未初始化段等要读写的段装入SDRAM 主存空间,并建立好映射,而对于可执行文件的只读的代码段空间则无需装入,直接映射到NOR Flash 设备上应用程序文件的代码段,程序执行时直接从NOR Flash 设备上获取代码执行。
3 ARM Linux 启动过程分析
开发板上电启动后,首先执行Bootloader 程序,Bootloader 进行初步的环境初始化并准备好内核参数。对于本文采用的内核XIP 执行方式,Bootloader 不需要从Flash 设备中解压拷贝内核映像到SDRAM主存中,运行内核映像后,把需要读写操作的数据段拷贝到SDRAM主存的适当位置,并进行片级初始化、板级初始化等内核运行的硬件环境初始化工作,最后是根据内核参数执行内核各个子系统的初始化。
3.1 执行映像生成过程及关系
生成内核映像的一般过程是,使用 make menuconfig 配置内核,再使用make zImage 或make bzImage 生成压缩的内核映像zImage 或bzImage,这样生成的是压缩的内核映像。本文通过配置CONFIG_XIP_KERNEL,使系统生成xipImage,其生成图如图2 所示:
3.2 获得内核启动过程函数关系调用图
这里使用 KFT 工具来获得。KFT 全称Kernel Function Trace[3],主要功能是跟踪函数调用事件。KFT 收集调用数据后,把数据保存在/proc/kft_data,在XScale 平台上配置KFT 时,KFT 需要使用cmpxchg 函数,而原始内核不支持,所以需要修改源代码,添加__cmpxchg_u3和__cmpxchg 函数的声明和定义,以及宏cmpxchg 和arch_align_stack(x)。准备工作完成后,下载到开发板上运行并获取原始跟踪数据。然后,调用addr2sym 工具对原始跟踪数据进行格式化,可以获取函数调用顺序图,再使用kd 工具将获得的内容格式化为树状关系图,最终获得内核启动过程函数关系调用图kft.tree,为下面的工作提供很好的指引和帮助。
3.3 Bootloader 的修改
Bootloader 分为两个阶段,第1 阶段采用汇编语言实现。第2 阶段采用C 语言实现。除了进行普通Bootloader 所需的片级和板级初始化之外,针对内核XIP 执行方式所做的主要工作有以下2 个:
1:通过查看体系Makefile 得到XIP 方式的DATAADDR 和TEXTADDR。
2:建立初始页表时,为.data 和.bss 段建立好3MB 连续空间以存放xipImage。
4 基于XIP 的ARM Linux 内核移植
本文采用的标准 Linux 内核2.6.12 版本不支持在XSBASE255 上直接运行,需要根据开发板硬件体系结构进行相关移植和订制裁减工作。
4.1 内核链接脚本
生成内核映像的链接脚本是在 arch/arm/kernel/vmlinux.lds 中,而vmlinux.lds 是由同目录下的vmlinux.lds.S 生成,查看脚本内容,可以获知内核映像各节的虚拟地址取决于内核符号TEXTADDR和DATAADDR,以及各节的大小。对于xipImage,其.init,.text 和__ext_table都是在NOR Flash 上,只有.data 节.bss 节在主存上,因而根据配置过程中设置的CONFIG_XIP_PHYS_ADDR 值,设置TEXTADDR 为0xbf000000,而DATAADDR 则设置为0xC0008000,在内核的CPU 片级初始化过程中的页表建立过程中,TEXTADDR 指向NORFlash,而DATAADDR 指向主存SDRAM 中,把.init 段链接到.data 段之前,拷贝到SDRAM中,执行完毕后,回收这部分主存,而内核的.text 段以Kernel XIP 方式运行[4][5]。
4.2 移植源代码
下面阐述在 XSBase255 开发板上以XIP 运行内核的移植过程[6]。
4.2.1 添加机器平台支持、目录框架及内核配置的支持
4.2.2 源代码文件移植,为实现XIP,在arch/arm/mach-pxa/Makefile.boot 中定义内核映像text节的物理地址,即ZRELADDR 的地址值 zreladdr-y := 0xa0008000
4.2.3 闪存分区的移植
本文采用的是 NOR Flash,根据开发板上闪存的起始地址和大小划分为Bootloader,Kernel , Rootfs 等四个不同部分。其初始地址和大小分别分Persistant storage 0x01000000-0x02000000, Initial ramdisk image 0x00300000-0x01000000,Kernel Image0x00020000-0x00300000 ,Bootloader 0x00000000-0x00020000
4.3 配置内核
根据开发板移植好特定代码后,本节对内核进行配置,主要通过make menuconfig 命令启动的图形交互界面进行。
4.3.1 指定内核CPU 体系和交叉编译器及选择系统类型
4.3.2 启动XIP 支持
在菜单 Boot options 中,选中Kernel Execute-In-Place from rom,并设置好XIP 内核的物理位置0x00380000。
4.3.3 设置启动参数
同样在 Boot options 中,设置启动参数,如图2 所示。
4.3.4 选择串口驱动和控制台驱动
4.3.5 启动MTD 和NOR Flash 分区至此内核配置完毕,使用 make xipImage,获得XIP 内核映像。
5 文件系统的制作
为了支持 XIP,需要选择Linear CRAMFS 作为根文件系统。系统使用过程中的其他需要,可以采用其他类型的文件系统,如系统的临时文件可以采用RAMFS/TMPFS,系统中可修改的配置数据可以采用JFFS2 文件系统挂载。最终定制的文件系统类型如表1 所示:
本文采用嵌入式系统常用的 Busybox 方法制作根文件系统映像[7]。先编译生成系统应用程序,再建立完整的顶层目录和必要的其他文件。然后使用的Linux2.6 自带的mkfs.cramfs工具制作rootfs_cramfs.img 映像。至此根文件系统制作完毕。
6 系统与性能测试
6.1 系统启动
完成整个系统的制作并逐步调整后,使用 Jflash 烧写Bootloader,然后利用Bootloader的tftp 工具,从宿主机下载内核映像和根文件系统映像并烧写到闪存上,最后启动开发板,引导系统。从串口输出系统中的启动信息可以看出,系统依次进行CPU 片级初始化、板级初始化和一些子系统初始化、并加载根文件系统,进入Busybox 的Shell 命令行,说明系统启动成功。
6.2 系统启动时间测试
本文采用开发板上 OSCR 寄存器测量内核映像解压所节省的时间,使用内核全局变量jiffies 测量启动过程各个部分的时间,测量所得时间数据如表2 所示:
从表中可以看出, Bootloader 启动时间与内核映像无关,当Bootloader 引导非压缩的Image 时,把内核映像拷贝到主存RAM 中需要耗费拷贝的时间。对于zImage,解压缩过程需要耗费545ms,而xipImage 则不需要。在xipImage 执行过程中,需要额外拷贝内核映像中可读写的数据段部分,因而内核启动时间要比zImage 要略长一下,但综合整体时间,使用Kernel XIP 执行方式的系统能有效的缩短系统启动时间。
6.3 系统内存使用测试
本文利用 RAMUST 和free 工具,测量系统使用的主存情况如表3 所示:
从表中可以看出,采用 Kernel XIP 的xipImage 内核映像通过增加对Flash 的使用需求,可以显著减少主存SDRAM 的使用量,Flash 上的内核代码的执行,不需要持续间断的动态刷新,从而降低了系统的整体功耗和成本。
总结:本文在通用Linux 2.6.12 内核基础上,以深圳亿道公司的XSBase255 开发板为硬件平台,研究并实现了以Kernel XIP 方式运行的ARM Linux 系统的移植,通过系统与性能测试,取得了较为理想的效果。