描述
Linux的启动代码真的挺大,从汇编到C,从Makefile到LDS文件,需要理解的东西很多。毕竟Linux内核是由很多人,花费了巨大的时间和精力写出来的。而且直到现在,这个世界上仍然有成千上万的程序员在不断完善Linux内核的代码。
Linux内核启动及文件系统加载过程
当u-boot开始执行bootcmd命令,就进入Linux内核启动阶段,与u-boot类似,普通Linux内核的启动过程也可以分为两个阶段,但针对压缩了的内核如uImage就要包括内核自解压过程了。本文以linux-2.6.37版源码为例分三个阶段来描述内核启动全过程。第一阶段为内核自解压过程,第二阶段主要工作是设置ARM处理器工作模式、使能MMU、设置一级页表等,而第三阶段则主要为C代码,包括内核初始化的全部工作
Linux内核启动流程
arch/arm/kernel/head-armv.S
该文件是内核最先执行的一个文件,包括内核入口ENTRY(stext)到start_kernel间的初始化代码,
主要作用是检查CPU ID, Architecture Type,初始化BSS等操作,并跳到start_kernel函数。在执行前,处理器应满足以下状态:
r0 - should be 0
r1 - unique architecture number
MMU - off
I-cache - on or off
D-cache – off
1 /* 部分源代码分析 */
2 /* 内核入口点 */
3 ENTRY(stext)
4 /* 程序状态,禁止FIQ、IRQ,设定SVC模式 */
5 mov r0, #F_BIT | I_BIT | MODE_SVC@ make sure svc mode
6 /* 置当前程序状态寄存器 */
7 msr cpsr_c, r0 @ and all irqs disabled
8 /* 判断CPU类型,查找运行的CPU ID值与Linux编译支持的ID值是否支持 */
9 bl __lookup_processor_type
10 /* 跳到__error */
11 teq r10, #0 @ invalid processor?
12 moveq r0, #‘p’ @ yes, error ‘p’
13 beq __error
14 /* 判断体系类型,查看R1寄存器的Architecture Type值是否支持 */
15 bl __lookup_architecture_type
16 /* 不支持,跳到出错 */
17 teq r7, #0 @ invalid architecture?
18 moveq r0, #‘a’ @ yes, error ‘a’
19 beq __error
20 /* 创建核心页表 */
21 bl __create_page_tables
22 adr lr, __ret @ return address
23 add pc, r10, #12 @ initialise processor
24 /* 跳转到start_kernel函数 */
25 b start_kernel
Linux内核启动第一阶段stage1
这里所以说的第一阶段stage1就是内核解压完成并出现Uncompressing Linux.。.done,booting the kernel.之后的阶段。该部分代码实现在arch/arm/kernel的 head.S中,该文件中的汇编代码通过查找处理器内核类型和机器码类型调用相应的初始化函数,再建 立页表,最后跳转到start_kernel()函数开始内核的初始化工作。检测处理器类型是在汇编子函数__lookup_processor_type中完成的,通过以下代码可实现对它的调用:bl__lookup_processor_type(在文件head-commom.S实现)。__lookup_processor_type调用结束返回原程序时,会将返回结果保存到寄存器中。其中r5寄存器返回一个用来描述处理器的结构体地址,并对r5进行判断,如果r5的值为0则说明不支持这种处理器,将进入__error_p。r8保存了页表的标志位,r9 保存了处理器的ID 号,r10保存了与处理器相关的struct proc_info_list结构地址。Head.S核心代码如下:
检测机器码类型是在汇编子函数__lookup_machine_type (同样在文件head-common.S实现) 中完成的。与__lookup_processor_type类似,通过代码:“bl __lookup_machine_type”来实现对它的调 用。该函数返回时,会将返回结构保存放在r5、r6 和r7三个寄存器中。其中r5寄存器返回一个用来描述机器(也就是开发板)的结构体地址,并对r5进行判断,如果r5的值为0则说明不支持这种机器(开发板),将进入__error_a,打印出内核不支持u-boot传入的机器码的错误如图2。r6保存了I/O基地址,r7 保存了 I/O的页表偏移地址。 当检测处理器类型和机器码类型结束后,将调用__create_page_tables子函数来建立页表,它所要做的工作就是将 RAM 基地址开始的1M 空间的物理地址映射到 0xC0000000开始的虚拟地址处。对本项目的开发板DM3730而言,RAM挂接到物理地址0x80000000处,当调用__create_page_tables 结束后 0x80000000 ~ 0x80100000物理地址将映射到 0xC0000000~0xC0100000虚拟地址处。当所有的初始化结束之后,使用如下代码来跳到C 程序的入口函数start_kernel()处,开始之后的内核初始化工作: bSYMBOL_NAME(start_kernel) 。
Linux内核启动第二阶段stage2
从start_kernel函数开始
Linux内核启动的第二阶段从start_kernel函数开始。start_kernel是所有Linux平台进入系统内核初始化后的入口函数,它主要完成剩余的与 硬件平台相关的初始化工作,在进行一系列与内核相关的初始化后,调用第一个用户进程- init 进程并等待用户进程的执行,这样整个 Linux内核便启动完毕。该函数位于init/main.c文件中,主要工作流程如图3所示:
该函数所做的具体工作有 :
1) 调用setup_arch()函数进行与体系结构相关的第一个初始化工作;对不同的体系结构来说该函数有不同的定义。对于ARM平台而言,该函数定义在 arch/arm/kernel/setup.c。它首先通过检测出来的处理器类型进行处理器内核的初始化,然后 通过bootmem_init()函数根据系统定义的meminfo结构进行内存结构的初始化,最后调用 paging_init()开启MMU,创建内核页表,映射所有的物理内存和IO空间。
2) 创建异常向量表和初始化中断处理函数;
3) 初始化系统核心进程调度器和时钟中断处理机制;
4) 初始化串口控制台(console_init);
ARM-Linux 在初始化过程中一般都会初始化一个串口做为内核的控制台,而串口Uart驱动却把串口设备名写死了,如本例中linux2.6.37串口设备名为ttyO0,而不是常用的ttyS0。有了控制台内核在启动过程中就可以通过串口输出信息以便开发者或用户了解系统的启动进程。
5) 创建和初始化系统cache,为各种内存调用机制提供缓存,包括;动态内存分配,虚拟文件系统(VirtualFile System)及页缓存。
6) 初始化内存管理,检测内存大小及被内核占用的内存情况;
7) 初始化系统的进程间通信机制(IPC); 当以上所有的初始化工作结束后,start_kernel()函数会调用rest_init()函数来进行最后的初始化,包括创建系统的第一个进程-init进程来结束内核的启动。
挂载根文件系统并启动init
Linux内核启动的下一过程是启动第一个进程init,但必须以根文件系统为载体,所以在启动init之前,还要挂载根文件系统。
打开APP阅读更多精彩内容
点击阅读全文