linux内核启动过程——基于S3C2410

1zImage自解压
本文以流行的Samsung公司的S3C2410,mini2440平台和linux-2.6.29为例,介绍如何在ZIX嵌入式开发环境下探索linux内核启动过程。
Linux内核启动一般由外部的bootloader引导,也可以在内核头部嵌入一个loader,实际的应用中这两种方式都会经常遇到。所以要了解内核启动最开始的过程,必须对bootloader如何引导内核有所熟悉。下面我们从u-boot加载linux内核的代码开始分析(关于u-boot 自身的启动流程,请参考
u-boot 启动过程 —— 基于S3C2410
)。
1.处理器内核加载代码
在u-boot的
do_bootm_linux函数
里,实现了处理器架构相关的linux内核加载代码,特别是tags传递。
该函数中,在(u-boot-1.6)lib_arm/armlinux.c的
90
调用了getenv将bootargs环境变量保存在commandline
    char *commandline = 
getenv
("bootargs");
然后解析uImage文件头,并且按照头中的定义分解和加载uImage。所以这部分代码的运行取决于uImage文件是如何生成的,本文不做过多叙述,可参考另文了解u-boot使用。接下来进行tags设置工作,分别调用了
setup_start_tag() 
setup_memory_tag() 
setup_commandline_tag() 
setup_initrd_tag() 
setup_end_tag() 
然后对TLB、cache等进行invalid操作,这是通过在lib_arm/armlinux.c的
268
调用
cleanup_before_linux()
(cpu/arm920t/108)实现,然后即可跳入从uImage中分解出来的内核Image或zImage入口
    cleanup_before_linux ();
    theKernel (0, machid, bd->bi_boot_params);
    /* does not return */
    return;
在s3c2410平台上,该入口theKernel一般是物理地址0x30008000。如果我们使用zImage自解压内核映像,对应的代码正是自解压头,位置在内核源码linux-2.6.29的arch/arm/boot/compressed/head.S第 114行的start符号
     start:
                .type   start,#function
                .rept   8
                mov     r0, r0
                .endr

                b       1f
                .word   0x016f2818   @ Magic numbers to help the loader
                .word   start        @ absolute load/run zImage address
                .word   _edata       @ zImage end address
1:              mov     r7, r1       @ save architecture ID
                mov     r8, r2       @ save atags pointer
这也标志着u-boot将系统完全的交给了OSbootloader生命终止。之后代码在133行会读取cpsr并判断是否处理器处于supervisor模式——从u-boot进入kernel,系统已经处于SVC32模式;而利用angel进入则处于user模式,还需要额外两条指令。之后是再次确认中断关闭,并完成cpsr写入
                mrs     r2, cpsr                @ get current mode
                tst     r2, #3                  @ not user?
                bne     not_angel
                mov     r0, #0x17               @ angel_SWIreason_EnterSVC
                swi     0x123456                @ angel_SWI_ARM
not_angel:
                mrs     r2, cpsr                @ turn off interrupts to
                orr     r2, r2, #0xc0           @ prevent angel from running
                msr     cpsr_c, r2
然后在LC0地址(157行)处将分段信息导入r0-r6、ip、sp等寄存器,并检查代码是否运行在与链接时相同的目标地址(162行),以决定是否进行处理。由于现在很少有人不使用loader和tags,将zImage烧写到rom直接从0x0位置执行,所以这个处理是必须的(但是zImage的头现在也保留了不用loader也可启动的能力)。arm架构下自解压头一般是链接在0x0地址而被加载到0x30008000运行,所以要修正这个变化。涉及到
r5寄存器存放的zImage基地址 
r6和r12(即ip寄存器)存放的got(global offset table) 
r2和r3存放的bss段起止地址 
sp栈指针地址 
很简单,这些寄存器统统被加上一个你也能猜到的偏移地址 0x30008000。该地址是s3c2410相关的,其他的ARM处理器可以参考下表
PXA2xx是0xa0008000 
IXP2x00和IXP4xx是0x00008000 
Freescale i.MX31/37是0x80008000 

TI davinci DM64xx是0x80008000 
TI omap系列是0x80008000 
AT91RM/SAM92xx系列是0x20008000 
Cirrus EP93xx是0x00008000 
这些操作发生在代码172行开始的地方,下面只粘贴一部分
                add     r5, r5, r0
                add     r6, r6, r0
                add     ip, ip, r0
后面在211行进行bss段的清零工作
not_relocated:  mov     r0, #0
1:              str     r0, [r2], #4            @ clear bss
                str     r0, [r2], #4
                str     r0, [r2], #4
                str     r0, [r2], #4
                cmp     r2, r3
                blo     1b
然后224行,打开cache,并为后面解压缩设置64KB的临时malloc空间
                bl      cache_on

                mov     r1, sp              @ malloc space above stack
                add     r2, sp, #0x10000    @ 64k max  
接下来238行进行检查,确定内核解压缩后的Image目标地址是否会覆盖到zImage头,如果是则准备将zImage头转移到解压出来的内核后面
                cmp     r4, r2
                bhs     wont_overwrite
                sub     r3, sp, r5              @ > compressed kernel size
                add     r0, r4, r3, lsl #2      @ allow for 4x expansion
                cmp     r0, r5
                bls     wont_overwrite

                mov     r5, r2                  @ decompress after malloc space
                mov     r0, r5
                mov     r3, r7
                bl      decompress_kernel
真实情况——在大多数的应用中,内核编译都会把压缩的zImage和非压缩的Image链接到同样的地址,s3c2410平台下即是0x30008000。这样做的好处是,人们不用关心内核是Image还是zImage,放到这个位置执行就OK,所以在解压缩后zImage头必须为真正的内核让路。
在250行解压完毕,内核长度返回值存放在r0寄存器里。在内核末尾空出128字节的栈空间用,并且使其长度128字节对齐。
                add     r0, r0, #127 + 128      @ alignment + stack
                bic     r0, r0, #127            @ align the kernel length
算出搬移代码的参数:计算内核末尾地址并存放于r1寄存器,需要搬移代码原来地址放在r2,需要搬移的长度放在r3。然后执行搬移,并设置好sp指针指向新的栈(原来的栈也会被内核覆盖掉)
                add     r1, r5, r0              @ end of decompressed kernel
                adr     r2, reloc_start
                ldr     r3, LC1
                add     r3, r2, r3
1:              ldmia   r2!, {r9 - r14}         @ copy relocation code
                stmia   r1!, {r9 - r14}
                ldmia   r2!, {r9 - r14}
                stmia   r1!, {r9 - r14}
                cmp     r2, r3
                blo     1b
                add     sp, r1, #128            @ relocate the stack
搬移完成后刷新cache,因为代码地址变化了不能让cache再命中被内核覆盖的老地址。然后跳转到新的地址继续执行
                bl      cache_clean_flush
                add     pc, r5, r0              @ call relocation code
注意——zImage在解压后的搬移和跳转会给gdb调试内核带来麻烦。因为用来调试的符号表是在编译是生成的,并不知道以后会被搬移到何处去,只有在内核解压缩完成之后,根据计算出来的参数“告诉”调试器这个变化。以撰写本文时使用的zImage为例,内核自解压头重定向后,reloc_start地址由0x30008360变为0x30533e60。故我们要把vmlinux的符号表也相应的从0x30008000后移到0x30533b00开始,这样gdb就可以正确的对应源代码和机器指令。
随着头部代码移动到新的位置,不会再和内核的目标地址冲突,可以开始内核自身的搬移了。此时r0寄存器存放的是内核长度(严格的说是长度外加128Byte的栈),r4存放的是内核的目的地址0x30008000,r5是目前内核存放地址,r6是CPU ID,r7是machine ID,r8是atags地址。代码从501行开始
reloc_start:    add     r9, r5, r0
                sub     r9, r9, #128            @ do not copy the stack
                debug_reloc_start
                mov     r1, r4
1:
                .rept   4
                ldmia   r5!, {r0, r2, r3, r10 - r14}    @ relocate kernel
                stmia   r1!, {r0, r2, r3, r10 - r14}

                .endr

                cmp     r5, r9
                blo     1b
                add     sp, r1, #128            @ relocate the stack
接下来在516行清除并关闭cache,清零r0,将machine ID存入r1,atags指针存入r2,再跳入0x30008000执行真正的内核Image
call_kernel:    bl      cache_clean_flush
                bl      cache_off
                mov     r0, #0                  @ must be zero
                mov     r1, r7                  @ restore architecture number
                mov     r2, r8                  @ restore atags pointer
                mov     pc, r4                  @ call kernel
zImage自解压过程结束。欲了解内核Image启动流程

zImage头跳转进来,此时的状态

  • MMUoff
  • D-cacheoff
  • I-cachedont careonoff没有关系
  • r00
  • r1machine ID
  • r2atags指针

1.检查CPU ID的合法性

内核代码入口在linux-2.6.29/arch/arm/kernel/head.S文件的78行。首先进入SVC32模式,并查询CPU ID,检查合法性

        msr     cpsr_c, #PSR_F_BIT | PSR_I_BIT | SVC_MODE @ ensure svc mode

                                                @ and irqs disabled

        mrc     p15, 0, r9, c0, c0              @ get processor id

        bl      __lookup_processor_type         @ r5=procinfo r9=cpuid

        movs    r10, r5                         @ invalid processor (r5=0)?

        beq     __error_p                       @ yes, error 'p'

其中__lookup_processor_typelinux-2.6.29/arch/arm/kernel/head-common.S文件的156行,该函数首将标号3的实际地址加载到r3,然后将编译时生成的__proc_info_begin虚拟地址载入到r5__proc_info_end虚拟地址载入到r6,标号3的虚拟地址载入到r7。由于adr伪指令和标号3的使用,以及__proc_info_begin等符号在linux-2.6.29/arch/arm/kernel/vmlinux.lds而不是代码中被定义,此处代码不是非常直观,想弄清楚代码缘由的读者请耐心阅读这两个文件和adr伪指令的说明。

r3r7分别存储的是同一位置标号3的物理地址(由于没有启用mmu,所以当前肯定是物理地址)和虚拟地址,所以二者相减即得到虚拟地址和物理地址之间的offset。利用此offset,将r5r6中保存的虚拟地址转变为物理地址

__lookup_processor_type:

    adr    r3, 3f

    ldmda    r3, {r5 - r7}

    sub    r3, r3, r7            @ get offset between virt&phys

    add    r5, r5, r3            @ convert virt addresses to

    add    r6, r6, r3            @ physical address space

然后从proc_info中读出内核编译时写入的processor ID和之前从cpsr中读到的processor ID对比,查看代码和CPU硬件是否匹配(想在arm920t上运行为cortex-a8编译的内核?不让!)。如果编译了多种处理器支持,如versatile板,则会循环每种type依次检验,如果硬件读出的ID在内核中找不到匹配,则r50返回(在83行检查processor id时状态寄存器Z位置零)。

1:      ldmia   r5, {r3, r4}                  @ value, mask

        and     r4, r4, r9                    @ mask wanted bits

        teq     r3, r4

        beq     2f

        add     r5, r5, #PROC_INFO_SZ         @ sizeof(proc_info_list)

        cmp     r5, r6

        blo     1b

        mov     r5, #0                        @ unknown processor

2:      mov     pc, lr

2.检查machine ID合法性

接着在85行进一步查询machine ID并检查合法性

        bl      __lookup_machine_type           @ r5=machinfo

        movs    r8, r5                          @ invalid machine (r5=0)?

        beq     __error_a                       @ yes, error 'a'

 __lookup_machine_typelinux-2.6.29/arch/arm/kernel/head-common.S文件的205行,编码方法与检查processor ID完全一样,请参考前段。macheine typelinux-2.6.29/arch/arm/tools/mach-types里定义,与uboot中的board/mini2440/mini2440.c里定义的的gd->bd->bi_arch_number=**相匹配,在uboot引导内核时传递。

__lookup_machine_type:

        adr     r3, 3b

        ldmia   r3, {r4, r5, r6}

        sub     r3, r3, r4                     @ get offset between virt&phys

        add     r5, r5, r3                     @ convert virt addresses to

        add     r6, r6, r3                     @ physical address space

1:      ldr     r3, [r5, #MACHINFO_TYPE]       @ get machine type

        teq     r3, r1                         @ matches loader number?

        beq     2f                             @ found

        add     r5, r5, #SIZEOF_MACHINE_DESC   @ next machine_desc

        cmp     r5, r6

        blo     1b

        mov     r5, #0                         @ unknown machine

2:      mov     pc, lr

3.检查atags合法性,创建初始页表

代码回到head.S88行,检查atags合法性,然后创建初始页表

        bl      __vet_atags

        bl      __create_page_tables

3.1创建页表

__vet_atagslinux-2.6.29/arch/arm/kernel/head-common.S文件的244行。创建页表的代码在214行,首先将内核起始地址到内核起始地址+0x4000地址之间的16K存储器清0

__create_page_tables:

        pgtbl   r4                             @ page table address

 

        /*

         * Clear the 16K level 1 swapper page table

         */

        mov     r0, r4

        mov     r3, #0

        add     r6, r0, #0x4000

1:      str     r3, [r0], #4

        str     r3, [r0], #4

        str     r3, [r0], #4

        str     r3, [r0], #4

        teq     r0, r6

               bne          1b

      从第238行开始创建页表,该初始页表将在paging_int()函数中remove

               ldr     r7, [r10, #PROCINFO_MM_MMUFLAGS] @ mm_mmuflags

 

        /*

         * Create identity mapping for first MB of kernel to

         * cater for the MMU enable.  This identity mapping

         * will be removed by paging_init().  We use our current program

         * counter to determine corresponding section base address.

         */

        mov     r6, pc, lsr #20                @ start of kernel section

        orr     r3, r7, r6, lsl #20            @ flags + kernel base

        str     r3, [r4, r6, lsl #2]           @ identity mapping

 

        /*

         * Now setup the pagetables for our kernel direct

         * mapped region.

         */

        add     r0, r4,  #(KERNEL_START & 0xff000000) >> 18

        str     r3, [r0, #(KERNEL_START & 0x00f00000) >> 18]!

        ldr     r6, =(KERNEL_END - 1)

        add     r0, r0, #4

        add     r6, r4, r6, lsr #18

1:      cmp     r0, r6

        add     r3, r3, #1 << 20

        strls   r3, [r0], #4

        bls     1b

3.2设置映射标识 

然后在230行将proc_info中的mmu_flags加载到r7

        ldr     r7, [r10, #PROCINFO_MM_MMUFLAGS] @ mm_mmuflags

238行将PC指针右移20位,得到内核第一个1MB空间的段地址存入r6,在s3c2410平台该值是0x3000x300xxxxx右移20位)。接着根据此值存入映射标识

        mov     r6, pc, lsr #20                @ start of kernel section

        orr     r3, r7, r6, lsl #20            @ flags + kernel base

        str     r3, [r4, r6, lsl #2]           @ identity mapping

3.3为打开虚拟地址映射作准备

完成页表设置后回到98行,为打开虚拟地址映射作准备。设置sp指针,函数返回地址lr指向__enable_mmu,并跳转到linux-2.6.29/arch/arm/mm/proc-arm920.S364行,清除I-cacheD-cachewrite bufferTLB

__arm920_setup:

        mov     r0, #0

        mcr     p15, 0, r0, c7, c7             @ invalidate I,D caches on v4

        mcr     p15, 0, r0, c7, c10, 4         @ drain write buffer on v4

#ifdef CONFIG_MMU

        mcr     p15, 0, r0, c8, c7             @ invalidate I,D TLBs on v4

#endif

3.4使能mmu

然后返回head.S155行(在127行将__enable_mmu的地址放到lr中),加载domain和页表,跳转到__turn_mmu_on

__enable_mmu:

#ifdef CONFIG_ALIGNMENT_TRAP

        orr     r0, r0, #CR_A

#else

        bic     r0, r0, #CR_A

#endif

#ifdef CONFIG_CPU_DCACHE_DISABLE

        bic     r0, r0, #CR_C

#endif

#ifdef CONFIG_CPU_BPREDICT_DISABLE

        bic     r0, r0, #CR_Z

#endif

#ifdef CONFIG_CPU_ICACHE_DISABLE

        bic     r0, r0, #CR_I

#endif

        mov     r5, #(domain_val(DOMAIN_USER, DOMAIN_MANAGER) | /

                     domain_val(DOMAIN_KERNEL, DOMAIN_MANAGER) | /

                     domain_val(DOMAIN_TABLE, DOMAIN_MANAGER) | /

                     domain_val(DOMAIN_IO, DOMAIN_CLIENT))

        mcr     p15, 0, r5, c3, c0, 0          @ load domain access register

        mcr     p15, 0, r4, c2, c0, 0          @ load page table pointer

        b       __turn_mmu_on

194行把mmu使能位写入mmu,激活虚拟地址。

        mov     r0, r0

        mcr     p15, 0, r0, c1, c0, 0          @ write control reg

        mrc     p15, 0, r3, c0, c0, 0          @ read id reg

        mov     r3, r3

        mov     r3, r3

        mov     pc, r13

4.进入虚拟地址

然后将原来保存在sp中的地址(98行)载入pc,跳转到head-common.S__switch_data18行)和__mmap_switched,至此代码进入虚拟地址的世界

head-common.S49行开始清除内核bss段,processor ID保存在r9machine ID报存在r1atags地址保存在r2,并将控制寄存器保存到r7定义的内存地址。接下来跳入linux-2.6.29/init/main.c530行,start_kernel函数。这里只粘贴部分代码

__mmap_switched:

        adr     r3, __switch_data + 4

 

        ldmia   r3!, {r4, r5, r6, r7}

        cmp     r4, r5                         @ Copy data segment if needed

1:      cmpne   r5, r6

        ldrne   fp, [r4], #4

        strne   fp, [r5], #4

        bne     1b

main.c530行,是硬件无关的C初始化代码

asmlinkage void __init start_kernel(void)

{

        char * command_line;

        extern struct kernel_param __start___param[], __stop___param[];

 

        smp_setup_processor_id();

s3c2410平台linux-2.6.24内核早期的汇编初始化到这里就结束了.

你可能感兴趣的:(c,image,cache,domain,alignment,linux内核)