Linux内核分析(三):构造一个简单的Linux系统MenuOS

何天杨+ 原创作品转载请注明出处 + 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000

一、操作系统的启动
最初计算机依靠一段二进制码来启动,并不是真正的计算机启动程序。计算机在开始加电的时候不具备工作能力,此时RAM芯片中包括的都是一些没有意义的随机数据,而没有操作系统在运行。在开始启动的时候,一个特殊的硬件电路在CPU的引脚上产生一个RESET复位信号,就是那个复位信号。在这个信号产生之后,就会把处理器的一些寄存器设置成固定的值,并执行物理地址0xfffffff0(x86架构是高地址,对于arm架构一般是低地址)那个地方的代码。硬件把这个地址映射独到ROM,ROM中所存放的程序集实际上在80x86体系中叫做基本输入/输出系统(Basic Input/Output System——BIOS)因为它包括了几个中断的低级过程。所有的操作系统在启动时,都要通过这些程序对计算机硬件设备进行初始化。一些操作系统,如微软的MS-DOS,依赖于BIOS实现大部分系统调用。
Linux中BIOS使用的是实模式,以为这是在一通电的时候就加载的所以不能用一些逻辑描述。实模式的地址用一个段地址和一个偏移量表示(seg段基址+offset)所以物理地址就是seg*16+offset。所以CPU这里面就可以直接的找到内存地址,此时还没建立一张逻辑表示和物理地址对应表。
Linux在启动阶段必须使用BIOS,此时Linux必须从磁盘或者其他的外部存储介质上获得系统的内核镜像(kernel Image)BOIS启动过程实际上分为四个过程:
1、对硬件的检测
2、硬件初始化
3、索索一个操作系统来启动
4、找到一个有效的设备。

二、实验过程简述及启动过程分析
首先我们先来构建一个简单的Linux内核。大体上是分为两个步骤,首先是现在内核源代码编译内核,然后制作根文件系统,具体步骤过程如下Linux内核分析(三):构造一个简单的Linux系统MenuOS_第1张图片
而实验楼已经为我们已经搭建了实验环境,只需要至今cd进Linux 3.18.6就行了,以下是MenuOS正在启动
Linux内核分析(三):构造一个简单的Linux系统MenuOS_第2张图片
到此为止我们就完成了一个简单的内核搭建。然后我们开始使用GDB调试,再重新打开一个终端我们可以进行如下步骤:
打开shell终端,执行以下命令:

qemu -kernel linux-3.18.6/arch/x86/boot/bzImage-initrd rootfs.img -s -S

关于-s和-S选项的说明:

-S freeze CPU at startup (use ’c’ to start execution) 在系统启动的时候冻结CPU,使用c键继续执行后续操作

-s shorthand for -gdb tcp::1234 打开远程调试端口,默认使用tcp协议1234端口,若不想使用1234端口,则可以使用-gdb tcp:xxxx来取代-s选项
指令的作用是在开始的时候就让CPU停止在启动的那一刻,我们可以看到如下的界面:
Linux内核分析(三):构造一个简单的Linux系统MenuOS_第3张图片
此时在刚才新建的那个终端窗口输入gdb进入调试模式:

gdb
(gdb)filelinux-3.18.6/vmlinux # 在gdb界面中targe remote之前加载符号表
(gdb)target remote:1234 # 建立gdb和gdbserver之间的连接,按c 让qemu上的Linux继续运行
(gdb)breakstart_kernel # 断点的设置可以在target remote之前,也可以在之后

可以看到进入gdb调试界面
Linux内核分析(三):构造一个简单的Linux系统MenuOS_第4张图片
按c键继续执行到start_kernel()函数
Linux内核分析(三):构造一个简单的Linux系统MenuOS_第5张图片
然后我们可以使用list命令常看停止断点的源代码:如下图所示就是start_kernel()部分的代码
Linux内核分析(三):构造一个简单的Linux系统MenuOS_第6张图片

三、代码分析
分析3.18.6内核部分的源码,其中比较主要就是arch下面的x86目录。由于Linux是支持很多不同的处理器的所以在这个arch就是architecture对应了不同的体系结构的CPU的启动和内核代码。以x86架构为例,从某种意义上,函数start_kernel就好像一般可执行程序中的主函数main,系统进入这个函数之前已经进行了一些最低限度的初始化,再往前研究就涉及很多硬件相关及编程语言了,这里是较高层次的初始化,基本是C代码,一直想搞清楚内核的初始化流程,好对整个linux内核有更深理解。分析程序习惯性的找main函数,那么就从这个start_kernel看看。 这个函数在init/main.c,我们首先开一下start_kernel()的源代码:
第一步:0号进程的创建

asmlinkage __visible void __init start_kernel(void)
{
    //命令行,存放bootloader传递过来的参数
    char *command_line;
    char *after_dashes;

    /*
     * Need to run as early as possible, to initialize the
     * lockdep hash:
     */
    lockdep_init();    //初始化内核调试模块
    set_task_stack_end_magic(&init_task);//init_task即手工创建的PCB
    smp_setup_processor_id();   //获取当前CPU的硬件ID
    debug_objects_early_init();    //初始化哈希桶

    /*
     * Set up the the initial canary ASAP:
     */
    boot_init_stack_canary();  //防止栈溢出

    cgroup_init_early();

这里我们看到了一个void lockdep_init(void) 函数,lockdep是一个内核调试模块,用来检查内核互斥机制(尤其是自旋锁)潜在的死锁问题。
接下来是看到init_task,其在文件linux-3.18.6/init/init_task.c中定义如下:

struct task_struct init_task = INIT_TASK(init_task);

可见它其实就是一个task_struct,与用户进程的task_struct一样。相当于《Linux内核分析(二)》中的PCB结构体。
init_task中保存了一个进程的所有基本信息,如进程状态,栈起始地址,进程号pid等,其特殊之处在于它的pid=0,也就是通常所说的0号进程,0号进程就是我们这样通过手工创建出来的。也就是start_kernel()创建了0号进程。
0号进程的任务范围是从最早的汇编代码一直到start_kernel()的执行结束。

总结下来就是:
start_kernel启动过程分析

内核的初始化程序在start_kernel这个函数中,可以在线查看这些代码: start_kernel。通过阅读start_kernel代码,可以大致了解到内核在初始化的时候,做了以下工作:
1)lockdep_init():初始化内核依赖关系表,初始化hash表
2)boot_init_stack_canary():为栈增加保护机制,预防一些缓冲区溢出之类的攻击
3)tick_init():初始化内核时钟系统
4)boot_cpu_init():激活当前CPU
5)setup_arch():对不同体系结构的CPU设置不同的参数、选项等
6)trap_init():初始化硬件中断,函数中设置了很多中断门
7)mm_init():建立内核的内存分配器
8)sched_init():初始化任务调度
9)init_IRQ():中断向量的初始化
…….
很多初始化工作。。
n)rest_init():剩下的初始化工作,这里面其实做了很多工作。
从rest_init开始,Linux开始产生进程,因为init_task是静态制造出来的,pid=0,它试图将从最早的汇编代码一直到start_kernel的执行都纳入到init_task进程上下文中。我们也可以看一下linux-3.18.6/init/main.c文件中的rest_init函数源码。内核将通过下面的代码产生第一个真正的进程(pid=1):
第二步:1号进程的创建

static noinline void __init_refok rest_init(void)
{
    int pid;
    rcu_scheduler_starting();
    //很重要,创建一个内核线程,PID=1,创建好了,但不能去调度它
    kernel_thread(kernel_init, NULL, CLONE_FS);
    numa_default_policy();
    ...
}

在rest_init()函数中有这样一句话:
kernel_thread(kernel_init, NULL, CLONE_FS);
其中kernel_thread()的源码在文件linux-3.18.6/kernel/fork.c中定义,如下:

pid_t kernel_thread(int (*fn)(void *), void *arg, unsigned long flags)
{
    return do_fork(flags|CLONE_VM|CLONE_UNTRACED, (unsigned long)fn,
        (unsigned long)arg, NULL, NULL);
}

这里相当于fork出了新进程来执行kernel_init()函数。
而kernel_init()函数的定义在文件linux-3.18.6/init/main.c中定义,如下:

//创建的内核线程运行本函数,在本函数里面启动run_init_process
static int __ref kernel_init(void *unused)
{
    int ret;
    kernel_init_freeable();
    async_synchronize_full();
    free_initmem();
    mark_rodata_ro();
    system_state = SYSTEM_RUNNING;
    numa_default_policy();
    flush_delayed_fput();
    if (ramdisk_execute_command) {
    //启动run_init_process
        ret = run_init_process(ramdisk_execute_command);
        if (!ret)
            return 0;
        pr_err("Failed to execute %s (error %d)\n",
               ramdisk_execute_command, ret);
    }
    if (execute_command) {
        ret = run_init_process(execute_command);
        if (!ret)
            return 0;
        pr_err("Failed to execute %s (error %d).  Attempting defaults...\n",
            execute_command, ret);
    }
    /*try_to_run_init_process()通过嵌入汇编构造一个
    类似用户态代码一样的sys_execve()调用,其参数就是
    要执行的可执行文件名。
    */
    /*这里是内核初始化结束并开始用户态初始化的分界
    */
    if (!try_to_run_init_process("/sbin/init") ||
        !try_to_run_init_process("/etc/init") ||
        !try_to_run_init_process("/bin/init") ||
        !try_to_run_init_process("/bin/sh"))
        return 0;

    panic("No working init found.  Try passing init= option to kernel. "
          "See Linux Documentation/init.txt for guidance.");
}

以上代码的最后部分,实际就是通过execve()执行磁盘文件上的init程序。而这里的init程序,就是用户态程序了,也就是大名鼎鼎的1号进程。由此实现了内核态向用户态的转化。

第三步:0号进程的转变

在linux-3.18.6/init/main.c文件中看rest_init()函数的代码如下:

static noinline void __init_refok rest_init(void)
{
    int pid;
    rcu_scheduler_starting();
    //很重要,创建一个内核线程,PID=1,创建好了,但不能去调度它
    kernel_thread(kernel_init, NULL, CLONE_FS);
    numa_default_policy();
    //很重要,创建第二个内核线程,PID=2,负责管理和调度其它内核线程。
    pid = kernel_thread(kthreadd, NULL, CLONE_FS | CLONE_FILES);
    rcu_read_lock();
    kthreadd_task = find_task_by_pid_ns(pid, &init_pid_ns);
    rcu_read_unlock();
    complete(&kthreadd_done);
    init_idle_bootup_task(current);
    schedule_preempt_disabled();
    cpu_startup_entry(CPUHP_ONLINE);
}

rest_init()在创建了1号、2号进程之后,系统可以正式对外工作了。之后执行最后一行代码:

cpu_startup_entry(CPUHP_ONLINE);

cpu_startup_entry()函数的定义在文件linux-3.18.6/kernel/sched/idle.c中,如下所示:

void cpu_startup_entry(enum cpuhp_state state)
{
#ifdef CONFIG_X86
    boot_init_stack_canary();
#endif
    arch_cpu_idle_prepare();
    cpu_idle_loop();
}

其中,cpu_idle_loop()实际是一个while无限循环,也就是说,0号进程在fork了1号进程并且做了其余的启动工作之后,最后“进化”成为了idle进程。完成其使命,并一直处于内核态中无线循环。

四、Linux内核启动的一些综述补充
start_kernel( )函数完成了Linux内核的初始化工作。几乎每天内核部件都是用这个函数进行初始化的,我们只是说道了其中的一小部分:
1.调用sched_init()函数来初始化调度程序
2.调用build_all_zonelists()函数俩初始化内存管理
3.调用page_alloc_init()函数来初始化伙伴系统分配程序
4.调用trap_init()函数和init_IRQ()函数以初始化IDT
5.调用softing_init()函数初始化TASKLET_SOFTIRQ和HI_SOFTIRQ(软中断)
6.调用time_init()初始化系统日期时间
7.调用kmem_cache_init()函数初始化slab分配器(普通和高速缓存)
8.调用calibrate_delay()函数用于确定CPU时钟(延迟函数)
9.调用kernel_thread()函数为进程1创建内个线程,这个内核线程又会创建其他的内核线程并执行/sbin/init程序
在start_kernel()开始执行之后会显示linux版本,除此之外,在init程序和内核线程执行的最后阶段还会显示很多其他信息。最后,就会在控制台上出现熟悉的登陆提示,通知用户Linux内核已经启动正在运行。
Linux内核分析(三):构造一个简单的Linux系统MenuOS_第7张图片

你可能感兴趣的:(孟Linux内核分析)