Linux内核源码分析--内核启动之(5)Image内核启动(rest_init函数)(Linux-3.0 ARMv7)

    前面粗略分析start_kernel函数,此函数中基本上是对内存管理和各子系统的数据结构初始化。在内核初始化函数start_kernel执行到最后,就是调用 rest_init函数,这个函数的主要使命就是创建并启动内核线程init。这个函数虽然意思为剩下的初始化,但是这个“剩下”的可是内容颇多,下面详细分析如下:

  1. /*
  2.  * 我们必须确定在一个非__init函数或
  3.  * 其他根线程(root thread)和初始化线程(init thread)间的竞态。
  4.  * (这种竞态可能导致start_kernel在根线程运作到cpu_idle前被free_initmem“收割”。)
  5.  *
  6.  *
  7.  *  gcc-3.4 偶尔会将这个函数作为内联函数, 所以使用了noinline.
  8.  */

  9. static __initdata DECLARE_COMPLETION(kthreadd_done);

  10. 点击(此处)折叠或打开

    1. 定义一个complete变量来告诉init线程:kthreads线程已经创建完成。
    2. 从前似乎不是用complete锁,而是用大内核锁。
  11. static noinline void __init_refok rest_init(void)
  12. {
  13.     int pid;

  14.     rcu_scheduler_starting();

    点击(此处)折叠或打开

    1. 内核RCU锁机制调度启动,因为下面就要用到

  15.     /*
  16.      * 我们必须先创建init内核线程,这样它就可以获得pid为1。
  17.      * 尽管如此init线程将会挂起来等待创建kthreads线程。
  18.      * 如果我们在创建kthreadd线程前调度它,就将会出现OOPS。
  19.      */
  20.     kernel_thread(kernel_init, NULL, CLONE_FS | CLONE_SIGHAND);

    点击(此处)折叠或打开

    1. 创建kernel_init内核线程,内核的1号进程!!!!!

  21.     numa_default_policy();

    点击(此处)折叠或打开

    1. 设定NUMA系统的内存访问策略为默认

  22.     pid = kernel_thread(kthreadd, NULL, CLONE_FS | CLONE_FILES);
  23. 点击(此处)折叠或打开

    1. 创建kthreadd内核线程,它的作用是管理和调度其它内核线程。
    2. 它循环运行一个叫做kthreadd的函数,该函数的作用是运行kthread_create_list全局链表中维护的内核线程。
    3. 调用kthread_create创建一个kthread,它会被加入到kthread_create_list 链表中;
    4. 被执行过的kthread会从kthread_create_list链表中删除;
    5. 且kthreadd会不断调用scheduler函数让出CPU。此线程不可关闭。

    上面两个线程就是我们平时在Linux系统中用ps命令看到:

    点击(此处)折叠或打开

    1. tekkaman@Super-MAGI:~/development/analyze/linux-3.0$ ps -A
    2. PID TTY TIME CMD
    3. 1 ? 00:00:00 init
    4. 2 ? 00:00:00 kthreadd
    5. ......

        rcu_read_lock();
  24.     kthreadd_task = find_task_by_pid_ns(pid, &init_pid_ns);
  25.     rcu_read_unlock();
  26.     complete(&kthreadd_done);

  27. 点击(此处)折叠或打开

    1. 获取kthreadd的线程信息,获取完成说明kthreadd已经创建成功。并通过一个complete变量(kthreadd_done)来通知kernel_init线程。

  28.     /*
  29.      为让系统运作起来,
  30.      * boot idle线程必须至少执行一次schedule():
  31.      */
  32.     init_idle_bootup_task(current);

    点击(此处)折叠或打开

    1. 设置当前进程为idle(闲置)进程类。

  33.     preempt_enable_no_resched();

    点击(此处)折叠或打开

    1. 使能抢占,但不重新调度

  34.     schedule();

    点击(此处)折叠或打开

    1. 执行调度,切换进程。

  35.     preempt_disable();

    点击(此处)折叠或打开

    1. 进程调度完成,回到这里,禁用抢占。


  36.     / 在抢占禁用时调用cpu_idle */
  37.     cpu_idle();

    点击(此处)折叠或打开

    1. 此时内核本体进入了idle状态,用循环消耗空闲的CPU时间片,该函数从不返回。在有其他进程需要工作的时候,该函数就会被抢占!这个函数因构架不同而异。

  38. }
    
     在以上的函数中,内核创建了两个内核线程,一个是内核线程的管理者,另一个是内核初始化线程init,后者是我们分析内核启动需要关注的,这个线程继续做系统的初始化(其中就包含了设备驱动系统):

点击(此处)折叠或打开

  1. 下面这个函数就是内核init线程运行的函数,它将完成设备驱动程序的初始化,并调用init_post函数启动用户空间的init进程。

  1. static int __init kernel_init(void * unused)
  2. {
  3.     /*
  4.      等待kthreadd的启动完成.
  5.      */
  6.     wait_for_completion(&kthreadd_done);
  7.     /*
  8.      init可以在任何节点(node)分配到内存页
  9.      */
  10.     set_mems_allowed(node_states[N_HIGH_MEMORY]);
  11.     /*
  12.      * init可以在任何CPU上运行.
  13.      */
  14.     set_cpus_allowed_ptr(current, cpu_all_mask);

    点击(此处)折叠或打开

    1. 增加当前进程的CPU亲和力,使所有的CPU(如果是SMP)都可以运行本线程。
    2. 线程可以被迁移到被设置掩码的CPU上运行,但如果在位掩码中删除该CPU位,此线程就不会在那个CPU上运行。

  15.     cad_pid = task_pid(current);

  16. 点击(此处)折叠或打开

    1. cad_pid为接收Ctrl-alt-del操作的INT信号的进程ID,此处很明显是设为了init的PID

  17.     smp_prepare_cpus(setup_max_cpus);

  18.     do_pre_smp_initcalls();
  19.     lockup_detector_init();

  20.     smp_init();
  21.     sched_init_smp();

    点击(此处)折叠或打开

    1. 以上代码是在SMP系统做准备,激活所有CPU,并开始SMP系统的调度。

  22.     do_basic_setup();

    点击(此处)折叠或打开

    1. 到此,与构架相关的部分已经初始化完成了,do_basic_setup函数主要是初始化设备驱动,完成其他驱动程序(直接编译进内核的模块)的初始化。内核中大部分的启动数据输出(都是各设备的驱动模块输出)都是这里产生的。
    2. 此函数比较重要,以后会详细分析!


  23.     /* 打开根文件系统中的 /dev/console , 此处不可失败 */
  24.     if (sys_open((const char __user *) "/dev/console", O_RDWR, 0) < 0)
  25.         printk(KERN_WARNING "Warning: unable to open an initial console.\n");

    点击(此处)折叠或打开

    1. 这是kernel_init(以后的init进程)打开的第一个文件,它也就成为了标准输入。
    2. 这里需要打开 /dev/console,如果没有这个节点,系统就出错。这个错误信息也是经常碰到的。可能的原因是:
    3. 1、制作文件系统的时候忘记创建/dev/console节点
    4. 2、文件系统挂载问题,挂载上的文件系统不是什么都没有,就是挂错了节点。


  26.     (void) sys_dup(0);
  27.     (void) sys_dup(0);

    点击(此处)折叠或打开

    1. 复制两次标准输入(0)的文件描述符(它是上面打开的/dev/console,也就是系统控制台):
    2. 一个作为标准输出(1)
    3. 一个作为标准出错(2)
    4. 现在标准输入、标准输出、标准出错都是/dev/console了。
    5. 这个console在内核启动参数中可以配置为某个串口(ttySn、ttyOn等等),也可以是虚拟控制台(tty0)。所以我们就在串口或者显示器上看到了之后的系统登录提示。

  28.     /*
  29.      * 检查是否有早期用户空间的init程序。如果有,让其执行
  30.      * 
  31.      */

  32.     if (!ramdisk_execute_command)
  33.         ramdisk_execute_command = "/init";

  34.     if (sys_access((const char __user *) ramdisk_execute_command, 0) != 0) {
  35.         ramdisk_execute_command = NULL;
  36.         prepare_namespace();
  37.     }

  38.     /*
  39.      * Ok, 我们已经完成了启动初始化, and
  40.      * 且我们本质上已经在运行。释放初始化用的内存(initmem)段
  41.      * 并开始用户空间的程序..
  42.      */

  43.     init_post();
  44.     return 0;
  45. }
在内核init线程的最后执行了init_post函数,在这个函数中真正启动了用户空间进程init,详解如下:

  1. /* 这是一个非__init函数。强制让它为非内联函数,以防 gcc
  2.  * 让它内联到init()中并成为init.text段的一部分。
  3.  */

    点击(此处)折叠或打开

    1. 从此函数名可知,这个函数是运行在用户空间的init程序之前
  4. static noinline int init_post(void)
  5. {
  6.     /* 在释放内存前,必须完成所有的异步 __init 代码 */
  7.     async_synchronize_full();
  8.     free_initmem();

    点击(此处)折叠或打开

    1. 释放所有init.* 段中的内存。

  9.     mark_rodata_ro();

    点击(此处)折叠或打开

    1. 通过修改页表,保证只读数据段为只读属性。大部分构架为空函数。

  10.     system_state = SYSTEM_RUNNING;

    点击(此处)折叠或打开

    1. 设置系统状态为运行状态

  11.     numa_default_policy();

    点击(此处)折叠或打开

    1. 设定NUMA系统的内存访问策略为默认


  12.     current->signal->flags |= SIGNAL_UNKILLABLE;

    点击(此处)折叠或打开

    1. 设置当前进程(init)为不可以杀进程(忽略致命的信号)


  13.     if (ramdisk_execute_command) {
  14.         run_init_process(ramdisk_execute_command);
  15.         printk(KERN_WARNING "Failed to execute %s\n",
  16.                 ramdisk_execute_command);
  17.     }

    点击(此处)折叠或打开

    1. 如果ramdisk_execute_command有指定的init程序,就执行它。


  18.     /*
  19.      * 我们尝试以下的每个函数,直到函数成功执行.
  20.      *
  21.      如果我们试图修复一个真正有问题的设备,
  22.      * Bourne shell 可以替代init进程。
  23.      */
  24.     if (execute_command) {
  25.         run_init_process(execute_command);
  26.         printk(KERN_WARNING "Failed to execute %s. Attempting "
  27.                     "defaults...\n", execute_command);
  28.     }

    点击(此处)折叠或打开

    1. 如果execute_command有指定的init程序,就执行它。

  29.     run_init_process("/sbin/init");
  30.     run_init_process("/etc/init");
  31.     run_init_process("/bin/init");
  32.     run_init_process("/bin/sh");

  33.     panic("No init found. Try passing init= option to kernel. "
  34.      "See Linux Documentation/init.txt for guidance.");

    点击(此处)折叠或打开

    1. 在检查完ramdisk_execute_command和execute_command为空的情况下,顺序执行以下初始化程序:如果都没有找到就打印错误信息。这也是我们做系统移植的时候经常碰到的错误信息,出现这个信息很有可能是:
    2. 1、你的启动参数配置有问题,通过 指定了init程序,但是没有找到,且默认的那四个程序也不在文件系统中。
    3. 2、文件系统挂载有问题,文件不存在
    4. 3、init程序没有执行权限

    点击(此处)折叠或打开

    1. 至此,内核的初始化结束,正式进入了用户空间的初始化过程!!

  35. }


你可能感兴趣的:(Linux内核源码分析--内核启动之(5)Image内核启动(rest_init函数)(Linux-3.0 ARMv7))