Linux内核源代码概述

Linux内核源代码非常庞大,截止到2015年据统计代码总量就已经超过1500万行(LOC,Line of Code),看代码总量非常吓人,具体看这1500万行代码的大致分布情况如下图。 显然占比最大的drivers和arch目录下的代码合计占比超过70%,而驱动程序和体系结构需要支持大量相似的不同硬件,结构上重复代码居多,可称为繁杂(complicated),而占比很小的init、kernel、mm、ipc、net等目录,是Linux内核的核心,尽管代码总量不是特别大,但是却可以称为复杂(complex)。

Linux内核源代码概述_第1张图片

 主要的代码目录:

  • arch目录是与体系结构相关的子目录列表,里面存放了许多CPU体系结构的相关代码,比如arm、x86、MIPS、PPC等。arch目录中的代码在Linux内核代码中占比相当庞大,主要原因是arch目录中的代码可以使Linux内核支持不同的CPU和体系结构。alpha、arm、arm64等不同目录分别支持不同的CPU,我们最需要关心的是x86目录。
  • init目录,init是初始化的意思,存放Linux内核启动时的初始化代码。init目录中的main.c源文件负责整个Linux内核启动,而main.c源文件中的start_kernel函数是Linux内核启动过程的起点。
  • kernel目录包含主内核代码,可谓Linux内核的内核,kernel的意思是内核,就是Linux内核,这个文件夹存放内核本身需要的一些核心代码文件,其中有很多关键代码。
  • mm目录包含所有的内存管理的代码,mm是memory management,即内存管理。
  • fs目录,fs是指文件系统(file system),里面列出了Linux支持的各种文件系统的实现。
  • ipc目录包含进程间通信的代码,IPC就是进程间通信(inter-process communication)。
  • net目录包含内核中关于网络的代码,比如TCP/IP协议栈等。
  • drivers目录包含内核中所有的设备驱动程序,如字符设备、块设备、SCSI设备等。
  • lib目录:公用的库文件,里面是一些公用的库函数。注意这里的库函数和C语言的库函数是不一样的,在内核编程中不能用C语言标准库函数,这里的lib目录下的库函数就是用来替代那些标准库函数的。譬如把字符串转成数字要用atoi函数,但是内核编程中只能用lib目录下的atoi函数,不能用标准C语言库中的atoi函数。譬如在内核中要打印信息时不能用printf,而要用printk,这个printk就是lib目录下的。
  • include目录包含建立内核代码时所需的公共的头文件,包括各种体系结构共用的头文件,而模块内部的头文件放在各自模块内部,比如ARM架构特有的一些头文件在arch/arm/include目录及其子目录下。
  • 此外还有一些与声音、安全、脚本、工具相关的目录不再一一赘述。Linux内核分析中比较重要的是arch目录下的x86目录下的源文件、init目录下的main.c、kernel目录下和进程调度相关的代码等,其他还有内存管理mm、网络net、文件系统fs等代码。

要弄清楚Linux内核从哪里开始执行的,有一个关键目录是init目录,内核启动相关的代码都在这个目录下。在init目录下有main.c源文件。普通C代码程序是从main函数开始运行的,C程序的阅读一般也从main函数开始。init目录中的main.c源文件是整个Linux内核启动的起点,但它的起点不是main函数,而是main.c源文件中的start_kernel函数,start_kernel函数是初始化Linux内核启动的起点,start_kernel前的代码使用汇编语言来进行硬件初始化,启动代码会在后面的博客中详细分析。


以上内容为中科大软件学院《Linux操作系统分析》课后总结,感谢孟宁老师的倾心教授,老师讲的太好啦(^_^)

参考资料:《庖丁解牛Linux内核分析》    孟宁  编著

你可能感兴趣的:(Linux,linux,运维,服务器)