Linux: 系统启动过程分析
以前经常觉得环境管理是运维的事,对于Linux觉得能用就行,后来实际工作中发现,当你不理解Linux内部怎么工作的,就无法在遇到问题的时候进行排查。
我们先看一个开机的流程图:
1.加载 BIOS 的硬件信息并进行自我测试,并依据设定取得第一个开机装置的代号;
2.读取并执行第一个开机装置的 MBR 的 boot Loader(lilo, grub, spfdisk 等等);
3.依据 boot loader 的设定载入 Kernel ,Kernel 开始检测硬体并载入驱动程式;
4.在硬件驱动成功后,Kernel 会主动呼叫 systemd(初始化) 程序。
大概的流程就是如此,但是每一步都是干嘛的,我们来详细说一下。
1:加载BIOS硬件信息并自检
BIOS(Basic Input Output System),基本输入输出系统,是一个永久地记录在ROM中的一个软件,是操作系统输入输出管理系统的一部分。早期的BIOS芯片确实是"只读"的,里面的内容是用一种烧录器写入的,一旦写入就不能更改,除非更换芯片。现在的主机板都使用一种叫Flash EPROM的芯片来存储系统BIOS,里面的内容可通过使用主板厂商提供的擦写程序擦除后重新写入,这样就给用户升级BIOS提供了极大的方便。
BIOS的功能由三部分组成,分别是POST,初始化和Runtime服务。POST阶段完成后它将从存储器中被清除,而Runtime服务会被一直保留,用于目标操作系统的启动。
步骤1:上电自检POST(Power-on self test),主要负责检测系统外围关键设备(如:CPU、内存、显卡、I/O、键盘鼠标等)是否正常。例如,最常见的是内存松动的情况,BIOS自检阶段会报错,系统就无法启动起来;
步骤2:初始化,包括创建中断向量、设置寄存器、对一些外部设备进行初始化和检测等,其中很重要的一部分是BIOS设置,主要是对硬件设置的一些参数,当电脑启动时会读取这些参数,并和实际硬件设置进行比较,如果不符合,会影响系统的启动。
步骤3:引导程序,会执行一段小程序用来枚举本地设备并对其初始化。这一步主要是根据我们在BIOS中设置的系统启动顺序来搜索用于启动系统的驱动器,如硬盘、光盘、U盘、软盘和网络等。我们以硬盘启动为例,BIOS此时去读取硬盘驱动器的第一个扇区(MBR,512字节),然后执行里面的代码。实际上这里BIOS并不关心启动设备第一个扇区中是什么内容,它只是负责读取该扇区内容、并执行。
PS: 在个人电脑中,Linux的启动是从0xFFFF0地址开始的。
由于不同的作业系统他的档案系统格式不相同,因此我们必须要以一个开机管理程序来处理核心档案加载(load)的问题,这个开机管理程序就被称为系统引导(Boot Loader),这个Boot Loader在开机装置的第一个磁区(sector)里,也就是主引导记录(MBR,Main Boot Record)。
至此,BIOS的任务就完成了,此后将系统启动的控制权移交到MBR部分的代码。
2. 系统引导
我们将包含MBR引导代码的扇区称为主引导扇区。因这一扇区中,引导代码占有绝大部分的空间,故而将习惯将该扇区称为MBR扇区(简称MBR)。由于这一扇区承担有不同于磁盘上其他普通存储空间的特殊管理职能,作为管理整个磁盘空间的一个特殊空间,它不属于磁盘上的任何分区,因而分区空间内的格式化命令不能清除主引导记录的任何信息。
它由三个部分组成,主引导程序(Bootloader)、硬盘分区表DPT(Disk Partition table)和硬盘有效标志(55AA)。
3. 加载Kernel操作系统核心
当我们借用 boot loader 的管理而开始读取核心档案后,接下来, Linux 就会将核心解压缩到内存当中,并将控制权转交给内核。而内核会立即初始化系统中各设备并做相关的配置工作,其中包括CPU、I/O、存储设备等。
此时 Linux 核心会以自己的功能重新检测一次硬件,并不一定会使用 BIOS 检测到的硬件信息!内核此时才开始接管 BIOS 后的工作了。核心档案一般会被放置到 /boot 里面。
[root@localhost boot]# ls--format=single-column -F /boot
config-3.10.0-693.e17.x86_64<--此版本核心被编译时选择的功能与模块设定
efi/
grub1/
grub2/ <--开机管理模式,grub2相关资料目录
initramfs-0-rescue-5b290dc8a346f8b41d03f58bb59a5b.img <==底下几个为虚拟系统档案,这个是救援系统档案。
initramfs-3.10.0-693.e17.x86_64.img <--正常开机会用到的虚拟档案系统
symvers-3.10.0-693.e17.x86_64.gz
System.map-3.10.0-693.e17.x86_64 <--核心功能放置到硬盘位置的对应表
vmlinuz-0-rescue-5b290dc8a346f8b41d03f58bb59a5b.img<--救援用的核心档案
vmlinuz-3.10.0-693.e17.x86_64* <--核心档案!!!
非必要的功能且可以编译成为模块的核心功能,目前的 Linux distributions 都會將他编译成模块。因此 USB, SATA, SCSI... 等磁盘的驱动程序都是以模块的方式存在的。
假设Linux是安装在磁盘上的,可以通过BIOS来取得boot loader与Kernel档案来开机,然后kernel会接管系统并检测硬件及挂载根目录来取得驱动程序。
但是,核心根本不认识磁盘,所以需要载入磁盘的驱动,不然无法挂载根目录,但是,磁盘的驱动是安装在/lib/modules下的,如果不挂载根目录又怎么能读取驱动程序呢,这个时候,我们就引入了虚拟硬盘的概念
虚拟硬盘是运行在内存中的,能通过boot loader载入内存,然后会被解压缩并模拟成为根目录,然后加载需要的驱动程序,并最终释放掉虚拟因公,然后挂载真实的根目录,然后就是真正的开机流程。
BIOS 与boot loader 及核心载入流程如下图所示:
4. 先简单的庆祝一小下,我们终于来到了初始化
kernel加载之后,进行完硬件检测与驱动程序加载之后,主机的硬件已经准备就绪了,这时kernel会主动呼叫第一个程序,就是systemd。systemd最主要的功能就是准备软件执行的环境,包括系统的主机名称,网络,语言,档案格式以及其他服务的启动等,这些都是通过systemd的预设启动服务集合,就是 /etc/systemd/system/default.target来进行。
大概的流程如下:
1)执行系统初始化脚本(/etc/rc.d/rc.sysinit),对系统进行基本的配置,以读写方式挂载根文件系统及其它文件系统,到此系统算是基本运行起来了,后面需要进行运行级别的确定及相应服务的启动。rc.sysinit所做的事情(不同的Linux发行版,该文件可能有些差异)如下:
(1)获取网络环境与主机类型。首先会读取网络环境设置文件"/etc/sysconfig/network",获取主机名称与默认网关等网络环境。
(2)测试与载入内存设备/proc及usb设备/sys。除了/proc外,系统会主动检测是否有usb设备,并主动加载usb驱动,尝试载入usb文件系统。
(3)决定是否启动SELinux。
(4)接口设备的检测与即插即用(pnp)参数的测试。
(5)用户自定义模块的加载。用户可以再"/etc/sysconfig/modules/*.modules"加入自定义的模块,此时会加载到系统中。
(6)加载核心的相关设置。按"/etc/sysctl.conf"这个文件的设置值配置功能。
(7)设置系统时间(clock)。
(8)设置终端的控制台的字形。
(9)设置raid及LVM等硬盘功能。
(10)以方式查看检验磁盘文件系统。
(11)进行磁盘配额quota的转换。
(12)重新以读取模式载入系统磁盘。
(13)启动quota功能。
(14)启动系统随机数设备(产生随机数功能)。
(15)清楚启动过程中的临时文件。
(16)将启动信息加载到"/var/log/dmesg"文件中。
当/etc/rc.d/rc.sysinit执行完后,系统就可以顺利工作了,只是还需要启动系统所需要的各种服务,这样主机才可以提供相关的网络和主机功能,因此便会执行下面的脚本。
2)、执行/etc/rc.d/rc脚本。该文件定义了服务启动的顺序是先K后S,而具体的每个运行级别的服务状态是放在/etc/rc.d/rc*.d(*=0~6)目录下,所有的文件均是指向/etc/init.d下相应文件的符号链接。rc.sysinit通过分析/etc/inittab文件来确定系统的启动级别,然后才去执行/etc/rc.d/rc*.d下的文件。
/etc/init.d-> /etc/rc.d/init.d
/etc/rc ->/etc/rc.d/rc
/etc/rc*.d ->/etc/rc.d/rc*.d
/etc/rc.local-> /etc/rc.d/rc.local
/etc/rc.sysinit-> /etc/rc.d/rc.sysinit
也就是说,/etc目录下的init.d、rc、rc*.d、rc.local和rc.sysinit均是指向/etc/rc.d目录下相应文件和文件夹的符号链接。我们以启动级别3为例来简要说明一下。
/etc/rc.d/rc3.d目录,该目录下的内容全部都是以 S 或 K 开头的链接文件,都链接到"/etc/rc.d/init.d"目录下的各种shell脚本。S表示的是启动时需要start的服务内容,K表示关机时需要关闭的服务内容。/etc/rc.d/rc*.d中的系统服务会在系统后台启动,如果要对某个运行级别中的服务进行更具体的定制,通过chkconfig命令来操作,或者通过setup、ntsys、system-config-services来进行定制。如果我们需要自己增加启动的内容,可以在init.d目录中增加相关的shell脚本,然后在rc*.d目录中建立链接文件指向该shell脚本。这些shell脚本的启动或结束顺序是由S或K字母后面的数字决定,数字越小的脚本越先执行。例如,/etc/rc.d/rc3.d /S01sysstat就比/etc/rc.d/rc3.d/S99local先执行。
3)、执行用户自定义引导程序/etc/rc.d/rc.local。其实当执行/etc/rc.d/rc3.d/S99local时,它就是在执行/etc/rc.d/rc.local。S99local是指向rc.local的符号链接。就是一般来说,自定义的程序不需要执行上面所说的繁琐的建立shell增加链接文件的步骤,只需要将命令放在rc.local里面就可以了,这个shell脚本就是保留给用户自定义启动内容的。
4)、完成了系统所有的启动任务后,linux会启动终端或X-Window来等待用户登录。tty1,tty2,tty3...这表示在运行等级1,2,3,4的时候,都会执行"/sbin/mingetty",而且执行了6个,所以linux会有6个纯文本终端,mingetty就是启动终端的命令。
除了这6个之外还会执行"/etc/X11/prefdm-nodaemon"这个主要启动X-Window
至此,系统就启动了。
这里有一张系统启动的详细图,仅供参考
本文参考了Linux的神作:鸟哥的Linux私房菜,在此强烈推荐一下,这本书适合当做工具书,放在手边,每次读都有新收获