距离我上次我写Linux0.11版本的内核分析,稍微隔得时间有点久,一个主要是由于要回答星球上朋友们遇到的问题,另外一个是自己去学习重温了一下汇编语言,其实也不是重温,压根就是自己基础差,以前没咋系统学习过!其实汇编还是非常有用的,比如平时调试错误在一些高级语言的时候,可以进行反汇编,这个有很大的帮助!
这里为啥突然去学习一下汇编,最主要的原因是我想好好分析一下boot目录里面的汇编源码,看看里面到底是如何运行到把内核加载执行起来的。其实这个东西,对于做嵌入式开发的朋友来说,应该是很熟悉的,比如说uboot(这个执行流程和作用,我就不重复了!)我自己平时工作也会接触到这个,只是对里面的细节不知道是咋样的!
今天打算把最近学习的一些东西,总结一下,本次文章主要是分析内核版本linux0.11里面的boot目录下的bootsect.s这个汇编源码解析。
Linux内核0.11版本boot目录在开始分析这个启动流程之前,给大家推荐一下比较不错的学习资料:
汇编语言学习这块,可以先看b站上这个老师的汇编讲解,讲的非常不错,然后可以结合王爽老师的那本书来巩固会更好:
课程地址:
https://www.bilibili.com/video/BV1pi4y1P76P?p=23&vd_source=6b552449c88698b9b658a83fbe4cde84
如果这个看完了之后,有时间的话,可以再学习这本书籍(X86汇编语言从实模式到保护模式):
同时呢,对于Linux内核0.11内核版本的试验环境,理论知识可以学习哈工大李治军老师的讲的操作系统课程:
课程地址:
https://www.icourse163.org/learn/HIT-1002531008?tid=1450346461#/learn/content
如果你想做试验的话,可以在这个模拟环境下进行:
环境地址:
https://www.lanqiao.cn/courses/115/learning/?id=374
当然如你时间多的话,可以自己折腾操作系统的实现,可以参考这本书去学习和实战(Orange'S一个操作系统的实现):
这块后面会分享个人学习笔记!
ok ,这里就大概讲这些,下面开始解析bootsect.s里面的源码!
不过在讲这个之前呢,我先把x86几个寄存器汇总一下,然后再开始分析源码;
在x86里面有14个寄存器,他们分别是:
1、通用寄存器:AX、BX、CX、DX
2、变址寄存器:SI、DI
3、指针寄存器:SP、BP
4、指令指针寄存器:IP
5、段器存器:CS、SS、DS、ES
6、标志寄存器:psw
具体的名称可以看这张图(图片来源网络整理):
这里的目的主要是等下,分析源码的时候,可以参考一下这个,其他的汇编指令,这里就不汇总了!
大家应该都有这样的感受,平时我们打开windows系统或者Linux系统,开机的时候,都会有一个过程,这个过程中你可以看到开机Logo,然后接着就可以进入到实际的应用桌面了!
其实这个再说的实际一点,比如我们平时做的嵌入式产品里面,也是这样的,上电开机的时候,会看到一个logo,然后接着就会进入到界面!
但是你有没有想过,这个过程中,干了啥?从嵌入式的角度来看,经历过程是这样的:
uboot到kernel,再到根文件系统,再到最后的实际应用程序!
今天我们从另外一个角度(原理都是一样的):X86 pc机上电干了啥:
1、x86 pc机刚开始上电开机的时候,cpu处于实模式,什么是实模式?这里简单的理解就是实际地址访问模式,具体的细节,这个大家可以去学习一下!比如说,cpu是怎样去寻址的!上面推荐的汇编书籍里面就有这块的知识点!我这里主要讲一个cpu怎样去找到实际的物理地址,暂时先记住这个就行,物理地址=段地址 x 16(也就是向左移四位)+偏移地址
2、同时开机的时候,器存器cs=0xffff,ip=0x0000
3、寻址0xffff0(ROM BIOS的隐射区),注意这里的0xffff0是从cs左移4位得到的,然后再加上ip,就是从这个地址0xffff0开始寻址的,这块地址上的代码就是ROM BIOS!
4、检查RAM、键盘、显示器、软硬磁盘,这里检查没有问题了,就可以继续往下执行!如果这里出了问题的话,根本就不能往下去加载内核的操作了。
5、将磁盘、磁道0扇区(也就是引导扇区)读入到0x7c00处,也就是说把bootsect.s读入到内存绝对地址0x7C00这个位置来
6、设置cs=0x07c0,ip=0x0000
注意:0x7c00这个位置存放的代码就是从引导扇区读入的512个字节,而引导扇区就是启动设备的第一个扇区,它里面存放着开机执行的第一段程序,也就是我们上面说的bootsect.s。
从上面。我们可以看到,bios主要的工作先是检查硬件的好坏(当然还包括初始化中断向量),然后再把bootsect.s加入到绝对地址0x7c00这里来,然后开始进行具体的一系列初始化操作,这个我们现在来看汇编源码,这里今天暂时只分析一部分:
.globl begtext, begdata, begbss, endtext, enddata, endbss
.text
begtext:
.data
begdata:
.bss
begbss:
.text
SETUPLEN = 4 ! nr of setup-sectors
BOOTSEG = 0x07c0 ! original address of boot-sector
INITSEG = 0x9000 ! we move boot here - out of the way
SETUPSEG = 0x9020 ! setup starts here
SYSSEG = 0x1000 ! system loaded at 0x10000 (65536).
ENDSEG = SYSSEG + SYSSIZE ! where to stop loading
! ROOT_DEV: 0x000 - same type of floppy as boot.
! 0x301 - first partition on first drive etc
ROOT_DEV = 0x306
entry start
start:
mov ax,#BOOTSEG
mov ds,ax
mov ax,#INITSEG
mov es,ax
mov cx,#256
sub si,si
sub di,di
rep
movw
jmpi go,INITSEG
go: mov ax,cs
mov ds,ax
mov es,ax
! put stack at 0x9ff00.
mov ss,ax
mov sp,#0xFF00 ! arbitrary value >>512
! load the setup-sectors directly after the bootblock.
! Note that 'es' is already set up.
代码解析:
.globl begtext, begdata, begbss, endtext, enddata, endbss:定义了6个全局标识符
然后是代码段、数据段、bss段、文本段:
.text ###文本段
begtext:
.data ###数据段
begdata:
.bss ###未初始化数据段
begbss:
.text ###文本段
上面这些都是伪指令,伪指令是由编译器来执行的指令,编译器根据伪指令来进行相关的编译工作
然后是相关参数介绍:
!也就是setup程序的扇区数为4块
SETUPLEN = 4 ! nr of setup-sectors
!bootset的段地址为0x07c0
BOOTSEG = 0x07c0 ! original address of boot-sector
#!把bootset移到这个地址0x9000上来
INITSEG = 0x9000 ! we move boot here - out of the way
!setup程序就是从0x9020开始执行
SETUPSEG = 0x9020 ! setup starts here
!把system模块加载到0x10000这个地方来
SYSSEG = 0x1000 ! system loaded at 0x10000 (65536).
!停止加载
ENDSEG = SYSSEG + SYSSIZE ! where to stop loading
ROOT_DEV = 0x306表示ROOT_DEV = 0x306,这个涉及到硬盘命名方式,这个可以自己去查资料学习一下
entry start:关键字entry告诉链接器start是程序的入口
下面我们开始讲解主代码:
start:
!把数据段器存器设置为0x7c00
mov ax,#BOOTSEG
mov ds,ax
!把es段器存器设置为0x9000
mov ax,#INITSEG
mov es,ax
mov cx,#256 !把cx设置成256
!源地址为ds:si= 0x07c0:0x0000 这里写主要是为了形成偏移地址,这里为0,也就是形成了物理地址,下面的同理
sub si,si
sub di,di !目的地址为es:di = 0x9000:0x0000
rep !重复执行,直到cx为0
movw !移动一个字,这里w的意思是word,一个字,这里的意思也就是
把0x07c0:0x0000处的256个字移动到 0x9000:0x0000
!这里的意思是0x7c0处的bootset程序跳转到0x9000:0x0000处去执行
jmpi go,INITSEG
go: mov ax,cs !cs=0x90000
mov ds,ax
mov es,ax
!这里的话把ds、cs、ss都设置成0x9000
! put stack at 0x9ff00. !将堆栈指针sp指向0x9ff00(0x9000:0xff00)
mov ss,ax
mov sp,#0xFF00 ! arbitrary value >>512
Ok,这里简单总结一下,这块代码主要是把bootsect移动到0x9000这个位置上来!后面还有一部分非常重要,我这里先给一个图:
今天的bootsect.s源码分析就到这里了,我们下期继续分析源码!
相关参考:
操作系统哈尔滨工业大学李治军老师
linux内核完全注释
https://www.bilibili.com/video/BV1iW411Y73K?p=3&vd_source=6b552449c88698b9b658a83fbe4cde84
对了,个人朋友圈,已经开放,坑位有限,时常分享一些非技术性的东西,感兴趣的,可以来唠唠嗑,交个朋友;技术方面的也行,大家相互学习,共同进步:三人行,必有我师焉!
我扫你,还是你扫我?