2022-02-16 Linux 0.11源码笔记(一)基址的赋值

跑起了一个hello world的操作系统 ,流程可以看2022-02-10 尝试跑个hello world的操作系统。接下来要做的事情还有很多,怎么让操作系统干事情?比如,最简单的,时间怎么显示?文件怎么创建?网络怎么请求?UI怎么绘制?APP怎么安装上去?等等一系列的问题,都需要去解决。那么,这些问题要怎么解决呢?我想到的方案的是看源码,看看别人是怎么做的,才好知道自己应该怎么做。于是,我找到了一份Linux 最简单的源码,0.11版本,Linux 0.11源码。下面是看源码做的一些笔记。
首先看看目录结构,文件目录不多。

├── Makefile
├── README.md
├── boot
├── cscope.files
├── fs
├── include
├── init
├── kernel
├── lib
├── mm
└── tools

boot则是启动目录,也就是最先执行的代码,所以我们先看看boot里面的。一共三个文件,其中第一个bootsect.s是启动相关的,后面两个后面再说

.
├── bootsect.s
├── head.s
└── setup.s

我们来打开bootsect.s文件看看里面的代码。先看最开始的一部分

.globl begtext, begdata, begbss, endtext, enddata, endbss
.text
begtext:
.data
begdata:
.bss
begbss:
.text

SETUPLEN = 4                ! nr of setup-sectors
BOOTSEG  = 0x07c0           ! original address of boot-sector
INITSEG  = 0x9000           ! we move boot here - out of the way
SETUPSEG = 0x9020           ! setup starts here
SYSSEG   = 0x1000           ! system loaded at 0x10000 (65536).
ENDSEG   = SYSSEG + SYSSIZE     ! where to stop loading

这部分代码很容易理解,都是一些变量的定义,其中需要关注的是BOOTSEG = 0x07c0,看注释可以知道0x07c0是启动的首地址,也就是说,机器开机通电后,经过一系列的自检操作,bios启动等等后,最后会跳到这个地址上,开始执行操作系统的代码。至于为什么是这个地址?可以不深究(因为我也没去深究,感兴趣的可以去查一下然后评论告诉我)。
继续往下走。今天我们先看两行代码

_start:
    mov ax,#BOOTSEG  !#BOOTSEG就是上面定义的0x07c0
    mov ds,ax

第一行代码就是把0x07c0赋值给ax
第二行代码就是把ax赋值给ds
最后的结果是,ax和ds里面的值都是0x07c0。那么这样做的作用是什么呢?这个要从ds的作用说起了,ds一般作为缺省的基址,何为基址?这么说吧,基址+偏移地址 = 物理地址,这里还有一个小细节,ds会先左移4位再和偏移地址相加。也就是说,实际上基址是0x7c00,不过ds的值依然是0x07c0。只是在计算的时候会执行左移的操作。所以,回到刚开始的问题 ,这两句代码的作用 ,其实就是保存一个基址。而保存基址的作用就是,开机时BIOS会执行到这个地址,只有把代码写在这个地址上,才会被执行到。

问题:为什么不直接把0x07c0赋值给ds呢?而要ax来中转一下?
答:据说是不允许直接给ds赋值,汇编也有它的要求,其中三条是

  • 不能直接给内存地址赋值,必须通过DS:[偏移地址]指向内存。
  • 不能直接通过给DS赋值,必须通过寄存器中转。
  • 不能修改CS、IP的值

这里扩展一些知识


寄存器结构.png

AX:寄存器称为累加器,常用于存放算术、逻辑运算中的操作数或结果。另外,所有的I/O指令都要使用累加器与外设接口传递数据。
BX:寄存器称为基址寄存器,常用来存放访问内存时的地址。
CX:寄存器称为计数寄存器,在循环、串操作指令中用作计数器。
DX:寄存器称为数据寄存器,在寄存器间接寻址中的I/O指令中存放I/O端口的地址。
CS:代码段。
DS:数据段寄存器,一般用于存放数据。也是缺省的基址
SS:堆栈段。
ES:附加段。

你可能感兴趣的:(2022-02-16 Linux 0.11源码笔记(一)基址的赋值)