linux之跳入保护模式+启动分页机制

以前的代码需要一段初始化

SelectorCode16  equ     LABEL_DESC_CODE16 - LABEL_GDT
   ;初始化16位的代码段描述符
    xor eax, eax
    mov     ax, cs
    shl eax, 4
    add eax, LABEL_SEG_CODE16
    mov word [LABEL_DESC_CODE16 +2], ax
    shr eax, 16
    mov     byte [LABEL_DESC_CODE16 +4], al
    mov byte [LABEL_DESC_CODE16 +7], ah

然后才能跳转

jmp dword   SelectorCode16:0 ;

但是现在的代码不需要初始化,直接跳

 jmp     dword   SelectorFlatC:(BaseOfLoaderPhyAddr+LABEL_PM_START)

可以分析,前面的code16的偏移其实被包含在了SelectCode16的里面,通过初始化这一操作将CS和LABEL_SEG_CODE16这个段偏移写入到选择子中
linux之跳入保护模式+启动分页机制_第1张图片
相当于这里面的段基址被写入了,不在是0

而现在的选择子则没有初始化这一阶段,段基址为零,所以直接在后面写真正的地址(BaseOfLoaderPhyAddr+LABEL_PM_START)
以前的是CS+段内偏移,因为是BIOS或者DOS加载的,所以cs不确定,也不知道程序运行的位置,现在loader是自己加载的,段地址已经被确定为BaseOfLoader,所以CS可以表示为BaseOfLoader*10h
我们因此定义BaseOfLoader*10h = BaseOfLoaderPhyAddr,这样就解释了为什么没有初始化的疑惑。

现在分析下大概的内存情况
首先boot.asm 是被写入引导扇区,程序上电自动将引导扇区加载到0x7c00处,引导扇区boot加载loader到内存0x90100处,然后跳到这里运行loader.
loader的主要操作是将磁盘中的kernel.bin拷贝到内存0x80100处,然后跳入保护模式,在保护模式中启动分页机制,然后开始内核初始化,将内核中的程序段分段拷贝到虚拟地址中。接着跳到内核程序入口地址0x30400h

完整代码如下

org 0100h
    jmp LABEL_START

%include "fat12hdr.inc"
%include "load.inc"
%include "pm.inc"
; GDT
;                            段基址     段界限, 属性
LABEL_GDT:      Descriptor 0,            0, 0              ; 空描述符
LABEL_DESC_FLAT_C:  Descriptor 0,      0fffffh, DA_CR|DA_32|DA_LIMIT_4K ;0-4G
LABEL_DESC_FLAT_RW: Descriptor 0,      0fffffh, DA_DRW|DA_32|DA_LIMIT_4K;0-4G
LABEL_DESC_VIDEO:   Descriptor 0B8000h, 0ffffh, DA_DRW|DA_DPL3 ; 显存首地址


GdtLen      equ $ - LABEL_GDT
GdtPtr      dw  GdtLen - 1              ; 段界限
        dd  BaseOfLoaderPhyAddr + LABEL_GDT     ; 基地址


; GDT 选择子
SelectorFlatC       equ LABEL_DESC_FLAT_C   - LABEL_GDT
SelectorFlatRW      equ LABEL_DESC_FLAT_RW  - LABEL_GDT
SelectorVideo       equ LABEL_DESC_VIDEO    - LABEL_GDT + SA_RPL3


BaseOfStack equ 0100h
PageDirBase equ 100000h ; 页目录开始地址: 1M
PageTblBase equ 101000h ; 页表开始地址:   1M + 4K


LABEL_START:
    mov ax, cs
    mov ds, ax
    mov es, ax
    mov ss, ax
    mov sp, BaseOfStack   ;堆栈地址

    ; 打印loading 字符
    mov dh, 0           ; "loading  "
    call    DispStrRealMode         ; 显示字符串

; 得到内存数
    mov ebx, 0          ; ebx = 后续值, 开始时需为 0
    mov di, _MemChkBuf      ; es:di 指向一个地址范围描述符结构(ARDS)
.MemChkLoop:
    mov eax, 0E820h     ; eax = 0000E820h
    mov ecx, 20         ; ecx = 地址范围描述符结构的大小
    mov edx, 0534D4150h     ; edx = 'SMAP'
    int 15h         ; int 15h
    jc  .MemChkFail
    add di, 20
    inc dword [_dwMCRNumber]    ; dwMCRNumber = ARDS 的个数
    cmp ebx, 0
    jne .MemChkLoop
    jmp .MemChkOK
.MemChkFail:
    mov dword [_dwMCRNumber], 0
.MemChkOK:


    xor ah, ah  ; 
    xor dl, dl  ;  
    int 13h ; 复位软驱

; 下面在 A 盘的根目录寻找 LOADER.BIN
    mov word [wSectorNo], SectorNoOfRootDirectory ;根目录第一个扇区号
LABEL_SEARCH_IN_ROOT_DIR_BEGIN:
    cmp word [wRootDirSizeForLoop], 0   ; 判断根目录区是不是已经读完
    jz  LABEL_NO_KERNELBIN      ; 如果读完表示没
    dec word [wRootDirSizeForLoop]  ; 
    mov ax, BaseOfKernelFile
    mov es, ax      ; es <- BaseOfLoader
    mov bx, OffsetOfKernelFile  ; bx <- OffsetOfLoader   es:bx -> 09100h
    mov ax, [wSectorNo]     ; ax <- Root Directory 中的某 Sector 号
    mov cl, 1           ;读一个扇区
    call    ReadSector

    mov si, KernelFileName  ; ds:si -> "LOADER  BIN"
    mov di, OffsetOfKernelFile  ; es:di -> BaseOfLoader:0100
    cld
    mov dx, 10h     ;每个条目占32字节  那么一个扇区只有16个条目
LABEL_SEARCH_FOR_KERNELBIN:
    cmp dx, 0                  ; 循环次数控制,
    jz  LABEL_GOTO_NEXT_SECTOR_IN_ROOT_DIR ;  如果已经读完了一个 Sector,
    dec dx                 ;  就跳到下一个 Sector
    mov cx, 11                 ;loader  bin总共有11个字符
LABEL_CMP_FILENAME:
    cmp cx, 0
    jz  LABEL_FILENAME_FOUND    ; 如果比较了 11 个字符都相等, 表示找到
    dec cx
    lodsb               ; ds:si -> al
    cmp al, byte [es:di]
    jz  LABEL_GO_ON
    jmp LABEL_DIFFERENT     ; 只要发现不一样的字符就表明本 DirectoryEntry
                    ; 不是我们要找的 LOADER.BIN
LABEL_GO_ON:
    inc di
    jmp LABEL_CMP_FILENAME  ; 继续循环

LABEL_DIFFERENT:
    and di, 0FFE0h      ;  di &= E0 为了让它指向本条目开头
    add di, 20h         ;       每个条目占32个字节  这是到达下一个条目
    mov si, KernelFileName  ;    di += 20h  下一个目录条目
    jmp LABEL_SEARCH_FOR_KERNELBIN;  

LABEL_GOTO_NEXT_SECTOR_IN_ROOT_DIR:
    add word [wSectorNo], 1
    jmp LABEL_SEARCH_IN_ROOT_DIR_BEGIN

LABEL_NO_KERNELBIN:
    mov dh, 2           ; "No kernel"
    call    DispStr         ; 显示字符串
    jmp $          ; 没有找到 kernel.BIN, 死循环在这里

LABEL_FILENAME_FOUND:           ; 找到 KERNEL.BIN 后便来到这里继续

    mov ax, RootDirSectors  ; 根目录占用的空间
    and di, 0FFE0h      ; di 指向当前目录的首地址

    push    eax
    mov eax, [es : di + 01Ch]
    mov dword [dwKernelSize], eax   ;保存kernel.bin文件大小
    pop eax


    add di, 01Ah        ; +26个字节指向条目中的开始扇区
    mov cx, word [es:di]    ; 获得开始扇区的值
    push    cx          ;保存该值 (FAT中的序号)
    add cx, ax          ;
    add cx, DeltaSectorNo   ;该簇号 + 根目录占用扇区数+19-2
                    ; 减2是因为是从第二个簇开始的
    mov ax, BaseOfKernelFile
    mov es, ax          ; es <- BaseOfLoader
    mov bx, OffsetOfKernelFile  ; bx <- OffsetOfLoader
    mov ax, cx          ; ax <- 扇区号

LABEL_GOON_LOADING_FILE:
    push    ax          ;
    push    bx          ;
    mov ah, 0Eh         ;
    mov al, '.'         ;
    mov bl, 0Fh         ;
    int 10h
    pop bx
    pop ax          ;运行之后会显示一个点 int10的作用??

    mov cl, 1
    call    ReadSector      ;读一个扇区 通过ax中的扇区号读取

    pop     ax          ;取出此sector在fat中的序号(簇号)
    call    GetFATEntry     ;通过簇号查找到下一个扇区
    cmp ax, 0FFFh       ;到达文件尾
    jz  LABEL_FILE_LOADED   ;

    push    ax          ;保存sector在FAT中的序号
    mov dx, RootDirSectors  ;根目录占扇区数
    add ax, dx
    add ax, DeltaSectorNo   ; 序号+根目录占扇区数+19-2=真正的扇区号
    add bx, [BPB_BytsPerSec]    ;每个扇区所占字节数  bx是内存偏移量
    jmp LABEL_GOON_LOADING_FILE

LABEL_FILE_LOADED:

    call    KillMotor
    mov dh, 1
    call    DispStrRealMode         ;显示字符串  ready

    ;下面跳入保护模式

    ;加载GDTR
    lgdt    [GdtPtr]
    ;关中断
    cli
    ;打开地址线
    in  al, 92h
    or  al, 00000010b
    out 92h, al
    ;准备切换到保护模式
    mov eax, cr0
    or  eax, 1
    mov cr0, eax

    ;真正进入保护模式
    jmp dword   SelectorFlatC:(BaseOfLoaderPhyAddr+LABEL_PM_START)
    jmp $

wRootDirSizeForLoop dw  RootDirSectors  ; Root Directory 占用的扇区数,
                        ; 在循环中会递减至零.
wSectorNo       dw  0       ; 要读取的扇区号
bOdd            db  0       ; 奇数还是偶数
dwKernelSize        dd  0       ;kernel.bin文件大小
;字符串
KernelFileName      db  "KERNEL  BIN", 0 ; kernel.BIN 之文件名
; 为简化代码, 下面每个字符串的长度均为 MessageLength
MessageLength       equ 9
LoadMessage:        db  "loading  " ; 9字节, 不够则用空格补齐. 序号 0
Message1        db  "ready... " ;  
Message2        db  "No KERNEL" ; 9字节, 不够则用空格补齐. 序号 2
;============================================================================


;----------------------------------------------------------------------------
; 函数名: DispStr
;----------------------------------------------------------------------------
; 作用:
;   显示一个字符串, 函数开始时 dh 中应该是字符串序号(0-based)
DispStrRealMode:
    mov ax, MessageLength
    mul dh
    add ax, LoadMessage
    mov bp, ax          ; 
    mov ax, ds          ;  ES:BP = 串地址
    mov es, ax          ; 
    mov cx, MessageLength   ; CX = 串长度
    mov ax, 01301h      ; AH = 13,  AL = 01h
    mov bx, 0007h       ; 页号为0(BH = 0) 黑底白字(BL = 07h)
    mov dl, 0
    add dh, 3
    int 10h         ; int 10h
    ret

;----------------------------------------------------------------------------
; 函数名: ReadSector
;----------------------------------------------------------------------------
; 作用:
;   从第 ax 个 Sector 开始, 将 cl 个 Sector 读入 es:bx 中
ReadSector:
    ; ----------------------------------------------------------------------
    ; 怎样由扇区号求扇区在磁盘中的位置 (扇区号 -> 柱面号, 起始扇区, 磁头号)
    ; ----------------------------------------------------------------------
    ; 设扇区号为 x
    ;                          ┌ 柱面号 = y >> 1
    ;       x           ┌ 商 y ┤
    ; -------------- => ┤      └ 磁头号 = y & 1
    ;  每磁道扇区数     │
    ;                   └ 余 z => 起始扇区号 = z + 1
    push    bp     ;将原来的bp保存
    mov bp, sp   
    sub esp, 2 ; 辟出两个字节的堆栈区域保存要读的扇区数: byte [bp-2]

    mov byte [bp-2], cl   ;要读的扇区有多少个 cl
    push    bx          ; 保存 bx
    mov bl, [BPB_SecPerTrk] ; bl: 除数  每磁道扇区数   被除数是ax  
    div bl          ; y 在 al 中, z 在 ah 中
    inc ah          ; z ++
    mov cl, ah          ; cl <- 起始扇区号
    mov dh, al          ; dh <- y
    shr al, 1           ; y >> 1 (y/BPB_NumHeads)
    mov ch, al          ; ch <- 柱面号
    and dh, 1           ; dh & 1 = 磁头号
    pop bx          ; 恢复 bx
    ; 至此, "柱面号, 起始扇区, 磁头号" 全部得到
    mov dl, [BS_DrvNum]     ; 驱动器号 (0 表示 A 盘)
.GoOnReading:
    mov ah, 2           ; 读
    mov al, byte [bp-2]     ; 读 al 个扇区
    int 13h
    jc  .GoOnReading        ; 如果读取错误 CF 会被置为 1, 
                    ; 这时就不停地读, 直到正确为止
    add esp, 2
    pop bp

    ret


;----------------------------------------------------------------------------
; 函数名: GetFATEntry
;----------------------------------------------------------------------------
; 作用:
;   找到序号为 ax 的 Sector 在 FAT 中的条目, 结果放在 ax 中
;   需要注意的是, 中间需要读 FAT 的扇区到 es:bx 处, 所以函数一开始保存了 es 和 bx
GetFATEntry:
    push    es
    push    bx
    push    ax
    mov ax, BaseOfKernelFile;
    sub ax, 0100h   ;   在 BaseOfLoader 后面留出 4K 空间用于存放 FAT
    mov es, ax      ; 
    pop ax
    mov byte [bOdd], 0
    mov bx, 3
    mul bx          ; dx:ax = ax * 3
    mov bx, 2
    div bx          ; dx:ax / 2  ==>  ax <- 商, dx <- 余数
    cmp dx, 0
    jz  LABEL_EVEN
    mov byte [bOdd], 1
LABEL_EVEN:;偶数
    ; 现在 ax 中是 FATEntry 在 FAT 中的偏移量,下面来
    ; 计算 FATEntry 在哪个扇区中(FAT占用不止一个扇区)
    xor dx, dx          
    mov bx, [BPB_BytsPerSec]
    div bx ; dx:ax / BPB_BytsPerSec
           ;  ax <- 商 (FATEntry 所在的扇区相对于 FAT 的扇区号)
           ;  dx <- 余数 (FATEntry 在扇区内的偏移)。
    push    dx
    mov bx, 0 ; bx <- 0 于是, es:bx = (BaseOfLoader - 100):00
    add ax, SectorNoOfFAT1 ; 此句之后的 ax 就是 FATEntry 所在的扇区号
    mov cl, 2
    call    ReadSector ; 读取 FATEntry 所在的扇区, 一次读两个, 避免在边界
               ; 发生错误, 因为一个 FATEntry 可能跨越两个扇区
    pop dx
    add bx, dx
    mov ax, [es:bx]
    cmp byte [bOdd], 1
    jnz LABEL_EVEN_2
    shr ax, 4
LABEL_EVEN_2:
    and ax, 0FFFh

LABEL_GET_FAT_ENRY_OK:

    pop bx
    pop es
    ret
;--------------------------------------------------------------------------
;关闭软驱马达
KillMotor:
    push    dx
    mov dx, 03F2h
    mov al, 0
    out dx, al
    pop dx
    ret





; 从此以后的代码在保护模式下执行 ----------------------------------------------------
; 32 位代码段. 由实模式跳入 ---------------------------------------------------------
[SECTION .s32]

ALIGN   32

[BITS   32]

LABEL_PM_START:
    mov ax, SelectorVideo
    mov gs, ax

    mov ax, SelectorFlatRW
    mov ds, ax
    mov es, ax
    mov fs, ax
    mov ss, ax
    mov esp, TopOfStack

    push    szMemChkTitle
    call    DispStr
    add esp, 4

    call    DispMemInfo
    call    SetupPaging

    mov ah, 0Fh             ; 0000: 黑底    1111: 白字
    mov al, 'P'
    mov [gs:((80 * 0 + 39) * 2)], ax    ; 屏幕第 0 行, 第 39 列。
    jmp $


%include    "lib.inc"


; 显示内存信息 --------------------------------------------------------------
DispMemInfo:
    push    esi
    push    edi
    push    ecx

    mov esi, MemChkBuf
    mov ecx, [dwMCRNumber];for(int i=0;i<[MCRNumber];i++)//每次得到一个ARDS
.loop:                ;{
    mov edx, 5        ;  for(int j=0;j<5;j++)//每次得到一个ARDS中的成员
    mov edi, ARDStruct    ;  {//依次显示:BaseAddrLow,BaseAddrHigh,LengthLow
.1:               ;               LengthHigh,Type
    push    dword [esi]   ;
    call    DispInt       ;    DispInt(MemChkBuf[j*4]); // 显示一个成员
    pop eax       ;
    stosd             ;    ARDStruct[j*4] = MemChkBuf[j*4];
    add esi, 4        ;
    dec edx       ;
    cmp edx, 0        ;
    jnz .1        ;  }
    call    DispReturn    ;  printf("\n");
    cmp dword [dwType], 1 ;  if(Type == AddressRangeMemory)
    jne .2        ;  {
    mov eax, [dwBaseAddrLow];
    add eax, [dwLengthLow];
    cmp eax, [dwMemSize]  ;    if(BaseAddrLow + LengthLow > MemSize)
    jb  .2        ;
    mov [dwMemSize], eax  ;    MemSize = BaseAddrLow + LengthLow;
.2:               ;  }
    loop    .loop         ;}
                  ;
    call    DispReturn    ;printf("\n");
    push    szRAMSize     ;
    call    DispStr       ;printf("RAM size:");
    add esp, 4        ;
                  ;
    push    dword [dwMemSize] ;
    call    DispInt       ;DispInt(MemSize);
    add esp, 4        ;

    pop ecx
    pop edi
    pop esi
    ret
; ---------------------------------------------------------------------------

; 启动分页机制 --------------------------------------------------------------
SetupPaging:
    ; 根据内存大小计算应初始化多少PDE以及多少页表
    xor edx, edx
    mov eax, [dwMemSize]
    mov ebx, 400000h    ; 400000h = 4M = 4096 * 1024, 一个页表对应的内存大小
    div ebx
    mov ecx, eax    ; 此时 ecx 为页表的个数,也即 PDE 应该的个数
    test    edx, edx
    jz  .no_remainder
    inc ecx     ; 如果余数不为 0 就需增加一个页表
.no_remainder:
    push    ecx     ; 暂存页表个数

    ; 为简化处理, 所有线性地址对应相等的物理地址. 并且不考虑内存空洞.

    ; 首先初始化页目录
    mov ax, SelectorFlatRW
    mov es, ax
    mov edi, PageDirBase    ; 此段首地址为 PageDirBase
    xor eax, eax
    mov eax, PageTblBase | PG_P  | PG_USU | PG_RWW
.1:
    stosd
    add eax, 4096       ; 为了简化, 所有页表在内存中是连续的.
    loop    .1

    ; 再初始化所有页表
    pop eax         ; 页表个数
    mov ebx, 1024       ; 每个页表 1024 个 PTE
    mul ebx
    mov ecx, eax        ; PTE个数 = 页表个数 * 1024
    mov edi, PageTblBase    ; 此段首地址为 PageTblBase
    xor eax, eax
    mov eax, PG_P  | PG_USU | PG_RWW
.2:
    stosd
    add eax, 4096       ; 每一页指向 4K 的空间
    loop    .2

    mov eax, PageDirBase
    mov cr3, eax
    mov eax, cr0
    or  eax, 80000000h
    mov cr0, eax
    jmp short .3
.3:
    nop

    ret
; 分页机制启动完毕 ----------------------------------------------------------


; SECTION .data1 之开始 ---------------------------------------------------------------------------------------------
[SECTION .data1]

ALIGN   32

LABEL_DATA:
; 实模式下使用这些符号
; 字符串
_szMemChkTitle: db "BaseAddrL BaseAddrH LengthLow LengthHigh   Type", 0Ah, 0
_szRAMSize: db "RAM size:", 0
_szReturn:  db 0Ah, 0
;; 变量
_dwMCRNumber:   dd 0    ; Memory Check Result
_dwDispPos: dd (80 * 6 + 0) * 2 ; 屏幕第 6 行, 第 0 列。
_dwMemSize: dd 0
_ARDStruct: ; Address Range Descriptor Structure
  _dwBaseAddrLow:       dd  0
  _dwBaseAddrHigh:      dd  0
  _dwLengthLow:         dd  0
  _dwLengthHigh:        dd  0
  _dwType:          dd  0
_MemChkBuf: times   256 db  0
;
;; 保护模式下使用这些符号
szMemChkTitle       equ BaseOfLoaderPhyAddr + _szMemChkTitle
szRAMSize       equ BaseOfLoaderPhyAddr + _szRAMSize
szReturn        equ BaseOfLoaderPhyAddr + _szReturn
dwDispPos       equ BaseOfLoaderPhyAddr + _dwDispPos
dwMemSize       equ BaseOfLoaderPhyAddr + _dwMemSize
dwMCRNumber     equ BaseOfLoaderPhyAddr + _dwMCRNumber
ARDStruct       equ BaseOfLoaderPhyAddr + _ARDStruct
    dwBaseAddrLow   equ BaseOfLoaderPhyAddr + _dwBaseAddrLow
    dwBaseAddrHigh  equ BaseOfLoaderPhyAddr + _dwBaseAddrHigh
    dwLengthLow equ BaseOfLoaderPhyAddr + _dwLengthLow
    dwLengthHigh    equ BaseOfLoaderPhyAddr + _dwLengthHigh
    dwType      equ BaseOfLoaderPhyAddr + _dwType
MemChkBuf       equ BaseOfLoaderPhyAddr + _MemChkBuf


; 堆栈就在数据段的末尾
StackSpace: times   1024    db  0
TopOfStack  equ BaseOfLoaderPhyAddr + $    ; 栈顶
; SECTION .data1 之结束

由于保护模式和分页机制前面已经单独写过详细的步骤代码,所以笔记从简。

你可能感兴趣的:(linux内核)