《30天自制操作系统》 第一周(D1-D7) 笔记

前言:这是我2023年5月份做的一个小项目,最终是完成了整个OS。笔记的话,只记录了第一周。想完善,却扔在草稿箱里许久。最终决定,还是发出来存个档吧。

一、汇编语言

基础指令

  • MOV: move赋值,数据传送指令。一个规则:源数据和目的数据必须位数相同。该指令的数据传送源和传送目的地,不仅可以是寄存器或常数,而且可以是内存地址
  • ADD: add加,演算指令
  • CMP: compare比较指令
  • JMP: jump/goto跳转,跳转到指定的内存地址(例如:JMP 0x7c50)
  • ORG: origin源头起点,程序要从指定的该地址开始
  • DB: define byte往文件里直接写入1个字节的指令,db小写功能相同;也可直接用它写字符串
  • RESB: reserve byte预留n个字节,空出地址上自动填充0x00

条件跳转指令

  • JE: jump if equal如果相等就跳转
  • JB: jump if below如果小于就跳转
  • JAE: jump if above or equal大于或等于时就跳转
  • JBE: jump if below or equal小于或等于时就跳转
  • JC: jump if carry如果进位标志是1就跳转
  • JNC: jump if not carry如果进位标志是0就跳转

其他指令

  • DW: define word16位,2字节
  • DD: define double-word32位,4字节
  • BYTE/WORD/DWORD: 保留字
  • DWORD: Double Word双字节数据类型,是指注册表的键值,每个word为2个字节的长度,DWORD 双字即为4个字节,每个字节是8位,共32位
  • entry: 入口,标签的声明,指定JMP指令的跳转目的地【汇编中,所有标号都是数字,其对应的数字由汇编语言编译器根据ORG指令计算出来】
  • EQU: equal声明常数
  • fin: finish结束
  • INT: interrupt中断,调用BIOS函数的指令
  • HLT: halt停止,让CPU停止动作的指令(进入待机状态),节能
  • CLI: clear interrupt flag中断标志置为0
  • STI: set interrupt flag中断标志置为1
  • EFLAGS: 存储进位标志和中断标志等标志的寄存器
  • PUSHFD: push flags double-word标志位的值按双字节长压入栈
  • POPFD: pop flags double-word标志位的值按双字节长从栈弹出
  • LGDT: 指定一个内存地址,从指定的地址【ESP+6】读取6个字节后赋值给GDTR寄存器(48位)
  • 将指定的段上限【存放在ESP+4】和地址值【ESP+8】赋值给名为GDTR的48位寄存器(低位放在内存地址小的字节里,前)
  • $: 这一行现在的字节数;若有ORG,代表将要读入的内存地址
  • []: 内存/主存,对于CPU,其为外部存储器

二、存储相关概念

《30天自制操作系统》 第一周(D1-D7) 笔记_第1张图片

缓冲区地址:从软盘上读出的数据装载到内存的哪个位置

EBX处理4G内存,32位基址寄存器

起辅助作用的段寄存器:MOV AL,[ES:BS] 代表ES*16+BX的内存地址

先用附加段寄存器指定一个大致的地址,然后再用基址寄存器来指定其中一个具体地址

可以默认省略数据段寄存器DS,DS必须预先指定为0:

例如

MOV CX,[1234] 等价于MOV CX,[DS:1234]

MOV AL,[SI]等价于MOV AL,[DS:AL]

指定处理的扇区数,范围在0x01-0xff(指定0x02以上的数值时,要特别注意能够连续处理多个扇区的条件。如果是FD的话,似乎不能跨越多个磁道,也不能超过64KB的界限)

读盘顺序:扇区-磁头-柱面

AH=0x02: 读盘

AH=0x03: 写盘

AH=0x04: 校验

AH=0x0c: 寻道

AL=处理对象的扇区数(只能同时处理连续的扇区)

CH=柱面号&0xff

CL=扇区号(0-5位)|(柱面号&0x300)>>2

DH=磁头号

DL=驱动器号

ES:BX=缓冲地址;(校验及寻道时不使用)

返回值:

FLAGS.CF: 进位标志

FLACG.CF==0: 没有错误,AH==0

FLAGS.CF==1: 有错误,错误号码存入AH内(与重置(reset)功能一样)

0x10(16号): 控制显卡

//显示一个字符
AH=0x0e;
AL=character code;
BH=0;
BL=color code;
返回值:无
//系统复位,复位软盘状态,再读一次
AH=0X00
DL=0X00
INT=0x13

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

一般向一个空软盘保存文件时,

1)文件名会写在0x002600以后的地方

2)文件的内容会写在0x004200以后的地方

《30天自制操作系统》 第一周(D1-D7) 笔记_第2张图片

如果与C语言联合使用,有的寄存器能自由使用:EAX/ECX/EDX,其他寄存器只能使用其值,不能改变其值

char *p;//用于BYTE类地址
short *p;//用于WORD类地址
int *p;//用于DWORD类地址

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

os思想:把操作和机制分开

三、术语

TAB=4: TAB键的宽度

FAT=12: 用Windows或MS-DOS格式化出来的软盘就是该格式

boot sector: 启动区,软盘的第一个扇区(512字节为1扇区),一张软盘共有2880个扇区

IPL: initial program loader启动程序加载器,必须取8字节的名字

boot: bootstrap启动,原指靴子上附带的便于拿取的靴带,自力更生完成任务

BIOS: basic input output system基本输入输出系统,组装在电脑主板的ROM(read only memory)单元里

0x00007c00-0x00007dff: 启动区内容的装载地址

地址空间:一个进程用于寻址内存的一套地址集合。主要用于解决多个应用程序同时处于内存中并且互不影响的问题——保护和重定位。

.com: 地址空间可以非数字,以.com结尾的网络域名的集合也是地址空间。

sys是system的缩写,就是系统的意思,sys是Windows的系统文件。如安装文件,日志文件,驱动文件,备份文件,操作如播放等文件,还有些垃圾文件等诸如此类。 都是这类sys后缀名的。

sys文件是驱动程序的可执行代码,其扩展名为.sys,驱动程序安装保持在windows/system32/drivers目录中。

在windows中文件的文件的路径是用反斜杠(\)表示(当初是为了和Unix的文件路径使用”/“区分开来),例如 C:\windows\system,但是我们在写程序的时候能不能再路径的字符串中写成C:\windows\system?答案是不能的,这一点想一下就会可以理解,在很多编译器中,“\”是一个转义字符,例如“\n,\r”等,如果在程序中写成“C:\windows\system“那么实际上编译出来的就是“C:windowssystem ",从而获取不到文件,但是这个路径可以写成C:\windows\system,或者也可以用正斜杠C:/windows/system,这两中方式都是可以的。说到这里,基本上这两种用法不会混淆了,只要记住”\“反斜杠有转义的功能,那么写路径的时候就不会出问题了。 顺便拓展一下,文件的相对路径和绝对路径: 例如一个绝对路径:C:\Windows\System\aaa.dll 如果当前目录是C:\windows 那么aaa.dll这个文件的地址可以表示为: ./system/aaa.dll 中”.“表示当前路径, …/windows/system/aaa.dll中”…“表示父级目录。

VGA显卡:VGA(Video Graphics Array)视频图形阵列是IBM于1987年提出的一个使用模拟信号的电脑显示标准。

sprintf: 只对内存进行操作,可应用于所有OS。不是按指定格式输出,只是将输出内容作为字符串写在内存中。能够不使用OS的任何功能。

分段:将4GB的内存分割,每一块的起始地址都看作0来处理

分页:paging,有多少个任务就要分多少页,还要对内存进行排序

GDT设定要优先于IDT

GDT: global (segment) descriptor table全局段号记录表。将这些数据整齐地排列在内存的某个地方,然后将内存的起始地址和有效设定个数放在CPU内被称作GDTR(global segment descriptor table register)的特殊寄存器中,设定完成。C语言里不能对GDTR赋值。

IDT: interrupt descriptor table中断记录表

中断功能:当CPU遇到外部状况变化,或者是内部偶然发生某些错误时,会临时切换过去处理这种突发事件。这就是中断功能。

要使用鼠标,就必须要使用中断。

各个设备有变化时就产生中断,中断发生后,CPU暂时停止正在处理的任务,并做好接下来能够继续处理的准备,转而执行中断程序。中断程序执行完后,再调用事先设定好的函数,返回处理中的任务。正是得益于中断机制,CPU可以一直不用查询键盘、鼠标、网卡等设备的状态,将精力集中在处理任务上。

这就是为什么每个操作前后要加中断标志的原因叭~

系统专用和应用程序用 等价于 内核模式和用户模式

PIC: programmable interrupt controller可编程中断控制器。将8个中断信号IRQ(interrupt request)集合成一个中断信号的装置。

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

PIC寄存器(8位)

IMR: interrupt mask register中断屏蔽寄存器。8位分别对应8路IRQ信号。如果该位值为1,对应IRQ信号被屏蔽,PIC忽视该路信号。理由:对中断设定进行更改时,如果再接受别的中断会引起混乱,所以要屏蔽;此外,还可以屏蔽静电干扰等。

ICW: initial control word初始化控制数据。(只有CPU里word指代16位,这里不一定)

OCW:操作命令字。OCW1写入奇地址口,OCW2、OCW3写入偶地址口。功能:PIC继续时刻监视IRQ信号中断是否发生。io_out8(PIC0_0CW2, 0x60+IDQ号码)

四、遇到的问题

描述问题1:模拟运行操作系统时,双击"!cons_9x.bat"启动失败。 解决方法:导致该问题的原因是我自己没有仔细看书上的标注,双击"!cons_nt.bat"重试后启动成功。原因是两个文件中的命令不同,"!cons_9x.bat"中命令为command,适合linux一类系统,而"!cons_nt.bat"中命令为cmd.exe适合我现在所用的windows系统。

问题2

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

人麻了,以为路径表示不对,跟着重新打了一遍一模一样的,最后发现是拼写失误!IMG写成ING了。

改了名称,一切正常。

网上跟我同一个报错的,但理由又是各不相同。

问题3数据也能执行吗?msg 机器语言也能显示吗?entry

不会报错,标号只是一个数字,但会错乱

不太懂以下的语句:

0A 0A——OR CL,[BP+SI]

68 65 6C——PUSH 0x6c65

问题4

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

问题5 无法生成sys文件

磁盘名称11字节

代码抄错,生成镜像文件时,一定要确保bin,sys, Makefile 同时存在

报错驱使我把代码看得更细

人才:把200写成了2OO,吐血

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

学会定位错误。添加新的中间文件makefile时,需要注意前后的连贯性,是否需要添加/增减

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

忘记声明全局变量了

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

问题可能出在makefile/naskfunc.nas/bootpack.c中

问题

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

使用32位寄存器需要你进入保护模式,进入保护的方法就是开A20 gate,我看下面几行的汇编应该就是在对CR0的这个位进行设置,从而进行快速A20。如果想使用64位寄存器,就必须在进入保护模式之后,开启长模式(long mode)。

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

INSTRSET指令:告诉nask这个程序是给486使用的哦,nask会将EAX解释成寄存器名

486是英特尔系列的CPU【32位】

指定内存时,不知道是BYTE,WORD,DWORD,只有另一方也是寄存器的时候才能省略

p不是指针,而是地址变量,用于存放地址值

问题:如何显示字符

这个逻辑还是没有搞清楚

//extern char hankaku[4096]; why can delete?

//GDT的长度是怎么定的?0x270000-0x27ffff

问题:

第六天中的GB到底是什么?

1GB(Gigabyte)=1024MB

G:granularity颗粒度,单位的大小

4KB * 1M=4GB。1KB * 1M = 1GB。

问题: 为什么键盘输入需要缓冲区

缓冲区其实就是一块内存空间,它用在硬件设备和用户程序之间,用来缓存数据, 目的是让快速的CPU 不必等待慢速的输入输出设备,同时减少操作硬件的次数

_io_stihlt

汇编语言写的函数,链接到C语言使用时,一定要加_

根据CPU规范,机器语言的STI指令之后,如果紧跟着HLT指令,那么就暂不受理这两条指令之间的中断,而要等到HLT指令之后才受理,所以使用io_stihlt函数就能克服这一问题

最常出现的错误:can't link

关注细节语法错误,重点看中断部分

.h 和 naskfunc.nas

问题:

改善FIFO缓冲区,还存在E0问题

五、总结感悟

  • 头文件.h 和 makefile类正则匹配的共同目的:减少重复片段
  • 头文件.h的作用:类似目录
  • 报错首先检查笔误,再依次按关联度从高到低排查文件

你可能感兴趣的:(系统架构,汇编,c语言,windows)