Linux-0.01 引导代码分析-head.s

head.s 通过编译链接的处理,同时被 boot.s 加载到保护模式零地址开始运行,在最后会调用 main 函数。

代码:

/*

 *  head.s contains the 32-bit startup code.

 *

 * NOTE!!! Startup happens at absolute address 0x00000000, which is also where

 * the page directory will exist. The startup code will be overwritten by

 * the page directory.

 * 注意:启动程序在 0x00000000,同时这个地址也是页表的地址,在这个启动完成后,这里的程序与数据会被页表覆盖。

 */

.code32 .text

.globl idt, gdt, pg_dir, startup_32



pg_dir:

startup_32:

	movl $0x10,%eax # 已经处于32 位保护模式,$0x10 是全局描述符表项的选择符

	mov %ax,%ds

	mov %ax,%es

	mov %ax,%fs

	mov %ax,%gs

	lss stack_start,%esp # 设置系统堆栈:ss,esp,stack_start 在 kernel/sched.c, 40 行

	

	call setup_idt # 设置中断描述符表

	call setup_gdt # 设置全局描述符表

	

	# 因为修改了gdt,所以需要重新装载所有的段寄存器

	movl $0x10,%eax	         # reload all the segment registers

	mov %ax,%ds		# after changing gdt. CS was already

	mov %ax,%es		# reloaded in 'setup_gdt'

	mov %ax,%fs

	mov %ax,%gs

	lss stack_start,%esp

	

	xorl %eax,%eax

	

	# 测试A20 地址线是否已经开启,如果没有开启,内核无法使用大于 1M 的内存

	# 采用的方法是向内存地址0x000000 处写入任意数值,

	# 检查 0x100000(1M) 处是否也是这个数值。

1:	incl %eax		# check that A20 really IS enabled

	movl %eax,0x000000

	cmpl %eax,0x100000

	je 1b # 向后寻找标号

	

	# CR0 : http://en.wikipedia.org/wiki/Control_register

	movl %cr0,%eax		# check math chip

	andl $0x80000011,%eax	# Save PG,ET,PE

	testl $0x10,%eax # test MP 位

	jne 1f			# ET is set - 387 is present

	orl $4,%eax		# else set emulate bit, EM 位

1:	movl %eax,%cr0

	jmp after_page_tables



/*********************************setup_idt*******************************/

/*

 *  setup_idt

 *

 *  sets up a idt with 256 entries pointing to

 *  ignore_int, interrupt gates. It then loads

 *  idt. Everything that wants to install itself

 *  in the idt-table may do so themselves. Interrupts

 *  are enabled elsewhere, when we can be relatively

 *  sure everything is ok. This routine will be over-

 *  written by the page tables.

 */



/*

 * 下面这段是设置中断描述符表子程序 setup_idt

 *

 * 将中断描述符表idt 设置成具有256 个项,并都指向ignore_int 中断门。然后加载中断

 * 描述符表寄存器(用lidt 指令)。真正实用的中断门以后再安装。当我们在其它地方认为一切

 * 都正常时再开启中断。该子程序将会被页表覆盖掉。

*/



setup_idt:

	lea ignore_int,%edx # 将 ignore_int 的有效地址(偏移值)存入到 edx 寄存器

	movl $0x00080000,%eax # 将选择符 0x0008 置入 eax 的高16 位中

	movw %dx,%ax	/* selector = 0x0008 = cs # 偏移值的低16 位置入eax 的低16 位中。此时eax 含有门描述符低4 字节的值*/

	movw $0x8E00,%dx	/* interrupt gate - dpl=0, present */



	lea idt,%edi # 将 idt 的有效地址存入 edi

	mov $256,%ecx # 循环计数 256,256 个表项

rp_sidt:

	movl %eax,(%edi) # 将 eax 的值存入 idt 的第一项的前32位

	movl %edx,4(%edi) # 将 edx 的值存入 idt 的第一项的第二个32位

	addl $8,%edi # 使 edi 指向 idt 的第二项

	dec %ecx

	jne rp_sidt # 重复执行

	lidt idt_descr # 设置中断描述符表

	ret



/*********************************setup_gdt*******************************/

/*

 *  setup_gdt

 *

 *  This routines sets up a new gdt and loads it.

 *  Only two entries are currently built, the same

 *  ones that were built in init.s. The routine

 *  is VERY complicated at two whole lines, so this

 *  rather long comment is certainly needed :-).

 *  This routine will beoverwritten by the page tables.

 */

setup_gdt:

	lgdt gdt_descr # 设置全局描述附表

	ret



/**********************************************************************/

/* Linus 将内核的内存页表直接放在页目录之后,使用了2 个表来寻址8 Mb 的物理内存。

 * 如果你有多于8 Mb 的内存,就需要在这里进行扩充修改。

*/

# 每个页表长为4 Kb 字节,而每个页表项需要4 个字节,因此一个页表共可以存放1000 个表项,

# 如果一个表项寻址4 Kb 的地址空间,则一个页表就可以寻址4 Mb 的物理内存。

# 页表项的格式为:项的前0-11 位存放一些标志,如是否在内存中(P 位0)、读写许可(R/W 位1)、

# 普通用户还是超级用户使用(U/S 位2)、是否修改过(是否脏了)(D 位6)等;表项的位12-31 是

# 页框地址,用于指出一页内存的物理起始地址。



# 从偏移0x1000 处开始是第1 个页表(偏移0 开始处将存放页表目录)。



/*********************************0x1000*******************************/

.org 0x1000 # 设置起始地址

pg0:



/*********************************0x2000*******************************/

.org 0x2000

pg1:



/*********************************0x3000*******************************/

.org 0x3000

pg2:		# This is not used yet, but if you

		# want to expand past 8 Mb, you'll have

		# to use it.



/*********************************0x4000*******************************/

.org 0x4000

after_page_tables:

	pushl $0		# These are the parameters to main :-)

	pushl $0

	pushl $0

	pushl $L6		# return address for main, if it decides to.

	pushl $main

	jmp setup_paging # 跳转到分页的设置代码

L6:

	jmp L6		# main should never return here, but

			# just in case, we know what happens.



/*********************************default interrupt "handler"*******************************/

/* This is the default interrupt "handler" :-) */

.align 2 # 2字节对齐

ignore_int:

	incb 0xb8000+160		# put something on the screen

	movb $2,0xb8000+161	# so that we know something

	iret			# happened



/*********************************Setup_paging*******************************/

/*

 * Setup_paging

 *

 * This routine sets up paging by setting the page bit

 * in cr0. The page tables are set up, identity-mapping

 * the first 8MB. The pager assumes that no illegal

 * addresses are produced (ie >4Mb on a 4Mb machine).

 *

 * NOTE! Although all physical memory should be identity

 * mapped by this routine, only the kernel page functions

 * use the >1Mb addresses directly. All "normal" functions

 * use just the lower 1Mb, or the local data space, which

 * will be mapped to some other place - mm keeps track of

 * that.

 *

 * For those with more memory than 8 Mb - tough luck. I've

 * not got it, why should you :-) The source is here. Change

 * it. (Seriously - it shouldn't be too difficult. Mostly

 * change some constants etc. I left it at 8Mb, as my machine

 * even cannot be extended past that (ok, but it was cheap :-)

 * I've tried to show which constants to change by having

 * some kind of marker at them (search for "8Mb"), but I

 * won't guarantee that's all :-( )

 */

 

/*

 * 这个子程序通过设置控制寄存器cr0 的标志(PG 位31)来启动对内存的分页处理功能,

 * 并设置各个页表项的内容,以恒等映射前8 MB 的物理内存。分页器假定不会产生非法的

 * 地址映射(也即在只有4Mb 的机器上设置出大于4Mb 的内存地址)。

 * 注意!尽管所有的物理地址都应该由这个子程序进行恒等映射,但只有内核页面管理函数能

 * 直接使用>1Mb 的地址。所有"一般"函数仅使用低于1Mb 的地址空间,或者是使用局部数据

 * 空间,地址空间将被映射到其它一些地方去 -- mm(内存管理程序)会管理这些事的。

 * 对于那些有多于8Mb 内存的家伙 - 太幸运了,我还没有,为什么你会有?代码就在这里,

 * 对它进行修改吧。(实际上,这并不太困难的。通常只需修改一些常数等。我把它设置为

 * 8Mb,因为我的机器再怎么扩充甚至不能超过这个界限(当然,我的机器很便宜的)。

 * 我已经通过设置某类标志来给出需要改动的地方(搜索"8Mb"),但我不能保证作这些

 * 改动就行了)。

 */



# paging : http://en.wikipedia.org/wiki/Paging



.align 2

setup_paging:

	movl $1024*3,%ecx # 0x1000=4096 byte=1024*32位, pg2 并没有使用,也没有在这里初始化。

	xorl %eax,%eax # eax 清零

	xorl %edi,%edi # edi 清零/* pg_dir is at 0x000 */

	cld;rep;stosl # cld 设置传送方向,rep 重复 ecx 次,stos 将 eax 的值传送到 edi 所指向的内存

	

	# 下面2 句设置页目录中的项,我们共有2 个页表所以只需设置2 项。

	# 页目录项的结构与页表中项的结构一样,4 个字节为1 项。

	# "$pg0+7"表示:0x00001007,是页目录表中的第1 项。

	# 则第1 个页表所在的地址 = 0x00001007 & 0xfffff000 = 0x1000;

	# 第1 个页表的属性标志 = 0x00001007 & 0x00000fff = 0x07,表示该页存在、用户可读写。

	movl $pg0+7,pg_dir		/* set present bit/user r/w */

	movl $pg1+7,pg_dir+4	/*  --------- " " --------- */

	

	# 下面6 行填写2 个页表中所有项的内容,共有:2(页表)*1024(项/页表)=2048 项(0 - 0xfff),

	# 也即能映射物理内存 2048*4Kb = 8Mb。

	# 每项的内容是:当前项所映射的物理内存地址 + 该页的标志(这里均为7)。

	# 使用的方法是从最后一个页表的最后一项开始按倒退顺序填写。一个页表的最后一项在页表中的

	# 位置是1023*4 = 4092。因此最后一页的最后一项的位置就是$pg3+4092。

	movl $pg1+4092,%edi

	# 最后1 项对应物理内存页面的地址是0x7ff000,

	# 加上属性标志7,即为0xfff007.

	movl $0x7ff007,%eax		/*  8Mb - 4096 + 7 (r/w user,p) */

	std # 方向位置位,edi 值递减(4 字节)。

1:	stosl			/* fill pages backwards - more efficient :-) */

	subl $0x1000,%eax # 每填写好一项,物理地址值减0x1000。

	jge 1b # 如果大于等于零,向后跳转到 1 继续执行。

	xorl %eax,%eax		/* pg_dir is at 0x0000 */  # 页目录表在0x0000 处

	movl %eax,%cr3		/* cr3 - page directory start */

	# 设置启动使用分页处理(cr0 的PG 标志,位31)

	movl %cr0,%eax

	orl $0x80000000,%eax 

	movl %eax,%cr0		/* set paging (PG) bit */ # 添上PG 标志

	

	# 在改变分页处理标志后要求使用转移指令刷新预取指令队列,这里用的是返回指令ret。

	# 该返回指令的另一个作用是将堆栈中的main 程序的地址弹出,并开始运行/init/main.c 程序。

	# 本程序到此真正结束了。终于结束了该死的汇编代码!

	ret			/* this also flushes prefetch-queue */



/*********************************idt_descr*******************************/

.align 2

.word 0

idt_descr:

	.word 256*8-1		# idt contains 256 entries

	.long idt



/*********************************gdt_descr*******************************/

.align 2

.word 0

gdt_descr:

	.word 256*8-1		# so does gdt (not that that's any

	.long gdt			# magic number, but it works for me :^)



/*********************************idt*******************************/

.align 8

idt:	.fill 256,8,0	# idt is uninitialized # 256 项,每项8 字节,填0。



/*********************************gdt*******************************/

gdt:

	.quad 0x0000000000000000	/* NULL descriptor */

	.quad 0x00c09a00000007ff	/* 8Mb , 代码段*/

	.quad 0x00c09200000007ff	/* 8Mb , 数据段*/

	.quad 0x0000000000000000	/* TEMPORARY - don't use */

	.fill 252,8,0		/* space for LDT's and TSS's etc */

需要进一步完善。

你可能感兴趣的:(linux)