一步步编写操作系统 44 用c语言编写内核1

先来个简单的,欢迎我们神秘嘉宾——main.c。这是我们第一个c语言代码。

1	int main(void) {
2	 while(1);
3	 return 0;
4	}

它没法再简单啦,简单的程序似乎能帮助咱们更容易的理解所学的知识,哈哈,我说的是似乎,其实,再长的代码,编译后生成的文件结构也是由那几个部分组成,万变不离其宗。这里所说的文件结构是指将来要说的elf文件格式,在此不多说,留作伏笔。

正如之前所说,咱们只有用c语言的语法结构,这里没有包含标准库,也没有直接的系统调用,以后咱们都得按照这种简洁的方式编程啦。另外,有的同学已经注意到main.c所在的目录啦,本来我还是想卖个关子的,但它所在的目录出卖了我:在kernel目录下。对,如您所想,它就是我们第一个内核文件,我们在project目录下建立了个子目录kernel,今后我们所有与内核相关的模块都要放在此目录下。

您也看到了,这个内核文件什么都没做,通过while(1)这个死循环一直空兜cpu,目的是停在这里。想当初我就因为忘记加这样的语句而导致不知道cpu执行到哪去了,当时排错时可晕头了,看到执行的指令都不是自己写的,甚至都怀疑是虚拟机的问题,想想好惭愧啊,脸红脸红啊。当然查出来原因之后,自然又是满地打滚,喜极而泣啦。这个简单粗暴可依赖的死循环仅仅是为了演示elf文件解析以及加载内核的作用,今后我们要逐步完善它,看着它一点一点长大,就像是我们在养育孩子一样,尽管我还没有结婚^_^。

生成c语言程序的过程是这样的。先将源程序编译成目标文件(由c代码变成汇编代码后,再由汇编代码生成二进制的目标文件),再将目标文件链接成二进制可执行文件。平时我们写只有一个文件的小程序时,编译器也是悄悄在背后这样做的,除非加了参数让编译器分成两个动作。由于咱们用的是c语言写的程序,想到的是编译器自然是大名鼎鼎的gcc,所以我们用gcc编译该程序的参数是:

gcc -c -o kernel/main.o kernel/main.c,也许对其中的参数有的同学不太熟,没关系,在执行gcc –help回车后,大家可以看到一些帮助信息,其中:

-c的作用是编译、汇编到目标代码,不进行链接,也就是直接生成目标文件。

-o的作用是将输出的文件以指定文件名来存储,有同名文件存在时直接覆盖。

经过上面gcc的编译后,我们得到了main.o文件,目前为止,它还是个“半成品”。为什么这么说呢,因为它只是个目标文件,也称为待重定位文件,重定位指的是文件里面所用的符号还没有安排地址,这些符号的地址需要将来与其它目标文件“组成”一个可执行文件时再重新定位(编排地址),这里的符号就是指该目标文件中所调用的函数或使用的变量,而这里的“组成”就是指链接。这些符号一般是位于其它文件中,所以在编译时不能确定其地址,需要在所有目标文件都到齐了,将它们链接到一起时再重新定位(编排地址)。由于不知道可执行文件是由几个目标文件组成,所以一律在链接阶段对符号重新定位(编排地址)。所以说,哪怕是可执行文件只是由一个文件组成,其目标文件中的符号也是未编址的,编址工作,即重定位,一律统一在链接阶段完成。

编译成目标文件时也不我们可以用file命令检查一下main.o的状态。如file kernel/main.o,输出见图

为了让大家更明显地看出目标文件的可重定位属性,我将relocatable用方框给大家圈出来了。

目标文件是可重定位文件,其中的符号都尚未“定位”,也就是符号(变量名,函数名)的地址尚未确定,这一点我们可以用linux的nm命令来查看。如图

如图所见,由于咱们的main.c过于简单,里面只有一个符号,即main,所以nm只列出了它的符号信息。main函数的地址由于未被指定,所以其值为00000000。一会咱们链接后再对比下大家就更清楚了.

你可能感兴趣的:(masm,一步步编写操作系统)