操作系统通常是由许多程序员写成的,包括很多部分的大型C(有时是C++)程序。
C语言
在C中基本数据类型是整数(包括短整数和长整数)、字符和浮点数等。使用数组、结构体和联合,可以构造组合数据类型。C语言中的控制语句与Java类似,包括if、、switch、for以及while等语句。在这两个语言中,函数和参数大致相同。
一项C语言中有而Java和Python中没有的特点是显式指针。指针是一种指向(即包含对象的地址)一个变量或数据结构的变量。C语言中没有内建字符串、线程、包、类、对象、类型安全以及垃圾回收等。最后一个是操作系统的“淋浴器塞子”。在C中分配的存储空间或者是静态的,或者是程序员明确分配和释放的,通常使用malloc以及free库函数。正是由于后面的这个性质——由程序员控制所有内存——而且是明确的指针,使得C语言対编写操作程序而言非常有吸引力。从一定程度上来说,操作系统实际上是一个实时操作系统,甚至通用系统也是实时系统。当中断发生时,操作系统可能只有若干微秒去完成特定的操作,否则会丢失关键的信息。在任意时刻启动垃圾回收功能是不可接受的。
头文件
一个操作系统项目通常包括多个目录,每个目录都含有许多.c文件,这些文件中存有系统某个部分的代码,而一些.h头文件则包含供一个或多个代码文件使用的声明及定义。头文件还可以包含简单的宏,宏允许程序员命名常数宏可以附带参数。头文件汉可以包含条件编译,例如:
#ifdef X86
intel_int_ack();
#endif
如果宏X86有定义,而不是其他,则编译进对Intel_int_ack函数的调用。为了分隔与结构有关的代码,大量使用了条件编译,这样只有当系统在X86上编译时,一些特定的代码才会被插入,其他的代码仅当系统在SPARC等机器上编译时才会插入。通过使用#include指令,一个.c文件体可以含有一个或多个头文件。
大型编程项目
为了构建操作系统,每个.c被C编译器编译成一个目标文件。目标文件使用后缀.o,含有目标机器的二进制代码。随后它们可以直接在CPU上运行。在C的世界里,没有类似于Java字节代码的东西。
补充:(Java 字节码(英语:Java bytecode)是Java虚拟机执行的一种指令格式。大多数操作码都是一个字节长,而有些操作需要参数,导致了有一些多字节的操作码。而且并不是所有可能的256个操作码都被使用;其中有51个操作码被保留做将来使用。除此之外,原始Java平台开发商,Sun Microsystems系统,额外保留了3个代码永久不使用。)
C预处理器+C编译器
C编译器的第一道称为C预处理器。在它读入每个.C文件时,每当遇到一个#include命令,就取来该名称的头文件,并加以处理、扩展宏、处理条件编译(以及其他事务),然后将结果传递给编译器的下一道,仿佛它们原先就包含在该文件中一样。
make程序
由于操作系统是非常庞大的,每当文件修改后就重新编译时无法忍受的。另一方面,改变了用在成千上万文件中的一个关键头文件,确实需要重新编译这些文件。没有一定的协助,想要记录哪个目标文件和哪个头文件相关是完全不可行的。
在UNIX系统中,有个名为make的程序,它读入Makefile文件,该Makefile说明哪个文件与哪个文件相关。make的作用是,在构建操作系统二进制编码时,检查此刻需要哪个目标文件,而且对于每个文件,检查自从上次目标文件创建之后是否有任何它依赖的文件(代码和头文件)已经被修改了。如果有,目标文件需要重新编译。在make确定了哪个.o文件需要重新编译后,他调用C编译器重新编译这些文件,这样就把编译的次数降到了最低限度!
linker程序形成可执行文件a.out文件
一旦所有的.o文件就绪,这些文件就被传递给称为linker的程序,将其组合成一个可执行的二进制文件。此时,任何被调用的库函数到包含在内,函数之间的引用都已解决,而机器地址也已经按需分配完毕。在linker完成之后,得到一个可执行程序,在UNIX中传统上称为a.out文件。
该过程的各个部分如下图所示:
编译C和头文件来创建可执行文件的过程
运行模型
在操作系统二进制代码链接完成后,计算机就可以重新启动,新的操作系统开始运行。一旦运行,系统会自动调入那些没有静态包括在二进制代码中的模块,如设备驱动和文件系统。在运行过程中,操作系统可能有若干段组成,有文本段(程序代码)、数据段和栈堆段。文本段通常是不可改变的,在运行过程中不可修改。数据段开始时有一定的大小,并用确定的值进行初始化,但是随后就被修改了,其大小随需要增长。栈堆段被初始化为空,但是随着对函数的调用和从函数返回,栈堆段时时刻刻在增长和缩小。通常文本段放置在接近内存底部的位置,数据段在其上面,这样可以向上增长。而栈堆段处于高处的虚拟地址,具有向下增长的能力,不过不同系统的工作方式各有差别。
在所有情形下,操作系统代码都是直接在硬件上执行的,不用解释器,也不是即时翻译,如Java通常做的那样。
以下是一些有用的计算机方面的网站:
ACM https://www.acm.org/
IEEE计算机协会 https://www.computer.org/
USENIX https://www.usenix.org/