从源程序到可执行文件(物语4)

       我们用C语言编写最简单的程序后,这个程序还是不能在操作系统上执行,需要经过翻译,编译和链接之后才能独立在操作系统上运行。

       我们首先用最简单的记事本来写一个后缀为C语言扩展名的纯文本文件。例如:

//源文件hello.c

#include

int main()

{

        printf("hello world !\n" );

}

       这是一个非常简单的文件,只要用windows上的记事本就可编写。我们现在不要使用复杂的智能的集成编辑器。开始学习语言最好从最基础的开始,循序渐进的学习。学会最基本的,然后再上平台,使用专业的编辑器。例如:visual studio,Android studio等非常好用的专业编制软件程序的系统。

      现在,还没有讲程序语言,索性我们先了解一下一个源程序如何变成可执行文件的。以linux系统下开源C语言的生成过程为例子。

       第一步:预处理阶段:

       预处理器处理“#include这段指令。而stdio.h是头文件。我们源程序中使用的输入输出函数“printf()”。这个函数就是在这个由C语言事先定义的标准输出输入函数。而“stdio.h”文件封装在静态库中。

        预处理阶段,由预处理器把“stdio.h”文件中所包含的声明函数“printf()”拷贝到源文件“hello.c”中。

         把stdio文件插入到hello.c中之后,源文件由hello.c变成hello.i文件。这个文件依然是纯文本文件。“i”就是包含文件(include)的第一个字母。

        第二步:编译阶段:

        编译器(ccl)对hello.i文件进行翻译处理。用汇编指令(assembly instruction)替换所有C语言指令代码。文件hello.ii经过翻译后编程hello.s汇编程序文件。

        这个汇编程序文件叫做汇编源文件。这时候,hello.s依然是纯文本文件。打开这个文件可以观看汇编源程序代码。后缀“s”为源文件(source file)的首字母。

         第三步:汇编阶段:

        汇编器(assembly device 简称as)对源文件hello.s进行汇编处理。这个过程分两步,首先把hello.s文件中的所有汇编指令翻译成二进制机器指令,然后对整个文件重新处理,术语叫做重新定位。在经过了汇编器(assembly)对hello.s处理后,变成hello.o的文件。

        而hello.o文件叫做目标文件(object file)。这个文件格式叫做“可重定位目标程序格式”。“可重定位(relocatable)”文件打开后一片乱码。

        而hello.o这个文件非常重要,包含了程序运行过程中的内存映射布局细节。

        第四步:链接阶段:

         链接器(link device简称ld)对hello.o文件,和预编译头文件例如:printf.o文件进行链接处理,最后编程hello.exe应用文件。

       为了加快程序编译过程,编译器把标准C库提供的函数都事前编译成目标文件,编译的最后阶段用链接器把目标文件(如:hello.o)与事前汇编好的printf.o链接起来。

        而hello.exe是可执行文件。这个文件是最重要的成果文件。这个文件为二进制文件,目标文件例如hello.o文件包含程序运行过程中内存映射细节。而链接器把二进制文件链接合并成一个文件,继续向各个内存映射节(section)填充信息。

       而hello.exe应用文件,由操作系统负责执行。

       以上就是一个应用程序的形成过程,是简化了的过程。是学习编程人员必须懂得的必知必会知识。我们学习编程就是把这个过程进行添枝加叶,逐步明白各个过程的细节。

         北荒客

          2020.3.16

你可能感兴趣的:(从源程序到可执行文件(物语4))