“Hello World”在Linux系统上的运行过程

#include
int main()
{
   printf("hello world\n");
   return 0;
}
   然后gcc helloworld.c -o helloworld,一个最简单的hello world程序出现了。它是从哪里开始执行的呢?这还不简单?main函数么。地球人都知道。为什么一定要从main函数开始呢?
   file helloworld可知,它是一个elf可执行文件。
   objdump -d helloworld 看反汇编的结果。运行gcc -v helloworld.c -o helloworld显示gcc详细的编译链接过程。其中包括链接/usr/lib/下的crti.o crt1.o crtn.o等等文件。用objdump查看,_start()函数就定义在crt1.o文件中。
   那么helloworld的真正执行的入口在哪里呢?我们可以使用readelf来查看,看有没有有用信息。readelf -a helloworld
   helloworld作为一个elf文件,有elf文件头,section table和各个section等等。有兴趣可以去看看elf文件格式的文档。用readelf可知,在helloworld的elf文件头的信息中,有这么一项信息:
       入口点地址:               0x80482c0
可见,helloworld程序的入口地址在0x80482c0处,而由objdump得:
       080482c0 <_start>:
可见,_start()是helloworld程序首先执行的函数。_start()执行完一些初始化工作后,经过层层调用,最终调用main().可以设想,如果_start()里最终调用的是foo(),那么C程序的主函数就不再是main(),而是foo()了。
       再进一步:helloworld程序具体是如何执行的呢。我们只能猜测是由bash负责执行的。然而具体看bash代码就太复杂了。我们可以用strace跟踪helloworld的执行。
       strace ./helloworld
       出 来一大堆函数调用。其中第一个是execve().这是一个关键的系统调用,它负责载入helloworld可执行文件并运行。其中有很关键的一步,就是 把用户态的eip寄存器(实际上是它在内存中对应的值)设置为elf文件中的入口点地址,也就是_start()。具体可见内核中的 sys_execve()函数。
       由此可见,程序从哪里开始执行,取决于在刚开始执行的那一刻的eip寄存器的值。而这个eip是由其它程序设置的,在这里,eip是由Linux内核设置的。具体过程如下:
1.用户在shell里运行./helloworld。
2.shell(这里是bash)调用系统调用execve()。
3.execve陷入到内核里执行sys_execve(),把用户态的eip设置为_start()。
4.当系统调用执行完毕,helloworld进程开始运行时,就从_start()开始执行
5.helloworld进程最后才执行到main()。

你可能感兴趣的:(“Hello World”在Linux系统上的运行过程)