探究java程序运行原理

        我以前是多C++程序开发的,2018年6月份进入平安寿险总部后才刚刚接触java,和很多初学java的萌新们一样,我也对java字节码是如何在机器上执行,java又是如何做到“一次编写,到处运行”充满了好奇。通过查阅资料加上自己的一些思考,将我对java程序运行原理的理解描述出来,如有不对之处还请大神帮忙斧正。

        众所周知,计算机永远只能执行二进制指令,不管是何种语言编写的程序,最终在计算机上执行的时候都是cpu指令集中一条条的二进制指令,通过程序计数器去寻址,加载到指令寄存器中,由cpu中的计算单元去执行。然而,cpu架构多种多样,每种架构的cpu指令集并不一样,x86上正常运行的二进制程序放到arm架构上,基本上是无法运行。此外,不同的操作系统,所支持的二进制可执行程序的格式也不一样,例如:linux支持ELF格式二进制可执行文件,而windows支持PE格式二进制可执行文件。如果把ELF格式的文件放到windows系统上面去运行,注定是无法运行的。总之,由于cpu指令集和操作系统的差异存在,二进制可执行文件想要实现“一次编写,到处运行”的理想基本上是痴人说梦。

        那么java程序又是如何实现“一次编写,到处运行”的理想的呢?我们不妨先类比思考下TCP/IP的网络模型:现实中的网络传输介质是多种多样的,有双绞线、光纤、还有无线电波,不同的传输介质,对于相同应用数据的电子信号表示肯定是不一样的。既然如此,那么TCP/IP的网络模型是如何实现数据的“一次封装,到处流通”的呢?首先TCP/IP使用了分层模型,数据链路层屏蔽了不同网络传输介质的差异性,使得网络层不用再关心物理链路的差异,只需要按照网络层协议格式封装数据报文,扔给链路层就行了。同样,我们使用分层的角度去看,java程序的运行也是类似原理:我们把java这个二进制程序看做是jvm虚拟机,jvm虚拟机屏蔽了cpu指令集和操作系统的各种差异,java程序员不用再关心底层的差异,只需要编写好java源代码,调用javac编译成统一的java字节码,再由jvm虚拟机将java字节码转换为二进制指令在计算机上面执行(这其中的转换可能相当复杂,鄙人能力有限,也不尽明白)。

        换个角度,我们从C程序员的角度去看:我们编写的java源文件由javac程序转换为统一格式的字节码文件,我们将这个字节码文件看成是统一标准格式的“数据文件”,java程序去加载这份“数据”,然后根据数据的内容去执行相应的操作。至于这些操作对应到计算机的二进制指令,我们是无需关心的。

        总之,大道至简,九九归一,计算机界很多东西的原理无非都是:向下封装,向上屏蔽,让上层不用再关心底层的差异,让站在肩上的人看得更高,望得更远。

你可能感兴趣的:(探究java程序运行原理)