前言
本篇补充的对象的实例化的创建方式、创建步骤等等详细说明
暂且可以看看一些大厂面试前的引入面试题
美团:
对象在JVM中是怎么存储的?
对象头信息里面有哪些东西?
蚂蚁金服:
二面:java对象头里有什么
一、对象的实例化
接下来我们就从对象的创建方式开始说起,常见的创建方式、步骤到底有哪些并且是个什么东西
我们对创建对象的方式这几种进行描述讲解一下:
- new:最常见的方式
单例类中调用getInstance的静态类方法,XXXFactory的静态方法
- Class的newInstance方法:在JDK9里面被标记为过时的方法,
因为只能调用空参构造器并且权限必须为 public
- Constructor的newInstance(Xxxx):
反射的方式
,可以调用空参的或者带参的构造器 - 使用clone():不调用任何的构造器,
要求当前的类需要实现Cloneable接口中的clone方法
- 使用序列化:从文件中从网络中获取一个对象的二进制流,
序列化一般用于Socket的网络传输
- 第三方库 Objenesis
接下来我们使用示例代码来看看创建对象步骤是怎么回事:
public class ObjectTest {
public static void main(String[] args) {
Object obj = new Object();
}
}
我们先将当前程序进行编译,然后看看字节码它做了哪些事情
编译后我们得到了具体的字节码文件,我们再对它进行字节码反解析看看
输入命令:javap -v -p ObjectTest.class
,在控制台查看具体的字节码
具体逻辑主要做了以下几行操作指令的操作
0: new #2 // class java/lang/Object
3: dup
4: invokespecial #1 // Method java/lang/Object."":()V
7: astore_1
8: return
那么具体这些指令做了什么事情呢?我们来分析并讲解讲解:
第一步:判断对象对应的类是否加载、链接、初始化:
即虚拟机遇到一条new指令,首先去检查这个指令的参数能否在Metaspace的常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已经被加载,解析和初始化。(即判断类元信息是否存在)
如果该类没有加载那么在双亲委派模式下,使用当前类加载器以ClassLoader + 包名 + 类名为key进行查找对应的.class文件,如果没有找到文件,则抛出ClassNotFoundException异常,如果找到,则进行类加载,并生成对应的Class对象
第二步:为对象分配内存:
在进过类型加载之后,内存当中已经是有当前这类了。那么就需要为对象分配内存空间,它需要计算对象占用空间的大小,接着在堆中划分一块内存给新对象。如果实例成员变量是引用变量,仅分配引用变量空间即可,即4个字节大小
那么分配对象的时候我们的堆空间如果是规整的:
- 虚拟机将采用的是指针碰撞法(Bump The Point)来为对象分配内存
意思是所有用过的内存在一边,空闲的内存放另外一边,中间放着一个指针作为分界点的指示器,分配内存就仅仅是把指针往空闲内存那边挪动一段与对象大小相等的距离罢了
垃圾收集器Serial ,ParNew就是采用标记压缩/标记整理算法, 标记压缩(整理)算法会解决碎片化问题,进而使得内存是比较规整的,它们两在分配数据的时候使用指针碰撞
那么分配对象的时候我们的堆空间如果是不规整的:
- 虚拟机将采用的是空闲列表来为对象分配内存
意思是虚拟机维护了一个列表记录上哪些内存块是可用的,再分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的内容。这种分配方式成为了 “ 空闲列表(Free List)”
说明:选择哪种分配方式由Java堆是否规整所决定,而Java堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定
第三步:处理并发安全问题:
在分配内存空间的时候,是在堆空间里进行创建,而堆空间是属于多个线程共享的
那么多个线程都去堆空间创建对象的话,就会造成出并发安全问题
那么对于出现并发的安全问题,具体采用两种策略
- 采用CAS + 失败重试保证更新的原子性
- 每个线程预先分配 TLAB - 通过设置 -XX:+UseTLAB参数来设置(区域加锁机制)
第四步:属性的默认初始化(零值初始化):
给对象的所有属性设置默认值,保证对象实例字段在不赋值可以直接使用
给对象属性赋值的顺序:
- 属性的默认值初始化
- 显示初始化/代码块初始化(并列关系,谁先谁后看代码编写的顺序)
- 构造器初始化
第五步:设置对象的对象头:
将对象的所属类(即类的元数据信息)、对象的HashCode和对象的GC信息、锁信息等数据存储在对象的对象头中。这个过程的具体设置方式取决于JVM实现。
第六步:执行init方法进行初始化:
在Java程序的视角看来,初始化才正式开始。初始化成员变量,执行实例化代码块,调用类的构造方法,并把堆内对象的首地址赋值给引用变量
因此一般来说(由字节码中跟随invokespecial指令所决定),new指令之后会接着就是执行init方法,把对象按照程序员的意愿进行初始化,这样一个真正可用的对象才算完成创建出来
二、对象的内存布局
我们都知道new 的对象都是放在堆空间当中的,那么对于堆空间里的对象到底有哪些结构呢?
请看以下的概述思维导图
一般在堆空间所指有三部分:对象头、实例数据、对齐填充
对象头信息说明讲解:
如图所示一般对象头主要包含两部分内容:
- 运行时元数据(Mark Word)
- 类型指针
主要运行时元数据存放的主要信息:哈希值、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳
类型指针有:指向类元数据InstanceKlass,确定对象所属的类型
说明:如果是数组的话,需要记录数组的长度
实例数据信息说明讲解:
指对象真正存储的有效信息,包括程序代码中定义各种类型的字段(本身拥有的、与从父类继承下来的)
这里面有以下的规则:
- 父类中定义的变量会出现在子类之前
- 相同宽度的字段总是被分配在一起
- 如果CompactFields参数为ture(默认为ture),子类的窄变量可能插入父类变量的空隙
对齐填充信息说明讲解:
不是必须的,也没啥含义,仅仅起到占位符的作用
相当于寄花瓶快递时,为了保证花瓶不所填充的泡沫
那么根据前面我们讲解着三个部分,我们再进行一个图示图解对象的内存布局
下面是我们对应的示例代码
public class Customer{
int id = 1001;
String name;
Account acct;
{
name = "匿名客户";
}
public Customer(){
acct = new Account();
}
public static void main(String[] args) {
Customer cust = new Customer();
}
}
class Account{
}
我们的main方法里就是对这个Customer进行创建,看看图解的内存空间是什么场景
三、对象的访问定位
我们这里还有一个问题就是JVM是如何通过栈帧中的对象引用访问到其内部的对象实例呢?
其实就是通过定位,通过栈上reference访问
那么对于对象有两种访问的方式:
- 句柄访问
- 直接指针
句柄访问:
缺点:在堆空间中开辟了一块空间作为句柄池,句柄池本身也会占用空间;通过两次指针访问才能访问到堆中的对象,效率低
优点:reference中存储稳定句柄地址,`对象被移动(垃圾收集时移动对象很普遍)时只会改变句柄中实例数据指针即可,reference本身不需要被修改
`
直接指针:
缺点:对象被移动(垃圾收集时移动对象很普遍)时需要修改 reference 的值
优点:直接指针是局部变量表中的引用,直接指向堆中的实例,在对象实例中有类型指针,指向的是方法区中的对象类型数据
在java虚拟机规范中并没有明确说明使用哪种方式,所以我们的hotspot采用的是直接指针方式
参考资料
尚硅谷:JVM虚拟机(宋红康老师)