简单聊聊JVM中的StringTable

先看下面一个问题:

String str = new String("hello");

执行这行代码,会new 出几个对象?不妨先思考一下,或者查查资料。
正确答案是:一个或者两个,为什么说是一个或者两个,而不是一个,两个这种准确的回答呢?
首先要弄清楚一点,创建一个String对象有几种方式,大致上分为两种:

第一种: 通过 "xxx"这种形式,以字符串字面量的形式会创建出一个String对象,而以字符串字面量创建的对象都是会进入到一个叫做StringTable(字符串常量池,串池)的地方。

第二种:就是以其他方式创建出来的对象,比如通过new关键字,又或者是通过StringBuilder的append方法后再toString,这样创建出来的字符串对象是不会进入StringTable的,如果想让字符串进入串池,那么就得调用String类的intern()方法,主动把字符串对象放入串池,放入规则此处暂不说明。

什么是StringTable呢?简单来说就是一个存储字符串的容器,这个容器的作用就是为了重复利用字符串,从而减少内存的消耗。

若在执行该行代码之前,就已经有过字符串字面量"hello"的出现,那么StringTable当中就会有"hello"存在,下一次需要使用时,就会直接从StringTable中获取而不是再次创建对象。而new String("hello");这个操作是一定会通过new这个关键字而创建出对象的,这时仅仅只是创建了一个对象存放在堆空间中,并把内存地址引用给str变量。

相反,若在执行该行代码之前没有出现过"hello"的出现,执行到该行代码时是"hello"的第一次出现,那么就需要创建两个对象,一个是字符串字面量的对象会放入StringTable中,另一个就是通过new关键字创建出来的对象,放入堆空间中。

所以上面的代码创建出来的对象是一个或两个

String类是一个比较特殊的类,使用final关键字修饰,也就是说该类不能被任何类继承是一个不可变类,你可以去仔细看看String类的源码,你会发现对于String对象的任何操作,诸如subString这种对字符串进行"裁剪"的操作最后都会再次new一个字符串进行返回。这也是就是为什么StringTable可以重复利用字符串的原因。

想要主动把字符串对象放入字符串常量池的话就得调用字符串对象的intern()方法:
简单聊聊JVM中的StringTable_第1张图片
intern()方法由native修饰所以无法看到源码,但对于他的注释还是很详细的。

在调用此方法时,若字符串常量池中已经有了该字符串,那么便返回在字符串常量池当中对象的引用,若字符串常量池中还没有该字符串,则放入一个字符串对象进去,至于怎么放入,在JDK1.6之前和JDK1.7之后,方式有些许不同。(ps:使用equals方法来判断字符串常量池中是否已经有了该字符串)

这里就不讲述细节了,简单说一下结论:
1.6及之前,若字符串常量池中没有该字符串,就把调用此方法的对象进行拷贝一份,然后放入字符串常量池中去。因为是拷贝,所以这两个对象的地址还是不同的,使用==判断会返回false

1.7及之后,若字符串常量池中没有该字符串,则把调用此方法的对象的引用放入字符串常量池,因为放入的是引用,使用==判断会返回true

具体细节可以参考美团的这篇技术文章:
https://tech.meituan.com/2014/03/06/in-depth-understanding-string-intern.html

看完美团这篇文章,相信你应该能弄明白intern()方法了。
看下图:
简单聊聊JVM中的StringTable_第2张图片
代码块是放在main方法中执行的,这样是可以正确出结果的,并且结果也是和预期的一样。
但是,如果你使用junit这样的单元测试工具来测试的话,就会发现结果并不是如此。

package com.jvm.jvm_demo1;

import org.junit.Test;

public class InternTest {
    @Test
    public void test(){
        String s = new String("1");
        s.intern();
        String s2 = "1";
        System.out.println(s==s2);//不论jdk版本,都是false

        String s3 = new String("1")+new String("1");
        s3.intern();
        String s4 = "11";
        System.out.println(s3==s4);//1.6 false 1.7,1.8+ true
    }

    public static void main(String[] args) {
        String s = new String("1");
        s.intern();
        String s2 = "1";
        System.out.println(s==s2);//不论jdk版本,都是false

        String s3 = new String("1")+new String("1");
        s3.intern();
        String s4 = "12";
        System.out.println(s3==s4);//1.6 false 1.7,1.8+ true
    }
}

同一个方法,一个使用main方法,一个使用@Test注解,结果却不同,根据对intern()方法的理解,很容易想到是调用单元测试时应该额外在StringTable中增加了字符串对象。

在方法执行的第一行打上断点,利用idea工具进行debug并查看内存中字符串。

简单聊聊JVM中的StringTable_第3张图片

简单聊聊JVM中的StringTable_第4张图片
简单聊聊JVM中的StringTable_第5张图片
与上面相同的步骤debug运行main方法,查看内存中字符串常量池的信息
简单聊聊JVM中的StringTable_第6张图片
简单聊聊JVM中的StringTable_第7张图片

以上也就可以说明为什么单元测试和main方法跑出来的结果会有些许不同了。
注意点:
千万不要在小框中以toString()=="11",toString()=="12"这种方式进行搜索是否有这个字符串,因为如果没有的话,可能会新增一个,所以在进行对字符串过滤时一定要时刻注意数量是否改变了:
如图:
简单聊聊JVM中的StringTable_第8张图片
参考资料:
https://docs.oracle.com/javase/specs/jvms/se7/html/index.html
https://docs.oracle.com/javase/specs/jls/se8/html/jls-3.html#jls-3.10.5
https://tech.meituan.com/2014/03/06/in-depth-understanding-string-intern.html
https://www.yuque.com/u1423247/hipqrb/vw97oe

你可能感兴趣的:(笔记,string,jvm)