string字符串常量池与string.intern方法

本人最近正在面试,然后注意到总是有公司喜欢考String的问题,如字符串连接有几种方式,它们之间有什么不同等问题;要不就是给一段代码问创建了几个对象。那么该不该问呢?我认为当面试有一定工作经验的求职者时还是应该问问这个问题的,应届生就不要为难他们了还是多考考底层基础比较好。下面我结合JVisualVM和javap这两个工具来详细解析下JVM内部是怎么处理String对象的。

一、字符串常量池(String Constant Pool)

字符串在java程序中被大量使用,为了避免每次都创建相同的字符串对象及内存分配,JVM内部对字符串对象的创建做了一定的优化,在Permanent Generation中专门有一块区域用来存储字符串常量池(一组指针指向Heap中的String对象的内存地址)。

创建字符串对象的几种形式:

(1)通过new方式如String s = new String("iByteCode")及string.intern()方法

(2)通过字面量的形式如String s = "aaaaa"

(3)字面量+字面量如String s = "bbbb" + "ccccc"

(4)字面量+变量如String s1 = "dddd";String s = "eeeee"+s1

假设刚开始字符串常量池为空,那么对于第一种创建方式,JVM内部是怎么处理的,这里也有一个面试题就是一共创建了几个对象,在这里答案是两个,为什么说是两个呢?一个是字符串字面量本身(可以通过string.intern()方法来取得,下图中常量池所指向的字符串对象),一个是单独的字符串对象,Heap视图如下所示:

string字符串常量池与string.intern方法_第1张图片

看下面的代码:

复制代码

public class StringConstantPoolTester {

    //private String s1 = new String("iByteCode");
    
    public static void main(String[] args) throws Exception {
        String s1 = new String("iByteCode");
        System.out.println(s1);
        CyclicBarrier barrier = new CyclicBarrier(2);
        barrier.await();
    }
    
}

复制代码

那么怎么来验证上面的结论的正确性呢?我们可以通过JVisualVM来Heap dump功能来实现,通过OQL语言来查询Heap内值为iByteCode的字符串对象的个数就可以确定上面的代码到底创建了几个对象。执行结果如下图所示:

string字符串常量池与string.intern方法_第2张图片

这里有一点要注意,对于通过new方式创建的String对象,每次都会在Heap上创建一个新的实例,但是对于字符串字面量的形式,只有当字符串常量池中不存在相同对象时才会创建。

第二种方式不用说,相当于第一种方式中的字面量部分。

第三种和第四种方式会怎样创建字符串对象,可以通过javap和JVisualVM来验证,下面通过一段代码来验证:

复制代码

public class StringConstantPoolTester {

    //private String s1 = new String("iByteCode");
    
    public static void main(String[] args) throws Exception {
        String s1 = new String("iByteCode");
        String s2 = "bbbb" + "ccccc";
        String s3 = "dddd" + s2;
        System.out.println(s3);
        CyclicBarrier barrier = new CyclicBarrier(2);
        barrier.await();
    }
    
}

复制代码

这段代码的bytecode输出如下:

string字符串常量池与string.intern方法_第3张图片

对于第三种形式String s2 = "bbbb" + "ccccc",在main方法字节码的第10-12可以看到在JVM里直接通过ldc指令将指向bbbbccccc字符串字面量的引用的值放入到Operand Stack顶,然后存入到Local variable Array的第二个slot位。同时可以通过JVisualVM验证结论的正确性,由于篇幅问题这里省略。

对于第四种形式String s3 = "dddd" + s2,在main方法字节码的13-32可以看到在JVM里面创建了两个字符串字面量dddd和ddddbbbbccccc,并且调用StringBuilder对字符串进行连接。

 

===========================================================

String中intern的方法

首先查看官方API那个的解释:

———————————————————————————————————————

intern

public String intern()

返回字符串对象的规范化表示形式。

一个初始时为空的字符串池,它由类 String 私有地维护。

当调用 intern 方法时,如果池已经包含一个等于此 String 对象的字符串(该对象由 equals(Object) 方法确定),则返回池中的字符串。否则,将此 String 对象添加到池中,并且返回此 String 对象的引用。

它遵循对于任何两个字符串 s 和 t,当且仅当 s.equals(t) 为 true 时,s.intern() == t.intern() 才为 true。

所有字面值字符串和字符串赋值常量表达式都是内部的。

返回:

一个字符串,内容与此字符串相同,但它保证来自字符串池中。

 

———————————————————————————————————————

尽管在输出中调用intern方法并没有什么效果,但是实际上后台这个方法会做一系列的动作和操作。在调用”ab”.intern()方法的时候会返回”ab”,但是这个方法会首先检查字符串池中是否有”ab”这个字符串,如果存在则返回这个字符串的引用,否则就将这个字符串添加到字符串池中,然会返回这个字符串的引用。

可以看下面一个范例:

复制代码

 

1 String str1 = "a";
2 String str2 = "b";
3 String str3 = "ab";
4 String str4 = str1 + str2;
5 String str5 = new String("ab");
6
7 System.out.println(str5.equals(str3));
8 System.out.println(str5 == str3);
9 System.out.println(str5.intern() == str3);
10 System.out.println(str5.intern() == str4);

复制代码

得到的结果:

true

false

true

false

 

为什么会得到这样的一个结果呢?我们一步一步的分析。

第一、str5.equals(str3)这个结果为true,不用太多的解释,因为字符串的值的内容相同。

第二、str5 == str3对比的是引用的地址是否相同,由于str5采用new String方式定义的,所以地址引用一定不相等。所以结果为false。

第三、当str5调用intern的时候,会检查字符串池中是否含有该字符串。由于之前定义的str3已经进入字符串池中,所以会得到相同的引用。

第四,当str4 = str1 + str2后,str4的值也为”ab”,但是为什么这个结果会是false呢?先看下面代码:

复制代码

 

1 String a = new String("ab");
2 String b = new String("ab");
3 String c = "ab";
4 String d = "a" + "b";
5 String e = "b";
6 String f = "a" + e;
7
8 System.out.println(b.intern() == a);
9 System.out.println(b.intern() == c);
10 System.out.println(b.intern() == d);
11 System.out.println(b.intern() == f);
12 System.out.println(b.intern() == a.intern());

复制代码

运行结果:

false

true

true

false

true

由运行结果可以看出来,b.intern() == a和b.intern() == c可知,采用new 创建的字符串对象不进入字符串池,并且通过b.intern() == d和b.intern() == f可知,字符串相加的时候,都是静态字符串的结果会添加到字符串池,如果其中含有变量(如f中的e)则不会进入字符串池中。但是字符串一旦进入字符串池中,就会先查找池中有无此对象。如果有此对象,则让对象引用指向此对象。如果无此对象,则先创建此对象,再让对象引用指向此对象。

    当研究到这个地方的时候,突然想起来经常遇到的一个比较经典的Java问题,就是对比equal和==的区别,当时记得老师只是说“==”判断的是“地址”,但是并没说清楚什么时候会有地址相等的情况。现在看来,在定义变量的时候赋值,如果赋值的是静态的字符串,就会执行进入字符串池的操作,如果池中含有该字符串,则返回引用。

执行下面的代码:

复制代码

 

1 String a = "abc";
2 String b = "abc";
3 String c = "a" + "b" + "c";
4 String d = "a" + "bc";
5 String e = "ab" + "c";
6
7 System.out.println(a == b);
8 System.out.println(a == c);
9 System.out.println(a == d);
10 System.out.println(a == e);
11 System.out.println(c == d);
12 System.out.println(c == e);

复制代码

运行的结果:

true

true

true

true

true

true

运行的结果刚好验证了我刚才的猜想。

转载于:https://my.oschina.net/u/3237413/blog/1517637

你可能感兴趣的:(string字符串常量池与string.intern方法)