本人最近正在面试,然后注意到总是有公司喜欢考String的问题,如字符串连接有几种方式,它们之间有什么不同等问题;要不就是给一段代码问创建了几个对象。那么该不该问呢?我认为当面试有一定工作经验的求职者时还是应该问问这个问题的,应届生就不要为难他们了还是多考考底层基础比较好。下面我结合JVisualVM和javap这两个工具来详细解析下JVM内部是怎么处理String对象的。
一、字符串常量池(String Constant Pool)
字符串在java程序中被大量使用,为了避免每次都创建相同的字符串对象及内存分配,JVM内部对字符串对象的创建做了一定的优化,在Permanent Generation中专门有一块区域用来存储字符串常量池(一组指针指向Heap中的String对象的内存地址)。
创建字符串对象的几种形式:
(1)通过new方式如String s = new String("iByteCode")及string.intern()方法
(2)通过字面量的形式如String s = "aaaaa"
(3)字面量+字面量如String s = "bbbb" + "ccccc"
(4)字面量+变量如String s1 = "dddd";String s = "eeeee"+s1
假设刚开始字符串常量池为空,那么对于第一种创建方式,JVM内部是怎么处理的,这里也有一个面试题就是一共创建了几个对象,在这里答案是两个,为什么说是两个呢?一个是字符串字面量本身(可以通过string.intern()方法来取得,下图中常量池所指向的字符串对象),一个是单独的字符串对象,Heap视图如下所示:
看下面的代码:
public class StringConstantPoolTester {
//private String s1 = new String("iByteCode");
public static void main(String[] args) throws Exception {
String s1 = new String("iByteCode");
System.out.println(s1);
CyclicBarrier barrier = new CyclicBarrier(2);
barrier.await();
}
}
那么怎么来验证上面的结论的正确性呢?我们可以通过JVisualVM来Heap dump功能来实现,通过OQL语言来查询Heap内值为iByteCode的字符串对象的个数就可以确定上面的代码到底创建了几个对象。执行结果如下图所示:
这里有一点要注意,对于通过new方式创建的String对象,每次都会在Heap上创建一个新的实例,但是对于字符串字面量的形式,只有当字符串常量池中不存在相同对象时才会创建。
第二种方式不用说,相当于第一种方式中的字面量部分。
第三种和第四种方式会怎样创建字符串对象,可以通过javap和JVisualVM来验证,下面通过一段代码来验证:
public class StringConstantPoolTester {
//private String s1 = new String("iByteCode");
public static void main(String[] args) throws Exception {
String s1 = new String("iByteCode");
String s2 = "bbbb" + "ccccc";
String s3 = "dddd" + s2;
System.out.println(s3);
CyclicBarrier barrier = new CyclicBarrier(2);
barrier.await();
}
}
这段代码的bytecode输出如下:
对于第三种形式String s2 = "bbbb" + "ccccc",在main方法字节码的第10-12可以看到在JVM里直接通过ldc指令将指向bbbbccccc字符串字面量的引用的值放入到Operand Stack顶,然后存入到Local variable Array的第二个slot位。同时可以通过JVisualVM验证结论的正确性,由于篇幅问题这里省略。
对于第四种形式String s3 = "dddd" + s2,在main方法字节码的13-32可以看到在JVM里面创建了两个字符串字面量dddd和ddddbbbbccccc,并且调用StringBuilder对字符串进行连接。
二、参考资料:
http://theopentutorials.com/tutorials/java/strings/string-literal-pool/