为什么JAVA中String是不可变的?

在回答这个问题前,我们先看一下下面的代码:

String s1 = "string";
String s2 = "string";
System.out.println(s1 == s2); 

请问结果是什么?
答案是true。

String使用private final char value[]来实现字符串的存储,也就是说String对象创建之后,就不能再修改此对象中存储的字符串内容,就是因为如此,才说String类型是不可变的(immutable)。
那么private final char value[]是什么呢?

Constant Pool常量池
在java编译好的class文件中,有个区域称为Constant Pool。
它是一个由数组组成的表,类型为cp_info constant_pool[],用来存储程序中使用的各种常量,包括Class/String/Integer等各种基本Java数据类型。

String类有一个特殊的创建方法,就是使用""双引号来创建。
在开始的那个问题中"string"是编译期常量,编译时已经能确定它的值,在编译好的class文件中它已经在Constant Pool中了,此语句会在Constant Pool中查找等于"string"的字符串(用equals(Object)方法确定),如果存在就把引用返回,付值给s1。不存在就会创建一个"string"放在Constant Pool中,然后把引用返回,付值给s1。
由于Constant Pool只会维护一个值相同的String对象,s2的引用是Constant Pool中同一个对象,所以他们引用相等。

补充知识 String的创建方式

String的创建方法一般有如下几种

  1. 直接使用""引号创建。
  2. 使用new String()创建。
  3. 使用new String("string")创建以及其他的一些重载构造函数创建。
  4. 使用重载的字符串连接操作符+创建。

new String("string") 实际创建了2个String对象,一个是"string"通过""双引号创建的,另一个是通过new创建的。只不过他们创建的时期不同,一个是编译期,一个是运行期。
看看下面这个例子

String s1 = new String("string"); 
String s2 = "string";
System.out.println(s1 == s2); //结果为false

在java中,使用new关键字会创建一个新对象。
在本例中,不管在Constant Pool中是否已经有值相同的对象,都会创建了一个新的String对象存储在heap中,然后把引用返回赋给s1。本例中使用了String的public String(String original)构造函数。
由于s1是new出的新对象,存储在heap中。s2指向的对象存储在Constant Pool中,他们肯定不是同一个对象。只是存储的字符串值相同,所以返回false。

再看这个例子

String s1 = new String("string"); 
s1 = s1.intern();
String s2 = "string";
System.out.println(s1 == s2);

当调用intern方法时,如果Constant Pool中已经包含一个等于此String对象的字符串(用 equals(Object)方法确定),则返回池中的字符串。否则,将此String对象添加到池中,并返回此String对象在Constant Pool中的引用。
由于执行了s1 = s1.intern(),会使s1指向Constant Pool中值为"string"的字符串对象,s2也指向了同样的对象,所以结果为true。

进阶版问题

String s1 = new String("111"); 
String s2 = "sss111";
String s3 = "sss" + "111";
String s4 = "sss" + s1;
System.out.println(s2 == s3); //true
System.out.println(s2 == s4); //false
System.out.println(s2 == s4.intern()); //true

由于进行连接的2个字符串都是常量,编译期就能确定连接后的值了,编译器会进行优化直接把他们表示成"sss111"存储到Constant Pool中,由于上边的s2="sss111"已经在Constant Pool中加入了"sss111",所以s3指向和s2相同的对象,所以他们引用相同。此时"sss"和"111" 两个常量不会再创建。
由于s1是个变量,在编译期不能确定它的值是多少,所以会在执行的时候创建一个新的String对象存储到heap中,然后赋值给s4。

总结

  1. 单独使用""引号创建的字符串都是常量,编译期就已经确定存储到Constant Pool中。
  2. 使用new String("")创建的对象会存储到heap中,是运行期新创建的。
  3. 使用只包含常量的字符串连接符如"aa" + "aa"创建的也是常量,编译期就能确定。已经确定存储到Constant Pool中。(编译时会直接优化成"aaaa",如果Constant Pool 中没有"aaaa",就用""创建一个String,直接放到Pool中。比如:String t = "a"+ "b" +"c"; 会优化成"abc",然后放入Pool中。又比如String s = "x"+"y"+ref;在编译时有部分的优化:"xy",而ref + "x" +"y"就不会有部分的优化,"+"从左到右执行,ref是变量,编译时期无法确定)
  4. 使用包含变量的字符串连接符如"aa" + s1创建的对象是运行期才创建的,存储在heap中。

最后来个常见面试题

String s1 = new String("s1") ;
String s2 = new String("s1") ;

上面创建了几个String对象?
答案:3个,编译期Constant Pool中创建1个,运行期heap中创建2个。

你可能感兴趣的:(为什么JAVA中String是不可变的?)