1、String常量池
当使用new String(“hello”)时,JVM会先使用常量池来管理“hello”直接量,再调用String类的构造器来创建一个新的String对象,新创建的对象被保存在堆内存中。即new String(“hello”)一共产生了两个字符串对象。
【常量池constant pool】管理在编译时被确定并保存在已编译的.class文件中的一些数据,包括关于类、方法、接口中的常量,和字符串常量。
【字符串常量池(String pool, String intern pool, String保留池)】 是Java堆内存中一个特殊的存储区域, 当创建一个String对象时,假如此字符串值已经存在于常量池中,则不会创建一个新的对象,而是引用已经存在的对象。
public void test(){
String a ="张三";
String b ="张";
String c ="三";
String d = b + c;
System.out.println(a == d);// false
String e ="张"+"三";
System.out.println(a == e);// true
}
答案一:
最流行的Java面试题之一就是:什么是不可变对象(immutable object),不可变对象有什么好处,在什么情况下应该用,或者更具体一些,Java的String类为什么要设成immutable类型?
不可变对象,顾名思义就是创建后不可以改变的对象,典型的例子就是Java中的String类。
答案二:
这是一个老生常谈的话题(This is an old yet still popular question). 在Java中将String设计成不可变的是综合考虑到各种因素的结果,想要理解这个问题,需要综合内存,同步,数据结构以及安全等方面的考虑. 在下文中,我将为各种原因做一个小结。
1. 字符串常量池的需要
字符串常量池(String pool, String intern pool, String保留池) 是Java堆内存中一个特殊的存储区域, 当创建一个String对象时,假如此字符串值已经存在于常量池中,则不会创建一个新的对象,而是引用已经存在的对象。
如下面的代码所示,将会在堆内存中只创建一个实际String对象.
示意图如下所示:
假若字符串对象允许改变,那么将会导致各种逻辑错误,比如改变一个对象会影响到另一个独立对象. 严格来说,这种常量池的思想,是一种优化手段.
请思考: 假若代码如下所示,s1和s2还会指向同一个实际的String对象吗?
public class Test { public static void main(String[] args) { String s1 = "ab" + "cd"; String s2 = "abc" + "d"; System.out.println("s1==s2:" + s1 == s2); } } |
// output:
false (注意和下面代码对比)
|
public class Test { public Test(); Code: 0: aload_0 1: invokespecial #8 //Method java/lang/Object."<init>":()V 4: return
public static void main(java.lang.String[]); Code: 0: ldc #16 //String abcd 2: astore_1 3: ldc #16 //String abcd 5: astore_2 6: getstatic #18 //Field java/lang/System.out:Ljava/io/PrintStream; 9: new #24 //class java/lang/StringBuilder 12: dup 13: ldc #26 //String s1==s2: 15: invokespecial #28 //Method java/lang/StringBuilder."<init>":(Ljava/lang/String;)V 18: aload_1 19: invokevirtual #31 //Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 22: invokevirtual #35 //Method java/lang/StringBuilder.toString:()Ljava/lang/String; 25: aload_2 26: if_acmpne 33 29: iconst_1 30: goto 34 33: iconst_0 34: invokevirtual #39 //Method java/io/PrintStream.println:(Z)V 37: return } |
public class Test { public Test(); Code: 0: aload_0 1: invokespecial #8 //Method java/lang/ // Object."<init>":()V 4: return
public static void main(java.lang.String[]); Code: 0: ldc #16 // String abcd 2: astore_1 3: ldc #16 // String abcd 5: astore_2 6: getstatic #18 // Field java/lang/ // System.out:Ljava/io/PrintStream; 9: aload_1 10: aload_2 11: if_acmpne 18 14: iconst_1 15: goto 19 18: iconst_0 19: invokevirtual #24 //Method java/io/ // PrintStream.println:(Z)V 22: return }
|
public class Test { public static void main(String[] args) { String s1 = "ab" + "cd"; String s2 = "abc" + "d"; System.out.println(s1 == s2); } } |
// output:
true
// 代码仅仅少了一个字符串而已
|
String s1 = "ab"; String s2 = "abc" + "d"; System.out.println(s1 + "cd" == s2);
|
输出为:
false 【只有false,没有前面
"s1==s2:"
这一串】
//
先执行StringBuilder的拼接,相当于new了一下,虽然值相等,但内存地址已变。
|
String s1 = "1234"; String s01 = "123"; String s02 = "4"; String s2 = s01 + s02; System.out.println(s1 == s2);
|
false
// s2取了s01、s02的引用地址。肯定和s1不同了额。
|
字符串不变性保证了hash码的唯一性,因此可以放心地进行缓存.这也是一种性能优化手段,意味着不必每次都去计算新的哈希码. 在String类的定义中有如下代码:
3. 安全性
String被许多的Java类(库)用来当做参数,例如 网络连接地址URL,文件路径path,还有反射机制所需要的String参数等, 假若String不是固定不变的,将会引起各种安全隐患。
假如有如下的代码:
总体来说, String不可变的原因包括 设计考虑,效率优化问题,以及安全性这三大方面. 事实上,这也是Java面试中的许多 "为什么" 的答案。
答案三:String类不可变性的好处
String是所有语言中最常用的一个类。我们知道在Java中,String是不可变的、final的。Java在运行时也保存了一个字符串池(String pool),这使得String成为了一个特别的类。
String类不可变性的好处
1.只有当字符串是不可变的,字符串池才有可能实现。字符串池的实现可以在运行时节约很多heap(堆)空间,因为不同的字符串变量都指向池中的同一个字符串。但如果字符串是可变的,那么String interning将不能实现(译者注:String interning(拘留)是指对不同的字符串仅仅只保存一个,即不会保存多个相同的字符串。),因为这样的话,如果变量改变了它的值,那么其它指向这个值的变量的值也会一起改变。
2.如果字符串是可变的,那么会引起很严重的安全问题。譬如,数据库的用户名、密码都是以字符串的形式传入来获得数据库的连接,或者在socket编程中,主机名和端口都是以字符串的形式传入。因为字符串是不可变的,所以它的值是不可改变的,否则黑客们可以钻到空子,改变字符串指向的对象的值,造成安全漏洞。
3.因为字符串是不可变的,所以是多线程安全的,同一个字符串实例可以被多个线程共享。这样便不用因为线程安全问题而使用同步。字符串自己便是线程安全的。
4.类加载器要用到字符串,不可变性提供了安全性,以便正确的类被加载。譬如你想加载java.sql.Connection类,而这个值被改成了myhacked.Connection,那么会对你的数据库造成不可知的破坏。
5.因为字符串是不可变的,所以在它创建的时候hashcode就被缓存了,不需要重新计算。这就使得字符串很适合作为Map中的键,字符串的处理速度要快过其它的键对象。这就是HashMap中的键往往都使用字符串。
以上就是我总结的字符串不可变性的好处。
什么是不可变对象?
String对象是不可变的,但这仅意味着你无法通过调用它的公有方法来改变它的值。
众所周知, 在Java中, String类是不可变的。那么到底什么是不可变的对象呢? 可以这样认为:如果一个对象,在它创建完成之后,不能再改变它的状态,那么这个对象就是不可变的。不能改变状态的意思是,不能改变对象内的成员变量,包括基本数据类型的值不能改变,引用类型的变量不能指向其他的对象,引用类型指向的对象的状态也不能改变。
区分对象和对象的引用
对于Java初学者, 对于String是不可变对象总是存有疑惑。看下面代码:
String s =
"ABCabc"
;
System.out.println(
"s = "
+ s);
s =
"123456"
;
System.out.println(
"s = "
+ s);
|
打印结果为:
s = ABCabc
s = 123456
|
首先创建一个String对象s,然后让s的值为“ABCabc”, 然后又让s的值为“123456”。 从打印结果可以看出,s的值确实改变了。那么怎么还说String对象是不可变的呢? 其实这里存在一个误区: s只是一个String对象的引用,并不是对象本身。对象在内存中是一块内存区,成员变量越多,这块内存区占的空间越大。引用只是一个4字节的数据,里面存放了它所指向的对象的地址,通过这个地址可以访问对象。
也就是说,s只是一个引用,它指向了一个具体的对象,当s=“123456”; 这句代码执行过之后,又创建了一个新的对象“123456”, 而引用s重新指向了这个新的对象,原来的对象“ABCabc”还在内存中存在,并没有改变。
Java和C++的一个不同点是, 在Java中不可能直接操作对象本身,所有的对象都由一个引用指向,必须通过这个引用才能访问对象本身,包括获取成员变量的值,改变对象的成员变量,调用对象的方法等。而在C++中存在引用,对象和指针三个东西,这三个东西都可以访问对象。其实,Java中的引用和C++中的指针在概念上是相似的,他们都是存放的对象在内存中的地址值,只是在Java中,引用丧失了部分灵活性,比如Java中的引用不能像C++中的指针那样进行加减运算。
为什么String对象是不可变的?
要理解String的不可变性,首先看一下String类中都有哪些成员变量。 在JDK1.6中,String的成员变量有以下几个:
public
final
class
String
implements
java.io.Serializable, Comparable<String>, CharSequence
{
/** The value is used for character storage. */
private
final
char
value[];
/** The offset is the first index of the storage that is used. */
private
final
int
offset;
/** The count is the number of characters in the String. */
private
final
int
count;
/** Cache the hash code for the string */
private
int
hash;
// Default to 0
|
在JDK1.8中,String类做了一些改动,主要是改变了substring方法执行时的行为,这和本文的主题不相关。JDK1.8中String类的主要成员变量就剩下了两个:
public final class String implements java.io.Serializable, Comparable<String>, CharSequence { /** The value is used for character storage. */ private final charvalue[]; /** Cache the hash code for the string */ private int hash; // Default to 0 /** * Class String is special cased within the Serialization Stream Protocol. * * A String instance is written into an ObjectOutputStream according to * <a href="{@docRoot}/../platform/serialization/spec/output.html"> * Object Serialization Specification, Section 6.2, "Stream Elements"</a> */ // 声明序列化时要包含的域,仅仅声明String中未使用 private static final ObjectStreamField[] serialPersistentFields = new ObjectStreamField[0]; } |
由以上的代码可以看出, 在Java中String类其实就是对字符数组的封装。JDK6中, value是String封装的数组,offset是String在这个value数组中的起始位置,count是String所占的字符的个数。在JDK7中,只有一个value变量,也就是value中的所有字符都是属于String这个对象的。这个改变不影响本文的讨论。 除此之外还有一个hash成员变量,是该String对象的哈希值的缓存,这个成员变量也和本文的讨论无关。在Java中,数组也是对象(可以参考我之前的文章java中数组的特性)。 所以value也只是一个引用,它指向一个真正的数组对象。其实执行了String s = “ABCabc”; 这句代码之后,真正的内存布局应该是这样的:
value,offset和count这三个变量都是private的,并且没有提供setValue, setOffset和setCount等公共方法来修改这些值,所以在String类的外部无法修改String。也就是说一旦初始化就不能修改, 并且在String类的外部不能访问这三个成员。此外,value,offset和count这三个变量都是final的, 也就是说在String类内部,一旦这三个值初始化了, 也不能被改变。所以可以认为String对象是不可变的了。
那么在String中,明明存在一些方法,调用他们可以得到改变后的值。这些方法包括substring, replace, replaceAll, toLowerCase等。例如如下代码:
String a =
"ABCabc"
;
System.out.println(
"a = "
+ a);
a = a.replace(
'A'
,
'a'
);
System.out.println(
"a = "
+ a);
|
打印结果为:
a = ABCabc
a = aBCabc
|
那么a的值看似改变了,其实也是同样的误区。再次说明, a只是一个引用, 不是真正的字符串对象,在调用a.replace(‘A', ‘a')时, 方法内部创建了一个新的String对象,并把这个心的对象重新赋给了引用a。String中replace方法的源码可以说明问题:
public String replace(char oldChar, char newChar) { if (oldChar != newChar) { int len = value.length; int i = -1; char[] val = value; /* avoid getfield opcode */ while (++i < len) { if (val[i] == oldChar) { break; } } if (i < len) { char buf[] = new char[len]; for (int j = 0; j < i; j++) { buf[j] = val[j]; } while (i < len) { char c = val[i]; buf[i] = (c == oldChar) ? newChar : c; i++; } return new String(buf, true); } } return this; } |
String ss =
"123456"
;
System.out.println(
"ss = "
+ ss);
ss.replace(
'1'
,
'0'
);
System.out.println(
"ss = "
+ ss);
|
打印结果:
ss =
123456
ss =
123456
|
String对象真的不可变吗?
从上文可知String的成员变量是private final 的,也就是初始化之后不可改变。那么在这几个成员中, value比较特殊,因为他是一个引用变量,而不是真正的对象。value是final修饰的,也就是说final不能再指向其他数组对象,那么我能改变value指向的数组吗? 比如将数组中的某个位置上的字符变为下划线“_”。 至少在我们自己写的普通代码中不能够做到,因为我们根本不能够访问到这个value引用,更不能通过这个引用去修改数组。
那么用什么方式可以访问私有成员呢? 没错,用反射, 可以反射出String对象中的value属性, 进而通过改变获得的value引用改变数组的结构。下面是实例代码:
import java.lang.reflect.Field;
public class Reflection { public static void main(String[] args) throws Exception { // 创建字符串"Hello World",并赋给引用s String s = "Hello World"; System.out.println("原 s= " + s + " ,hash:" + s.hashCode()); // 原s= Hello World 地址:-862545276 commonChange(s); System.out.println("======反射修改======"); // 获取String类中的value字段 Field valueField = String.class.getDeclaredField("value"); // 改变value属性的访问权限 valueField.setAccessible(true); // 获取s对象上的value属性的值 char[] value = (char[]) valueField.get(s); // 改变value所引用的数组中的第5个字符 // value[5] = '_'; valueField.set(s, newchar[]{'h', 'a', 'p', 'p', 'y'}); System.out.println("反射s= " + s + " ,hash:" + s.hashCode()); // 新s= happy 地址:-862545276 }
private static void commonChange(String s) { System.out.println("======普通修改======"); s = "Hello--World"; System.out.println("改变s= " + s + " ,hash:" + s.hashCode()); // 改变s= Hello--World ,hash:753841376 String newStr = new String("Hello--World"); System.out.println("新 s= " + newStr + " ,hash:" + newStr.hashCode()); // 新 s= Hello--World ,hash:753841376【内存中已存在】 System.out.println(s == newStr); // 依旧 false 【虽然hash相同】 } }
|
在这个过程中,s始终引用的同一个String对象,但是在反射前后,这个String对象发生了变化, 也就是说,通过反射是可以修改所谓的“不可变”对象的。但是一般我们不这么做。这个反射的实例还可以说明一个问题:如果一个对象,他组合的其他对象的状态是可以改变的,那么这个对象很可能不是不可变对象。例如一个Car对象,它组合了一个Wheel对象,虽然这个Wheel对象声明成了private final 的,但是这个Wheel对象内部的状态可以改变, 那么就不能很好的保证Car对象不可变。
参考:http://www.jb51.net/article/73243.htm