0 概述
- 众所周知,java中String为不可变的,即一旦一个String对象在内存中被创建出来就无法被修改。
具体表现为,String类的所有方法都没有改变字符串本身的值,而是返回了一个新的对象。 - 比如以下代码:
String str = "a";
str = "b";
事实上,内容为"a"的字符串对象并没有改变,只是str指向的对象地址发生了改变。
1 String的不可变性是如何保证的
JDK源码中,存放String内容的实际上是char数组,这个数组是final类型的,一经初始化就不能改变。
/** The value is used for character storage. */
private final char value[];
但是,char数组是引用类型,final类型只能保证value的地址不可变,不能保证value数组的内容不能变化。即完全可以通过以下方式改变value的内容:
final char[] value = {'a','b','c'};
value[0] = 'd';
所以,重点是字符数组为private访问权限,所以只有SUN的工程师可以拿到这个字符数组。而SUN的工程师在所有方法中都没有改变该字符数组的值。另外,String被定义为Final类型,也防止了通过继承之后破坏不可变性。
2 String为什么设计为不可变?
Sring设计为不可变,显然是优点要大于缺点。优点主要是效率高,安全性高。我们先看优点有哪些:
2.1 优点
1 效率
效率主要体现在,基于Sting不可变,可以缓存字符串以及Hashcode,节省时间和空间。
String intern pool(字符串保留池)
基于Sting不可变,我们就可以用缓存池将String对象缓存起来,同时把一个String对象的地址赋值给多个String引用,这样可以安全保证多个变量共享同一个对象。如果Java中的String对象可变的话,一个引用操作改变了对象的值,那么其他的变量也会受到影响。
Java语法中专门给String类型设计有String intern pool,当程序员构造一个新的字符串时(只适用String str = "abc"的场景,不适用new String("abc")的场景),会优先在池子中查找是否已经存在内容相同的String对象,如果有则直接返回该对象的地址引用,没有就会构造一个新对象,放进池子,再返回地址引用。因此,构造一万个string x = "abc",实际上得到都是同一个引用,避免很多不必要的空间开销。缓存Hashcode
String对象内的hashCode()方法实际上只需执行一次计算过程(惰性计算),计算后把结果缓存到一个内部私有变量 int hash中,再次调用hashCode()方法时了,直接返回hash。例如,HashMap以Srting为key,需要频繁读取访问任意键值对时,能够节省很多的cpu计算开销。
2 安全性
- 线程安全
不可变对象在物理上是绝对性的线程安全。由于不可变对象不可能被修改,因此能够在多线程中被任意自由访问而不导致线程安全问题,不需要多余的同步操作。即在并发场景下,多个线程同时读一个资源,并不会引发竞态条件,只有对资源进行读写才有危险。不可变对象不能被写,所以线程安全。
- 其它地方使用安全
String被广泛用于网络连接、文件IO等多种Java基础类的参数中,如果String内容可变的话,将潜在地带来多种严重安全隐患,例如链接地址被暗中更改等。
下面是截取的一个示例,用不可变的String与可变的StringBuilder作为对比。
在例子中,客户端可以拿到String参数s和StringBuilder参数sb,不能改变原始的s,却能改变sb。如果String可变,不安全性就体现在这里。
2.1 缺点
1 丧失了部分灵活性
我们平时使用的大部分都是可变对象,如果内容变化,只需要setValue()更新一下就可以了,不需要重新创建一个对象。当然,我们完全可以使用StringBuilder来弥补这个缺点。
3 脆弱的不可变性
- 任何东西都可以靠JNI改变。一旦有调用C语言,你将在很多方面打破很多事情我甚至无法数清…
- 使用纯java,通过反射改变String对象也很容易。
public class StringModifier {
public static void main(String[] str){
try {
String test1="aaaa";
String test2 =test1;
String test3 = new String(test1);
String test4 = new String(test1.toCharArray());
Field values = String.class.getDeclaredField("value");
values.setAccessible(true);
char[] ref = (char [])values.get(test1);
ref[0] = 'b';
System.out.println("aaaa");
System.out.println(test1+" "+test2+" "+test3+" "+test4);
} catch (NoSuchFieldException|SecurityException|
IllegalArgumentException|IllegalAccessException ex) {
}
}
}
代码输出可能出乎你的意料:
我们知道,test1、test2同一String对象的引用。test3虽然持有的引用和test1的String对象不一样,但是value[]数组是同一个。而test4的初始化方式,会生成新的数组并且拷贝每个元素,并创建新的String对象,所以不受影响。而System.out.println("aaaa")最终会调用到println(String s),栈中的s和test1同样指向同一地址。
详情可以参考String类源码中的初始化方式:http://www.jianshu.com/p/e5461012dcea
3 总结
总的来说,String作为Java中使用最为广泛的一个类,设计为不可变,是出于效率与安全性方面考虑。