关于String的不可变性

0 概述

  • 众所周知,java中String为不可变的,即一旦一个String对象在内存中被创建出来就无法被修改。
    具体表现为,String类的所有方法都没有改变字符串本身的值,而是返回了一个新的对象。
  • 比如以下代码:
        String str = "a";
        str =  "b";
关于String的不可变性_第1张图片
image.png

事实上,内容为"a"的字符串对象并没有改变,只是str指向的对象地址发生了改变。

1 String的不可变性是如何保证的

JDK源码中,存放String内容的实际上是char数组,这个数组是final类型的,一经初始化就不能改变。

 /** The value is used for character storage. */
    private final char value[];

但是,char数组是引用类型,final类型只能保证value的地址不可变,不能保证value数组的内容不能变化。即完全可以通过以下方式改变value的内容:

final char[] value = {'a','b','c'};
value[0] = 'd';

所以,重点是字符数组为private访问权限,所以只有SUN的工程师可以拿到这个字符数组。而SUN的工程师在所有方法中都没有改变该字符数组的值。另外,String被定义为Final类型,也防止了通过继承之后破坏不可变性。

2 String为什么设计为不可变?

Sring设计为不可变,显然是优点要大于缺点。优点主要是效率高,安全性高。我们先看优点有哪些:

2.1 优点

1 效率

效率主要体现在,基于Sting不可变,可以缓存字符串以及Hashcode,节省时间和空间。

  • String intern pool(字符串保留池)
    基于Sting不可变,我们就可以用缓存池将String对象缓存起来,同时把一个String对象的地址赋值给多个String引用,这样可以安全保证多个变量共享同一个对象。如果Java中的String对象可变的话,一个引用操作改变了对象的值,那么其他的变量也会受到影响。
    Java语法中专门给String类型设计有String intern pool,当程序员构造一个新的字符串时(只适用String str = "abc"的场景,不适用new String("abc")的场景),会优先在池子中查找是否已经存在内容相同的String对象,如果有则直接返回该对象的地址引用,没有就会构造一个新对象,放进池子,再返回地址引用。因此,构造一万个string x = "abc",实际上得到都是同一个引用,避免很多不必要的空间开销。

  • 缓存Hashcode

String对象内的hashCode()方法实际上只需执行一次计算过程(惰性计算),计算后把结果缓存到一个内部私有变量 int hash中,再次调用hashCode()方法时了,直接返回hash。例如,HashMap以Srting为key,需要频繁读取访问任意键值对时,能够节省很多的cpu计算开销。

2 安全性

  • 线程安全

不可变对象在物理上是绝对性的线程安全。由于不可变对象不可能被修改,因此能够在多线程中被任意自由访问而不导致线程安全问题,不需要多余的同步操作。即在并发场景下,多个线程同时读一个资源,并不会引发竞态条件,只有对资源进行读写才有危险。不可变对象不能被写,所以线程安全。

  • 其它地方使用安全

String被广泛用于网络连接、文件IO等多种Java基础类的参数中,如果String内容可变的话,将潜在地带来多种严重安全隐患,例如链接地址被暗中更改等。

下面是截取的一个示例,用不可变的String与可变的StringBuilder作为对比。


关于String的不可变性_第2张图片
image.png

在例子中,客户端可以拿到String参数s和StringBuilder参数sb,不能改变原始的s,却能改变sb。如果String可变,不安全性就体现在这里。

2.1 缺点

1 丧失了部分灵活性

我们平时使用的大部分都是可变对象,如果内容变化,只需要setValue()更新一下就可以了,不需要重新创建一个对象。当然,我们完全可以使用StringBuilder来弥补这个缺点。

3 脆弱的不可变性

  • 任何东西都可以靠JNI改变。一旦有调用C语言,你将在很多方面打破很多事情我甚至无法数清…
  • 使用纯java,通过反射改变String对象也很容易。
public class StringModifier {
    public static void main(String[] str){
        try {
            String test1="aaaa";
            String test2 =test1;
            String test3 = new String(test1);
            String test4 = new String(test1.toCharArray());

            Field values = String.class.getDeclaredField("value"); 
            values.setAccessible(true);
            char[] ref = (char [])values.get(test1);
            ref[0] = 'b';
 
            System.out.println("aaaa");
            System.out.println(test1+" "+test2+" "+test3+" "+test4);
        } catch (NoSuchFieldException|SecurityException|
            IllegalArgumentException|IllegalAccessException ex) {
        }
    }
}

代码输出可能出乎你的意料:


image.png

我们知道,test1、test2同一String对象的引用。test3虽然持有的引用和test1的String对象不一样,但是value[]数组是同一个。而test4的初始化方式,会生成新的数组并且拷贝每个元素,并创建新的String对象,所以不受影响。而System.out.println("aaaa")最终会调用到println(String s),栈中的s和test1同样指向同一地址。
详情可以参考String类源码中的初始化方式:http://www.jianshu.com/p/e5461012dcea

3 总结

总的来说,String作为Java中使用最为广泛的一个类,设计为不可变,是出于效率与安全性方面考虑。

你可能感兴趣的:(关于String的不可变性)