关于String的不可变性

0 概述

众所周知，java中String为不可变的，即一旦一个String对象在内存中被创建出来就无法被修改。
具体表现为，String类的所有方法都没有改变字符串本身的值，而是返回了一个新的对象。
比如以下代码：

        String str = "a";
        str =  "b";

image.png

事实上，内容为"a"的字符串对象并没有改变，只是str指向的对象地址发生了改变。

1 String的不可变性是如何保证的

JDK源码中，存放String内容的实际上是char数组，这个数组是final类型的，一经初始化就不能改变。

 /** The value is used for character storage. */
    private final char value[];

但是，char数组是引用类型，final类型只能保证value的地址不可变，不能保证value数组的内容不能变化。即完全可以通过以下方式改变value的内容：

final char[] value = {'a','b','c'}；
value[0] = 'd';

所以，重点是字符数组为private访问权限，所以只有SUN的工程师可以拿到这个字符数组。而SUN的工程师在所有方法中都没有改变该字符数组的值。另外，String被定义为Final类型，也防止了通过继承之后破坏不可变性。

2 String为什么设计为不可变？

Sring设计为不可变，显然是优点要大于缺点。优点主要是效率高，安全性高。我们先看优点有哪些：

2.1 优点

1 效率

效率主要体现在，基于Sting不可变，可以缓存字符串以及Hashcode，节省时间和空间。

String intern pool（字符串保留池）
基于Sting不可变，我们就可以用缓存池将String对象缓存起来，同时把一个String对象的地址赋值给多个String引用，这样可以安全保证多个变量共享同一个对象。如果Java中的String对象可变的话，一个引用操作改变了对象的值，那么其他的变量也会受到影响。
Java语法中专门给String类型设计有String intern pool，当程序员构造一个新的字符串时（只适用String str = "abc"的场景，不适用new String("abc")的场景），会优先在池子中查找是否已经存在内容相同的String对象，如果有则直接返回该对象的地址引用，没有就会构造一个新对象，放进池子，再返回地址引用。因此，构造一万个string x = "abc"，实际上得到都是同一个引用，避免很多不必要的空间开销。
缓存Hashcode

String对象内的hashCode()方法实际上只需执行一次计算过程（惰性计算），计算后把结果缓存到一个内部私有变量 int hash中,再次调用hashCode()方法时了，直接返回hash。例如，HashMap以Srting为key，需要频繁读取访问任意键值对时，能够节省很多的cpu计算开销。

2 安全性

线程安全

不可变对象在物理上是绝对性的线程安全。由于不可变对象不可能被修改，因此能够在多线程中被任意自由访问而不导致线程安全问题，不需要多余的同步操作。即在并发场景下，多个线程同时读一个资源，并不会引发竞态条件，只有对资源进行读写才有危险。不可变对象不能被写，所以线程安全。

其它地方使用安全

String被广泛用于网络连接、文件IO等多种Java基础类的参数中，如果String内容可变的话，将潜在地带来多种严重安全隐患，例如链接地址被暗中更改等。

下面是截取的一个示例，用不可变的String与可变的StringBuilder作为对比。

image.png

在例子中，客户端可以拿到String参数s和StringBuilder参数sb，不能改变原始的s，却能改变sb。如果String可变，不安全性就体现在这里。

2.1 缺点

1 丧失了部分灵活性

我们平时使用的大部分都是可变对象，如果内容变化，只需要setValue()更新一下就可以了，不需要重新创建一个对象。当然，我们完全可以使用StringBuilder来弥补这个缺点。

3 脆弱的不可变性

任何东西都可以靠JNI改变。一旦有调用C语言，你将在很多方面打破很多事情我甚至无法数清…
使用纯java，通过反射改变String对象也很容易。

public class StringModifier {
    public static void main(String[] str){
        try {
            String test1="aaaa";
            String test2 =test1;
            String test3 = new String(test1);
            String test4 = new String(test1.toCharArray());

            Field values = String.class.getDeclaredField("value"); 
            values.setAccessible(true);
            char[] ref = (char [])values.get(test1);
            ref[0] = 'b';
 
            System.out.println("aaaa");
            System.out.println(test1+" "+test2+" "+test3+" "+test4);
        } catch (NoSuchFieldException|SecurityException|
            IllegalArgumentException|IllegalAccessException ex) {
        }
    }
}

代码输出可能出乎你的意料：

image.png

我们知道，test1、test2同一String对象的引用。test3虽然持有的引用和test1的String对象不一样，但是value[]数组是同一个。而test4的初始化方式，会生成新的数组并且拷贝每个元素，并创建新的String对象，所以不受影响。而System.out.println("aaaa")最终会调用到println(String s)，栈中的s和test1同样指向同一地址。
详情可以参考String类源码中的初始化方式：http://www.jianshu.com/p/e5461012dcea

3 总结

总的来说，String作为Java中使用最为广泛的一个类，设计为不可变，是出于效率与安全性方面考虑。

关于String的不可变性

0 概述

1 String的不可变性是如何保证的

2 String为什么设计为不可变？

2.1 优点

1 效率

2 安全性

2.1 缺点

1 丧失了部分灵活性

3 脆弱的不可变性

3 总结

你可能感兴趣的:(关于String的不可变性)