本章主要讨论为什么 String 被设计为是不可变的?这样设计有什么好处?
《Java 并发编程 78 讲》- 徐隆曦 学习笔记
在 Java 中,字符串是一个常量,我们一旦创建了一个 String 对象,就无法改变它的值,它的内容也就不可能发生变化(不考虑反射这种特殊行为)。
举个例子,比如我们给字符串 s 赋值为 “csdn”,然后再尝试给它赋一个新值,正如下面这段代码所示:
String s = "csdn";
s = "cs";
此时打印输出 s 的值为 “cs”,看起来好像是改变了字符串的值,但其背后实际上是新建了一个新的字符串 “cs”,并且把 s 的引用指向这个新创建出来的字符串 “cs”,原来的字符串对象 “csdn” 保持不变。
同样,如果我们调用 String 的 subString() 或 replace() 等方法,同时把 s 的引用指向这个新创建出来的字符串,这样都没有改变原有字符串对象的内容,因为这些方法只不过是建了一个新的字符串而已。
String 类的部分重要源码:
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
/** The value is used for character storage. */
private final char value[];
...
可以看到 String 内部存储的是一个 char 字符的数组,而且是被 final 和 private 修饰,外部既不能直接访问,也不能被修改。 而且 String 类本身也是被 final 进行修饰,所以想通过继承的方式来修改 value 的值也不可能,因此没有任何人可以通过扩展或者覆盖行为来破坏 String 类的不变性。
这就是 String 具备不变性的原因。
存在即合理,我们来看看这样设计的好处。
String 不可变的第一个好处是可以使用字符串常量池。在 Java 中有字符串常量池的概念,比如两个字符串变量的内容一样,那么就会指向同一个对象,而不需创建第二个同样内容的新对象,例如:
String s1="csdn";
String s2="csdn";
其实 s1 和 s2 背后指向的都是常量池中的同一个“csdn”,如下图所示:
在图中可以看到,左边这两个引用都指向常量池中的同一个 “csdn”,正是因为这样的机制,再加上 String 在程序中的应用是如此广泛,我们就可以节省大量的内存空间。
String 不可变的第二个好处就是它可以很方便地用作 HashMap (或者 HashSet) 的 key。通常建议把不可变对象作为 HashMap的 key,比如 String 就很合适作为 HashMap 的 key。
对于 key 来说,最重要的要求就是它是不可变的,这样我们才能利用它去检索存储在 HashMap 里面的 value。由于 HashMap 的工作原理是 Hash,也就是散列,所以需要对象始终拥有相同的 Hash 值才能正常运行。如果 String 是可变的,这会带来很大的风险,因为一旦 String 对象里面的内容变了,那么 Hash 码自然就应该跟着变了,若再用这个 key 去查找的话,就找不回之前那个 value 了。
String 不可变的第三个好处就是缓存 HashCode。
在 Java 中经常会用到字符串的 HashCode,在 String 类中有一个 hash 属性,代码如下:
/** Cache the hash code for the string */
private int hash; // Default to 0
这是一个成员变量,保存的是 String 对象的 HashCode。因为 String 是不可变的,所以对象一旦被创建之后,HashCode 的值也就不可能变化了,我们就可以把 HashCode 缓存起来。这样的话,以后每次想要用到 HashCode 的时候,不需要重新计算,直接返回缓存过的 hash 的值就可以了,因为它不会变,这样可以提高效率,所以这就使得字符串非常适合用作 HashMap 的 key。
而对于其他的不具备不变性的普通类的对象而言,如果想要去获取它的 HashCode ,就必须每次都重新算一遍,相比之下,效率就低了。
String 不可变的第四个好处就是线程安全,因为具备不变性的对象一定是线程安全的,我们不需要对其采取任何额外的措施,就可以天然保证线程安全。
由于 String 是不可变的,所以它就可以非常安全地被多个线程所共享,这对于多线程编程而言非常重要,避免了很多不必要的同步操作。
本章主要介绍了 String 是不可变的, String 具备不可变性会带来的好处,分别是可以使用字符串常量池、适合作为 HashMap 的 key、缓存 HashCode 以及线程安全。