深入理解java.lang.String类的不可变性

1. 字符串 String 的不可变性

什么是不可变类?

这样理解:
        一个对象在创建完成后,不能去改变它的状态,不能改变它的成员变量(如果成员变量包含基本数据类型,那么这个基本数据类型的值不能改变;如果包含引用类型,那么这个引用类型的变量不能指向别的对象)

不可变类只是其实例不能被修改的类。每个实例中包含的所有信息都必须在创建该实例的时候就提供,并且在对象的整个生命周期内固定不变。为了使类不可变,要遵循下面五条规则:

  • 不要提供任何会修改对象状态的方法
  • 保证类不会被扩展。 一般的做法是让这个类称为 final 的,防止子类化,破坏该类的不可变行为
  • 使所有的域都是 final 的
  • 使所有的域都成为私有的。 防止客户端获得访问被域引用的可变对象的权限,并防止客户端直接修改这些对象
  • 确保对于任何可变性组件的互斥访问。 如果类具有指向可变对象的域,则必须确保该类的客户端无法获得指向这些对象的引用

翻阅 API 文档:

public final class String
    implements java.io.Serializable, Comparable, CharSequence {
    // value 数组被 final 修饰
    private final char value[];
    ...
}

String 类代表字符串。Java 程序中的所有字符串字面值(如 “abc” )都作为此类的实例来实现。 这些字面值都是直接存储在“方法区”的 字符串常量池

字符串是常量;它们的值在创建之后 不能改变,所以可以共享它们。例如:

String str = "abc";

这时就有人疑惑了:为什么 String 不可变?但我的代码中经常改变 String 啊,如下:

String str = "HELLO";
str = "WORLD";
System.out.println(str);    // WORLD

这样操作,不就是将 “HELLO” 对象改变成了 “WORLD” 对象了吗?

虽然字符串的内容看上去从“HELLO” 变成了“WORLD”,但实际上,这已经是生成了一个新的字符串了:

String str = "HELLO";
System.out.println(str.hashCode());  // 68624562
str = "WORLD";
System.out.println(str.hashCode());  // 82781042

变量 str 前后的 hashCode 值不一样,说明了 str 在改变前后,指向了不同的对象。所以,变量 str 只是指向了不同对象,字符串 “HELLO”对象本身没有被改变。

变量 str 的指向如下图所示(jdk1.8:字符串常量位于堆中):

深入理解java.lang.String类的不可变性_第1张图片

我们也可以使用 javap 命令来查看 class 的常量池:

javap -c -v StringTest.class

执行后,常量池信息如下:

深入理解java.lang.String类的不可变性_第2张图片

从常量池中可以看出,确实有两个字符串对象:HELLO、WORLD

【总结】:一旦一个 String 对象堆中被创建出来,它就无法被修改。而且,String 类的所有 API 方法都没有改变字符串本身的值,都是返回了一个新的字符串对象。

2. String 设计成不可变类的好处

在了解了“String 是不可变”的之后,大家是不是很疑惑:为什么要把 String 设计成不可变的呢?这样做又有什么好处呢?

主要从以下几个角度考虑:

  • 安全可靠性:字符串在 Java 应用程序中应用广泛(存储敏感信息,如:用户名、密码、连接 url、网络连接等);JVM类加载器在加载类的时也广泛地使用它。因此,保护 String 类对于提升整个应用程序的安全性至关重要。
  • 缓存:字符串是使用最广泛的数据结构,大量的字符串的创建是非常耗费资源的。JVM 中专门开辟了一部分空间来存储 Java 字符串,那就是字符串常量池。通过字符串常量池,两个内容相同的字符串变量,可以从池中指向同一个字符串对象,从而节省了关键的内存资源
  • 线程安全:不可变会自动使字符串成为线程安全的,因为当从多个线程访问它们时,它们不会被更改
  • hashcode 缓存:字符串也被广泛地用于哈希实现,如 HashMap、HashTable、HashSet 等。在对这些散列实现进行操作时,经常调用键的hashCode() 方法。不可变性保证了字符串的值不会改变,因此,hashCode() 方法在 String 类中被重写,以方便缓存。这样,在第一次hashCode() 调用期间计算和缓存散列,并从那时起返回相同的值。

3. 面试题

// 生成两个对象:一个在常量池中;一个中堆中,且都是 hello 对象
String s = new String("hello");

那么,下面会生成几个对象呢?

// 只会在字符串常量池中生成一个对象:helloworld。
String s3 = "hello" + "world";

这种字面量用“+”拼接,编译器在编译期间会直接进行优化。

// 这个会生成4个对象。2个在常量池中:hello、world
// 2个在堆中:StringBuilder、helloworld对象
String s = "hello";
String s2 = s + "world";

编译后,使用反编译软件 ------ jad 进行查看:

String s1 = "hell0";
String s2 = (new StringBuilder()).append(s1).append("world").toString();

发现:使用“+”将变量和字面量进行拼接的结果是:将 String 转成了StringBuilder 后,使用其 append() 方法进行处理的

查看 StringBuilder.toString() 方法源码:

@Override
public String toString() {
	// char[] value; value 是 StringBuilder 类的成员变量
    return new String(value, 0, count);
}

最后调用 toString() 方法时,会创建一个 String 对象。这个字符串对象只会在堆中创建,并不会在字符串常量池中创建。所以,会创建4个对象(hello 和 world 会直接在字符串常量池中创建)。

到此这篇关于深入理解java.lang.String类的不可变性的文章就介绍到这了,更多相关java.lang.String不可变性内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

你可能感兴趣的:(深入理解java.lang.String类的不可变性)