我看到一个 segmentfault 上的问题, 是关于 String.intern() 的, 感觉比较有意思, 于是自己也去探索了一下, 有了一些自己的见解, 于是在此记录下来.
我们首先来看一个例子:
// 1
String str1 = new StringBuilder("ja").append("va").toString();
System.out.println(str1.intern() == str1);
// 2
String str2 = new StringBuffer("编").append("程").toString();
System.out.println(str2.intern() == str2);
// 3
String str3 = new StringBuffer("编").append("程").toString();
System.out.println(str3.intern() == str3);
这个例子会输出什么呢? 有些读者朋友可能没有想到, 其实上面的例子在不同的 JDK 版本中运行, 会有不同的结果的. 那么接下来我们来试一下吧:
// 使用 JDK6 进行编译运行:
false, false, false
// 使用 JDK7 进行编译运行:
false, true, false
为什么结果会不同呢?
首先我们来看一下第一部分:
String str1 = new StringBuilder("ja").append("va").toString();
System.out.println(str1.intern() == str1);
这里 JDK6 和 JDK7 都是打印的 false, 其原因是 "java" 字符串常量比较特殊, 它是固定存在字符串常量池中的, 因此 "str1.intern()" 返回的就是字符串常量池中的对象的引用, 和堆上的 str1 就自然是不相等了.
接下来我们来分析一下第二部分的代码:
// 2
String str2 = new StringBuffer("编").append("程").toString();
System.out.println(str2.intern() == str2);
在这里 JDK6 和 JDK7 的输出有了差异, 其具体原因是 JDK6 和 JDK7 对 String.intern() 方法的实现的不同.
在 JDK6 及以前的 JDK 中:
intern() 方法会把首次遇到的字符串实例 **复制** 到永久代中, 然后返回永久代中的实例.
而对于 JDK7 以及之上的JDK:
当遇到第一次出现的字符串时, intern() **不再复制实例**, 而是在常量池中记录首次出现的实例的引用, 并且 intern() 返回的是此实例引用.
根据 JDK6 和 JDK7 的 intern() 方法的区别, 我们就知道了在第二部分的代码中, "编程" 这个字符串是第一次出现的, 因此在 JDK6 中, 会将此对象的实例拷贝一份然后存放到常量池中, intern() 返回的是在常量池中拷贝后的新对象的引用, 进而就和堆上的 str1 不等了; 而在 JDK7 中, 由于 intern() 方法的实现不同, 这个方法并不会拷贝一份对象实例到常量池中, 而是在常量池中记录此对象的引用, 因此 intern() 返回的引用其实和堆中的 str1 是一样的.
有了前面的认知, 我们对第三部分的代码的输出结果就比较熟悉了:
// 3
String str3 = new StringBuffer("编").append("程").toString();
System.out.println(str3.intern() == str3);
第三部分代码和第二部分代码其实是一样的, "编程" 这个字符串已经在第二部分的代码中出现了, 因此在常量池中已经存在了, 因此 str3.intern() 返回的是常量池中的对象的引用, 和堆上的 str3 自然是不一样的, 因此不论在 JDK6 还是 JDK7 中, 输出的都是 false.