假设你有一个字符串s,并持有他的字串s',那么即使你不再持有字符串s的引用,JVM也不会使用垃圾回收机制回收s,这在SUN的网站上被报告为一个bug,http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=4513622 。当然有人认为这是一个bug,也有人认为不是一个bug。
看一个代码:
public class TestGC { private String largeString = new String(new byte[100000]); private String smallString = "foo"; String getString() { // if caller stores this substring, this customer will not be gc'ed return this.largeString.substring(0,2); // return new String(this.largeString.substring(0,2)); // no error here! // return smallString; // no error here! } public static void main(String[] args) { java.util.ArrayList list = new java.util.ArrayList(); for (int i = 0; i < 1000000; i++) { TestGC gc = new TestGC(); list.add(gc.getString()); } } }
注意到这段代码会报OutofMemory的异常,但是当使用return new String(this.largeString.substring(0,2)); 则不会。其实这是SUN实现的JVM的一种优化策略,直接使用return this.largeString.substring(0,2);,其实是一种浅拷贝,String的实现内部保存一个char[]的value,如果直接返回一个子字符串其实是保存了value的开始和结束索引,并不产生一个新的字符串。
跟踪到substring的实现可见:
public String substring(int beginIndex, int endIndex) { if (beginIndex < 0) { throw new StringIndexOutOfBoundsException(beginIndex); } if (endIndex > count) { throw new StringIndexOutOfBoundsException(endIndex); } if (beginIndex > endIndex) { throw new StringIndexOutOfBoundsException(endIndex - beginIndex); } return ((beginIndex == 0) && (endIndex == count)) ? this : new String(offset + beginIndex, endIndex - beginIndex, value); } // Package private constructor which shares value array for speed. String(int offset, int count, char value[]) { this.value = value; this.offset = offset; this.count = count; }
这样就可以明白异常抛出的原因了。
这主要是提醒我们在取很多长字符串的子串的时候一定要记得使用深度复制,这种方式内存上的节省往往是令人惊讶的。