探讨String、StringBuilder与StringBuffer

String定义

String是final类，派生类不可继承
String是char的集合，它的value其实就是char数组

public final class String
        implements java.io.Serializable, Comparable, CharSequence {
    /** The value is used for character storage. */
    private final char value[];

    /** Cache the hash code for the string */
    private int hash; // Default to 0
}

String特点

String的值发生变化都会导致对象引用发生变化，简单介绍就是new，例如：

    public String replace(char oldChar, char newChar) {
        if (oldChar != newChar) {
            int len = value.length;
            int i = -1;
            char[] val = value; /* avoid getfield opcode */

            while (++i < len) {
                if (val[i] == oldChar) {
                    break;
                }
            }
            if (i < len) {
                char buf[] = new char[len];
                for (int j = 0; j < i; j++) {
                    buf[j] = val[j];
                }
                while (i < len) {
                    char c = val[i];
                    buf[i] = (c == oldChar) ? newChar : c;
                    i++;
                }
                return new String(buf, true);//值发生变化时，new String
            }
        }
        return this;//未发生值变化
    }

    public String substring(int beginIndex, int endIndex) {
        if (beginIndex < 0) {
            throw new StringIndexOutOfBoundsException(beginIndex);
        }
        if (endIndex > value.length) {
            throw new StringIndexOutOfBoundsException(endIndex);
        }
        int subLen = endIndex - beginIndex;
        if (subLen < 0) {
            throw new StringIndexOutOfBoundsException(subLen);
        }
        return ((beginIndex == 0) && (endIndex == value.length)) ? this
                : new String(value, beginIndex, subLen);//值发生变化时，new String
    }

到String类中查看所有值操作方法就会发现，值发生变化都会导致对象引用发生变化，这里就不一一列举。

String问题及解析

问题1：观察下面代码，main方法中生成对象的个数？

    public static void main(String[] args) {
        String a = "test122222";
        String b = "test122222";
    }

分析：
笔者使用的是Mac OS，当前目录在该文件Test.java所在目录。
编译Test.java命令：

$ javac Test.java

对代码进行反汇编：

$ javap -c Test
class Test {
  public static void main(java.lang.String[]);
    Code:
       0: ldc           #2                  // String test122222
       2: astore_1
       3: ldc           #2                  // String test122222
       5: astore_2
       6: return
}

观察，两次字节码指令ldc操作，都使用同一个资源String test122222，初步结论：生成一个对象。
继续，使用命令jps，jmap，jhat去分析
为方便分析，main方法中加入Thread.sleep代码：

class Test {
    public static void main(String[] args) {
        String a = "test122222";
        String b = "test122222";
        try {
            Thread.sleep(3000000);
        } catch (Exception e) {
            
        }
    }
}

查看Java运行进程PID命令：

$ jps
1363 
5396 Launcher
5397 Test
5400 Jps
2239 Main

生成dump文件命令：

$ jmap -dump:format=b,file=/Users/lubixin/test/dump_test 5397
Dumping heap to /Users/lubixin/test/dump_test ...
Heap dump file created

使用jhat分析dump文件命令：

$ jhat /Users/lubixin/test/dump_test
Reading from /Users/lubixin/test/dump_test...
Dump file created Sun Feb 24 15:19:41 CST 2019
Snapshot read, resolving...
Resolving 20503 objects...
Chasing references, expect 4 dots....
Eliminating duplicate references....
Snapshot resolved.
Started HTTP server on port 7000
Server is ready.

默认7000端口，到浏览器访问http://localhost:7000
点击：Show heap histogram

Show heap histogram

点击：class java.lang.String

java.lang.String

搜索test122222

image

发现只有一个对象，结论：

网上提到其他类似问题都可以通过命令jps，jmap，jhat去分析，触类旁通。

问题2：String中hashCode的作用？

    public int hashCode() {
        int h = hash;
        if (h == 0 && value.length > 0) {
            char val[] = value;

            for (int i = 0; i < value.length; i++) {
                h = 31 * h + val[i];
            }
            hash = h;
        }
        return h;
    }

分析：
观察源码，得出以下结论：
1.String的hashCode通过一定的算法计算出对应String的int值
2.两个相同的String，它的hashCode值一定相等
3.一一对应的关系，根据逆否命题，不相等的hashCode值，一定是两个不同的String
我们常常使用的HashMap类，get方法中的hash方法使用到hashCode方法

    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

结论之一：
具体为什么HashMap执行get操作，效率之高，请查看相关介绍：//TODO

String与StringBuilder

观察下面两个方法testString与testStringBuilder，字符串的拼接，最终结果都是：test1test2test2test2

    public void testString() {
        String a = "test1";
        String b = "test2";
        for (int i = 0;i < 3;i++) {
            a = a + b;
        }
        //a = "test1test2test2test2"
    }

    public void testStringBuilder() {
        StringBuilder a = new StringBuilder("test1");
        String b = "test2";
        for (int i = 0;i < 3;i++) {
            a.append(b);
        }
        //a = "test1test2test2test2"
    }

反编译javap -c

  public void testString();
    Code:
       0: ldc           #2                  // String test1
       2: astore_1
       3: ldc           #3                  // String test2
       5: astore_2
       6: iconst_0
       7: istore_3
       8: iload_3
       9: iconst_3
      10: if_icmpge     38
      13: new           #4                  // class java/lang/StringBuilder
      16: dup
      17: invokespecial #5                  // Method java/lang/StringBuilder."":()V
      20: aload_1
      21: invokevirtual #6                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      24: aload_2
      25: invokevirtual #6                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      28: invokevirtual #7                  // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
      31: astore_1
      32: iinc          3, 1
      35: goto          8
      38: return

从8-35行对应代码的for循环体
可以观察到，testString方法中a = a + b;
每次循环都会new StringBuilder，再执行两次append方法，最后再执行一次toString方法
查看StringBuilder的toString方法的实现

    public String toString() {
        // Create a copy, don't share the array
        return new String(value, 0, count);
    }

每次toString，都会new String
再查看testStringBuilder方法反编译结果

  public void testStringBuilder();
    Code:
       0: new           #4                  // class java/lang/StringBuilder
       3: dup
       4: ldc           #2                  // String test1
       6: invokespecial #8                  // Method java/lang/StringBuilder."":(Ljava/lang/String;)V
       9: astore_1
      10: ldc           #3                  // String test2
      12: astore_2
      13: iconst_0
      14: istore_3
      15: iload_3
      16: iconst_3
      17: if_icmpge     32
      20: aload_1
      21: aload_2
      22: invokevirtual #6                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      25: pop
      26: iinc          3, 1
      29: goto          15
      32: return

每次循环，只会执行一次append方法
比较testString与testStringBuilder
testString每次循环：new两次，append两次
testStringBuilder每次循环：append一次
可见两者效率上的差别，读者可以尝试增大循环次数，比较两者运行时间。

StringBuilder与StringBuffer

查看源码，StringBuilder中有的方法，对应的，StringBuffer中也有，例如append方法，区别在于，StringBuffer的append方法前的synchronized。
同步原语synchronized详解请点击：//TODO
了解synchronized后，就明白，为什么StringBuffer是线程安全的，StringBuilder是非线程安全的。

总结

仅仅从简单的对比，执行的效率上，，原因是相同的操作，StringBuffer需要通过加锁来保证线程安全的额外开销。
，原因是多出new与append的额外开销。
网上评论说StringBuffer > String，，在超高并发下，StringBuffer不见得比String效率更高。