探讨String、StringBuilder与StringBuffer

String定义

  • String是final类,派生类不可继承
  • String是char的集合,它的value其实就是char数组
public final class String
        implements java.io.Serializable, Comparable, CharSequence {
    /** The value is used for character storage. */
    private final char value[];

    /** Cache the hash code for the string */
    private int hash; // Default to 0
}

String特点

String的值发生变化都会导致对象引用发生变化,简单介绍就是new,例如:

    public String replace(char oldChar, char newChar) {
        if (oldChar != newChar) {
            int len = value.length;
            int i = -1;
            char[] val = value; /* avoid getfield opcode */

            while (++i < len) {
                if (val[i] == oldChar) {
                    break;
                }
            }
            if (i < len) {
                char buf[] = new char[len];
                for (int j = 0; j < i; j++) {
                    buf[j] = val[j];
                }
                while (i < len) {
                    char c = val[i];
                    buf[i] = (c == oldChar) ? newChar : c;
                    i++;
                }
                return new String(buf, true);//值发生变化时,new String
            }
        }
        return this;//未发生值变化
    }
    public String substring(int beginIndex, int endIndex) {
        if (beginIndex < 0) {
            throw new StringIndexOutOfBoundsException(beginIndex);
        }
        if (endIndex > value.length) {
            throw new StringIndexOutOfBoundsException(endIndex);
        }
        int subLen = endIndex - beginIndex;
        if (subLen < 0) {
            throw new StringIndexOutOfBoundsException(subLen);
        }
        return ((beginIndex == 0) && (endIndex == value.length)) ? this
                : new String(value, beginIndex, subLen);//值发生变化时,new String
    }

到String类中查看所有值操作方法就会发现,值发生变化都会导致对象引用发生变化,这里就不一一列举。


String问题及解析

问题1:观察下面代码,main方法中生成对象的个数?

    public static void main(String[] args) {
        String a = "test122222";
        String b = "test122222";
    }

分析:
笔者使用的是Mac OS,当前目录在该文件Test.java所在目录。
编译Test.java命令:

$ javac Test.java

对代码进行反汇编:

$ javap -c Test
class Test {
  public static void main(java.lang.String[]);
    Code:
       0: ldc           #2                  // String test122222
       2: astore_1
       3: ldc           #2                  // String test122222
       5: astore_2
       6: return
}

观察,两次字节码指令ldc操作,都使用同一个资源String test122222,初步结论:生成一个对象。
继续,使用命令jps,jmap,jhat去分析
为方便分析,main方法中加入Thread.sleep代码:

class Test {
    public static void main(String[] args) {
        String a = "test122222";
        String b = "test122222";
        try {
            Thread.sleep(3000000);
        } catch (Exception e) {
            
        }
    }
}

查看Java运行进程PID命令:

$ jps
1363 
5396 Launcher
5397 Test
5400 Jps
2239 Main

生成dump文件命令:

$ jmap -dump:format=b,file=/Users/lubixin/test/dump_test 5397
Dumping heap to /Users/lubixin/test/dump_test ...
Heap dump file created

使用jhat分析dump文件命令:

$ jhat /Users/lubixin/test/dump_test
Reading from /Users/lubixin/test/dump_test...
Dump file created Sun Feb 24 15:19:41 CST 2019
Snapshot read, resolving...
Resolving 20503 objects...
Chasing references, expect 4 dots....
Eliminating duplicate references....
Snapshot resolved.
Started HTTP server on port 7000
Server is ready.

默认7000端口,到浏览器访问http://localhost:7000
点击:Show heap histogram

Show heap histogram

点击:class java.lang.String
java.lang.String

搜索test122222
image

发现只有一个对象,结论:

网上提到其他类似问题都可以通过命令jps,jmap,jhat去分析,触类旁通。

问题2:String中hashCode的作用?

    public int hashCode() {
        int h = hash;
        if (h == 0 && value.length > 0) {
            char val[] = value;

            for (int i = 0; i < value.length; i++) {
                h = 31 * h + val[i];
            }
            hash = h;
        }
        return h;
    }

分析:
观察源码,得出以下结论:
1.String的hashCode通过一定的算法计算出对应String的int值
2.两个相同的String,它的hashCode值一定相等
3.一一对应的关系,根据逆否命题,不相等的hashCode值,一定是两个不同的String
我们常常使用的HashMap类,get方法中的hash方法使用到hashCode方法

    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

结论之一:
具体为什么HashMap执行get操作,效率之高,请查看相关介绍://TODO


String与StringBuilder

观察下面两个方法testString与testStringBuilder,字符串的拼接,最终结果都是:test1test2test2test2

    public void testString() {
        String a = "test1";
        String b = "test2";
        for (int i = 0;i < 3;i++) {
            a = a + b;
        }
        //a = "test1test2test2test2"
    }

    public void testStringBuilder() {
        StringBuilder a = new StringBuilder("test1");
        String b = "test2";
        for (int i = 0;i < 3;i++) {
            a.append(b);
        }
        //a = "test1test2test2test2"
    }

反编译javap -c

  public void testString();
    Code:
       0: ldc           #2                  // String test1
       2: astore_1
       3: ldc           #3                  // String test2
       5: astore_2
       6: iconst_0
       7: istore_3
       8: iload_3
       9: iconst_3
      10: if_icmpge     38
      13: new           #4                  // class java/lang/StringBuilder
      16: dup
      17: invokespecial #5                  // Method java/lang/StringBuilder."":()V
      20: aload_1
      21: invokevirtual #6                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      24: aload_2
      25: invokevirtual #6                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      28: invokevirtual #7                  // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
      31: astore_1
      32: iinc          3, 1
      35: goto          8
      38: return

从8-35行对应代码的for循环体
可以观察到,testString方法中a = a + b;
每次循环都会new StringBuilder,再执行两次append方法,最后再执行一次toString方法
查看StringBuilder的toString方法的实现

    public String toString() {
        // Create a copy, don't share the array
        return new String(value, 0, count);
    }

每次toString,都会new String
再查看testStringBuilder方法反编译结果

  public void testStringBuilder();
    Code:
       0: new           #4                  // class java/lang/StringBuilder
       3: dup
       4: ldc           #2                  // String test1
       6: invokespecial #8                  // Method java/lang/StringBuilder."":(Ljava/lang/String;)V
       9: astore_1
      10: ldc           #3                  // String test2
      12: astore_2
      13: iconst_0
      14: istore_3
      15: iload_3
      16: iconst_3
      17: if_icmpge     32
      20: aload_1
      21: aload_2
      22: invokevirtual #6                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      25: pop
      26: iinc          3, 1
      29: goto          15
      32: return

每次循环,只会执行一次append方法
比较testString与testStringBuilder
testString每次循环:new两次,append两次
testStringBuilder每次循环:append一次
可见两者效率上的差别,读者可以尝试增大循环次数,比较两者运行时间。


StringBuilder与StringBuffer

查看源码,StringBuilder中有的方法,对应的,StringBuffer中也有,例如append方法,区别在于,StringBuffer的append方法前的synchronized。
同步原语synchronized详解请点击://TODO
了解synchronized后,就明白,为什么StringBuffer是线程安全的,StringBuilder是非线程安全的。


总结

仅仅从简单的对比,执行的效率上,,原因是相同的操作,StringBuffer需要通过加锁来保证线程安全的额外开销。
,原因是多出new与append的额外开销。
网上评论说StringBuffer > String,,在超高并发下,StringBuffer不见得比String效率更高。

你可能感兴趣的:(探讨String、StringBuilder与StringBuffer)