什么情况下用“+” 运算符进行字符串连接比调用 StringBuffer/StringBuilder 对象的 append 方法连接字符串性能更好?

字符串是 Java 程序中最常用的数据结构之一。在 Java 中 String 类已经重载了"+"。也就是说,字符串可以直接
使用"+"进行连接,如下面代码所示:

String s = "abc" + "ddd";

但这样做真的好吗?当然,这个问题不能简单地回答 yes or no。要根据具体情况来定。在 Java 中提供了一个
StringBuilder 类(这个类只在 J2SE5 及以上版本提供,以前的版本使用 StringBuffer 类),这个类也可以起到"+"的
作用。那么我们应该用哪个呢?
下面让我们先看看如下的代码:

package string;
public class TestSimplePlus
{
public static void main(String[] args)
{
String s = "abc";
String ss = "ok" + s + "xyz" + 5;
System.out.println(ss);
	}
}

上面的代码将会输出正确的结果。从表面上看,对字符串和整型使用"+"号并没有什么区别,但事实真的如此吗?
下面让我们来看看这段代码的本质。
我们首先使用反编译工具(如 jdk 带的 javap、或 jad)将 TestSimplePlus 反编译成 Java Byte Code,其中的奥
秘就一目了然了。在本文将使用 jad 来反编译,命令如下:
jad -o -a -s d.java TestSimplePlus.class
反编译后的代码如下:

package string;
import java.io.PrintStream;
public class TestSimplePlus
{
public TestSimplePlus()
{
// 0 0:aload_0
// 1 1:invokespecial #8 
// 2 4:return
}

public static void main(String args[])
 {
 String s = "abc";
 // 0 0:ldc1 #16 
 // 1 2:astore_1
 String ss = (new StringBuilder("ok")).append(s).append("xyz").append(5).toString()
 // 2 3:new #18 
 // 3 6:dup
 // 4 7:ldc1 #20 
 // 5 9:invokespecial #22 
 // 6 12:aload_1
 // 7 13:invokevirtual #25 
 // 8 16:ldc1 #29 
 // 9 18:invokevirtual #25 
 // 10 21:iconst_5
 // 11 22:invokevirtual #31 
 // 12 25:invokevirtual #34 
// 13 28:astore_2
System.out.println(ss);
// 14 29:getstatic #38 
// 15 32:aload_2
// 16 33:invokevirtual #44 
// 17 36:return
}
}

读者可能看到上面的 Java 字节码感到迷糊,不过大家不必担心。本文的目的并不是讲解 Java Byte Code,因此,
并不用了解具体的字节码的含义。
使用 jad 反编译的好处之一就是可以同时生成字节码和源代码。这样可以进行对照研究。从上面的代码很容易看
出,虽然在源程序中使用了"+",但在编译时仍然将"+“转换成 StringBuilder。因此,我们可以得出结论, 在 Java 中
无论使用何种方式进行字符串连接,实际上都使用的是 StringBuilder

那么是不是可以根据这个结论推出使用”+“和 StringBuilder 的效果是一样的呢?这个要从两个方面的解释。如果
从运行结果来解释,那么”+“和 StringBuilder 是完全等效的。但如果从运行效率和资源消耗方面看,那它们将存在很
大的区别。
当然,如果连接字符串行表达式很简单(如上面的顺序结构),那么”+"和 StringBuilder 基本是一样的,但如果
结构比较复杂,如使用循环来连接字符串,那么产生的 Java Byte Code 就会有很大的区别。先让我们看看如下的代
码:

package string;
import java.util.*;
public class TestComplexPlus
{
public static void main(String[] args)
{
String s = "";
Random rand = new Random();
for (int i = 0; i < 10; i++)
{
s = s + rand.nextInt(1000) + " ";
}
System.out.println(s);
}
}

上面的代码返编译后的 Java Byte Code 如下:

 package string;

 import java.io.PrintStream;
 import java.util.Random;

 public class TestComplexPlus
 {

public TestComplexPlus()
 {
 // 0 0:aload_0
 // 1 1:invokespecial #8 
 // 2 4:return
 }

 public static void main(String args[])
 {
 String s = "";
 // 0 0:ldc1 #16 
 // 1 2:astore_1
 Random rand = new Random();
 // 2 3:new #18 
 // 3 6:dup
 // 4 7:invokespecial #20 
 // 5 10:astore_2
 for(int i = 0; i < 10; i++)
 //* 6 11:iconst_0
 //* 7 12:istore_3
 //* 8 13:goto 49
 s = (new StringBuilder(String.valueOf(s))).append(rand.nextInt(1000)).append(" ").t
oString();
 // 9 16:new #21 
 // 10 19:dup
 // 11 20:aload_1
 // 12 21:invokestatic #23 
 // 13 24:invokespecial #29 
 // 14 27:aload_2
// 15 28:sipush 1000
// 16 31:invokevirtual #32 
// 17 34:invokevirtual #36 
// 18 37:ldc1 #40 
// 19 39:invokevirtual #42 
// 20 42:invokevirtual #45 
// 21 45:astore_1
// 22 46:iinc 3 1
// 23 49:iload_3
// 24 50:bipush 10
// 25 52:icmplt 16
System.out.println(s);
// 26 55:getstatic #49 
// 27 58:aload_1
// 28 59:invokevirtual #55 
// 29 62:return
}
}

大家可以看到,虽然编译器将"+"转换成了 StringBuilder,但创建 StringBuilder 对象的位置却在 for 语句内
部。这就意味着每执行一次循环,就会创建一个 StringBuilder 对象(对于本例来说,是创建了 10 个 StringBuilder
对象),虽然 Java 有垃圾回收器,但这个回收器的工作时间是不定的。如果不断产生这样的垃圾,那么仍然会占用
大量的资源。解决这个问题的方法就是在程序中直接使用 StringBuilder 来连接字符串,代码如下:

package string;

import java.util.*;

public class TestStringBuilder
{
public static void main(String[] args)
{
String s = "";
 Random rand = new Random();
 StringBuilder result = new StringBuilder();
 for (int i = 0; i < 10; i++)
 {
 result.append(rand.nextInt(1000));
 result.append(" ");
 }
 System.out.println(result.toString());
 }
 }

上面代码反编译后的结果如下:

20.package string;

import java.io.PrintStream;
import java.util.Random;

public class TestStringBuilder
{

public TestStringBuilder()
 {
 // 0 0:aload_0
 // 1 1:invokespecial #8 
 // 2 4:return
 }

 public static void main(String args[])
 {
 String s = "";
 // 0 0:ldc1 #16 
 // 1 2:astore_1
 Random rand = new Random();
 // 2 3:new #18 
 // 3 6:dup
 // 4 7:invokespecial #20 
 // 5 10:astore_2
 StringBuilder result = new StringBuilder();
 // 6 11:new #21 
 // 7 14:dup
 // 8 15:invokespecial #23 
 // 9 18:astore_3
 for(int i = 0; i < 10; i++)
 //* 10 19:iconst_0
 //* 11 20:istore 4
 //* 12 22:goto 47
 {
 result.append(rand.nextInt(1000));
 // 13 25:aload_3
// 14 26:aload_2
// 15 27:sipush 1000
// 16 30:invokevirtual #24 
// 17 33:invokevirtual #28 
// 18 36:pop
result.append(" ");
// 19 37:aload_3
// 20 38:ldc1 #32 
// 21 40:invokevirtual #34 
// 22 43:pop
}

// 23 44:iinc 4 1
// 24 47:iload 4
// 25 49:bipush 10
// 26 51:icmplt 25
System.out.println(result.toString());
// 27 54:getstatic #37 
// 28 57:aload_3
// 29 58:invokevirtual #43 
// 30 61:invokevirtual #47 
// 31 64:return
}
}

从上面的反编译结果可以看出,创建 StringBuilder 的代码被放在了 for 语句外。虽然这样处理在源程序中看起
来复杂,但却换来了更高的效率,同时消耗的资源也更少了。
在使用 StringBuilder 时要注意,尽量不要"+"和 StringBuilder 混着用,否则会创建更多的 StringBuilder 对
象,如下面代码所:

for (int i = 0; i < 10; i++)
{
result.append(rand.nextInt(1000));
result.append(" ");
}

改成如下形式:

for (int i = 0; i < 10; i++)
{
result.append(rand.nextInt(1000) + " ");
}

则反编译后的结果如下:

for(int i = 0; i < 10; i++)
//* 10 19:iconst_0
//* 11 20:istore 4
//* 12 22:goto 65
{
result.append((new StringBuilder(String.valueOf(rand.nextInt(1000)))).append(" ").toString());
// 13 25:aload_3
// 14 26:new #21 
// 15 29:dup

从上面的代码可以看出, Java 编译器将"+“编译成了 StringBuilder,这样 for 语句每循环一次,又创建了一个
StringBuilder 对象。
如果将上面的代码在 JDK1.4 下编译,必须将 StringBuilder 改为 StringBuffer,而 JDK1.4 将”+"转换为
StringBuffer(因为 JDK1.4 并没有提供 StringBuilder 类)。 StringBuffer 和 StringBuilder 的功能基本一样,只是
StringBuffer 是线程安全的,而 StringBuilder 不是线程安全的。因此, StringBuilder 的效率会更高。

你可能感兴趣的:(Java)