字符串是 Java 程序中最常用的数据结构之一。在 Java 中 String 类已经重载了"+"。也就是说,字符串可以直接
使用"+"进行连接,如下面代码所示:
1.String s = "abc" + "ddd"; 但这样做真的好吗?当然,这个问题不能简单地回答 yes or no。要根据具体情况来定。在 Java 中提供了一个
StringBuilder 类(这个类只在 J2SE5 及以上版本提供,以前的版本使用 StringBuffer 类),这个类也可以起到"+"的
作用。那么我们应该用哪个呢?
下面让我们先看看如下的代码:
1.package string; 2. 3. 4. 5. 6. 7. 8. 9. public class TestSimplePlus { public static void main(String[] args) { String s = "abc"; String ss = "ok" + s + "xyz" + 5; System.out.println(ss);
40
10. } 11. } 上面的代码将会输出正确的结果。从表面上看,对字符串和整型使用"+"号并没有什么区别,但事实真的如此吗?
下面让我们来看看这段代码的本质。
我们首先使用反编译工具(如 jdk 带的 javap、或 jad)将 TestSimplePlus 反编译成 Java Byte Code,其中的奥
秘就一目了然了。在本文将使用 jad 来反编译,命令如下:
jad -o -a -s d.java TestSimplePlus.class
反编译后的代码如下:
1.package string; 2. 3.import java.io.PrintStream; 4. 5.public class TestSimplePlus 6.{ 7. public TestSimplePlus() {8. 9. // 0 0:aload_0 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. // 1 2 1:invokespecial 4:return
#8
// }
public static void main(String args[]) { String s = "abc"; // // 0 1 0:ldc1 #16
30. 31. 32. 33. 34. 35. 36. 37. 38.}
// //
12 25:invokevirtual #34
#38
13 28:astore_2 System.out.println(ss); // 14 29:getstatic
读者可能看到上面的 Java 字节码感到迷糊,不过大家不必担心。本文的目的并不是讲解 Java Byte Code,因此,
并不用了解具体的字节码的含义。
使用 jad 反编译的好处之一就是可以同时生成字节码和源代码。这样可以进行对照研究。从上面的代码很容易看
出,虽然在源程序中使用了"+",但在编译时仍然将"+"转换成 StringBuilder。因此,我们可以得出结论,在 Java中 无论使用何种方式进行字符串连接,实际上都使用的是 StringBuilder。 那么是不是可以根据这个结论推出使用"+"和 StringBuilder 的效果是一样的呢?这个要从两个方面的解释。如果
从运行结果来解释,那么"+"和 StringBuilder 是完全等效的。但如果从运行效率和资源消耗方面看,那它们将存在很
大的区别。
当然,如果连接字符串行表达式很简单(如上面的顺序结构),那么"+"和 StringBuilder 基本是一样的,但如果
结构比较复杂,如使用循环来连接字符串,那么产生的 Java Byte Code 就会有很大的区别。先让我们看看如下的代
码:
1.package string; 2. 3. import java.util.*; 4. 5. public class TestComplexPlus 6. { 7. public static void main(String[] args) 8. { 9. String s = ""; 10. 11. 12. 13. Random rand = new Random(); for (int i = 0; i < 10; i++) { s = s + rand.nextInt(1000) + " "; 42
14. } 15. System.out.println(s); 16. } 17. }
上面的代码返编译后的 Java Byte Code如下:
1.package string; 2. 3.import java.io.PrintStream; 4.import java.util.Random; 5. 6.public class TestComplexPlus 7.{ 8. 9. 10. public TestComplexPlus() { 11. // // // } 0 1 2 0:aload_0 12. 1:invokespecial #8
36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55.}
// 14 27:aload_2 // 15 28:sipush 1000 // 16 31:invokevirtual #32
// //
22 46:iinc 3 1 23 49:iload_3 50:bipush// 24 10 16// 25 52:icmplt System.out.println(s); // 26 55:getstatic // 27 58:aload_1 #49
大家可以看到,虽然编译器将"+"转换成了 StringBuilder,但创建 StringBuilder 对象的位置却在 for 语句内
部。这就意味着每执行一次循环,就会创建一个 StringBuilder 对象(对于本例来说,是创建了 10 个 StringBuilder
对象),虽然 Java 有垃圾回收器,但这个回收器的工作时间是不定的。如果不断产生这样的垃圾,那么仍然会占用
大量的资源。解决这个问题的方法就是在程序中直接使用 StringBuilder 来连接字符串,代码如下:
1.package string; 2. 3.import java.util.*; 4. 5.public class TestStringBuilder 6.{ 7. public static void main(String[] args) 8. { 9. String s = ""; 10. 11. 12. 13. 14. Random rand = new Random(); StringBuilder result = new StringBuilder(); for (int i = 0; i < 10; i++) { result.append(rand.nextInt(1000)); 44
15. 16. 17. 18. 19.}
result.append(" ");
} System.out.println(result.toString());
}
上面代码反编译后的结果如下:
1.20.package string; 2. 3.import java.io.PrintStream; 4.import java.util.Random; 5. 6.public class TestStringBuilder 7.{ 8. 9. public TestStringBuilder() {10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. // // // } 0 1 2 0:aload_0 1:invokespecial #8
37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61.}
// 13 // 14
25:aload_3 26:aload_2 27:sipush// 15 1000 #24// 16 30:invokevirtual
// // // //
23 24 25 26
44:iinc 4 1 47:iload 49:bipush 51:icmplt 4 10 25 System.out.println(result.toString());
// // // // // }
27 28 29 30 31
54:getstatic 57:aload_3
#37
58:invokevirtual 61:invokevirtual 64:return
#43 #47
从上面的反编译结果可以看出,创建 StringBuilder 的代码被放在了 for 语句外。虽然这样处理在源程序中看起
来复杂,但却换来了更高的效率,同时消耗的资源也更少了。
在使用 StringBuilder 时要注意,尽量不要"+"和 StringBuilder 混着用,否则会创建更多的 StringBuilder 对
象,如下面代码所:
for (int i = 0; i < 10; i++) { result.append(rand.nextInt(1000)); result.append(" "); }
改成如下形式:
for (int i = 0; i < 10; i++)
46
{
result.append(rand.nextInt(1000) + " ");
}
则反编译后的结果如下:
for(int i = 0; i < 10; i++) //* 10 19:iconst_0 //* 11 20:istore //* 12 22:goto {
4 65
result.append((new StringBuilder(String.valueOf(rand.nextInt(1000)))).append(" ").toString()); // 13 25:aload_3 // 14 26:new #21
StringBuilder 对象。
如果将上面的代码在 JDK1.4 下编译,必须将 StringBuilder 改为 StringBuffer,而 JDK1.4 将"+"转换为
StringBuffer(因为 JDK1.4 并没有提供 StringBuilder 类)。StringBuffer 和 StringBuilder 的功能基本一样,只是
StringBuffer 是线程安全的,而 StringBuilder 不是线程安全的。因此,StringBuilder 的效率会更高