if快还是switch快?解密switch背后的秘密

本文经授权转载自 Java中文社群(ID:javacn666)

作者: 磊哥

如若转载请联系原公众号

条件判断语句是程序的重要组成部分,也是系统业务逻辑的控制手段。重要程度和使用频率更是首屈一指,那我们要如何选择 if 还是 switch 呢?他们的性能差别有多大?switch 性能背后的秘密是什么?接下来让我们一起来寻找这些问题的答案。

switch VS if

我在之前的文章《9个小技巧让你的 if else看起来更优雅》中有提过,要尽量使用 switch 因为他的性能比较高,但具体高多少?以及为什么高的原因将在本文为你揭晓。

我们依然借助 Oracle 官方提供的 JMH(Java Microbenchmark Harness,JAVA 微基准测试套件)框架来进行测试,首先引入 JMH 框架,在 pom.xml 文件中添加如下配置:

org.openjdk.jmhgroupId>

jmh-coreartifactId>

1.23version>

dependency>

然后编写测试代码,我们这里添加 5 个条件判断分支,具体实现代码如下:

importorg.openjdk.jmh.annotations.*;

importorg.openjdk.jmh.runner.Runner;

importorg.openjdk.jmh.runner.RunnerException;

importorg.openjdk.jmh.runner.options.Options;

importorg.openjdk.jmh.runner.options.OptionsBuilder;

importjava.util.concurrent.TimeUnit;

@BenchmarkMode(Mode.AverageTime)// 测试完成时间

@OutputTimeUnit(TimeUnit.NANOSECONDS)

@Warmup(iterations =2, time =1, timeUnit = TimeUnit.SECONDS)// 预热 2 轮,每次 1s

@Measurement(iterations =5, time =1, timeUnit = TimeUnit.SECONDS)// 测试 5 轮,每次 3s

@Fork(1)// fork 1 个线程

@State(Scope.Thread)// 每个测试线程一个实例

publicclassSwitchOptimizeTest{

staticInteger _NUM =9;

publicstaticvoidmain(String[] args)throwsRunnerException{

// 启动基准测试

Options opt =newOptionsBuilder()

.include(SwitchOptimizeTest.class.getSimpleName())// 要导入的测试类

.output("/Users/admin/Desktop/jmh-switch.log")// 输出测试结果的文件

.build();

newRunner(opt).run();// 执行测试

}

@Benchmark

publicvoidswitchTest(){

intnum1;

switch(_NUM) {

case1:

num1 =1;

break;

case3:

num1 =3;

break;

case5:

num1 =5;

break;

case7:

num1 =7;

break;

case9:

num1 =9;

break;

default:

num1 = -1;

break;

}

}

@Benchmark

publicvoidifTest(){

intnum1;

if(_NUM ==1) {

num1 =1;

}elseif(_NUM ==3) {

num1 =3;

}elseif(_NUM ==5) {

num1 =5;

}elseif(_NUM ==7) {

num1 =7;

}elseif(_NUM ==9) {

num1 =9;

}else{

num1 = -1;

}

}

}

以上代码的测试结果如下:

备注:本文的测试环境为:JDK 1.8 / Mac mini (2018) / Idea 2020.1

从以上结果可以看出(Score 列),switch 的平均执行完成时间比 if 的平均执行完成时间快了约 2.33 倍

性能分析

为什么 switch 的性能会比 if 的性能高这么多?

这需要从他们字节码说起,我们把他们的代码使用javac生成字节码如下所示:

publicclasscom.example.optimize.SwitchOptimize{

staticjava.lang.Integer _NUM;

publiccom.example.optimize.SwitchOptimize();

Code:

0: aload_0

1: invokespecial #1// Method java/lang/Object."":()V

4:return

publicstaticvoidmain(java.lang.String[]);

Code:

0: invokestatic  #7// Method switchTest:()V

3: invokestatic  #12// Method ifTest:()V

6:return

publicstaticvoidswitchTest();

Code:

0: getstatic     #15// Field _NUM:Ljava/lang/Integer;

3: invokevirtual #19// Method java/lang/Integer.intValue:()I

6: tableswitch   {// 1 to 9

1:56

2:83

3:61

4:83

5:66

6:83

7:71

8:83

9:77

default:83

}

56: iconst_1

57: istore_0

58: goto85

61: iconst_3

62: istore_0

63: goto85

66: iconst_5

67: istore_0

68: goto85

71: bipush7

73: istore_0

74: goto85

77: bipush9

79: istore_0

80: goto85

83: iconst_m1

84: istore_0

85:return

publicstaticvoidifTest();

Code:

0: getstatic     #15// Field _NUM:Ljava/lang/Integer;

3: invokevirtual #19// Method java/lang/Integer.intValue:()I

6: iconst_1

7: if_icmpne15

10: iconst_1

11: istore_0

12: goto81

15: getstatic     #15// Field _NUM:Ljava/lang/Integer;

18: invokevirtual #19// Method java/lang/Integer.intValue:()I

21: iconst_3

22: if_icmpne30

25: iconst_3

26: istore_0

27: goto81

30: getstatic     #15// Field _NUM:Ljava/lang/Integer;

33: invokevirtual #19// Method java/lang/Integer.intValue:()I

36: iconst_5

37: if_icmpne45

40: iconst_5

41: istore_0

42: goto81

45: getstatic     #15// Field _NUM:Ljava/lang/Integer;

48: invokevirtual #19// Method java/lang/Integer.intValue:()I

51: bipush7

53: if_icmpne62

56: bipush7

58: istore_0

59: goto81

62: getstatic     #15// Field _NUM:Ljava/lang/Integer;

65: invokevirtual #19// Method java/lang/Integer.intValue:()I

68: bipush9

70: if_icmpne79

73: bipush9

75: istore_0

76: goto81

79: iconst_m1

80: istore_0

81:return

static{};

Code:

0: iconst_1

1: invokestatic  #25// Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;

4: putstatic     #15// Field _NUM:Ljava/lang/Integer;

7:return

}

这些字节码中最重要的信息是“getstatic     #15”,这段代码表示取出“_NUM”变量和条件进行判断。

从上面的字节码可以看出,在 switch 中只取出了一次变量和条件进行比较,而 if 中每次都会取出变量和条件进行比较,因此 if 的效率就会比 switch 慢很多

提升测试量

前面的测试代码我们使用了 5 个分支条件来测试了 if 和 switch 的性能,那如果把分支的判断条件增加 3 倍(15 个)时,测试的结果又会怎么呢?

增加至 15 个分支判断的实现代码如下:

packagecom.example.optimize;

importorg.openjdk.jmh.annotations.*;

importorg.openjdk.jmh.runner.Runner;

importorg.openjdk.jmh.runner.RunnerException;

importorg.openjdk.jmh.runner.options.Options;

importorg.openjdk.jmh.runner.options.OptionsBuilder;

importjava.util.concurrent.TimeUnit;

@BenchmarkMode(Mode.AverageTime)// 测试完成时间

@OutputTimeUnit(TimeUnit.NANOSECONDS)

@Warmup(iterations =2, time =1, timeUnit = TimeUnit.SECONDS)// 预热 2 轮,每次 1s

@Measurement(iterations =5, time =1, timeUnit = TimeUnit.SECONDS)// 测试 5 轮,每次 3s

@Fork(1)// fork 1 个线程

@State(Scope.Thread)// 每个测试线程一个实例

publicclassSwitchOptimizeTest{

staticInteger _NUM =1;

publicstaticvoidmain(String[] args)throwsRunnerException{

// 启动基准测试

Options opt =newOptionsBuilder()

.include(SwitchOptimizeTest.class.getSimpleName())// 要导入的测试类

.output("/Users/admin/Desktop/jmh-switch.log")// 输出测试结果的文件

.build();

newRunner(opt).run();// 执行测试

}

@Benchmark

publicvoidswitchTest(){

intnum1;

switch(_NUM) {

case1:

num1 =1;

break;

case2:

num1 =2;

break;

case3:

num1 =3;

break;

case4:

num1 =4;

break;

case5:

num1 =5;

break;

case6:

num1 =6;

break;

case7:

num1 =7;

break;

case8:

num1 =8;

break;

case9:

num1 =9;

break;

case10:

num1 =10;

break;

case11:

num1 =11;

break;

case12:

num1 =12;

break;

case13:

num1 =13;

break;

case14:

num1 =14;

break;

case15:

num1 =15;

break;

default:

num1 = -1;

break;

}

}

@Benchmark

publicvoidifTest(){

intnum1;

if(_NUM ==1) {

num1 =1;

}elseif(_NUM ==2) {

num1 =2;

}elseif(_NUM ==3) {

num1 =3;

}elseif(_NUM ==4) {

num1 =4;

}elseif(_NUM ==5) {

num1 =5;

}elseif(_NUM ==6) {

num1 =6;

}elseif(_NUM ==7) {

num1 =7;

}elseif(_NUM ==8) {

num1 =8;

}elseif(_NUM ==9) {

num1 =9;

}elseif(_NUM ==10) {

num1 =10;

}elseif(_NUM ==11) {

num1 =11;

}elseif(_NUM ==12) {

num1 =12;

}elseif(_NUM ==13) {

num1 =13;

}elseif(_NUM ==14) {

num1 =14;

}elseif(_NUM ==15) {

num1 =15;

}else{

num1 = -1;

}

}

}

以上代码的测试结果如下:

从 Score 的值可以看出,当分支判断增加至 15 个,switch 的性能比 if 的性能高出了约 3.7 倍,而之前有 5 个分支判断时的测试结果为,switch 的性能比 if 的性能高出了约 2.3 倍,也就是说分支的判断条件越多,switch 性能高的特性体现的就越明显

switch 的秘密

对于 switch 来说,他最终生成的字节码有两种形态,一种是 tableswitch,另一种是 lookupswitch,决定最终生成的代码使用那种形态取决于 switch 的判断添加是否紧凑,例如到 case 是 1...2...3...4 这种依次递增的判断条件时,使用的是 tableswitch,而像 case 是 1...33...55...22 这种非紧凑型的判断条件时则会使用 lookupswitch,测试代码如下:

publicclassSwitchOptimize{

staticInteger _NUM =1;

publicstaticvoidmain(String[] args){

tableSwitchTest();

lookupSwitchTest();

}

publicstaticvoidtableSwitchTest(){

intnum1;

switch(_NUM) {

case1:

num1 =1;

break;

case2:

num1 =2;

break;

case3:

num1 =3;

break;

case4:

num1 =4;

break;

case5:

num1 =5;

break;

case6:

num1 =6;

break;

case7:

num1 =7;

break;

case8:

num1 =8;

break;

case9:

num1 =9;

break;

default:

num1 = -1;

break;

}

}

publicstaticvoidlookupSwitchTest(){

intnum1;

switch(_NUM) {

case1:

num1 =1;

break;

case11:

num1 =2;

break;

case3:

num1 =3;

break;

case4:

num1 =4;

break;

case19:

num1 =5;

break;

case6:

num1 =6;

break;

case33:

num1 =7;

break;

case8:

num1 =8;

break;

case999:

num1 =9;

break;

default:

num1 = -1;

break;

}

}

}

对应的字节码如下:

publicclasscom.example.optimize.SwitchOptimize{

staticjava.lang.Integer _NUM;

publiccom.example.optimize.SwitchOptimize();

Code:

0: aload_0

1: invokespecial #1// Method java/lang/Object."":()V

4:return

publicstaticvoidmain(java.lang.String[]);

Code:

0: invokestatic  #7// Method tableSwitchTest:()V

3: invokestatic  #12// Method lookupSwitchTest:()V

6:return

publicstaticvoidtableSwitchTest();

Code:

0: getstatic     #15// Field _NUM:Ljava/lang/Integer;

3: invokevirtual #19// Method java/lang/Integer.intValue:()I

6: tableswitch   {// 1 to 9

1:56

2:61

3:66

4:71

5:76

6:81

7:87

8:93

9:99

default:105

}

56: iconst_1

57: istore_0

58: goto107

61: iconst_2

62: istore_0

63: goto107

66: iconst_3

67: istore_0

68: goto107

71: iconst_4

72: istore_0

73: goto107

76: iconst_5

77: istore_0

78: goto107

81: bipush6

83: istore_0

84: goto107

87: bipush7

89: istore_0

90: goto107

93: bipush8

95: istore_0

96: goto107

99: bipush9

101: istore_0

102: goto107

105: iconst_m1

106: istore_0

107:return

publicstaticvoidlookupSwitchTest();

Code:

0: getstatic     #15// Field _NUM:Ljava/lang/Integer;

3: invokevirtual #19// Method java/lang/Integer.intValue:()I

6: lookupswitch  {// 9

1:88

3:98

4:103

6:113

8:125

11:93

19:108

33:119

999:131

default:137

}

88: iconst_1

89: istore_0

90: goto139

93: iconst_2

94: istore_0

95: goto139

98: iconst_3

99: istore_0

100: goto139

103: iconst_4

104: istore_0

105: goto139

108: iconst_5

109: istore_0

110: goto139

113: bipush6

115: istore_0

116: goto139

119: bipush7

121: istore_0

122: goto139

125: bipush8

127: istore_0

128: goto139

131: bipush9

133: istore_0

134: goto139

137: iconst_m1

138: istore_0

139:return

static{};

Code:

0: iconst_1

1: invokestatic  #25// Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;

4: putstatic     #15// Field _NUM:Ljava/lang/Integer;

7:return

}

从上面字节码可以看出 tableSwitchTest 使用的 tableswitch,而 lookupSwitchTest 则是使用的 lookupswitch。

tableswitch VS lookupSwitchTest

当执行一次 tableswitch 时,堆栈顶部的 int 值直接用作表中的索引,以便抓取跳转目标并立即执行跳转。也就是说 tableswitch 的存储结构类似于数组,是直接用索引获取元素的,所以整个查询的时间复杂度是 O(1),这也意味着它的搜索速度非常快。

而执行 lookupswitch 时,会逐个进行分支比较或者使用二分法进行查询,因此查询时间复杂度是 O(log n),所以使用 lookupswitch 会比 tableswitch 慢

接下来我们使用实际的代码测试一下,他们两个之间的性能,测试代码如下:

packagecom.example.optimize;

importorg.openjdk.jmh.annotations.*;

importorg.openjdk.jmh.runner.Runner;

importorg.openjdk.jmh.runner.RunnerException;

importorg.openjdk.jmh.runner.options.Options;

importorg.openjdk.jmh.runner.options.OptionsBuilder;

importjava.util.concurrent.TimeUnit;

@BenchmarkMode(Mode.AverageTime)// 测试完成时间

@OutputTimeUnit(TimeUnit.NANOSECONDS)

@Warmup(iterations =2, time =1, timeUnit = TimeUnit.SECONDS)// 预热 2 轮,每次 1s

@Measurement(iterations =5, time =1, timeUnit = TimeUnit.SECONDS)// 测试 5 轮,每次 3s

@Fork(1)// fork 1 个线程

@State(Scope.Thread)// 每个测试线程一个实例

publicclassSwitchOptimizeTest{

staticInteger _NUM = -1;

publicstaticvoidmain(String[] args)throwsRunnerException{

// 启动基准测试

Options opt =newOptionsBuilder()

.include(SwitchOptimizeTest.class.getSimpleName())// 要导入的测试类

.build();

newRunner(opt).run();// 执行测试

}

@Benchmark

publicvoidtableSwitchTest(){

intnum1;

switch(_NUM) {

case1:

num1 =1;

break;

case2:

num1 =2;

break;

case3:

num1 =3;

break;

case4:

num1 =4;

break;

case5:

num1 =5;

break;

case6:

num1 =6;

break;

case7:

num1 =7;

break;

case8:

num1 =8;

break;

case9:

num1 =9;

break;

default:

num1 = -1;

break;

}

}

@Benchmark

publicvoidlookupSwitchTest(){

intnum1;

switch(_NUM) {

case1:

num1 =1;

break;

case11:

num1 =2;

break;

case3:

num1 =3;

break;

case4:

num1 =4;

break;

case19:

num1 =5;

break;

case6:

num1 =6;

break;

case33:

num1 =7;

break;

case8:

num1 =8;

break;

case999:

num1 =9;

break;

default:

num1 = -1;

break;

}

}

}

以上代码的测试结果如下:

可以看出在分支判断为 9 个时,tableswitch 的性能比 lookupwitch 的性能快了约 1.3 倍。但即使这样 lookupwitch 依然比 if 查询性能要高很多

总结

switch 的判断条件是 5 个时,性能比 if 高出了约 2.3 倍,而当判断条件的数量越多时,他们的性能相差就越大。而 switch 在编译为字节码时,会根据 switch 的判断条件是否紧凑生成两种代码:tableswitch(紧凑时生成)和 lookupswitch(非紧凑时生成),其中 tableswitch 是采用类似于数组的存储结构,直接根据索引查询元素;而 lookupswitch 则需要逐个查询或者使用二分法查询,因此 tableswitch 的性能会比 lookupswitch 的性能高,但无论如何 switch 的性能都比 if 的性能要高

参考 & 鸣谢

https://www.javaguides.net/2020/03/5-best-ways-to-iterate-over-hashmap-in-java.html

你可能感兴趣的:(if快还是switch快?解密switch背后的秘密)