代码优化最重要的作用应该是避免未知的错误,因此在写代码的时候,从源头开始注意各种细节,权衡并使用最优的选择,将会很大程度上避免出现未知的错误,从长远看也极大的降低了工作量。所以说代码优化的目标是减小代码体积、提高代码运行效率。优化是无止境的,本文也只给出整理的一些常见优化建议。
1. 尽量指定类、方法的 final 修饰符。
带有 final 修饰符的类是不可派生的。在 Java 核心 API 中,有许多应用 final 的例子,例如 java.lang.String
,整个类都是 final 的。为类指定 final 修饰符可以让类不可以被继承,为方法指定 final 修饰符可以让方法不可以被重写。如果指定了一个类为 final,则该类所有的方法都是 final 的。Java 编译器会寻找机会内联所有的 final 方法,内联对于提升 Java 运行效率作用重大,具体可以查阅 Java 运行期优化相关资料,此举能够使性能平均提高 50%。
2. 尽量重用对象。
特别是 String 对象的使用,出现字符串连接时应该使用 StringBuilder 或 StringBuffer 代替。由于 Java 虚拟机不仅要花时间生成对象,以后可能还需要花时间对这些对象进行垃圾回收和处理,因此生成过多的对象将会给程序的性能带来很大的影响。
3. 尽可能使用局部变量。
调用方法时传递的参数以及在调用中创建的临时变量都保存在栈中,速度较快,其他变量,如静态变量、实例变量等,都在堆中创建,速度较慢。另外,栈中创建的变量,随着方法的运行结束,这些内容就没了,不需要额外的垃圾回收。
4. 及时关闭流。
Java 编程过程中,进行数据库连接、I/O 流操作时务必小心,在使用完毕后,及时关闭以释放资源。因为对这些大对象的操作会造成系统大的开销,稍有不慎,将会导致严重的后果。
//性能不好,list.size() 会重复调用
for (int i = 0; i < list.size(); i++) {
...
}
//建议替换为如下
for (int i = 0, length = list.size(); i < length; i++) {
...
}
//如上写法在 list.size() 很大的时候,就减少了很多的消耗。
5. 尽量采用懒加载的策略,即在需要的时候才创建。
这个原则其实就是节约,具体样例如下。
//不好的示范
String str = "aaa";
if (i == 1) {
list.add(str);
}
//建议替换为如下
if (i == 1) {
String str = "aaa";
list.add(str);
}
6. 慎用异常。
异常对性能不利,抛出异常首先要创建一个新的对象,Throwable 接口的构造函数调用名为 fillInStackTrace()
的本地同步方法,fillInStackTrace()
方法检查堆栈,收集调用跟踪信息。只要有异常被抛出,Java 虚拟机就必须调整调用堆栈,因为在处理过程中创建了一个新的对象。异常只能用于错误处理,不应该用来控制程序流程。
7. 不要在循环中使用 try - catch,应该把其放在最外层。
根据网友们提出的意见,这一点我认为值得商榷,其实分业务场景吧,有些场景需要循环终止,有些只是为了忽略当此循环处理。
8. 如果能估计到待添加的内容长度,为底层以数组方式实现的集合、工具类指定初始长度。
比如 ArrayList、LinkedLlist、StringBuilder、StringBuffer、HashMap、HashSet 等,以 StringBuilder 为例,StringBuilder()
构造方法默认分配 16 个字符的空间,StringBuilder(int size)
构造方法默认分配 size 个字符的空间,StringBuilder(String str)
构造方法默认分配 16 个字符加 str.length()
个字符空间,所以可以通过类的构造方法来设定它的初始化容量,这样可以明显地提升性能。
9. 当复制大量数据时,使用 System.arraycopy() 命令。
这个肯定大家都没有疑问的,性能优化的实现而已。System.arraycopy()
实现的是浅复制,即复制引用。
10. 乘法和除法使用移位操作。
用移位操作可以极大地提高性能,因为在计算机底层,对位的操作是最方便、最快的,但是移位操作虽然快,可能会使代码不太好理解,因此最好加上相应的注释。
//不好的示范
for (val = 0; val < 100000; val += 5) {
a = val * 8;
b = val / 2;
}
//建议修改实现
for (val = 0; val < 100000; val += 5) {
a = val << 3;
b = val >> 1;
}
11. 循环内不要不断创建对象引用。
见如下案例解释分析原因。
//不好的示范
for (int i = 1; i <= count; i++) {
Object obj = new Object();
}
//上面这种做法会导致内存中有 count 份 Object 对象引用存在,
//count 很大的话,就耗费内存了,建议为如下实现。
Object obj = null;
for (int i = 0; i <= count; i++) {
obj = new Object();
}
//如上实现内存中只有一份 Object 对象引用,
//每次 new Object() 的时候,Object 对象引用指向不同的 Object 罢了,
//但是内存中只有一份,这样就大大节省了内存空间了。
12. 基于效率和类型检查的考虑,应该尽可能使用 array,无法确定数组大小时才使用 ArrayList。
13. 尽量使用 HashMap、ArrayList、StringBuilder,除非线程安全需要,否则不推荐使用 Hashtable、Vector、StringBuffer,后三者由于使用同步机制而导致了性能开销。
14. 不要将数组声明为 public static final。
因为这毫无意义,这样只是定义了引用为 static final,数组的内容还是可以随意改变的,将数组声明为 public 更是一个安全漏洞,这意味着这个数组可以被外部类所改变。
15. 尽量在合适的场合使用单例。
使用单例可以减轻加载的负担、缩短加载的时间、提高加载的效率,但并不是所有地方都适用于单例,简单来说,单例主要适用于以下三个方面:
控制资源的使用,通过线程同步来控制资源的并发访问;
控制实例的产生,以达到节约资源的目的;
控制数据的共享,在不建立直接关联的条件下,让多个不相关的进程或线程之间实现通信;
16. 尽量避免随意使用静态变量。
因为当某个对象被定义为 static 的变量所引用,那么 gc 通常是不会回收这个对象所占有的堆内存的。
public class A {
private static B b = new B();
}
//此时静态变量 b 的生命周期与 A 类相同,
//如果 A 类不被卸载,那么引用 B 指向的 B 对象会常驻内存,直到程序终止。
17. 及时清除不再需要的会话。
为了清除不再活动的会话,许多应用服务器都有默认的会话超时时间,一般为 30 分钟。当应用服务器需要保存更多的会话时,如果内存不足,那么操作系统会把部分数据转移到磁盘,应用服务器也可能根据 MRU(最近最频繁使用)算法把部分不活跃的会话转储到磁盘,甚至可能抛出内存不足的异常。如果会话要被转储到磁盘,那么必须要先被序列化,在大规模集群中,对对象进行序列化的代价是很昂贵的。因此,当会话不再需要时,应当及时调用 HttpSession 的 invalidate()
方法清除会话。
18. 实现 RandomAccess 接口的集合(比如 ArrayList)应当使用最普通的 for 循环而不是 foreach 循环来遍历。
这是 JDK 推荐给用户的,JDK API 对于 RandomAccess 接口的解释是:实现 RandomAccess 接口用来表明其支持快速随机访问,此接口的主要目的是允许一般的算法更改其行为,从而将其应用到随机或连续访问列表时能提供良好的性能。实际经验表明,实现 RandomAccess 接口的类实例,假如是随机访问的,使用普通 for 循环效率将高于使用 foreach 循环,反过来,如果是顺序访问的,则使用 Iterator 会效率更高。
//样板代码:可以使用类似如下的代码作判断。
if (list instanceof RandomAccess) {
for (int i = 0; i < list.size(); i++) {
}
} else {
Iterator> iterator = list.iterable();
while (iterator.hasNext()) {
iterator.next()
}
}
19. 使用同步代码块替代同步方法。
尽量使用同步代码块,避免对那些不需要进行同步的代码也进行了同步,影响了代码执行效率。
20. 将常量声明为 static final,并以大写命名。
这样在编译期间就可以把这些内容放入常量池中,避免运行期间计算生成常量的值。另外,将常量的名字以大写命名也可以方便区分出常量与变量。
21. 不要创建一些不使用的对象,不要导入一些不使用的类。
这毫无意义,如果代码中出现 "The value of the local variable i is not used"
、"The import java.util is never used"
,那么请删除这些无用的内容,虽说没啥影响,但是有些时候编译期会报错,譬如没 import 用到的类被删掉了。
22. 程序运行过程中避免使用反射。
不建议在程序运行过程中使用,除非万不得已,尤其是频繁使用反射机制,特别是 Method
的 invoke
方法,如果确实有必要,一种建议性的做法是将那些需要通过反射加载的类在项目启动的时候通过反射实例化出一个对象并放入内存,用户只关心和对端交互的时候获取最快的响应速度,并不关心对端的项目启动花多久时间。
23. 使用数据库连接池和线程池。
这两个池都是用于重用对象的,前者可以避免频繁地打开和关闭连接,后者可以避免频繁地创建和销毁线程。
24. 使用带缓冲的输入输出流进行 IO 操作。
带缓冲的输入输出流,即 BufferedReader、BufferedWriter、BufferedInputStream、BufferedOutputStream,这可以极大地提升 IO 效率。
25. 顺序插入和随机访问比较多的场景使用 ArrayList,元素删除和中间插入比较多的场景使用 LinkedList。
26. 不要让 public 方法中有太多的形参。
public 方法即对外提供的方法,如果给这些方法太多形参的话主要坏处是违反了面向对象的编程思想,Java 讲求一切都是对象,太多的形参和面向对象的编程思想并不契合,参数太多势必导致方法调用的出错概率增加。
27. 字符串变量和字符串常量 equals 的时候将字符串常量写在前面,这样可以避免空指针。
28. 建议使用 if (i == 1) 而不是 if (1 == i) 的方式。
因为有可能 == 会误写成 =,而在 C/C++ 中 if (i = 1) 是会出问题的,而 Java 会在编译时报错 "Type mismatch: cannot convert from int to boolean"
,但是,尽管 Java 的 if (i == 1) 和 if (1 == i) 在语义上没有任何区别,从阅读习惯上讲,建议使用前者会更好些。
29. 不要对数组使用 toString() 方法。
本意是想打印出数组内容,却打出来的是对象信息,甚至有可能因为数组引用为空而导致空指针异常。对于集合 toString()
是可以打印出集合里面的内容的,因为集合的父类 AbstractCollections
重写了 Object 的 toString()
方法。
30. 不要对超出范围的基本数据类型做向下强制转型。
这很明确,譬如 long 转 int 是会存在潜在风险的。
31. 公用的集合类中不使用的数据一定要及时 remove 掉。
如果一个集合类是公用的(也就是说不是方法里面的属性),那么这个集合里面的元素是不会自动释放的,因为始终有引用指向它们。所以,如果公用集合里面的某些数据不使用而不去 remove 掉它们,那么将会造成这个公用集合不断增大,使得系统有内存泄露的隐患。
32. 把一个基本数据类型转为字符串,基本数据类型.toString() 是最快的方式、String.valueOf(数据) 次之、数据 + "" 最慢。
因为 String.valueOf()
方法底层调用了 Integer.toString()
方法,但是会在调用前做空判断;Integer.toString() 是直接调用;i + "" 底层使用了 StringBuilder 实现,先用 append 方法拼接,再用 toString() 方法获取字符串。
33. 使用最有效率的方式去遍历 Map。
遍历 Map 的方式有很多,通常场景下我们需要的是遍历 Map 中的 Key 和 Value,那么推荐使用的、效率最高的方式是 entrySet()
,如果只是想遍历一下这个 Map 的 key 值则 keySet()
会比较合适一些。
34. 对资源的 close() 建议分开操作。
虽然有些麻烦,却能避免资源泄露,这其实和 try - catch 机制相关,各自分开 close 各自的 try-catch 就会互不影响,防止写在一个 try - catch 中因为一个异常了后面的释放不了。
35. 对于 ThreadLocal 在线程池场景使用前或者使用后一定要先 remove。
因为线程池技术做的是一个线程重用,这意味着代码运行过程中一条线程使用完毕并不会被销毁而是等待下一次的使用,而 Thread 类中持有 ThreadLocal.ThreadLocalMap
的引用,线程不销毁意味着上条线程 set 的 ThreadLocal.ThreadLocalMap
中的数据依然存在,那么在下一条线程重用这个 Thread 的时候很可能 get 到的是上条线程 set 的数据而不是自己想要的内容。这个问题非常隐晦,一旦出现这个原因导致的错误,没有相关经验或者没有扎实的基础非常难发现这个问题,因此在写代码的时候就要注意这一点,这将给你后续减少很多的工作量。
36. 切记以常量定义的方式替代魔鬼数字(一连串的数字),魔鬼数字的存在将极大地降低代码可读性,字符串常量是否使用常量定义可以视情况而定。
37. long 或者 Long 初始赋值时使用大写的 L 而不是小写的 l,因为字母 l 极易与数字 1 混淆,这个点非常细节,值得注意。
38. 所有重写的方法必须保留 @Override 注解。
这么做可以清楚地知道这个方法由父类继承而来,同时可以保证重写成功,此外在抽象类中对方法签名进行修改,实现类会马上报出编译错误。
39. 推荐使用 JDK7 中新引入的 Objects 工具类来进行对象的 equals 比较,直接 a.equals(b) 有空指针异常的风险。
40. 循环体内不要使用 "+" 进行字符串拼接,而直接使用 StringBuilder 不断 append。
因为每次虚拟机碰到 "+" 这个操作符对字符串进行拼接的时候会 new 出一个 StringBuilder,然后调用 append 方法,最后调用 toString()
方法转换字符串赋值给对象,所以循环多少次,就会 new 出多少个 StringBuilder()
来,这对于内存是一种浪费。
41. 不捕获 Java 类库中定义的继承自 RuntimeException 的运行时异常类。
异常处理效率低,RuntimeException 的运行时异常中绝大多数完全可以由程序员来规避,比如 ArithmeticException
可以通过判断除数是否为空来规避,NullPointerException
可以通过判断对象是否为空来规避,IndexOutOfBoundsException
可以通过判断数组/字符串长度来规避,ClassCastException
可以通过 instanceof 关键字来规避,ConcurrentModificationException
可以使用迭代器来规避。
42. 静态类、单例类、工厂类将它们的构造函数置为 private。
这是因为静态类、单例类、工厂类这种类本来我们就不需要外部将它们 new 出来,将构造函数置为 private 之后,保证了这些类不会产生实例对象。
本文原作者:五月的仓颉
本文来自 推荐四十多条纯干货 Java 代码优化建议