虽然JAVA的垃圾回收和当前高配置的服务器可以让程序员大部分时间忘掉OutOfMemoryError的存在,但是访问量增大后频繁的GC会额外消耗CPU (使用top查看结果为us值高),系统响应速度下降,积压的请求又会占用更多内存从而恶性循环,严重时可能导致系统不断Full GC造成应用停顿。
优化内存的使用可从以下几方面着手:
单例模式是开发者最早接触并使用的设计模式之一,尽管写代码的时候可能还不知道用了设计模式。简单来说就是构造函数private化,通过静态方法获得唯一实例。因为其特性,对于某些场景例如每次请求都要使用无状态工具类的检验方法,使用单例模式可以大量节省创建新对象的开销。
public class Singleton { private Singleton() {} private static Singleton instance = new Singleton(); public static Singleton getInstance() { return instance; } public void doSomething() { } }
简单来说就是按一定特征创建"对象缓存池",使用集合类保存已创建的对象,当有相同特征的对象申请时,使用缓存池中现有的对象代替通过 new关键字重新创建。
public class BigObjectPoolTest { public static void main(String[] args) { long start = System.nanoTime(); for(int i = 0; i < 10000; i++) { BigObjectPool.getBigObject("xxx", true); } System.out.println("使用缓存池耗时" + TimeUnit.MILLISECONDS.convert(System.nanoTime() - start, TimeUnit.NANOSECONDS) + "毫秒"); start = System.nanoTime(); for(int i = 0; i < 10000; i++) { BigObjectPool.getBigObject("xxx", false); } System.out.println("不使用缓存池耗时" + TimeUnit.MILLISECONDS.convert(System.nanoTime() - start, TimeUnit.NANOSECONDS) + "毫秒"); } } class BigObjectPool { private static Map<String, BigObject> map = new HashMap<String, BigObject>(); static { map.put("xxx", new BigObject("xxx")); map.put("yyy", new BigObject("yyy")); } public static BigObject getBigObject(String key, boolean usePool) { if(usePool) { BigObject bo = map.get(key); if(bo == null) { bo = new BigObject(key); } return bo; } else { return new BigObject(key); } } } class BigObject{ private String name; private byte[] data = new byte[1024 * 1024]; public BigObject(String name) { this.name = name; } }
以-Xms32m -Xmx32m -Xloggc:d:/gc.log 参数运行
使用缓存池耗时3毫秒 不使用缓存池耗时998毫秒(查看gc.log,可以观察到不使用缓存池触发Minor GC 1000次以上)
实际业务中通常使用EhCache等框架代替自己实现缓存池。
与这种实现原理相似的也有一个设计模式:享元模式,区别是享元模式更关注类设计结构上的优化,对上下文环境的设计也做了明确定义。
如果业务模型中要求的类的属性和方法都非常多,可以尝试将其拆分成多个小类,再通过合成/聚合模式组装成一个大类,这也符合设计模式的优化思想。甚至可以结合上面的对象缓存池的方式将其中一部分内容缓存化。
class Composition { private BigObject bigObject = null; private int id; public void setBigObject(BigObject bigObject) { this.bigObject = bigObject; } public Composition(int id) { this.id = id; } }
Composition c = new Composition(1); c.setBigObject(BigObjectPool.getBigObject("xxx", true));
使用StringBuilder代替用+号连接字符串
尽量使用int, long等基本类型代替Integer, Long包装对象
合理利用SoftReference和WeakReference
一般设置 java -server -Xms2048m -Xmx2048m -XX:PermSize=256m -XX:MaxPermSize=256m
-Xms和-Xmx决定java堆区可使用的内存最小值和最大值,通常设为相同的值,避免运行期间反复的重新申请内存。如果出现OutOfMemoryError: Java heap space,则在硬件允许的情况下临时调大-Xmx,为排查问题和优化代码争取时间。
-XX:PermSize和-XX:MaxPermSize决定永久代可用空间大小,存放class和meta信息,通常设置为相同的值。如果出现OutOfMemoryError: PermGen space,说明加载的类和jar文件过多,可以调大这两个参数值。
如果web容器下有多个应用引用了相同的第三方jar文件,可以转移到容器的共享目录。
另一个重要参数是-Xmn,决定堆区新生代的大小,通常占-Xmx的比值设置为1/4到1/3。如果业务中有大量体积大且生命周期很短的对象创建需求,可适当调大新生代空间以利于失效对象在新生代中被回收。
此外,可通过参数设置回收算法:
–XX:+UseSerialGC
–XX:+UseParallelGC
–XX:+UseParallelOldGC
–XX:+UseConcMarkSweepGC
回收算法的选择和对比需要较大的篇幅介绍,这里不做详细的解释。通常来说,对于响应时间优先的web应用,ConcMarkSweepGC(CMS)是个不错的选择。
需要注意的是,经过几代发展后,JVM对内存管理已经做的非常好。如果不是有明确的证据证明JVM的默认选择不合理,就没必要做过多细节的调整设置。调整后,可通过-XX:+PrintGCDetails -XX:+PrintGCTimeStamps等参数输出GC信息进行比对,优化的首要目标是减少Full GC次数和时间。
参考资料: 分布式java应用基础与实践