Java内存泄漏

Java中的内存管理

要了解Java中的内存泄漏,首先就得知道Java中的内存是如何管理的。

在Java程序中,我们通常使用 new 为对象分配内存,而这些内存空间都在堆上。

Java判断对象是否可以回收使用的而是可达性分析算法。

这个算法的基本思路就是通过一系列名为 "GC Roots" 的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到 GC Roots 没有任何引用链相连时,则证明此对象是不可用的,下图对象 object5, object6, object7 虽然有互相判断,但它们到 GC Roots 是不可达的,所以它们将会判定为是可回收对象。

在 Java 语言中,可作为 GC Roots 对象的包括如下几种:

虚拟机栈(栈帧中的本地变量表)中引用的对象

本地方法栈(Native方法)中引用的对象

方法区中类静态属性引用的对象

方法区中常量引用的对象

什么是Java中的内存泄漏

Java 中的内存泄漏,广义并通俗的说,就是:不再会被使用的对象的内存不能被回收,就是内存泄漏。

Java 中的内存泄漏与 C++ 中的表现有所不同。

在 C++ 中,所有被分配了内存的对象,不再使用之后,都必须程序员手动的去释放他们。但是在 Java 中,我们不用自己释放内存,无用的内存由 GC 自动清理,这也极大的简化了我们的编程工作。但实际有时候一些不再会被使用的对象在 GC 看来不能被释放就会造成内存泄漏。

对象都是有生命周期的,有的长,有的短。如果长生命周期的对象持有短生命周期的引用,就很可能会出现内存泄漏。例如:



这里的 object 实例,其实我们期望它只作用于 method() 方法中,且其他地方也不会再用到它,但是当 method() 方法执行完之后,object对象所分配的内存不会马上被认为是可以被释放的对象。只有在 Test 类创建的对象被释放后才会被释放。严格地说,这就是一种内存泄漏。解决办法就是将 object 作为 method() 方法中的局部变量。当然也可以在使用完 object 之后 将其置为 null。


这样,之前 new Object() 分配的内存就可以被 GC 回收。

Java中内存泄漏的例子

静态集合类

如HashMap、LinkedList等等。如果这些容器为静态的,那么它们的生命周期与程序一致,则容器中的对象在程序结束之前将不能被释放,从而造成内存泄漏。简单而言,长生命周期的对象持有短生命周期对象的引用,尽管短生命周期的对象不再使用,但是因为长生命周期对象持有它的引用而导致不能被回收。


在这个例子中,代码栈中存在 Vector 对象的引用 v 和 Object 对象的引用 o 。在 For 循环,我们不断的生成新的对象,然后将其添加到 Vector 对象中,之后将 o 引用置空。问题是当 o 引用被置空后,如果发生 GC,我们创建的 Object 对象是否能够被 GC 回收呢?答案是否定的。因为, GC 在跟踪代码栈中的引用时,会发现 v 引用,而继续往下跟踪,就会发现 v 引用指向的内存空间中又存在指向 Object 对象的引用。也就是说尽管o 引用已经被置空,但是 Object 对象仍然存在其他的引用,是可以被访问到的,所以 GC 无法将其释放掉。如果在此循环之后, Object 对象对程序已经没有任何作用,那么我们就认为此 Java 程序发生了内存泄漏。

各种连接,如数据库连接、网络连接和IO连接等

在对数据库进行操作的过程中,首先需要建立与数据库的连接,当不再使用时,需要调用close方法来释放与数据库的连接。只有连接被关闭后,垃圾回收器才会回收对应的对象。否则,如果在访问数据库的过程中,对Connection、Statement或ResultSet不显性地关闭,将会造成大量的对象无法被回收,从而引起内存泄漏。

变量不合理的作用域

一般而言,一个变量的定义的作用范围大于其使用范围,很有可能会造成内存泄漏。另一方面,如果没有及时地把对象设置为null,很有可能导致内存泄漏的发生。


如上面这个伪代码,通过 readFromNet() 方法把接受的消息保存在变量 msg 中,然后调用 saveDB() 方法把 msg 的内容保存到数据库中,此时 msg 已经就没用了,由于 msg 的生命周期与对象的生命周期相同,此时 msg 还不能回收,因此造成了内存泄漏。

实际上这个 msg 变量可以放在 receiveMsg() 方法内部,当方法使用完,那么 msg 的生命周期也就结束,此时就可以回收了。还有一种方法,在使用完 msg 后,把 msg 设置为 null,这样垃圾回收器也会回收 msg 的内存空间。

内部类持有外部类

如果一个外部类的实例对象的方法返回了一个内部类的实例对象,这个内部类对象被长期引用了,即使那个外部类实例对象不再被使用,但由于内部类持有外部类的实例对象,这个外部类对象将不会被垃圾回收,这也会造成内存泄露。

改变哈希值

当一个对象被存储进 HashSet 集合中以后,就不能修改这个对象中的那些参与计算哈希值的字段了,否则,对象修改后的哈希值与最初存储进 HashSet 集合中时的哈希值就不同了,在这种情况下,即使在 contains 方法使用该对象的当前引用作为的参数去 HashSet 集合中检索对象,也将返回找不到对象的结果,这也会导致无法从 HashSet 集合中单独删除当前对象,造成内存泄露。



单例对象在被初始化后将在JVM的整个生命周期中存在(以静态变量的方式),如果单例对象持有外部对象的引用,那么这个外部对象将不能被jvm正常回收,导致内存泄露

缓存泄漏

内存泄漏的另一个常见来源是缓存,一旦你把对象引用放入到缓存中,他就很容易遗忘,对于这个问题,可以使用 WeakHashMap 代表缓存,此种 Map 的特点是,当除了自身有对 key 的引用外,此 key 没有其他引用那么此 map 会自动丢弃此值

监听器和回调

内存泄漏第三个常见来源是监听器和其他回调,如果客户端在你实现的 API 中注册回调,却没有显示的取消,那么就会积聚。需要确保回调立即被当作垃圾回收的最佳方法是只保存他的弱引用,例如将他们保存成为 WeakHashMap 中的键。

内存泄露解决的原则

1.尽量减少使用静态变量,类的静态变量的生命周期和类同步的。

2.声明对象引用之前,明确内存对象的有效作用域,尽量减小对象的作用域,将类的成员变量改写为方法内的局部变量;

3.减少长生命周期的对象持有短生命周期的引用;

4.使用StringBuilder和StringBuffer进行字符串连接,Sting和StringBuilder以及StringBuffer等都可以代表字符串,其中String字符串代表的是不可变的字符串,后两者表示可变的字符串。如果使用多个String对象进行字符串连接运算,在运行时可能产生大量临时字符串,这些字符串会保存在内存中从而导致程序性能下降。

5.对于不需要使用的对象手动设置null值,不管GC何时会开始清理,我们都应及时的将无用的对象标记为可被清理的对象;

6.各种连接(数据库连接,网络连接,IO连接)操作,务必显示调用close关闭。

你可能感兴趣的:(Java内存泄漏)