我们在日常工作中,对于一些没有固定销毁时间点的对象,通常会考虑用WeakHashMap 来协助自动销毁对象。
举个例子,根据不同的request出错信息的key,自动找到相关的翻译内容。就是常说的国际化,I18n。软件出错的信息是不固定的,如果每次load完内容,就销毁又性能不高。所以通常想法是做个map,但是map的情况下,我没有办法决定什么时候销毁这个key,那么这个时候通常会用WeakHashMap。利用GC 来帮我保证map的内容不会膨胀,导致内存泄漏。
WeakHashMap的行为取决于垃圾回收器的动作。由于垃圾回收器是由jvm调度的,gc可以发生在WeakHashMap对象生命周期的任何时候,所以WeakHashMap的表现为,
即使对 WeakHashMap 实例进行同步,并且没有调用任何赋值方法,在一段时间后 size 方法也可能返回较小的值。
对于 isEmpty 方法连续调用两次,可能先返回false,然后返回true,
对于给定的key,containsKey方法返回true,然后返回false。
对于给定的key ,get方法调用两次, 可能第一次返回一个值,但接着返回null。
总而言之就是只要在垃圾回收器清除某个键的弱引用之后,该键才会自动移除。所以如果用WeakHashMap自己要有这方面的判断。比如上例,如果拿不到内容需要重新加载再放到WeakHashMap。
关于引用
如果一个对象具有弱引用,在GC线程扫描内存区域的过程中,不管当前内存空间足够与否,都会回收内存,使用弱引用 构建非敏感数据的缓存。声明如下:
//WeakReference
WeakReference
WeakHashMap与GC
WeakHashMap中Entry[]有着Entry->WeakReference->Reference
这样一个继承结构,我们先来看下Reference
字段
- referent: 引用指向的对象
- queue: ReferenceQueue,Reference构造的时候传入,其内部封装了单向链表的添加,删除和遍历等操作。用于Reference状态监听及管理
- discovered:单向链表,由JVM维护
- next:指向ReferenceQueue中下一个元素,ReferenceQueue链表指针
- pending:discovered链表表头,在referent被回收后的reference
将有JVM标记,等待入队处理
方法
- static代码块:构造ReferenceHandler线程,循环执行tryHandlePending方法
- tryHandlePending:循环处理pending链表头,维护discovered链表,如果pending不为空,则进行插入ReferenceQueue进行后续操作。(这里如果是cleaner,则先进行clean操作)
内部类
- ReferenceHandler,线程实现类,run方法中循环调用Refreence的静态方法tryHandlePending
private static Lock lock = new Lock();
/* List of References waiting to be enqueued. The collector adds
* References to this list, while the Reference-handler thread removes
* them. This list is protected by the above lock object. The
* list uses the discovered field to link its elements.
*/
private static Reference
上面是Reference类的部分代码,可以看到Reference中有一个全局的锁对象:lock;有一个静态变量pending;在静态代码块中启动一个ReferenceHandler线程,启动完成后处于wait状态,它在一个Lock同步锁模块中等待。那么WeakHashMap中key/value如何自动回收跟这些有什么关系呢。
我们假设JVM使用G1 使用其他收集器对于弱引用的回收原理相同)。
- JVM 在进行G1 GC的时候,会创建一个ConcurrentMarkSweepThread(简称CMST)线程去进行GC,ConcurrentMarkSweepThread线程被创建的同时会创建一个SurrogateLockerThread(简称SLT)线程并且启动它。
- SLT启动之后,处于等待阶段。CMST开始GC时,会发一个消息给SLT让它去获取Java层Reference对象的全局锁:Lock。
- 直到G1 GC完毕之后,JVM 会将WeakHashMap中所有被回收的对象所属的WeakReference容器对象放入到Reference 的pending属性当中(每次GC完毕之后,pending属性基本上都不会为null了)。
- 然后通知SLT释放并且notify全局锁:Lock。此时激活了ReferenceHandler线程的run方法,使其脱离wait状态,开始工作了。
- ReferenceHandler这个线程会将pending中的所有WeakReference对象都移动到它们各自的列队当中,比如当前这个WeakReference属于某个WeakHashMap对象,那么它就会被放入相应的ReferenceQueue列队里面(该列队是链表结构)。
- 当我们下次从WeakHashMap对象里面get、put数据或者调用size方法的时候,WeakHashMap就会将ReferenceQueue列队中的
WeakReference一一poll
出来去和Entry[]数据做比较,如果发现相同的,则说明这个Entry所保存的对象已经被GC掉了,那么将Entry[]内的Entry对象剔除掉,这样就完成的key/value的自动回收。
这是WeakHashMap中的ReferenceQueue定义,注释就可以知道这是用来清除WeakEntries的
/**
* Expunges stale entries from the table.
*/
private void expungeStaleEntries() {
for (Object x; (x = queue.poll()) != null; ) {
synchronized (queue) {
@SuppressWarnings("unchecked")
Entry e = (Entry) x;
int i = indexFor(e.hash, table.length);
Entry prev = table[i];
Entry p = prev;
while (p != null) {
Entry next = p.next;
if (p == e) {
if (prev == e)
table[i] = next;
else
prev.next = next;
// Must not null out e.next;
// stale entries may be in use by a HashIterator
e.value = null; // Help GC
size--;
break;
}
prev = p;
p = next;
}
}
}
}
大家可以看一段GC 的log,看看reference 是怎么回收的。
继续观察日志,可以发现,总共150ms的执行过程中,仅Ref Proc一步就花费了108ms。那么可以判断,多出来的时间,应该是和Ref Proc 有关了。Ref Proc这一步就来处理这些引用对象。默认是由单线程执行,如果这一步花费的时间较长,可以通过加参数-XX:+ParallelRefProcEnabled改为多线程处理。
WeakHashMap的Weakness
使用WeakHashMap一般是全局变量,我们直接的想法就是把它应用到多线程中去。观察WeakHashMap源码可以发现,它是线程不安全的
/**
* Expunges stale entries from the table.
*/
private void expungeStaleEntries() {
for (Object x; (x = queue.poll()) != null; ) {
synchronized (queue) {
@SuppressWarnings("unchecked")
Entry e = (Entry) x;
int i = indexFor(e.hash, table.length);
Entry prev = table[i];
Entry p = prev;
while (p != null) {
Entry next = p.next;
if (p == e) {
if (prev == e)
table[i] = next;
else
prev.next = next;
// Must not null out e.next;
// stale entries may be in use by a HashIterator
e.value = null; // Help GC
size--;
break;
}
prev = p;
p = next;
}
}
}
}
下面指针交换过程,有可能把另外一个线程修改的指针改到当前线程指针, 导致指针闭环,从而引起无限循环。
prev = p;
p = next;
这段代码当线程1
pre =p
p =next
时,另外一个线程可能
pre=p //(此时 p 可能是线程1的 p.pre)
当线程1 p=next 赋完值后, 线程2 又开始赋值 p=p.pre.next 所以p=p 就造成指针闭环。当你去调用get 方法时,由于有 while 条件和e =e.next就导致无限循环。
*/
public V get(Object key) {
Object k = maskNull(key);
int h = hash(k);
Entry[] tab = getTable();
int index = indexFor(h, tab.length);
Entry e = tab[index];
while (e != null) {
if (e.hash == h && eq(k, e.get()))
return e.value;
e = e.next;
}
return null;
}
所以当我们使用WeakHashMap做temporary cache时, 通常都要如下写法
WeakHashMap weakHashMapintsmaze=new WeakHashMap();
Map intsmaze=Collections.synchronizedMap(weakHashMapintsmaze)