记忆是衍生自lisp,python,和perl等过程性语言的一种设计模式,它可以对前次的计算结果进行记忆。 一个实现了记忆功能的函数, 带有显式的cache, 所以, 已经计算过的结果就能直接从cache中获得, 而不用每次都进行计算.
记忆能显著的提升大计算量代码的效率. 而且是一种可重用的方案.
本文阐述了在java中使用这一模式的方法,并提供了一个可以提供上述功能的"记忆类":
foo foo = (foo) memoizer.memoize(new fooimpl());
这里,foo是一个接口,它含有的方法是需要记忆的.fooimpl是foo的一个实现.foo是foo的一个引用.方法与fooimpl基 本相同,区别在于foo返回的值,会被缓存起来.单个记忆类的优点在于为任何类添加记忆功能是很简单的:定义一个包含需要记忆的方法的接口,然后调用 memoize来实现一个实例.
为了理解记忆类是怎么实现的,我们将分几步来解释.首先,我解释一下为何缓存能够在需要它的类中实现.然后,我测试一下如何为一个特定的类添加缓存包装器.最后,我解释一下如何才能使得一个缓存包装器能够通用于任意的类.
为大计算量的程序添加缓存
作为一个大计算量程序的例子,我们考虑pibinarydigitscalculator这个例子-计算二进制数据pi.仅有的public 方法 calculatebinarydigit带有一个参数:整数n,代表需要精确到的位数.例如,1000000,将会返回小数点后的一百万位,通过 byte值返回-每位为0或者1.(算法可以参考: screen.width-600)this.style.width=screen.width-600;">http://www.cecm.sfu.ca/~pborwein/papers/p123.pdf)
public class pibinarydigitscalculator {
/**
* returns the coefficient of 2^n in the binary
* expansion of pi.
* @param n the binary digit of pi to calculate.
* @throws validitycheckfailedexception if the validity
* check fails, this means the implementation is buggy
* or n is too large for sufficient precision to be
* retained.
*/
public byte calculatebinarydigit(final int n) {
return runbbpalgorithm(n);
}
private byte runbbpalgorithm(final int n) {
// lengthy routine goes here ...
}
}
最简单直接的方法来缓存返回值可以通过修改这个类来实现:添加一个map来保存之前计算得到的值,如下:
import java.util.hashmap;
public class pibinarydigitscalculator {
private hashmap cache = new hashmap();
public synchronized byte calculatebinarydigit(
final int n) {
final integer n = new integer(n);
byte b = (byte) cache.get(n);
if (b == null) {
byte b = runbbpalgorithm(n);
cache.put(n, new byte(b));
return b;
} else {
return b.bytevalue();
}
}
private byte runbbpalgorithm(final int n) {
// lengthy routine goes here ...
}
}
calculatebinarydigit 方法首先会检查hashmap里面是否缓存了这个关键字-参数n,如果找到了,就直接返回这个值.否则,就会进行这个冗长的计算,并将结果保存到缓存里 面.在添加进hashmap的时候,在原始类型和对象之间还要进行小小的转换.
尽管这个方法是可行的,但是有几个缺点.首先,进行缓存的代码和正常的算法代码不是显著分开的.一个类,不仅负责进行计算,也要负责进行维护 缓存数据.这样,要进行一些测试就会显得很困难.比如,不能写一个测试程序来测试这个算法持续地返回相同的值,因为,从第二次开始,结果都是直接从 cache中获得了.
其次,当缓存代码不再需要,移除它会变得困难,因为它和算法块地代码是紧密结合在一起的.所以,要想知道缓存是否带来了很高的效率提升也是很困难的,因为不能写一个测试程序是和缓存数据分开的.当你改进了你的算法,缓存有可能失效-但是这个时候你并不知道.
第三,缓存代码不能被重用.尽管代码遵从了一个普通的模式,但是都是在一个类- pibinarydigitscalculator里面.
前面两个问题都可以通过构造一个缓存包装器来解决.
缓存包装器
通过使用decorator模式,要分开计算代码和缓存代码是很容易的.首先,定义一个接口,里面定义基本的方法.
public interface binarydigitscalculator {
public byte calculatebinarydigit(final int n);
}
然后定义两个实现,分别负责两个任务:
public class pibinarydigitscalculator
implements binarydigitscalculator {
public byte calculatebinarydigit(final int n) {
return runbbpalgorithm(n);
}
private byte runbbpalgorithm(final int n) {
// lengthy routine goes here ...
}
}
import java.util.hashmap;
public class cachingbinarydigitscalculator implements
binarydigitscalculator {
private binarydigitscalculator binarydigitscalculator;
private hashmap cache = new hashmap();
public cachingbinarydigitscalculator(
binarydigitscalculator calculator) {
this.binarydigitscalculator = calculator;
}
public synchronized byte calculatebinarydigit(int n) {
final integer n = new integer(n);
byte b = (byte) cache.get(n);
if (b == null) {
byte b =
binarydigitscalculator.calculatebinarydigit(n);
cache.put(n, new byte(b));
return b;
} else {
return b.bytevalue();
}
}
}
这是很之前的实现pibinarydigitscalculator的一种简单的refactored版本. cachingbinarydigitscalculator包装了binarydigitscalculator句柄,并增加了缓存,供 calculatebinarydigit的方法调用. 这种方法提高了代码的可读性与可维护性. 用户不能直接使用 binarydigitscalculator接口来实现算法,所以,如果需要关闭缓存块,将是很容易实现的.
还有,合适的测试程序很容易写出来.比如,我们写一个假的binarydigitscalculator实现,每次 calculatebinarydigit被调用,赋予相同的参数,返回不同的值. 这样,我们就能测试缓存是否工作了,因为如果每次都返回相同的值,则证明缓存是正常工作了. 这种测试在之前那种简单的实现是不可能的。