大家都不陌生,一个函数直接或间接的调用它自己,就是递归了。我们来看一个简单的,计算阶乘的例子。
def factorial(n: Int): Int = {
if( n <= 1 ) 1
else n * factorial(n-1)
}
以上factorial方法,在n>1时,需要调用它自身,这是一个典型的递归调用。如果n=5,那么该递归调用的过程大致如下:
factorial(5)
5 * factorial(4)
5 * (4 * factorial(3))
5 * (4 * (3 * factorial(2)))
5 * (4 * (3 * (2 * factorial(1))))
5 * (4 * (3 * (2 * 1)))
120
递归算法,一般来说比较简单,符合人们的思维方式,但是由于需要保持调用堆栈,效率比较低,在调用次数较多时,更经常耗尽内存。 因此,程序员们经常用递归实现最初的版本,然后对它进行优化,改写为循环以提高性能。尾递归于是进入了人们的眼帘。
尾递归是指递归调用是函数的最后一个语句,而且其结果被直接返回,这是一类特殊的递归调用。 由于递归结果总是直接返回,尾递归比较方便转换为循环,因此编译器容易对它进行优化。现在很多编译器都对尾递归有优化,程序员们不必再手动将它们改写为循环。
以上阶乘函数不是尾递归,因为递归调用的结果有一次额外的乘法计算,这导致每一次递归调用留在堆栈中的数据都必须保留。我们可以将它修改为尾递归的方式。
def factorialTailrec(n: BigInt, acc: BigInt): BigInt = {
if(n <= 1) acc
else factorialTailrec(n-1, acc * n)
}
现在我们再看调用过程,就不一样了,factorialTailrec每一次的结果都是被直接返回的。还是以n=5为例,这次的调用过程如下。
factorialTailrec(5, 1)
factorialTailrec(4, 5) // 1 * 5 = 5
factorialTailrec(3, 20) // 5 * 4 = 20
factorialTailrec(3, 60) // 20 * 3 = 60
factorialTailrec(2, 120) // 60 * 2 = 120
factorialTailrec(1, 120) // 120 * 1 = 120120
以上的调用,由于调用结果都是直接返回,所以之前的递归调用留在堆栈中的数据可以丢弃,只需要保留最后一次的数据,这就是尾递归容易优化的原因所在, 而它的秘密武器就是上面的acc,它是一个累加器(accumulator,习惯上翻译为累加器,其实不一定非是“加”,任何形式的积聚都可以),用来积累之前调用的结果,这样之前调用的数据就可以被丢弃了。
将普通的递归改写为尾递归,关键在于找到合适的累加器。下面我们以斐波那契数列为例,看看如何找到累加器。斐波那契数列,前两项为1,从第三项起,每一项都是它之前的两项和。这个定义就是天然的递归算法,如下。
def fibonacci(n: Int): Int = {
if (n <= 2) 1
else fibonacci(n - 1) + fibonacci(n - 2)
}
还是以n=5为例,看它的计算过程。
fibonacci(5)
fibonacci(4) + fibonacci(3)
(fibonacci(3) + fibonacci(2)) + (fibonacci(2) + fibonacci(1))
((fibonacci(2) + fibonacci(1)) + 1) + (1 + 1)
((1 + 1) + 1) + 2
5
以上显然不是尾递归,如何找到累加器将它改造为尾递归?因为需要前两项的和,所以这里需要两个累加器,假设较小的一个为acc1,较大的一个为acc2, 需要计算下一项时,将acc2赋值为新的的acc1',而(acc1+acc2)赋值为acc2',这样,调用堆栈中旧有的数据即可丢弃。以下是这个过程的演示。
n | 0 | 1 | 2 | 3 | 4 |
---|---|---|---|---|---|
F(n) | 0 | 1 | 1 | 2 | 3 |
acc1 acc2
acc1'=acc2 acc2'=acc1+acc2
acc1''=acc2' acc2''=(acc1'+acc2') acc1'''=acc2'' acc2'''=acc1''+acc2''
根据上面的演示过程,可以写代码如下。
def fibonacciTailrec(n: Int, acc1: Int, acc2: Int): Int = {
if (n < 2) acc2
else fibonacciTailrec(n - 1, acc2, acc1 + acc2)
}
以上代码,直接返回递归的结果,因此是严格的尾递归,n=5时,调用过程如下。
fibonacciTailrec(5,0,1)
fibonacciTailrec(4,1,1)
fibonacciTailrec(3,1,2)
fibonacciTailrec(2,2,3)
fibonacciTailrec(1,3,5)
5
上述过程只是演示简单的改写递归的方法,事实上,关于累加器,有更普遍的规律可循,这里不再深入介绍。 对比上述普通递归和尾递归的效率,完整的代码如下。
def fibonacci(n: Int): Int = {
if (n <= 2) 1
else fibonacci(n - 1) + fibonacci(n - 2)
}
def fibonacciTailrec(n: Int, acc1: Int, acc2: Int): Int = {
if (n < 2) acc2
else fibonacciTailrec(n - 1, acc2, acc1 + acc2)
}
val list = List(20, 30, 40)
val sw = new Stopwatch
for (num <- list) {
println("n = " + num)
sw.start("Normal")
val ret = fibonacci(num)
println("F(n) = " + ret)
sw.stop()
sw.start("Tail")
val retTail = fibonacciTailrec(num, 0, 1)
println("FT(n) = " + retTail)
sw.stop()
println(sw.prettyPrint())
println()
sw.reset()
}
上述代码,某次执行输出的结果如下(处理器1.8GHz Intel Core i5)。
n = 20
F(n) = 6765
FT(n) = 6765
Total time elapsed: 2(ms)
-------------------------------------
(ms) (%) Task name
2 100.00 Normal
0 0.00 TailRec
-------------------------------------
n = 30
F(n) = 832040
FT(n) = 832040
Total time elapsed: 3(ms)
-------------------------------------
(ms) (%) Task name
3 100.00 Normal
0 0.00 TailRec
-------------------------------------
n = 40
F(n) = 102334155
FT(n) = 102334155
Total time elapsed: 396(ms)
-------------------------------------
(ms) (%) Task name
396 100.00 Normal
0 0.00 TailRec
-------------------------------------
完整例程,请参见TailRecursion
Scala对形式上严格的尾递归进行了优化,对于严格的尾递归,可以放心使用,不必担心性能问题。对于是否是严格尾递归,若不能自行判断, 可使用Scala提供的尾递归标注@scala.annotation.tailrec,这个符号除了可以标识尾递归外,更重要的是编译器会检查该函数是否真的尾递归,若不是,会导致如下编译错误。
could not optimize @tailrec annotated method fibonacci: it contains a recursive call not in tail position
由于JVM的限制,对尾递归深层次的优化比较困难,因此,Scala对尾递归的优化很有限,它只能优化形式上非常严格的尾递归。也就是说,下列情况不在优化之列。
//call function value will not be optimized
val func = factorialTailrec _
def factorialTailrec(n: BigInt, acc: BigInt): BigInt = {
if(n <= 1) acc
else func(n-1, acc*n)
}
//indirect recursion will not be optimized
def foo(n: Int) : Int = {
if(n == 0) 0;
bar(n)
}
def bar(n: Int) : Int = {
foo(n-1)
}
scalass.com/zh/article/tail-recursion.html