斐波纳切数列相关算法竞赛知识（一）：记忆化搜索、快速幂、矩阵快速幂

众所周知，斐波纳切数列是这样的一个数列，F(0)=0，F(1)=1，F(n)=F(n-1)+F(n-2)。
围绕如何算出F（n），有很多算法竞赛相关知识，总结如下。

一、递归

入门级思维，写一个函数，不断调用自己即可。优点是书写简单，缺点是效率极低，因为有很多重复计算，比如要计算f(6)，需计算f(5)+f(4)，先算f(5)，中途计算一次f(4)，再算f(4)，又算了一次。

int f(int n){
    return n < 2 ? n : f(n-1) + f(n-2);
}

二、记忆化搜索

记忆化也是算法的一个基本技能，上面的做法既然会重复计算，那么第一次算出来f(i)的时候，把它保存（记忆）起来，下次需要的时候直接取出，加快速度。

int a[40];
int f(int n){
    if(n < 2) return n;
    if(a[n] > 0) return a[n];//已经计算过了,直接返回
    else return a[n] = f(n-1)+f(n-2);//没有算过，先算，然后保存起来，最后返回。
}

三、循环，动态规划启蒙

利用循环，直接根据前两项算出f(n)，效率和记忆话搜索一样，去掉了递归。此处蕴含了初级的动态规划思想，用前面已作出的决策，决定当前要采取的决策，当前采取的决策，也不会影响后面决策的正确性。

int a[40] = {0, 1};
int f(int n){
    if (n < 2 ) return n;
    for(int i = 2; i <= n; i++){
        a[i] = a[i-1] + a[i-2];
    }
    return a[n];
}

四、整数范围

上面的程序只对n比较小的时候有效，如果计算f(47)，就发生溢出，因为结果比int类型能表示的最大数还大。int是32位的，最大能表示2^31-1，大概是20多亿。可用unsigned long long容纳更大的数，unsigned long long 是64位，并且最高位也用来计数，最大能表示2^64-1，十进制是18446744073709551615，可以用程序输出这个数，体会一下：

#include 
#include //常用数据类型的最大、最小值都在这个头文件里
int main(){
    printf("%llu", ULLONG_MAX);
    return 0;
}

2^64-1对于斐波纳切数列这样的指数级别函数的增长速度来说，也不算很大,大概f(200)就快要超出去了。

五、模

n再大的话怎么办，一般题目要求计算结果对一个很大的数M（比如1e8+7，100000007）求模，求模以后结果总会小于M。关于求模有两个重要公式需要记住：
(a+b)%c = (a %c + b%c)%c
(ab)%c = ((a%c) * (b%c))%c
加入模运算以后，n很大的时候也可以求了，把循环代码改一下即可，不需要用很大的数组记录所有0-n的结果，只需要2个元素就够了：

#include 
#define MOD 1000000007
typedef long long ll;
ll a[2] = {0, 1};
ll f(int n){
    if (n < 2 ) return n;
    for(int i = 2; i <= n; i++){
        ll tmp = (a[0] + a[1]) % MOD;
        a[0] = a[1];
        a[1] = tmp;
    }
    return a[1];
}
int main(){
    printf("%lld", f(200000000));
    return 0;
}

六、矩阵乘法辅助转移

上面的代码当n在10亿范围内勉强能算出来，再大的话就很无力了。因为复杂度是O(n)，只用简单的手段已经没有优化的空间了，要想加速必须用其它办法。办法就是利用矩阵乘法。矩阵乘法运算规则此处就不展开了，学习资源随处可见。
矩阵象鲁迅先生一样装作很无辜：“你算斐波纳切数列，和我矩阵有什么关系？？？”
我们先不管矩阵先生的抗议，试定义数列初始值是一个1*2（1行，2列）的矩阵，表示[f(0),f(1)]，如果这个矩阵乘以另外一个矩阵，结果能变成[f(1),f(2)]，再乘一次，变成[f(2),f(3)]，显然乘上n-1次，结果就变成了[f(n-1),f(n)]。把这个式子一般化，即[f(i-2),f(i-1)] xA = [f(i-1),f(i)]，根据矩阵乘法定义，A显然是一个2x2的矩阵，第一列是0，1；第二列是1，1，乘完以后，第一列是f(i-2)x0+f(i-1)x1，即f(i-1)；第二列是f(i-2)x1+f(i-1)x1，正好是f(i)。
结论是：[f(n-1),f(n)] = [f(0),f(1)] x A^(n-1)，[f(n-1),f(n)] 等于[f(0),f(1)] 乘以A的n-1次幂。
矩阵再次装无辜：“这样也没用，算这么多次乘法，还不如原来算加法快呢，你们还是放了我找别人吧......”

七、快速幂

矩阵n次幂，如果能快速算出来，我们的目的就达到了。幸运的是办法很简单，也许对于矩阵来说这是不幸的^ _ ^。
先看看整数的幂怎么算。普通方法用循环乘，当然很慢数据上了1亿就不能秒出了。用初中数学知识把做法稍微改一下即可:
假设n是偶数，A^n = (AA)^(n/2)
若n是奇数，A^n = AxA(n-1)，n-1肯定是偶数，所以A^n = Ax(AA)^((n-1)/2)
根据上述原理，一次乘法运算将底数变成原来的平方，就能把幂减少1半，效率非常高，再大的数，也经不起几次减半啊，时间复杂度从O(n)降到O(logn)。
代码也很简单，请运行并体验一下它的威力：

#include 
typedef long long ll;
ll fastpow(ll base, ll p, int k){//快速幂，结果对k取模
    ll ret = 1;
    while(p > 0){
        if (p & 1){//奇数,相当于p % 2 == 1
            ret = ret * base % k;
        }
        base = base * base % k;//底数变成原来的平方
        p >>= 1;//相当于p /= 2，指数减半
    }
    return ret % k;
}
int main(){
    printf("%lld", fastpow(3, 8888888880000088, 100000007));
    return 0;
}

八、矩阵快速幂

这下矩阵先生再也躲不掉了，乖乖地干活吧。快速幂同样适用于矩阵，因为行和列大小相等的矩阵（方阵）乘法满足结合率。代码如下：

#include 
#include 
#define MOD 1000000007
using namespace std;
typedef long long ll;
/*
从[f(i-2), f(i-1)]转移到[f(i-1), f(i)]
这是一个1x2的矩阵，乘一个2x2的加速矩阵，就变成一个新的1x2矩阵
加速矩阵是
0 1
1 1
*/

ll n;
struct Mx{
    ll v[2][2];
    int n, m;//行，列
    Mx(int rows, int cols) : n(rows), m(cols){//构造函数
        memset(v, 0, sizeof(v));
    }
    Mx operator*(const Mx &r){//重载乘法运算符，为了代码书写方便
        Mx ret(n, r.m);
        for(int i = 0; i < n; i++){
            for(int j = 0; j < r.m; j++){
                for(int k = 0; k < m; k++){//此处注意k的循环放在最内层，有助于cpu缓存命中，加快运算速度，放在最外层结果正确，但速度慢。
                    ret.v[i][j] = (ret.v[i][j] + (v[i][k] * r.v[k][j] % MOD)) % MOD;
                }
            }
        }
        return ret;
    }
} ans(1, 2), rush(2, 2);
ll calc(ll t){
    if (t == 1 || t == 2){
        return 1;
    }
    t -= 3;//矩阵乘t次，base的t次方
    ans.v[0][0] = ans.v[0][1] = 1;//将结果矩阵初始化为[1, 1]，n从1开始算
    rush.v[0][1] = rush.v[1][0] = rush.v[1][1] = 1;//初始化加速矩阵，第一列0，1；第二列1，1
    Mx trans = rush;
    while(t > 0){
        if(t & 1){
            trans = trans * rush;
        }
        rush = rush * rush;
        t >>= 1;
    }
    ans = ans * trans;
    return ans.v[0][1];
}
int main(){
    scanf("%lld", &n);
    printf("%lld\n", calc(n));
    return 0;
}

九、斐波纳切公约数

gcd(f(a),f(b)) = f(gcd(a,b))
gcd表示最大公约数，f(n)表示斐波纳切数列第n位。