前言
你打开了“P4000 斐波那契数列”一题;
你发现是已经写过 \(\mathrm{998244853}\) 遍的求 \(\mathrm{Fib}_n\);
你熟练地写出矩阵快速幂并提交;
你得到了一版的 \(\mathrm{TLE}\) ,因为 \(n \leq 10^{30000000}\);
你点开了题解,发现第一篇题解一大片公式和定理;
你向下滑动界面,其他的题解都直接摆结论。
相信经历了这么多的你心中满满的“我太难了”。
那么这篇题解将拯救你于水火之中(?)
前置芝士
- 主角:生日悖论;
- 辅助结论:模数为 \(p\) 的斐波那契循环节长度 \(\pi(p) \leq 6p\);
- \(O(\sqrt p)-O(1)\) 快速幂,LOJ有模板题。
关于辅助结论的证明,因为前置结论比较多 (实际上是我不会) ,故在本篇题解中被省略。如果你有条件,可以参考 \(\mathrm{Wikipedia}\) 中的 \(\mathrm{Pisano\ Period}\) 条目,其中有证明。
所以实际上这个做法也有很多前置。但是相比纯数论做法,结论只有这一个,而且这个结论很好记。
算法流程
一件显然的事情是需要计算斐波那契数列的循环节。暴力做法基本没有优化空间,考虑:设循环节长度为 \(\pi(p)\),对于 \(i \neq j\) ,如果 \(\mathrm{Fib}_i = \mathrm{Fib}_j\) 且 \(\mathrm{Fib}_{i+1} = \mathrm{Fib}_{j+1}\),那么\(\pi(p) \mid j-i\)。也就是说如果找到两个位置 \(i,j\) 满足条件就可以得到循环节长度的某个倍数。
因为只需求值,所以求出\(\pi(p)\)的真实值没有必要,求出其倍数也可以接受。所以可以利用随机化得到一个新算法:每一次随机两个数 \(i,j\),计算 \(\mathrm{Fib}_i , \mathrm{Fib}_{i+1} , \mathrm{Fib}_j , \mathrm{Fib}_{j+1}\) 的值判断是否相等。
显然这个做法是期望 \(O(p)\) 的,跟暴力没有区别。但我们可以换一个角度描述这个问题:每一次随机两个位置 \(i,j\),相当于随机两个数 \(x = i \mod \pi(p)\) 和 \(y = j \mod \pi(p)\),如果 \(x=y\) 就可以找到循环节的倍数。
可以发现这个问题与“生日悖论”问题基本一致。利用生日悖论思想,每一次随机两个命中概率很小,但随机三个、四个、很多个位置,随着随机的数量增长,命中概率是以平方级别增长的。
所以可以得到一个更优秀的算法:使用一个哈希表记录之前随机到的所有 \((\mathrm{Fib}_i , \mathrm{Fib}_{i+1} , i)\) 三元组,每次随机位置 \(j\) 并得到 \((\mathrm{Fib}_j , \mathrm{Fib}_{j+1} , j)\),如果在哈希表中可以找到满足 \(\mathrm{Fib}_i = \mathrm{Fib}_j\) 且 \(\mathrm{Fib}_{i+1} = \mathrm{Fib}_{j+1}\) 的三元组 \((\mathrm{Fib}_i , \mathrm{Fib}_{i+1} , i)\),就可以得到循环节的某个倍数。
根据生日悖论,上述算法在期望 \(O(\sqrt p)\) 次内可以完成寻找。使用 \(O(\sqrt p) - O(1)\) 矩阵/扩域快速幂实现求斐波那契数,可以做到 \(O(\sqrt p)\) 求出循环节。
后话
这个做法是在复习Pollard-rho
算法时 打隔膜 翻到有博客记录 \(\pi(p) \leq 6p\) 时浮现的。如果在考场上遇到了类似问题,只需要信仰猜想循环节长度为模数级别、把 \(\frac{\text{循环节长度}}{\text{模数}}\) 这个常数估计大一些然后套用本题做法就可以了,拓展性比较高。
如果想求 \(\pi(p)\) 的真实值,只需要枚举算出来的循环节的约数然后逐个判断即可。
Show me the Code.
两个实现细节:
- 建议随机位置上界大于 \(12p\),否则期望次数可能会退化。代码中的随机上界是 \(2^{36}\),选择二的次幂作为模数(或许)可以最小化因为取模导致的
mt19937_64
随机不均匀问题。 - \(p < 2^{31}\) 所以可以直接用一个
long long
存下 \((\mathrm{Fib}_i,\mathrm{Fib}_{i+1})\) 二元组,然后就可以用unordered_map
实现哈希表了。
与此同时这份代码常数比较大。
#include
using namespace std;
#define ll long long
#define ull unsigned long long
unordered_map < ull , ll > circ; ll len;
int MOD , MX = 1 << 18; mt19937_64 rnd(time(0));
struct matrix{
ll arr[2][2];
matrix(){memset(arr , 0 , sizeof(arr));}
ll* operator [](int x){return arr[x];}
friend matrix operator *(matrix p , matrix q){
matrix x;
for(int i = 0 ; i < 2 ; ++i)
for(int j = 0 ; j < 2 ; ++j)
for(int k = 0 ; k < 2 ; ++k)
x[i][k] += p[i][j] * q[j][k];
for(int i = 0 ; i < 2 ; ++i)
for(int j = 0 ; j < 2 ; ++j) x[i][j] %= MOD;
return x;
}
}G , T[2][1 << 18 | 1];
signed main(){
static char str[300000003]; scanf("%s %d" , str + 1 , &MOD);
T[0][0][0][0] = T[0][0][1][1] = T[1][0][0][0] = T[1][0][1][1] = 1;
T[0][1][0][1] = T[0][1][1][0] = T[0][1][1][1] = 1;
for(int i = 2 ; i <= MX ; ++i) T[0][i] = T[0][i - 1] * T[0][1];
T[1][1] = T[0][MX]; for(int i = 2 ; i <= MX ; ++i) T[1][i] = T[1][i - 1] * T[1][1];
while(1){
ll x = (rnd() << 28 >> 28); matrix C = T[0][x & (MX - 1)] * T[1][x >> 18];
ull val = ((1ull * C[0][0]) << 32) | C[0][1];
if(circ.find(val) != circ.end()){len = abs(circ[val] - x); break;}
circ[val] = x;
}
ll sum = 0;
for(int i = 1 ; str[i] ; ++i) sum = (sum * 10 + str[i] - '0') % len;
cout << (T[0][sum & (MX - 1)] * T[1][sum >> 18])[0][1];
return 0;
}