题目
发现题解都不够优雅,就自己来一篇
( 以下除【代码】处代码,其余均为现场手打,如有误请与本蒟蒻联系 )
【分析】
首先,看清楚了,题目是 \(\sum_{i=1}^ai^b\) 的余数 ,而不是 \(\sum_{i=1}^ab^i\) ( 等比数列求和了解一下 )
毕竟......本蒟蒻一开始就看错了......
好,进入正题,介于 \(a,b\leq 10^9\) ,暴力就想都不用想了,肯定过不了每一次乘法需要 \(O(b)\) 的时间,加法需要 \(O(a)\) 的时间,外部一个 \(O(N)\) 的循环,总复杂度 \(O(Nab)=10^{20}\) ,大概要 \(10^{12} s\) ,也就是大概 \(31710\) 年吧 逃
首先,有一个很优秀的方法可以优化乘法,那就是 快速幂 !
如果你要求 \(a^x\) 那么你就先求出 \(a^{\lfloor {x\over 2}\rfloor}\)
然后 \(a^{\lfloor {x\over 2}\rfloor}\times a^{\lfloor {x\over 2}\rfloor}\) 就完事啦!
递归边界在于当 \(x=1\) 时 \(a^1=a\)
那奇数怎么办?我们知道 \(a^4=a^2\times a^2\) ,但 \(a^5\neq a^2\times a^2\) 啊
没事,你想, \(a^5=a^2\times a^2\times a^1\) 对不对?
同理,\(a^x=a^{\lfloor {x\over 2}\rfloor}\times a^{\lfloor {x\over 2}\rfloor}\times a\) ( \(x\) 为奇数)
所以,我们可以递归地盘它了:
int pow(int a,int x){
if(x==1) return a;
int p=pow(a,x/2);
if(x%2==1) return (p*p%Mod)*a%Mod;
else return p*p%Mod;
}
当然,喜欢三目运算符和位运算的小伙伴们可以更优雅地盘它:
int pow(int a,int x){
if(x==1) return a;
int p=pow(a,x>>1);
return (p*p%Mod)*((x&1)?a:1)%Mod;
}
这边再推荐一下非递归的打法,因为有的地方的评测机可能会爆栈:
int pow(int a,int x){
int bas=a,ans=(x&1)?a:1;
while(x>>=1){
bas=bas*bas%Mod;
if(x&1) ans=ans*bas%Mod;
}
return ans;
}
好的,我们可喜的发现,由于每次递归都是对半,求 \(i^b\) 的方法优化到了 \(O(\log b)\),现在的总复杂度为 \(O(Na\log b)\) 了,大概为 \(10^{12}\) 大概要 \(10^4s\) 了,也就是 \(3\) 小时 再逃
这说明我们还是不够优雅的,我们还得继续优化
我们还能发现,根据同余的性质: \((a+10000)\equiv a (\mod 10000)\)
两边同时翻 \(b\) 次方得:
\((a+10000)^b\equiv a^b(\mod10000)\)
这说明了啥?说明我们对于任何大于 \(10000\) 的数 \(n\) ,它的 \(b\) 次方我们已经求过了,就是 \((n\%10000)^b\)
因为本人是 C++ 选手,所以习惯用 \(a\%b\) 表示 \(a\) 除以 \(b\) 的余数
好的,所以我们把 \(1\) ~ \(10000\) 的 \(b\) 次方存起来,比如用 \(c_i\) 表示 \(i^b\%10000\) 。
我们先预处理 \(c_1\)~\(c_{10000}\) ,接下来,每次我们要 \(i^b\) ,就直接用 \(c_{i\%10000}\) 即可。
耶!总复杂度又下降了,每次预处理都是 \(O(10000\log b)\) 的,统计是 \(O(a)\) 的
\(\because 10000\log b\leq 10^4\times 10^2=10^6\leq 10^9=a\)
\(\therefore O(10000\log b)+O(a)=O(a)\)
总复杂度为 \(O(Na)=10^{11}\) , 大概 \(20\) 分钟吧 继续逃
至此,我们还能发现,对于给定的 \(a\) ,我们需要将 \(c_1\)~\(c_{10000}\) 的加和计算 \(\lfloor{a\over 10000}\rfloor\) 次,剩下的就是从 \((\lfloor{a\over 10000}\rfloor\times 10000+1)\) 到 \(a\) 的再各多记一次
也就是把加和乘上 \(\lfloor{a\over 10000}\rfloor\) ,再加上 \(c_1\)~\(c_{a\%10000}\) 的和就可以了
有的机智的小朋友立即意识到了,可以把 \(c_1\)~\(c_{10000}\) 的和记录起来,接下来的一个循环搞掉,岂不美哉
但是为什么要那么复杂呢?
我们令 \(Add_n=\sum_{i=1}^nc_i\)
那么,我们的答案就应该是 \(Add_{10000}\times \lfloor{a\over 10000}\rfloor+Add_{a\%10000}\)
这个实际上叫做前缀和
不是吗?
所以现在很明确了吧,我们要的是 \(Add_n\) ,只要这个一出来,我们就可以根据公式,\(O(1)\) 输出答案了
那 \(Add_n\) 又怎么求? \(c_n\) 全部算出来然后每次算 \(Add_n\) 都一遍扫过去?
复杂度 \(O(n^2)\) 的事情过于暴力了吧
我们想:
\(Add_n=\sum_{i=1}^nc_i=\sum_{i=1}^{n-1}c_i+c_n=Add_{n-1}+c_n\)
所以我们只要一遍算 \(c_n\) 的时候统计 \(Add_n\) 即可
这次,预处理复杂度 \(O(10000\log b)\) ,输出答案是 \(O(1)\) 的,总复杂度 \(O(10000N\log b)=10^7\) 可以做到一秒出结果了
【进阶】
这边讲一个毫无意义的进阶,虽然对复杂度和答案毫无影响,但确实看起来更优雅:
由欧拉定理得: \(a^{\varphi(n)}\equiv1(\mod n)\)
对于右上角那个鬼东西,它叫欧拉函数,是指小于 \(n\) 的正整数中,与其互质的数的个数
也有的版本是说小于等于 \(n\) 的正整数中,与其互质的数的个数
关于欧拉函数的性质,你们可以看看我 这篇文章 中讲欧拉函数的那一部分,其它的可以跳过
至于欧拉定理,记住它就行 OI是不需要数学证明的
根据公式 \(\varphi(10000)=4000\) 所以,我们不需要算 \(b\) 次方的快速幂,\(b\%4000\) 的快速幂即可
这样,您的代码将看起来更加的优雅、大气
hrq:“我现在终于知道了,代码优雅指的就是别人看不懂!原来我代码不优雅是褒义词!”
(P.S. 虽然丝毫不影响复杂度)
【代码】
好的,废话了那么多,本蒟蒻要放 我码风极丑无比的 代码了
代码前面加了一些读入和输出优化,无视即可
#include
#include
using namespace std;
#define f(a,b,c,d) for(register int a=b,c=d;a<=c;a++)
#define g(a,b,c,d) for(register int a=b,c=d;a>=c;a--)
#define File(s) freopen(s".in","r",stdin);freopen(s".out","w",stdout);
typedef int i32;
typedef long long int i64;
const int Mod=10000;
namespace INPUT{
char s[1<<20|1],*p1=s,*p2=s;
inline char gc() { return (p1==p2)&&(p2=(p1=s)+fread(s,1,1<<20|1,stdin),p1==p2)?EOF:*(p1++); }
inline i32 read(){
register i32 ans=0;register char c=gc();register bool neg=0;
while(c<48||c>57) neg^=!(c^'-'),c=gc();
while(c>=48&&c<=57) ans=(ans<<3)+(ans<<1)+(c^48),c=gc();
return neg?-ans:ans;
}
}
namespace OUTPUT{
char s[1<<20|1],*cur=s;
inline void output(){ cur-=fwrite(s,1,cur-s,stdout); }
inline void print(i32 x){
char tmp[16],*p1=tmp,*p2=tmp;
p2+=sprintf(tmp,"%d",x);
if(cur-s+p2-p1>>20) output();
while(p1<=p2) *(cur++)=*(p1++);
cur--;
}
inline void print(char c){
if(cur-s+1>>20) output();
*(cur++)=c;
}
}
using namespace INPUT;
using namespace OUTPUT;
//前面全是读入输出优化,无视它们
inline i32 pow(i32 d_A,i32 d_X){
i32 d_Bas=d_A,d_Ans=(d_X&1)?d_A:1;
while(d_X>>=1){
d_Bas*=d_Bas;
d_Bas%=10000;
if(d_X&1) d_Ans*=d_Bas,d_Ans%=10000;
}
return d_Ans;
}//快速幂
inline i32 work(i32 d_A,i32 d_B){
i32 ar_d_Add[Mod+1]={0};
f(i,1,I,Mod) ar_d_Add[i]=ar_d_Add[i-1]+pow(i,d_B),ar_d_Add[i]-=( (ar_d_Add[i]>=Mod)?Mod:0 );
i32 d_Ans= d_A/Mod%Mod * ar_d_Add[Mod]%Mod + ar_d_Add[d_A%Mod];
return d_Ans>=Mod?(d_Ans-Mod):d_Ans;
}//计算结果
i32 main(){
i32 d_N=read();
while(d_N--){
int d_A=read(),d_B=read()%4000;
print( work(d_A,d_B) );
print('\n');
}
output();
return 0;
}//对于主函数尽可能剪短的特殊癖好
最后安利一下 本蒟蒻的博客