【LOJ#6718】九个太阳「弱」化版(循环卷积,任意模数NTT)

题面

给定 n , K n,K n,K ,满足 K K K 2 2 2 的幂,求
∑ K ∣ i , 0 ≤ i ≤ n ( n i ) \sum_{K|i,0\leq i\leq n} {n\choose i} Ki,0in(in)

998244 998244 998244 8 8 8 53 53 53 取模。

1 ≤ n ≤ 1 0 15 , 1 ≤ K ≤ 2 15 1\leq n\leq10^{15},1\leq K\leq2^{15} 1n1015,1K215

题解

这题网上的题解好像很少。

LOJ 讨论区给出了常数非常大的单位根反演做法,但是正如 4 楼说的
【LOJ#6718】九个太阳「弱」化版(循环卷积,任意模数NTT)_第1张图片
不难发现这题答案就是 ( 1 + x ) n (1+x)^{n} (1+x)n 进行长度 K K K 的循环卷积的常数项。我们直接循环卷积加快速幂解决。

但是模数十分阴间,不可做 NTT 模数,于是又得使用任意模数NTT / MTT(那个一点五次方的万能卷积法不行,过不了)。

这次我终于学懂了,不用 __int128 了,

我们获得三个同余式子:
{ x ≡ c 1 m o d    m 1 x ≡ c 2 m o d    m 2 x ≡ c 3 m o d    m 3 \begin{cases} x\equiv c_1 &\mod m_1\\ x\equiv c_2 &\mod m_2\\ x\equiv c_3 &\mod m_3 \end{cases} xc1xc2xc3modm1modm2modm3

我们先合并前两个得到 x ≡ k m o d    m 1 m 2 x\equiv k\mod m_1m_2 xkmodm1m2

我们令 m 1 ′ m_1' m1 m 1 m_1 m1 取模 m 2 m_2 m2 的逆元, m 2 ′ m_2' m2 m 2 m_2 m2 取模 m 1 m_1 m1 的逆元,

可以得到: k = ( ( c 1 ⋅ m 2 ′ ) % m 1 ⋅ m 2 + ( c 2 ⋅ m 1 ′ ) % m 2 ⋅ m 1 ) % ( m 1 m 2 ) k=\left( (c_1\cdot m_2')\%m_1\cdot m_2 +(c_2\cdot m_1')\%m_2\cdot m_1\right)\%(m_1m_2) k=((c1m2)%m1m2+(c2m1)%m2m1)%(m1m2)

这个过程是不会爆 l o n g   l o n g \rm long~long long long 的。

然后令 x = t m 1 m 2 + k x=tm_1m_2+k x=tm1m2+k ,那么
t m 1 m 2 + k ≡ c 3 m o d    m 3 ⇒ t ≡ ( c 3 − k ) ( m 1 m 2 ) − 1 m o d    m 3 tm_1m_2+k\equiv c_3\mod m_3\\ \Rightarrow t\equiv(c_3-k)(m_1m_2)^{-1}\mod m_3 tm1m2+kc3modm3t(c3k)(m1m2)1modm3

我们想知道 t m 1 m 2 m o d    m 1 m 2 m 3 tm_1m_2\mod m_1m_2m_3 tm1m2modm1m2m3 的结果,只需要知道 t m o d    m 3 t\mod m_3 tmodm3 的结果就行了。计算 t t t 的过程是不爆 l o n g   l o n g \rm long~long long long 的,也不需要龟速乘。

这时候我们只需要保证真实的 x < m 1 m 2 m 3 − m 1 m 2 xx<m1m2m3m1m2 ,那么计算 t m 1 m 2 + k tm_1m_2+k tm1m2+k 得到的就是真实的 x x x 对指定 m o d \rm mod mod 的取模结果。

时间复杂度 O ( K log ⁡ K log ⁡ n ) O(K\log K\log n) O(KlogKlogn)

CODE

#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#pragma GCC optimize(2)
using namespace std;
#define MAXN (1<<16|5)
#define LL long long
#define ULL unsigned long long
#define ENDL putchar('\n')
#define DB double
#define lowbit(x) (-(x) & (x))
#define FI first
#define SE second
#define PR pair<int,int>
#define UIN unsigned int
int xchar() {
	static const int maxn = 1000000;
	static char b[maxn];
	static int pos = 0,len = 0;
	if(pos == len) pos = 0,len = fread(b,1,maxn,stdin);
	if(pos == len) return -1;
	return b[pos ++];
}
// #define getchar() xchar()
LL read() {
	LL f = 1,x = 0;int s = getchar();
	while(s < '0' || s > '9') {if(s<0)return -1;if(s=='-')f=-f;s = getchar();}
	while(s >= '0' && s <= '9') {x = (x<<1) + (x<<3) + (s^48);s = getchar();}
	return f*x;
}
void putpos(LL x) {if(!x)return ;putpos(x/10);putchar((x%10)^48);}
void putnum(LL x) {
	if(!x) {putchar('0');return ;}
	if(x<0) putchar('-'),x = -x;
	return putpos(x);
}
void AIput(LL x,int c) {putnum(x);putchar(c);}

const int MOD = 998244853;
const int M1 = 1012924417,R1 = 5;
const int M2 = 1007681537,R2 = 3;
const int M3 = 1004535809,R3 = 3;
int n,m,s,o,k;
inline void MD(int &x) {if(x>=MOD)x-=MOD;}
int qkpow(int a,LL b) {
	int res = 1;
	while(b > 0) {
		if(b & 1) res = res *1ll* a % MOD;
		a = a *1ll* a % MOD; b >>= 1;
	}return res;
}
int qkpow(int a,int b,int MOD) {
	int res = 1;
	while(b > 0) {
		if(b & 1) res = res *1ll* a % MOD;
		a = a *1ll* a % MOD; b >>= 1;
	}return res;
}
int om,xm[MAXN<<2];
int rev[MAXN<<2];
void NTT(int *s,int n,int op,int MOD,int R) {
	for(int i = 1;i < n;i ++) {
		rev[i] = (rev[i>>1]>>1) | ((i&1) ? (n>>1):0);
		if(rev[i] < i) swap(s[i],s[rev[i]]);
	}
	om = qkpow(R,(MOD-1)/n,MOD); xm[0] = 1;
	if(op < 0) om = qkpow(om,MOD-2,MOD);
	for(int i = 1;i < n;i ++) xm[i] = xm[i-1] *1ll* om % MOD;
	for(int k = 2,t = n>>1;k <= n;k <<= 1,t >>= 1) {
		for(int j = 0;j < n;j += k) {
			for(int i = j,l = 0;i < j+(k>>1);i ++,l += t) {
				int A = s[i],B = s[i+(k>>1)];
				s[i] = (A + xm[l]*1ll*B) % MOD;
				s[i+(k>>1)] = (A +MOD- xm[l]*1ll*B%MOD) % MOD;
			}
		}
	}
	if(op < 0) {
		int invn = qkpow(n,MOD-2,MOD);
		for(int i = 0;i < n;i ++) s[i] = s[i]*1ll*invn % MOD;
	}return ;
}
int a[MAXN<<1],b[MAXN<<1],c[MAXN<<1];
int a_[MAXN<<1],b_[MAXN<<1];
void polymul(int *A,int *B,int le) {
	for(int i = 0;i < le;i ++) a_[i] = A[i],b_[i] = B[i];
	NTT(A,le,1,M1,R1); NTT(B,le,1,M1,R1);
	for(int i = 0;i < le;i ++) a[i] = A[i]*1ll*B[i] % M1;
	for(int i = 0;i < le;i ++) A[i] = a_[i],B[i] = b_[i];
	NTT(a,le,-1,M1,R1);
	NTT(A,le,1,M2,R2); NTT(B,le,1,M2,R2);
	for(int i = 0;i < le;i ++) b[i] = A[i]*1ll*B[i] % M2;
	for(int i = 0;i < le;i ++) A[i] = a_[i],B[i] = b_[i];
	NTT(b,le,-1,M2,R2);
	NTT(A,le,1,M3,R3); NTT(B,le,1,M3,R3);
	for(int i = 0;i < le;i ++) c[i] = A[i]*1ll*B[i] % M3;
	for(int i = 0;i < le;i ++) A[i] = a_[i],B[i] = b_[i];
	NTT(c,le,-1,M3,R3);
	int v1 = qkpow(M2,M1-2,M1);
	int v2 = qkpow(M1,M2-2,M2);
	int v3 = qkpow(M1*1ll*M2%M3,M3-2,M3);
	LL MD = M1*1ll*M2;
	for(int i = 0;i < le;i ++) {
		LL k = (v1*1ll*a[i]%M1*M2 + v2*1ll*b[i]%M2*M1) % MD;
		int t = (c[i]+M3-k%M3) % M3 *1ll* v3 % M3;
		A[i] = (MD % MOD * t % MOD + k) % MOD;
	}
	return ;
}
void polymuls(int *A,int le) {
	for(int i = 0;i < le;i ++) a_[i] = A[i];
	NTT(A,le,1,M1,R1);
	for(int i = 0;i < le;i ++) a[i] = A[i]*1ll*A[i] % M1;
	for(int i = 0;i < le;i ++) A[i] = a_[i];
	NTT(a,le,-1,M1,R1);
	NTT(A,le,1,M2,R2);
	for(int i = 0;i < le;i ++) b[i] = A[i]*1ll*A[i] % M2;
	for(int i = 0;i < le;i ++) A[i] = a_[i];
	NTT(b,le,-1,M2,R2);
	NTT(A,le,1,M3,R3);
	for(int i = 0;i < le;i ++) c[i] = A[i]*1ll*A[i] % M3;
	for(int i = 0;i < le;i ++) A[i] = a_[i];
	NTT(c,le,-1,M3,R3);
	int v1 = qkpow(M2,M1-2,M1);
	int v2 = qkpow(M1,M2-2,M2);
	int v3 = qkpow(M1*1ll*M2%M3,M3-2,M3);
	LL MD = M1*1ll*M2;
	for(int i = 0;i < le;i ++) {
		LL k = (v1*1ll*a[i]%M1*M2 + v2*1ll*b[i]%M2*M1) % MD;
		int t = (c[i]+M3-k%M3) % M3 *1ll* v3 % M3;
		A[i] = (MD % MOD * t % MOD + k) % MOD;
	}
	return ;
}
int A[MAXN],B[MAXN],C[MAXN];
int main() {
	LL N = read(); m = read();
	if(m == 1) {
		return AIput(qkpow(2,N),'\n'),0;
	}
	C[0] = 1; A[0] = 1; A[1] = 1;
	while(N > 0) {
		if(N & 1) {
			polymul(C,A,m);
		}
		for(int i = 0;i < m;i ++) B[i] = A[i];
		polymuls(A,m);
		N >>= 1;
	}
	AIput(C[0],'\n');
	return 0;
}

你可能感兴趣的:(数学,多项式,算法,卷积,组合数学)