先说一下,这个不是正解。但是也可以过。
题意:有5个数字——0,1,2,3,4,每个数字分别有a0,a1,a2,a3,a4个。问这些数字能组成多少个n位数?
数据范围:a<=30000,n<=15000
时限:6s
分析:
首先n位数肯定是排列,每种数字有很多个,就是多重集,这个就是多重集的排列问题。显然是指数生成函数可以做的。
关于指数生成函数可以看看我前面的生成函数这个课件。
现在有个问题,就是怎么消除前导0?
设W(n,a0,a1,a2,a3,a4) 代表可以有前导0的n位5进制数字,至多ai个数字为i的方案数,那么答案等于W(n,a0,a1,a2,a3,a4)−W(n−1,a0−1,a1,a2,a3,a4),相当于减去一定有前导0的方案数。
这下问题转换成了求多项式 ∏4j=0(∑aji=01i!xi) 第n次项的系数乘以n的阶乘。
这个显然直接ntt就完了。
但是这里有个问题,就是模的数不是费马质数,这个显然直接上ntt不能做。
所以我们可以嘿嘿嘿
找3个1e9左右的费马质数,比如998244353,1005060097,950009857,然后对每个质数都做一次ntt,用CRT合并解。
注意到CRT的过程要把模数乘起来,这样long long不是很资瓷,于是需要手写一个高精度或者int128.
这个题我学会了一个东西就是:在写ntt模任意数的时候,多项式必须两两相乘,因为CRT这里限制了不能把多项式全部ntt然后乘起来变回去。
所以这里还有一个思想,就是启发式合并。对于t个多项式,我们开一个集合维护它们的长度。每次选取最短的两个进行ntt,然后将得到的新多项式塞集合。这样显然比较快。
对于本题,因为t只有5,比较小,所以启发式合并就不需要了,但是也不应该用一个数组保存解,一直乘下去,这样明显不优。应该两个两个地乘,再把每一对的乘积拿来乘。
下面是代码
#include
#include
#include
#include
#define ll long long
using namespace std;
const ll M=131073ll,MOD=1000000007ll,P[3]={998244353ll,1005060097ll,950009857ll},G[3]={3ll,5ll,7ll},Inv[3]={644348675ll,675933219ll,647895261ll};
int n,m,cas,a0,a1,a2,a3,a4;
ll inv[M],fac[M];
inline ll pow(ll x,ll y,ll P)
{
ll re=1;
while(y)
{
if(y&1)re=re*x%P;
x=x*x%P;
y>>=1;
}
return re;
}
struct Int_128{
unsigned long long a,b;
Int_128(ll x){a=0,b=x;}
friend bool operator < (Int_128 x,Int_128 y)
{
return x.a<y.a||x.a==y.a&&x.b<y.b;
}
friend Int_128 operator + (Int_128 x,Int_128 y)
{
Int_128 re(0);
re.a=x.a+y.a+(x.b+y.b<x.b);
re.b=x.b+y.b;
return re;
}
friend Int_128 operator - (Int_128 x,Int_128 y)
{
y.a=~y.a;y.b=~y.b;
return x+y+1;
}
void Div2()
{
b>>=1;b|=(a&1ll)<<63;a>>=1;
}
friend Int_128 operator * (Int_128 x,Int_128 y)
{
Int_128 re=0;
while(y.a||y.b)
{
if(y.b&1)re=re+x;
x=x+x;y.Div2();
}
return re;
}
friend Int_128 operator % (Int_128 x,Int_128 y)
{
Int_128 temp=y;
int cnt=0;
while(temp<x)temp=temp+temp,++cnt;
for(;cnt>=0;cnt--)
{
if(temp<x)x=x-temp;
temp.Div2();
}
return x;
}
};
void ntt(ll*a,int n,int f,int P,int G)
{
for(int i=1,j=0;i1;++i)
{
for(int d=n;j^=d>>=1,~j&d;);
if(ifor(int i=1;i1)
{
ll wn=pow(G,(P-1)/(i<<1),P);
for(int j=0;j1)
{
ll w=1;
for(int k=0;k*wn%P)
{
ll x=a[j+k],y=w*a[j+k+i]%P;
a[j+k]=(x+y)%P;
a[j+k+i]=(x-y+P)%P;
}
}
}
if(f==-1)
{
for(int i=1;i<(n>>1);++i)swap(a[i],a[n-i]);
ll inv=pow(n,P-2,P);
for(int i=0;i*inv%P;
}
}
inline void Polynomial_Multiplication(ll a[],ll b[],ll c[],int n)
{
static ll A[3][M],B[3][M];
for(int j=0;j<3;++j)
{
for(int i=0;i%P[j];
B[j][i]=b[i]%P[j];
}
ntt(A[j],n,1,P[j],G[j]);
ntt(B[j],n,1,P[j],G[j]);
for(int i=0;i*B[j][i]%P[j];
ntt(A[j],n,-1,P[j],G[j]);
}
Int_128 _MOD=Int_128(P[0]*P[1])*P[2];
for(int i=0;i1]*P[2])*Int_128(Inv[0]*A[0][i])+
Int_128(P[0]*P[2])*Int_128(Inv[1]*A[1][i])+
Int_128(P[0]*P[1])*Int_128(Inv[2]*A[2][i]);
c[i]=(temp%_MOD%MOD).b;
}
}
int main()
{
scanf("%d",&cas);
inv[0]=inv[1]=fac[0]=fac[1]=1;
for(int i=2;i<=15000;++i)inv[i]=(MOD-MOD/i)*inv[MOD%i]%MOD,fac[i]=fac[i-1]*i%MOD;
for(int i=2;i<=15000;++i)inv[i]=inv[i]*inv[i-1]%MOD;
static ll A[M],B[M],C[M],D[M],E[M],F[M];
for(int t=1;t<=cas;++t)
{
scanf("%d%d%d%d%d%d",&n,&a0,&a1,&a2,&a3,&a4);
for(int i=0;i<=min(n,a0);++i)A[i]=inv[i];
for(int i=min(n,a0)+1;i<=m;++i)A[i]=0;
for(int i=0;i<=min(n,a1);++i)B[i]=inv[i];
for(int i=min(n,a1)+1;i<=m;++i)B[i]=0;
for(int i=0;i<=min(n,a2);++i)C[i]=inv[i];
for(int i=min(n,a2)+1;i<=m;++i)C[i]=0;
for(int i=0;i<=min(n,a3);++i)D[i]=inv[i];
for(int i=min(n,a3)+1;i<=m;++i)D[i]=0;
for(int i=0;i<=min(n,a4);++i)E[i]=inv[i];
for(int i=min(n,a4)+1;i<=m;++i)E[i]=0;
/*运用了启发式合并的思想,跑了5.1s*/
for(m=1;mm<<=1);
Polynomial_Multiplication(B,C,B,m);
for(m=1;mm<<=1);
Polynomial_Multiplication(D,E,D,m);
for(m=1;mm<<=1);
Polynomial_Multiplication(B,D,B,m);
/*
如果不用启发式合并,直接B数组乘到底,5.8s,已经是卡着过了
for(m=1;m for(m=1;m0 ,n)+min(a1,n)+min(a2,n)+min(a3,n)+min(a4,n);m<<=1);
if(!a0)
{
Polynomial_Multiplication(A,B,F,m);
printf("Case #%d: %I64d\n",t,F[n]*fac[n]%MOD);
}
else
{
Polynomial_Multiplication(A,B,F,m);
ll ans=F[n]*fac[n]%MOD;
A[min(a0,n)]=0;
Polynomial_Multiplication(A,B,F,m);
printf("Case #%d: %I64d\n",t,((ans-F[n-1]*fac[n-1]%MOD)%MOD+MOD)%MOD);
}
}
}