考虑所有 n n n行 m m m列的矩阵,矩阵中每个元素的值都在 1 1 1到 k k k之间。对于这样的矩阵 A A A,按照下面规则构造序列 x 1 , x 2 , ⋯ , x n + m x_1,x_2,\cdots,x_{n+m} x1,x2,⋯,xn+m:
求能构造出多少种不同的序列。
输出答案模 1 0 9 + 7 10^9+7 109+7后的值。
有 T T T组数据。
1 ≤ T ≤ 1000 , ∑ n , ∑ m ≤ 1 0 5 , k ≤ 1 0 9 1\leq T\leq 1000,\sum n,\sum m\leq 10^5,k\leq 10^9 1≤T≤1000,∑n,∑m≤105,k≤109
时间限制 3000 m s 3000ms 3000ms,空间限制 512 M B 512MB 512MB。
首先,我们可以发现, x 1 x_1 x1到 x n x_n xn的最大值要等于 x n + 1 x_{n+1} xn+1到 x n + m x_{n+m} xn+m的最大值。
然而,当 x 1 x_1 x1到 x n x_n xn的最大值和 x n + 1 x_{n+1} xn+1到 x n + m x_{n+m} xn+m的最大值相等时,这个序列一定合法。
为什么呢?我们可以把最大值的列和最大值的行相交的位置填上最大值,在这一行的其他位置填上其他数来满足列的要求,在这一列的其他位置填上其他数来满足行的要求,并在其他位置填 1 1 1,即可构造出这个序列。
我们可以枚举最大值来计算答案。
a n s = ∑ i = 1 k [ i n − ( i − 1 ) n ] × [ i m − ( i − 1 ) m ] ans=\sum\limits_{i=1}^k[i^n-(i-1)^n]\times [i^m-(i-1)^m] ans=i=1∑k[in−(i−1)n]×[im−(i−1)m]
这样做是 O ( k log n ) O(k\log n) O(klogn)的,我们考虑优化。
我们可以发现,这是一个关于 k k k的 n + m n+m n+m次多项式,那么整个和式就是一个关于 k k k的 n + m + 1 n+m+1 n+m+1次多项式。那么,我们计算出前 n + m + 2 n+m+2 n+m+2项之后,用拉格朗日差值法,就可以优化到 O ( n 2 ) O(n^2) O(n2)。
因为差值的时候, i i i的取值是连续的,那么差值的式子为
f ( x ) = ∑ i = 1 N y i ∏ j = 1 , j ≠ i N x − j i − j = ∑ i = 1 N y i × ∏ j = 1 , j ≠ i N x − j ∏ j = 1 , j ≠ i N i − j f(x)=\sum\limits_{i=1}^Ny_i\prod\limits_{j=1,j\neq i}^N\dfrac{x-j}{i-j}=\sum\limits_{i=1}^Ny_i\times \dfrac{\prod\limits_{j=1,j\neq i}^Nx-j}{\prod\limits_{j=1,j\neq i}^Ni-j} f(x)=i=1∑Nyij=1,j=i∏Ni−jx−j=i=1∑Nyi×j=1,j=i∏Ni−jj=1,j=i∏Nx−j
其中 N = n + m + 2 N=n+m+2 N=n+m+2。
对后面的式子,我们考虑如何快速来求。
∏ j = 1 , j ≠ i N i − j = ( ∏ j = 1 i − 1 i − j ) × ( ∏ j = i + 1 N i − j ) = ( i − 1 ) ! × ( N − i ) ! × ( − 1 ) N − i \prod\limits_{j=1,j\neq i}^Ni-j=(\prod_{j=1}^{i-1}i-j)\times (\prod\limits_{j=i+1}^Ni-j)=(i-1)!\times (N-i)!\times (-1)^{N-i} j=1,j=i∏Ni−j=(j=1∏i−1i−j)×(j=i+1∏Ni−j)=(i−1)!×(N−i)!×(−1)N−i
预处理出每个数的阶乘,这部分就可以 O ( 1 ) O(1) O(1)求出。
当 x > N x>N x>N时, ∏ j = 1 , j ≠ i N x − j = ( ∏ j = 1 N x − j ) × 1 x − i \prod\limits_{j=1,j\neq i}^Nx-j=(\prod\limits_{j=1}^Nx-j)\times \dfrac{1}{x-i} j=1,j=i∏Nx−j=(j=1∏Nx−j)×x−i1,其中 ∏ j = 1 N x − j \prod\limits_{j=1}^Nx-j j=1∏Nx−j可以在插值之前 O ( n ) O(n) O(n)求出, 1 x − i \dfrac{1}{x-i} x−i1可以用逆元来求。
当 x ≤ N x\leq N x≤N时,我们一开始已经计算出来了,这部分可以直接输出。
那么,分子就可以 O ( log n ) O(\log n) O(logn)求出。
这样,我们就可以把拉格朗日插值的时间复杂度降到 O ( n log n ) O(n\log n) O(nlogn)。
总时间复杂度为 O ( ∑ n log n ) O(\sum n\log n) O(∑nlogn)。
#include
using namespace std;
const int N=200005;
const long long mod=1e9+7;
int T;
long long n,m,k;
long long ans,x[N+5],y[N+5],jc[N+5];
long long mi(long long t,long long v){
if(!v) return 1;
long long re=mi(t,v/2);
re=re*re%mod;
if(v&1) re=re*t%mod;
return re;
}
void init(){
jc[0]=1;
for(int i=1;i<=N;i++) jc[i]=jc[i-1]*i%mod;
}
long long gt(long long vx){
long long re=0,wt=1;
for(int i=1;i<=n+m+2;i++){
wt=wt*((vx-x[i]+mod)%mod)%mod;
}
for(int i=1;i<=n+m+2;i++){
long long p,q;
p=y[i]*wt%mod*mi((vx-x[i]+mod)%mod,mod-2)%mod;
if(n+m+2-i&1) q=(mod-jc[i-1]*jc[n+m+2-i]%mod)%mod;
else q=jc[i-1]*jc[n+m+2-i]%mod;
re=(re+p*mi(q,mod-2)%mod)%mod;
}
return re;
}
int main()
{
init();
scanf("%d",&T);
while(T--){
scanf("%lld%lld%lld",&n,&m,&k);
ans=0;
for(int i=1;i<=n+m+2;i++){
x[i]=i;
y[i]=(y[i-1]+(mi(i,n)-mi(i-1,n))*(mi(i,m)-mi(i-1,m))%mod+mod)%mod;
}
if(k<=n+m+2) printf("%lld\n",y[k]);
else printf("%lld\n",gt(k));
}
return 0;
}