神仙题。
我们考虑一下一个特定的数对(A,B),原来在A位置和在B位置的数在k次交换之后,会在哪些位置。可以发现,如果它们没有落在A位置和B位置,落在其他位置的概率是一样的,那么我们把所有其他位置都记做C位置。
初始状态是(A,B),现在我们要算出结束状态分别是(A,B),(C,A),(B,A),(C,B),(A,C),(B,C),(C,C)的方案数。
考虑矩阵乘法,可以构造转移矩阵表示一次交换操作之后到达某个状态的方案数。
行代表起始状态列表示终止状态,从0号到6号状态分别是(A,B),(C,A),(B,A),(C,B),(A,C),(B,C),(C,C),转移矩阵应该是:
似乎还要额外考虑一下 n n 比较小的情况?但是反正过了我就懒得管了=。=
#include
using namespace std;
#define RI register int
int read() {
int q=0;char ch=' ';
while(ch<'0'||ch>'9') ch=getchar();
while(ch>='0'&&ch<='9') q=q*10+ch-'0',ch=getchar();
return q;
}
typedef long long LL;
const int mod=1000000007,N=500005;
int n,K,inv,inv2,ans,w[N];LL tr[3][N];
struct matrix{int t[7][7];}re,X;
int qm(int x) {return x>=mod?x-mod:x;}
int ksm(int x,int y) {
int re=1;
for(;y;y>>=1,x=1LL*x*x%mod) if(y&1) re=1LL*re*x%mod;
return re;
}
matrix operator * (matrix a,matrix b) {
matrix c;
for(RI i=0;i<7;++i)
for(RI j=0;j<7;++j) {
c.t[i][j]=0;
for(RI k=0;k<7;++k)
c.t[i][j]=qm(c.t[i][j]+1LL*a.t[i][k]*b.t[k][j]%mod);
}
return c;
}
void build() {//矩阵乘法
for(RI i=0;i<7;++i) re.t[i][i]=1;
for(RI i=0;i<7;++i) X.t[i][i]=1LL*(n-2)*(n-3)%mod*inv2%mod;
X.t[0][1]=n-2,X.t[0][2]=1,X.t[0][5]=n-2;
X.t[1][0]=1,X.t[1][1]=qm(X.t[1][1]+n-3),X.t[1][3]=X.t[1][4]=1,X.t[1][6]=n-3;
X.t[2][0]=1,X.t[2][3]=X.t[2][4]=n-2;
X.t[3][1]=X.t[3][2]=1,X.t[3][3]=qm(X.t[3][3]+n-3),X.t[3][5]=1,X.t[3][6]=n-3;
X.t[4][1]=X.t[4][2]=1,X.t[4][4]=qm(X.t[4][4]+n-3),X.t[4][5]=1,X.t[4][6]=n-3;
X.t[5][0]=1,X.t[5][3]=X.t[5][4]=1,X.t[5][5]=qm(X.t[5][5]+n-3),X.t[5][6]=n-3;
X.t[6][1]=X.t[6][3]=X.t[6][4]=X.t[6][5]=1,X.t[6][6]=(X.t[6][6]+n+n-7)%mod;
for(RI i=K;i;i>>=1,X=X*X) if(i&1) re=re*X;
}
#define lowbit(x) (x&(-x))
void add(int o,int x,LL num) {
while(x<=n) tr[o][x]=qm(tr[o][x]+num),x+=lowbit(x);
}
LL query(int o,int x) {
LL re=0;
while(x) re=qm(re+tr[o][x]),x-=lowbit(x);
return re;
}
int main()
{
n=read(),K=read();
for(RI i=1;i<=n;++i) w[i]=read();
inv=ksm(n-2,mod-2),inv2=ksm(2,mod-2),build();
LL sumf=0,sumg=0;
for(RI i=1;i<=n;++i) {
LL a=query(0,w[i]),b=i-1-a;
LL fa=query(1,w[i]),fb=sumf-fa;
LL ga=query(2,w[i]),gb=sumg-ga;
ans=qm(ans+1LL*b*re.t[0][0]%mod);
ans=qm(ans+1LL*(a*(n-i)%mod+b*(i-2)%mod)%mod*re.t[0][1]%mod*inv%mod);
ans=qm(ans+1LL*a*re.t[0][2]%mod);
ans=qm(ans+1LL*(fb+ga)%mod*re.t[0][3]%mod*inv%mod);
ans=qm(ans+1LL*(a*(i-2)%mod+b*(n-i)%mod)%mod*re.t[0][4]%mod*inv%mod);
ans=qm(ans+1LL*(gb+fa)%mod*re.t[0][5]%mod*inv%mod);
sumf+=(LL)(i-1),sumg+=(LL)(n-i-1);
add(0,w[i],1),add(1,w[i],i-1),add(2,w[i],n-i-1);
}
ans=qm(ans+1LL*n*(n-1)%mod*inv2%mod*inv2%mod*re.t[0][6]%mod);
printf("%d\n",ans);
return 0;
}