栋栋有一块长方形的地,他在地上种了一种能量植物,这种植物可以采集太阳光的能量。在这些植物采集能量后,栋栋再使用一个能量汇集机器把这些植物采集到的能量汇集到一起。 栋栋的植物种得非常整齐,一共有n列,每列有m棵,植物的横竖间距都一样,因此对于每一棵植物,栋栋可以用一个坐标(x, y)来表示,其中x的范围是1至n,表示是在第x列,y的范围是1至m,表示是在第x列的第y棵。 由于能量汇集机器较大,不便移动,栋栋将它放在了一个角上,坐标正好是(0, 0)。 能量汇集机器在汇集的过程中有一定的能量损失。如果一棵植物与能量汇集机器连接而成的线段上有k棵植物,则能量的损失为2k + 1。例如,当能量汇集机器收集坐标为(2, 4)的植物时,由于连接线段上存在一棵植物(1, 2),会产生3的能量损失。注意,如果一棵植物与能量汇集机器连接的线段上没有植物,则能量损失为1。现在要计算总的能量损失。 下面给出了一个能量采集的例子,其中n = 5,m = 4,一共有20棵植物,在每棵植物上标明了能量汇集机器收集它的能量时产生的能量损失。 在这个例子中,总共产生了36的能量损失。
仅包含一行,为两个整数n和m。
仅包含一个整数,表示总共产生的能量损失。
【样例输入1】
5 4
【样例输入2】
3 4
【样例输出1】
36
【样例输出2】
20
对于100%的数据:1 ≤ n, m ≤ 100,000。
首先,根据题目描述,我们可以得到:
ans=n∗m+2∗∑ni=1∑mj=1(gcd(i,j)−1) a n s = n ∗ m + 2 ∗ ∑ i = 1 n ∑ j = 1 m ( g c d ( i , j ) − 1 )
整理一下:
ans=−n∗m+2∗∑ni=1∑mj=1gcd(i,j) a n s = − n ∗ m + 2 ∗ ∑ i = 1 n ∑ j = 1 m g c d ( i , j )
那么我们只需要求出: ∑ni=1∑mj=1gcd(i,j) ∑ i = 1 n ∑ j = 1 m g c d ( i , j )
枚举 gcd(i,j)=d g c d ( i , j ) = d ,得到式子:
ans=−n∗m+2∗∑min(n,m)d=1∑ni=1∑mj=1[gcd(i,j)==d]∗d a n s = − n ∗ m + 2 ∗ ∑ d = 1 m i n ( n , m ) ∑ i = 1 n ∑ j = 1 m [ g c d ( i , j ) == d ] ∗ d
其中令 f(d)=∑ni=1∑mj=1[gcd(i,j)==d] f ( d ) = ∑ i = 1 n ∑ j = 1 m [ g c d ( i , j ) == d ]
所以 ans=−n∗m+2∗∑min(n,m)d=1d∗f(d) a n s = − n ∗ m + 2 ∗ ∑ d = 1 m i n ( n , m ) d ∗ f ( d )
那么对于 f(d) f ( d ) ,我们将式子除以d,得到:
f(d)=∑⌊nd⌋i=1∑⌊md⌋j=1[gcd(i,j)==1] f ( d ) = ∑ i = 1 ⌊ n d ⌋ ∑ j = 1 ⌊ m d ⌋ [ g c d ( i , j ) == 1 ]
然后再把 [gcd(i,j)==1] [ g c d ( i , j ) == 1 ] 转化一下:
f(d)=∑⌊nd⌋i=1∑⌊md⌋j=1∑min(⌊nd⌋,⌊md⌋)p=1μ(p) f ( d ) = ∑ i = 1 ⌊ n d ⌋ ∑ j = 1 ⌊ m d ⌋ ∑ p = 1 m i n ( ⌊ n d ⌋ , ⌊ m d ⌋ ) μ ( p )
然后把对p的枚举甩到前面:
f(d)=∑min(⌊nd⌋,⌊md⌋)p=1μ(p)∑⌊nd⌋p|i∑⌊md⌋p|j1 f ( d ) = ∑ p = 1 m i n ( ⌊ n d ⌋ , ⌊ m d ⌋ ) μ ( p ) ∑ p | i ⌊ n d ⌋ ∑ p | j ⌊ m d ⌋ 1
所以:
f(d)=∑min(⌊nd⌋,⌊md⌋)p−1μ(p)⌊nd∗p⌋⌊md∗p⌋ f ( d ) = ∑ p − 1 m i n ( ⌊ n d ⌋ , ⌊ m d ⌋ ) μ ( p ) ⌊ n d ∗ p ⌋ ⌊ m d ∗ p ⌋
所以原式转化成:
ans=−n∗m+2∗∑min(n,m)d=1d∗∑min(⌊nd⌋,⌊md⌋)p=1μ(p)⌊nd∗p⌋⌊md∗p⌋ a n s = − n ∗ m + 2 ∗ ∑ d = 1 m i n ( n , m ) d ∗ ∑ p = 1 m i n ( ⌊ n d ⌋ , ⌊ m d ⌋ ) μ ( p ) ⌊ n d ∗ p ⌋ ⌊ m d ∗ p ⌋
对于d的枚举,我们采取朴素方法,对于对k的枚举,我们线性预处理 μ μ 函数的前缀和然后进行下底函数分块计算
总效率: O(nsqrt(n)) O ( n s q r t ( n ) )
#include
using namespace std;
#define LL long long
#define N 100010
LL n,m,tot=0,ans=0;
LL pri[N],mu[N],F[N];
bool mark[N]={0};
void init(){
mu[1]=1;
for(int i=2;iif(!mark[i])pri[++tot]=i,mu[i]=-1;
for(int j=1;j<=tot&&pri[j]*i*i]=1;
if(i%pri[j]==0){
mu[i*pri[j]]=0;
break;
}else mu[i*pri[j]]=-mu[i];
}
}
for(int i=1;i1]+mu[i];
}
LL solve(int d){
LL res=0,n1=n/d,m1=m/d,up=min(n1,m1);
for(int i=1,j;i<=up;i=j+1){
j=min(n1/(n1/i),m1/(m1/i));
res+=(F[j]-F[i-1])*(n1/i)*(m1/i);
}
return res*d;
}
int main(){
init();
scanf("%lld%lld",&n,&m);
int up=min(n,m);
for(int i=1;i<=up;i++)ans+=solve(i);
ans*=2;
ans-=n*m;
printf("%lld",ans);
return 0;
}
但是我们发现这样做似乎不是最优秀的
然后定义 k=d∗p k = d ∗ p
转换一下:
ans=−n∗m+2∗∑min(n,m)d=1d∑min(n,m)d|kμ(k/d)⌊nk⌋⌊mk⌋ a n s = − n ∗ m + 2 ∗ ∑ d = 1 m i n ( n , m ) d ∑ d | k m i n ( n , m ) μ ( k / d ) ⌊ n k ⌋ ⌊ m k ⌋
把k提到前面枚举:
ans=−n∗m+2∗∑min(n,m)k=1∑min(n,m)d|kdμ(k/d)⌊nk⌋⌊mk⌋ a n s = − n ∗ m + 2 ∗ ∑ k = 1 m i n ( n , m ) ∑ d | k m i n ( n , m ) d μ ( k / d ) ⌊ n k ⌋ ⌊ m k ⌋
ans=−n∗m+2∗∑min(n,m)k=1∑min(n,m)d|kkdμ(d)⌊nk⌋⌊mk⌋ a n s = − n ∗ m + 2 ∗ ∑ k = 1 m i n ( n , m ) ∑ d | k m i n ( n , m ) k d μ ( d ) ⌊ n k ⌋ ⌊ m k ⌋
ans=−n∗m+2∗∑min(n,m)k=1⌊nk⌋⌊mk⌋∑min(n,m)d|kkdμ(d) a n s = − n ∗ m + 2 ∗ ∑ k = 1 m i n ( n , m ) ⌊ n k ⌋ ⌊ m k ⌋ ∑ d | k m i n ( n , m ) k d μ ( d )
然后我们发现 ∑min(n,m)d|kkdμ(d) ∑ d | k m i n ( n , m ) k d μ ( d ) 是可以线性筛的
时间复杂度 O(n)预处理+O(sqrt(n))查询 O ( n ) 预 处 理 + O ( s q r t ( n ) ) 查 询
#include
using namespace std;
#define LL long long
#define N 100010
LL n,m,tot=0,ans=0;
LL pri[N],mu[N],F[N];
bool mark[N]={0};
void init(){
mu[1]=1;
for(int i=2;iif(!mark[i])pri[++tot]=i,mu[i]=-1;
for(int j=1;j<=tot&&pri[j]*i*i]=1;
if(i%pri[j]==0){
mu[i*pri[j]]=0;
break;
}else mu[i*pri[j]]=-mu[i];
}
}
for(int i=1;ifor(int j=1;j*i*j]+=mu[i]*j;
for(int i=1;i1];
}
int main(){
init();
scanf("%lld%lld",&n,&m);
int up=min(n,m);
for(int i=1,j;i<=up;i=j+1){
j=min(n/(n/i),m/(m/i));
ans+=(F[j]-F[i-1])*(n/i)*(m/i);
}
ans*=2;
ans-=n*m;
printf("%lld",ans);
return 0;
}
然后我们发现可能代码2比代码1慢?为什么呢?
因为预处理的时候失去了线性的性质
但是当查询很多的时候代码优势就得以凸显
各取所需吧