【算法/数论】欧拉筛法详解:过程详述、正确性证明、复杂度证明

文章目录

      • 一、什么是筛法
      • 二、欧拉筛法详解
      • 三、欧拉筛法正确性的证明
      • 四、欧拉筛法时间复杂度的证明

一、什么是筛法

筛法就是求出小于等于 n n n的所有素数的方法,在数论中发挥着很大的作用。

二、欧拉筛法详解

筛法进行复杂度优化,所采用的一个惯用思路是:找到一个素数后,就将它的倍数标记为合数,也就是把它的倍数“筛掉”;如果一个数没有被比它小的素数“筛掉”,那它就是素数。欧拉筛法的大致思路也是如此,就是其中有些细节有差异。欧拉筛法拥有线性的复杂度,而且编码较简单,应用十分广泛。

我们先给出代码:

bool isprime[MAXN]; // isprime[i]表示i是不是素数
int prime[MAXN]; // 现在已经筛出的素数列表
int n; // 上限,即筛出<=n的素数
int cnt; // 已经筛出的素数个数

void euler()
{
    memset(isprime, true, sizeof(isprime)); // 先全部标记为素数
    isprime[1] = false; // 1不是素数
    for(int i = 2; i <= n; ++i) // i从2循环到n(外层循环)
    {
        if(isprime[i]) prime[++cnt] = i;
        // 如果i没有被前面的数筛掉,则i是素数
        for(int j = 1; j <= cnt && i * prime[j] <= n; ++j)
        // 筛掉i的素数倍,即i的prime[j]倍
        // j循环枚举现在已经筛出的素数(内层循环)
        {
            isprime[i * prime[j]] = false;
            // 倍数标记为合数,也就是i用prime[j]把i * prime[j]筛掉了
            if(i % prime[j] == 0) break;
            // 最神奇的一句话,如果i整除prime[j],退出循环
            // 这样可以保证线性的时间复杂度
        }
    }
}

假设要筛出n以内的素数。我们先把所有数标记为素数。枚举i2n,所以因为i是从小到大的,如果i没有被前面的数(比它小的数)标记为合数,那i就是素数,加入素数列表。现在用i来筛后面的数,枚举已经筛出来的素数prime[j]j=1~cnt),标记i * prime[j]为素数,当iprime[j]的倍数时退出循环,i++

思路很简单,也很莫名其妙。首先我们看似无法保证每个合数都被筛掉,也无法保证复杂度为线性(因为有两层循环)。要解决这些问题,必须经过深入的思考。

三、欧拉筛法正确性的证明

假设我们要筛掉数 a a a,且 a a a的最小质因数为 p 1 p_1 p1,令 a = p 1 b a=p_1b a=p1b。那么显然 b < a bb<a b b b先被外层循环碰到。现在 b b b要筛掉它的倍数。因为 p 1 p_1 p1 a a a的最小质因数,所以 b b b的最小质因数必不小于 p 1 p_1 p1,这样就保证 b b b筛掉 a a a前不会在if(i % prime[j] == 0) break;处跳出循环。即使 b b b的最小质因数等于 p 1 p_1 p1,也会先筛掉 a a a后再退出循环。令 a a a等于全体合数,就保证了每个合数都会被筛掉。

四、欧拉筛法时间复杂度的证明

欧拉筛法的时间、空间复杂度为 Θ ( n ) \Theta(n) Θ(n)。空间复杂度是显然的。下面证明时间复杂度为线性。

我们的核心就是要证明一个合数只会被筛掉一次,即标记isprime[它]=1一次。首先,对于 a = p 1 b a=p_1b a=p1b b b b当然只会筛掉 a a a一次,因为我们从小到大枚举prime[j],也就是说b * prime[j]递增,因此不可能遇到 a a a两次。会不会有其他的数筛掉 a a a呢?假设 a a a又被 c c c筛掉了,其中 a = c p x a=cp_x a=cpx p x p_x px就是 c c c用来筛掉 a a aprime[j]
①若 c > b c>b c>b,则 p x < p 1 p_xpx<p1,与 p 1 p_1 p1 a a a最小的质因数矛盾,假设不成立;
②若 c < b cc<b,则 p x > p 1 p_x>p_1 px>p1,这意味着 p 1 p_1 p1 c c c的质因数。那么 c c c从小到大筛掉它的素数倍,在筛到 c p 1 cp_1 cp1时就break了,所以根本轮不到 a a a

综上所述,每个数都只会被筛掉一次,再加上外层的i的循环是线性复杂度,总的时间复杂度是线性的。

感性地理解:一开始i很小的时候一次能筛掉很多素数,后面超过 n 2 \frac n2 2n之后就几乎不用做什么事情了。所以虽然有两层循环,把每次循环加起来还是线性的复杂度。


这个算法远远没有埃拉托斯特尼筛法直观,需要细细品味。不过背过板子就好啦。

你可能感兴趣的:(数据结构与算法,OI,数学,c++,经验分享,算法)