转自:http://blog.csdn.net/dinosoft/article/details/5829550
一般的线性筛法
首先先介绍一般的线性筛法求素数
void make_prime() { memset(prime, 1, sizeof(prime)); prime[0]=false; prime[1]=false; int N=31700; for (int i=2; i<N; i++) if (prime[i]) { primes[++cnt ]=i; for (int k=i*i; k<N; k+=i) prime[k]=false; } return; }
这种方法比较好理解,初始时,假设全部都是素数,当找到一个素数时,显然这个素数乘上另外一个数之后都是合数(注意上面的 i*i , 比 i*2 要快点 ),把这些合数都筛掉,即算法名字的由来。
但仔细分析能发现,这种方法会造成重复筛除合数,影响效率。比如10,在i=2的时候,k=2*15筛了一次;在i=5,k=5*6 的时候又筛了一次。所以,也就有了快速线性筛法。
快速线性筛法
快速线性筛法没有冗余,不会重复筛除一个数,所以“几乎”是线性的,虽然从代码上分析,时间复杂度并不是O(n)。先上代码
#include<iostream> using namespace std; const long N = 200000; long prime[N] = {0},num_prime = 0; int isNotPrime[N] = {1, 1};//先将0,1排除 int main() { for(long i = 2 ; i < N ; i ++) { if(! isNotPrime[i]) //isNotPrime==0 prime[num_prime ++]=i;//自己在前面打好了标记。 //关键处1 /*i为合数时也要参与循环*/ for(long j = 0 ; j < num_prime/*小于已经求出的质数个数*/ && i * prime[j]/*乘以其它质数,且质数比自己小或者是自己(已经求出来了),所以不可能重复*/ < N ; j ++) { isNotPrime[i * prime[j]] = 1;//乘以其它素数得到的一定是合数,之所以不重复是因为质数间不等 if( !(i % prime[j] ) ) //关键处2 i%prime==0 根据“关键处2”的定义,当p1==prime[j] 的时候, //筛除就终止了(从最小质数开始所以本句话成立), break; } } return 0; //我们可以直观地举个例子。i=2*3*5*3,补大 //此时能筛除 2*i ,不能筛除 3*i //如果能筛除3*i 的话,当 i' 等于 i'=3*3*5 加小 时,筛除2*i' 就和前面重复了。(顺序性) }
先,先明确一个条件,任何合数都能表示成一系列素数的积。
不管 i 是否是素数,都会执行到“关键处1”,
①如果 i 都是是素数的话,那简单,一个大的素数 i 乘以不大于 i 的素数,这样筛除的数跟之前的是不会重复的。筛出的数都是 N=p1*p2的形式, p1,p2之间不相等
②如果 i 是合数,此时 i 可以表示成递增素数相乘 i=p1*p2*...*pn, pi都是素数(2<=i<=n), pi<=pj ( i<=j )
p1是最小的系数。
根据“关键处2”的定义,当p1==prime[j] 的时候,筛除就终止了,也就是说,只能筛出不大于p1的质数*i。
我们可以直观地举个例子。i=2*3*5
此时能筛除 2*i ,不能筛除 3*i
如果能筛除3*i 的话,当 i' 等于 i'=3*3*5 时,筛除2*i' 就和前面重复了。
需要证明的东西:
- 一个数会不会被重复筛除。
- 合数肯定会被干掉。
根据上面红字的条件,现在分析一个数会不会被重复筛除。
设这个数为 x=p1*p2*...*pn, pi都是素数(1<=i<=n) , pi<=pj ( i<=j )
当 i = 2 时,就是上面①的情况,
当 i >2 时, 就是上面②的情况, 对于 i ,第一个能满足筛除 x 的数 y 必然为 y=p2*p3...*pn(p2可以与p1相等或不等),而且满足条件的 y 有且只有一个。所以不会重复删除。
证明合数肯定会被干掉? 用归纳法吧。
类比一个模型,比如说我们要找出 n 中2个不同的数的所有组合 { i , j } ,1<=i<=n, 1<=j<=n,
我们会这么写
for (i=1; i<n; ++i )
for (j=i+1; j<=n; ++j)
{
/////
}
我们取 j=i+1 便能保证组合不会重复。快速筛法大概也是这个道理,不过这里比较难理解,没那么直观。