寻找素数的并行算法

一.串行算法(筛选法):

输入N。

输出0 到 N之间的所有素数

int A[ N + 1];
Memset(A , 0 , sizeof(A));
int Count = 0;
 
for (int I = 2; I <= N; ++i)
{
         if(A[i] != 0)continue;
         ++Count;
         for(int j = I + I; j <= N; j += i)
                   A[j]= 1;
}
printf(“%d\n” , Count);

上述算法的时间复杂度为O(N * Log(Log(N)));

 

并行算法:

         考虑如何将上面的算法进行并行化,上面的串行算法中有两层循环,第二层循环依赖于第一层的循环结果,在第一层中判断A[i]的状态,必须计算先判断A[ii]的状态即 i是否=Z*ii, Z > 1。因此在筛选法中我们无法将第一层循环进行并行化。在第二层循环中,A[j]的计相对独立,因此我们可以将第二层循环进行并行化。

 

        假设有K个线程, 因此我们可以将for(j= i+i; j<=N; j += i)的计算平均分配到k个线程中,即每个线程计算ceil( ((N-2i)/i + 1)/K ) 个.

         因此上面的算法可以改写成openmp并行的代码。


int A[ N + 1];
Memset(A , 0 , sizeof(A));
int Count = 0;
 
for (int I = 2; I <= N; ++i)
{
         if(A[i] != 0)continue;
         ++Count;
#prama parallel omp for num_threads(k)
         for(int j = I + I; j <= N; j += i)
                   A[j]= 1;
}
printf(“%d\n” , Count);

当然上面第一层循环每次都要创建k个线程,这是一种非常浪费系统资源的方法,可以使用线程池的方法来处理第二层的循环。

 

 

你可能感兴趣的:(分布式与并行计算)