Cuda C++ Thrust API与 Cuda Runtime API程序比较

今天买了本新书《高性能CUDA应用设计与开发方法与最佳实践》,今天读了第一章有点出获,分享给大家。

程序功能:给向量填充数据并计算各元素之和

1. CPU串行运行的代码:

//seqSerial.cpp:串行执行数组的填充及求和
#include
#include
using namespace std;

int main()
{
 const int N=50000;
 //任务1:创建数组
 vector a(N);
 //任务2:填充数组
 for(int i=0;i //任务3:计算数组各元素之和
 int sumA=0;
 for(int i=0;i  //任务4:计算0-N-1之和
 int sumCheck=0;
 for(int i=0;i  //任务5:检查结果是否正确
 if(sumA==sumCheck) cout<<"Test Succeeded!"<  else {cerr<<"TestFailed!"<  return (0);
}

 2.Cuda Thrust C++ API 程序

#include
using namespace std;

#include
#include
#include
#include

int main()
{
 const int N=50000;
 //任务1:创建数组
 thrust::device_vectora(N);
 //任务2:填充数组,并行运算
 thrust::sequence(a.begin(),a.end(),0);
 //任务3:计算数组元素之和,并行计算
 int sumA=thrust::reduce(a.begin(),a.end(),0);
 //
 int sumCheck=0;
 for(int i=0;i   sumCheck+=i;
 //
 if(sumA==sumCheck)cout<<"Test Succeeded!"<  else
 {
  cerr<<"Test Failed!"<   return(1);
 }
 getchar();
 return (0);
}

 

3.仅对数据填充改为Runtime API 程序

//使用cuda Runtime API完成向数组中填充连续整数
#include
using namespace std;

#include
#include
#include
#include

__global__ void fillKernel(int *a,int n)
{
 int tid=blockIdx.x*blockDim.x+threadIdx.x;
 if(tid }

void fill(int *d_a,int n)
{
 int nThreadsPerBlock=512;
 //int nBlocks=n/nThreadsPerBlock+(n%nThreadsPerBlock)?1:0);
 int nBlocks=(n+nThreadsPerBlock)/nThreadsPerBlock;
 fillKernel<<>>(d_a,n);
}

int main()
{
 const int N=50000;
 //任务1:创建数组
 thrust::device_vectora(N);
 //任务2:填充数组,使用Runtime API 填充数组
 fill(thrust::raw_pointer_cast(&a[0]),N);
 //任务3:计算数组元素之和,并行计算
 int sumA=thrust::reduce(a.begin(),a.end(),0);
 //任务4:计算0-N-1之和
 int sumCheck=0;
 for(int i=0;i   sumCheck+=i;
 //任务5:检查结果的正确性
 if(sumA==sumCheck)cout<<"Test Succeeded!"<  else
 {
  cerr<<"Test Failed!"<   return(1);
 }
 getchar();
 return (0);
}

 

 

你可能感兴趣的:(GPU编程)