转载请注明出处:http://blog.csdn.net/bendanban/article/details/8893944
/*=======================================================================
* 第二天了,打算弄完这个去吃劈柴院的灌汤包,海上起雾了,要是不冷了,去趟只听过没去过的栈桥
* 金刚狼3上映有一段时间了吧,晚上去尝尝。。
=======================================================================*/
我看过cublas的说明文档,它在讲解的时候先从总体上说明cublas的基本存储规则,所以这里,我说几点,这些内容将在实践中具体练习。
上一篇中介绍了如何配置cublas的编译环境,不过要使用cublas,还需要cuda的runtime支持,所以你需要在链接器的依赖项中添加cudart.lib的额外依赖。具体添加方法,与上一篇中方法类似,不再赘述。
另外,源码中使用cuda runtime函数的文件中要添加#include “cuda_runtime.h”
今天我们要实验的库函数是cublasIsamax(...),它要实现的功能是获得某个向量中第一个最大模的索引号,注意这个索引号是从1开始的。
函数原型是:cublasStatus_t cublasIsamax(cublasHandle_t handle, int n, const float *x, int incx, int *result)
参数说明:
此函数返回第一个i,使得 |Im(x[j])| + |Re(x[j])| 为最大值,其中i=1,...,n,并且,j=1 + (i-1)*incx.
代码我贴在了下面
#include <stdio.h> #include <stdlib.h> #include <time.h> #include "cuda_runtime.h" #include "cublas_v2.h" #define DATA_SIZE 1024 #define CUBLAS_ERROR_CHECK(sdata) if(CUBLAS_STATUS_SUCCESS!=sdata){printf("ERROR at:%s:%d\n",__FILE__,__LINE__);exit(-1);} void InitVector(float *vec, int n, int down, int up) { int i; srand((unsigned int)time(NULL)); for (i = 0; i < n; i++) { vec[i] = (float)(rand()%(up-down+1)+down); } return ; } void myIsamax(int n, float *x, int incx, int *result) { int i = 0; *result = 0; for (i = 1; i < n; i+=incx) { if(x[i]>x[*result]) *result=i; } } int main(int argc, char **argv) { cublasHandle_t cubhandle; cublasStatus_t cubStatus = CUBLAS_STATUS_SUCCESS; float *h_datax; float *d_datax; int h_result; int d_result; int data_size = DATA_SIZE; // initialize cublas resource cubStatus = cublasCreate(&cubhandle); CUBLAS_ERROR_CHECK(cubStatus) // allocate memory CPU + GPU h_datax = (float*)malloc(data_size*sizeof(float)); cudaMalloc((void**)&d_datax, data_size*sizeof(float)); // initialize cpu memory InitVector(h_datax, data_size, 0, 100); // copy cpu value to gpu memory cubStatus = cublasSetVector(data_size, sizeof(float), h_datax, 1, d_datax, 1); CUBLAS_ERROR_CHECK(cubStatus) // execute GPU version cubStatus = cublasIsamax(cubhandle, data_size, d_datax, 1, &d_result); CUBLAS_ERROR_CHECK(cubStatus) // execute CPU version myIsamax(data_size, h_datax, 1, &h_result); printf("host : h_datax[%d]=%.2f\n", h_result, h_datax[h_result]); printf("device : d_datax[%d]=%.2f\n", d_result-1, h_datax[d_result-1]); // Free memory free(h_datax);h_datax=0x0; cudaFree(d_datax);d_datax=0x0; cublasDestroy(cubhandle); getchar(); return 0; }
总结
为尽之处,欢迎大家批评指针。