【OpenCL学习】在Visual Studios上永久配置OpenCL库环境(Intel)

要写并行的大作业,连VS都是头一次用的小白昨天花了一上午学习怎么配置OpenCL。_(:з」∠)_

可以说这篇教程是对新手蛮友好的~

(一)查看自己电脑的显卡配置支不支持OpenCL

我的电脑用的是intel的显卡,具体查看方式:桌面右键 → 英特尔显卡设置 → 选项与支持

【OpenCL学习】在Visual Studios上永久配置OpenCL库环境(Intel)_第1张图片


(二)下载OpenCL

英特尔https://software.intel.com/en-us/intel-opencl/download

我这里下载安装完成后默认路径是C:\Intel\OpenCL


(三)配置OpenCL库环境

1. 打开Visual Studio2013 → 新建 → Win32控制台应用程序 → 命名opencl → 确定

2. 打开属性页

视图 → 其他窗口 → 属性管理器

【OpenCL学习】在Visual Studios上永久配置OpenCL库环境(Intel)_第2张图片

在右侧的属性管理器窗口右键点击Microsoft.Cpp.Win32.user → 属性

【OpenCL学习】在Visual Studios上永久配置OpenCL库环境(Intel)_第3张图片


3. 配置库文件

3.1 配置CL目录

将OpenCL的SDK的头文件包含到项目中:

C/C++ → 常规 → 附加包含目录 → 编辑 → 添加CL文件夹的目录

我的目录是C:\Intel\OpenCL\sdk\include

【OpenCL学习】在Visual Studios上永久配置OpenCL库环境(Intel)_第4张图片


【OpenCL学习】在Visual Studios上永久配置OpenCL库环境(Intel)_第5张图片


3.2 配置预处理器

C/C++ → 预处理器 → 预处理器定义 → 编辑 → 添加"_CRT_SECURE_NO_WARNINGS"

这是为了避免编译的时候对某些函数报错。

【OpenCL学习】在Visual Studios上永久配置OpenCL库环境(Intel)_第6张图片


3.3 配置外部依赖OpenCL.lib目录

链接器 → 常规 → 附加库目录 → 编辑 → 添加OpenCL.lib所在的目录

这里需要注意的是,32位平台和64位平台的目录是不同的。

我这里的解决方案平台是Win32,目录是C:\Intel\OpenCL\sdk\lib\x86

如果是Win64,目录则是C:\Intel\OpenCL\sdk\lib\x64

同时将启用增量链接设置为否:

链接器 → 常规 → 启用增量链接 → 编辑 → 否

【OpenCL学习】在Visual Studios上永久配置OpenCL库环境(Intel)_第7张图片


3.4 配置OpenCL.lib文件

链接器 → 输入 → 附加依赖项 → 编辑 → 添加“OpenCL.lib”

【OpenCL学习】在Visual Studios上永久配置OpenCL库环境(Intel)_第8张图片


4. 保存

配置完成后,右键点击Microsoft.Cpp.Win32.user → 保存Microsoft.Cpp.Win32.user

保存成功之后,下次新建项目就不需要再配置OpenCL了。

【OpenCL学习】在Visual Studios上永久配置OpenCL库环境(Intel)_第9张图片


(四)用OpenCL运行一个HelloWorld程序

1. 新建一个空项目:文件 → 新建 → 项目 → Visual C++ → 空项目

【OpenCL学习】在Visual Studios上永久配置OpenCL库环境(Intel)_第10张图片


2. 新建两个文件:文件 → 新建 → 文件 → Visual C++ → C++ 文件(.cpp)

第一个是主函数文件(内容同附录1),存为.cpp格式

第二个是OpenCL核函数文件(内容同附录2),存为.cl格式

这里将主函数命名为源1.cpp,核函数命名为HelloWorld_Kernel.cl

【OpenCL学习】在Visual Studios上永久配置OpenCL库环境(Intel)_第11张图片


3. 添加源文件

视图 → 解决方案资源管理器

【OpenCL学习】在Visual Studios上永久配置OpenCL库环境(Intel)_第12张图片

在右侧的小窗口,

右键点击源文件 → 添加 → 现有项 → 源1.cpp

右键点击源文件 → 添加 → 现有项 HelloWorld_Kernel.cl

【OpenCL学习】在Visual Studios上永久配置OpenCL库环境(Intel)_第13张图片


4. 编译运行

源1.cpp文件中点击“本地Windows调试器”编译运行。


5.运行结果

【OpenCL学习】在Visual Studios上永久配置OpenCL库环境(Intel)_第14张图片


6.附录

附录1 源1.cpp

// OpenCl-1.cpp : Defines the entry point for the console application.
//
//#include "stdafx.h" 项目属性c/c++预编译头里本来就有
#include 
#include 
#include 
#include 
#include 
#include 
#include 

using namespace std;

#pragma warning( disable : 4996 )//宏定义,避免报错。
                                 //因为在OpenCL2.0中clCreateCommandQueue()已经被弃用了 

cl_int ConvertToString(const char *pFileName, std::string &str);

int _tmain(int argc, _TCHAR* argv[])
{
	cl_int			iStatus = 0;				// 函数返回状态
	cl_uint			uiNumPlatforms = 0;				// 平台个数
	cl_platform_id	Platform = NULL;				// 选择的平台
	size_t			uiSize = 0;				// 平台版本名字字节数	
	cl_int			iErr = 0;				// 返回参数
	char			*pName = NULL;				// 平台版本名
	cl_uint			uiNumDevices = 0;				// 设备数量
	cl_device_id	*pDevices = NULL;				// 设备
	cl_context		Context = NULL;				// 设备环境
	cl_command_queue	CommandQueue = NULL;			// 命令队列
	const char		*pFileName = "HelloWorld_Kernel.cl";	// cl文件名
	string			strSource = "";				// 用于存储cl文件中的代码
	const char		*pSource;							// 代码字符串指针
	size_t			uiArrSourceSize[] = { 0 };			// 代码字符串长度
	cl_program		Program = NULL;				// 程序对象
	const char		*pInput = "gdkknvnqkc";		// 输入字符串
	size_t			uiStrlength = strlen(pInput);	// 输入字符串长度
	char			*pOutput = NULL;				// 输出字符串
	cl_mem			memInutBuffer = NULL;				// 输入内存对象
	cl_mem			memOutputBuffer = NULL;				// 输出内存对象
	cl_kernel		Kernel = NULL;				// 内核对象
	size_t			uiGlobal_Work_Size[1] = { 0 };		// 用于设定内核分布	


	//-------------------1. 获得并选择可用平台-----------------------------
	// 查询可用的平台个数,并返回状态
	iStatus = clGetPlatformIDs(0, NULL, &uiNumPlatforms);
	if (CL_SUCCESS != iStatus)
	{
		cout << "Error: Getting platforms error" << endl;
		return 0;
	}


	// 获得平台地址
	if (uiNumPlatforms > 0)  // 如果有可用平台
	{
		// 根据平台数为平台分配内存空间
		cl_platform_id *pPlatforms = (cl_platform_id *)malloc(uiNumPlatforms * sizeof(cl_platform_id));

		// 获得可用的平台
		iStatus = clGetPlatformIDs(uiNumPlatforms, pPlatforms, NULL);
		Platform = pPlatforms[0];	// 获得第一个平台的地址
		free(pPlatforms);			// 释放平台占用的内存空间
	}

	// 获得平台版本名
	// 获得平台版本名的字节数
	iErr = clGetPlatformInfo(Platform, CL_PLATFORM_VERSION, 0, NULL, &uiSize);

	// 根据字节数为平台版本名分配内存空间
	pName = (char *)alloca(uiSize * sizeof(char));

	// 获得平台版本名字
	iErr = clGetPlatformInfo(Platform, CL_PLATFORM_VERSION, uiSize, pName, NULL);
	cout << pName << endl;



	//--------------2. 查询GPU设备,并选择可用设备------------------------
	// 获得GPU设备数量
	iStatus = clGetDeviceIDs(Platform, CL_DEVICE_TYPE_GPU, 0, NULL, &uiNumDevices);
	if (0 == uiNumDevices)	// 如果没有GPU设备
	{
		cout << "No GPU device available." << endl;
		cout << "Choose CPU as default device." << endl;

		// 选择CPU作为设备,获得设备数
		iStatus = clGetDeviceIDs(Platform, CL_DEVICE_TYPE_CPU, 0, NULL, &uiNumDevices);

		// 为设备分配空间
		pDevices = (cl_device_id *)malloc(uiNumDevices * sizeof(cl_device_id));

		// 获得平台
		iStatus = clGetDeviceIDs(Platform, CL_DEVICE_TYPE_CPU, uiNumDevices, pDevices, NULL);
	}
	else
	{
		pDevices = (cl_device_id *)malloc(uiNumDevices * sizeof(cl_device_id));

		iStatus = clGetDeviceIDs(Platform, CL_DEVICE_TYPE_GPU, uiNumDevices, pDevices, NULL);
	}


	// -------------------3.创建设备环境---------------------------------
	// 创建设备环境
	Context = clCreateContext(NULL, 1, pDevices, NULL, NULL, NULL);
	if (NULL == Context)
	{
		cout << "Error: Can not create context" << endl;
		return 0;
	}

	// -------------------4.创建命令队列--------------------------------------
	// 创建第1个设备的命令队列
	CommandQueue = clCreateCommandQueue(Context, pDevices[0], 0, NULL);
	if (NULL == CommandQueue)
	{
		cout << "Error: Can not create CommandQueue" << endl;
		return 0;
	}


	// ----------------------5. 创建程序对象------------------------------
	// 将cl文件中的代码转为字符串
	iStatus = ConvertToString(pFileName, strSource);

	pSource = strSource.c_str();			// 获得strSource指针
	uiArrSourceSize[0] = strlen(pSource);	// 字符串大小

	// 创建程序对象
	Program = clCreateProgramWithSource(Context, 1, &pSource, uiArrSourceSize, NULL);
	if (NULL == Program)
	{
		cout << "Error: Can not create program" << endl;
		return 0;
	}


	// -----------------------------6. 编译程序--------------------------------
	// 编译程序
	iStatus = clBuildProgram(Program, 1, pDevices, NULL, NULL, NULL);
	if (CL_SUCCESS != iStatus)	// 编译错误
	{
		cout << "Error: Can not build program" << endl;
		char szBuildLog[16384];
		clGetProgramBuildInfo(Program, *pDevices, CL_PROGRAM_BUILD_LOG, sizeof(szBuildLog), szBuildLog, NULL);

		cout << "Error in Kernel: " << endl << szBuildLog;
		clReleaseProgram(Program);

		return 0;
	}

	//-------------------------7. 并创建输入输出内核内存对象--------------------------------

	// 创建输入内存对象
	memInutBuffer = clCreateBuffer(
		Context,
		CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,  // 输入内存为只读,并可以从宿主机内存复制到设备内存
		(uiStrlength + 1) * sizeof(char),		  // 输入内存空间大小
		(void *)pInput,
		NULL);

	// 创建输出内存对象
	memOutputBuffer = clCreateBuffer(
		Context,
		CL_MEM_WRITE_ONLY,					// 输出内存只能写
		(uiStrlength + 1) * sizeof(char),	// 输出内存空间大小
		NULL,
		NULL);

	if ((NULL == memInutBuffer) || (NULL == memOutputBuffer))
	{
		cout << "Error creating memory objects" << endl;
		return 0;
	}

	//--------------------------8. 创建内核对象-------------------------------------
	Kernel = clCreateKernel(Program,
		"helloworld",  // cl文件中的入口函数
		NULL);
	if (NULL == Kernel)
	{
		cout << "Error: Can not create kernel" << endl;
		return 0;
	}



	//----------------------------9. 设置内核参数----------------------------------
	iStatus = clSetKernelArg(Kernel,
		0,		// 参数索引
		sizeof(cl_mem),
		(void *)&memInutBuffer);

	iStatus |= clSetKernelArg(Kernel, 1, sizeof(cl_mem), (void *)&memOutputBuffer);

	if (CL_SUCCESS != iStatus)
	{
		cout << "Error setting kernel arguments" << endl;
	}



	// --------------------------10.运行内核---------------------------------
	uiGlobal_Work_Size[0] = uiStrlength;  // 输入字符串大小

	// 利用命令队列使将再设备上执行的内核排队
	iStatus = clEnqueueNDRangeKernel(
		CommandQueue,
		Kernel,
		1,
		NULL,
		uiGlobal_Work_Size,  // 确定内核在设备上的多个处理单元间的分布
		NULL,				 // 确定内核在设备上的多个处理单元间的分布
		0,
		NULL,
		NULL);


	if (CL_SUCCESS != iStatus)
	{
		cout << "Error: Can not run kernel" << endl;
		return 0;
	}

	// ----------------------------11. 将输出读取到主机内存
	pOutput = (char *)malloc(uiStrlength + 1);  // uiStrlength 为 输入字符串长度

	iStatus = clEnqueueReadBuffer(
		CommandQueue,		// 命令队列
		memOutputBuffer,	// 输出内存对象
		CL_TRUE,			// 内核读取结束之前该函数不会返回
		0,
		uiStrlength * sizeof(char),
		pOutput,
		0,
		NULL,
		NULL);

	if (CL_SUCCESS != iStatus)
	{
		cout << "Error: Can not reading result buffer" << endl;
		return 0;
	}


	// ---------------------12--输出计算结果---------------
	pOutput[uiStrlength] = '\0';
	cout << "Input String:" << endl;
	cout << pInput << endl;
	cout << "Output String:" << endl;
	cout << pOutput << endl;


	// -------------------------------13. 释放资源--------------------------------
	iStatus = clReleaseKernel(Kernel);
	iStatus = clReleaseProgram(Program);
	iStatus = clReleaseMemObject(memInutBuffer);
	iStatus = clReleaseMemObject(memOutputBuffer);
	iStatus = clReleaseCommandQueue(CommandQueue);
	iStatus = clReleaseContext(Context);

	if (NULL != pOutput)
	{
		free(pOutput);
		pOutput = NULL;
	}

	if (NULL != pDevices)
	{
		free(pDevices);
		pDevices = NULL;
	}

	system("pause");//避免执行完闪退
	return 0;
}

// 将cl文件代码转为字符串
cl_int ConvertToString(const char *pFileName, std::string &Str)
{
	size_t		uiSize = 0;
	size_t		uiFileSize = 0;
	char		*pStr = NULL;
	std::fstream fFile(pFileName, (std::fstream::in | std::fstream::binary));


	if (fFile.is_open())
	{
		fFile.seekg(0, std::fstream::end);
		uiSize = uiFileSize = (size_t)fFile.tellg();  // 获得文件大小
		fFile.seekg(0, std::fstream::beg);
		pStr = new char[uiSize + 1];

		if (NULL == pStr)
		{
			fFile.close();
			return 0;
		}

		fFile.read(pStr, uiFileSize);				// 读取uiFileSize字节
		fFile.close();
		pStr[uiSize] = '\0';
		Str = pStr;

		delete[] pStr;

		return 0;
	}

	cout << "Error: Failed to open cl file\n:" << pFileName << endl;

	return -1;
}

附录2 HelloWorld_Kernel.cl

__kernel void helloworld(__global char *pIn, __global char *pOut)
{
	int iNum = get_global_id(0);
	pOut[iNum] = pIn[iNum] + 1;
}

你可能感兴趣的:(教程)