阳光开朗男孩

OpenCL编程指南-7缓冲区和子缓冲区

内存对象、缓冲区、子缓冲概述

OpenCL内存对象的分配对应于一个上下文，这个上下文可能有一个或多个相关联的设备。内存对象对这个上下文中的所有设备都是全局可见的。不过，由于OpenCL定义了一个宽松的内存模型，所以对一个内存对象的所有写操作并非对同一个缓冲区的后续读操作都可见。

通过观察可以明确这一点，与其他设备命令类似，读、写内存对象时将把一个与特定设备相关的命令入队。可以将内存对象的读/写标记为阻塞，这会阻塞宿主机线程，直到排队的命令完成为止，这样写至一个特定设备的内存对与特定上下文相关的所有设备都可见，或者所读的内存已经完全读回宿主机内存。如果读/写命令未阻塞，宿主机线程可能会在排队的命令完成之前返回，则应用程序不能假设所读/写的内存已经准备就绪可以使用。

在这种情况下，宿主机应用程序必须使用以下OpenCL同步原语之一来确保命令已经完成：
1）cl_int clFinish(cl_command_queue queue)，这里的queue是特定的命令队列，读/写命令会在这个命令队列中排队。clFinish会阻塞，直到 queue中所有未结束的命令都已经完成。
2）cl_int clwaitForEvents(cl_uint num_events, const cl _event *event_list)，这里的event_list至少包含与特定读/写相关联的入队命令所返回的事件。clwaitForEvents 会阻塞，直到与event_list中相应事件相关联的所有命令都已经完成。

对于与不同上下文关联的OpenCL内存对象，只能与同一个上下文中创建的其他对象一同使用。例如，不能用不同上下文创建的命令队列完成读/写操作。由于上下文的创建特别针对一个特定的平台，所以不可能创建不同平台设备之间共享的内存对象。如果一个应用程序要使用系统中的所有OpenCL设备，那么在这种情况下，当管理数据时，需要通过宿主机内存空间向给定上下文以及在上下文之间复制数据。

创建缓冲区和子缓冲区

缓冲区（buffer）：1维字节数组。缓冲区对象是1维的内存资源，可以包含标量、矢量或用户定义的数据类型。缓冲区对象使用以下函数创建：

cl_mem clCreateBuffer(cl_context context,
                      cl_mem_flags flags,
                      size_t size,
                      void *host_ptr,
                      cl_int *errcode_ref)

context 一个合法的上下文对象，要为这个上下文分配缓冲区

flags 这是一个位域，用于指定关于缓冲区创建的分配和使用信息。flags可取的合法值由枚举cl_mem_flags定义

size 所分配的缓冲区大小（字节数）

host_ptr 这是一个数据指针，由应该程序分配; 这个指针在clCreateBuffer调用中如何使用由flags参数确定, host_ptr指向的数据大小至少为请求分配的大小, 也就是说, >=size字节

errode_ret 如果是非NULL, 函数返回的错误码将由这个参数返回

cl_mem_flags支持的合法值

CL_MEM_READ_WRITE        指定内存对象将由内核读写。
                         如果没有给定任何其他修饰符，则认为这个模式是默认模式

CL_MEM_WRITE_ONLY        指定内存对象将由内核写，但不能读。
                         对于使用CL_MEM_WRITE_ONLY创建的缓冲区或其他内存对象（如图像)，
                         在内核中读取这些内存对象的行为是未定义的

CL_MEM_USE_HOST_PTR      只有当host_ptr为非 NULL时，这个标志才合法。
                         如果指定了这个标志，表示就用程序看望OpenCL实现使用host_ptr引用的内存作为内存对象的存储位

CL_MEM_ALLOC_HOST_PTR    指定缓冲区应当在宿主机可访问的内存中分配。
                         不能同时使用CL_MEM_ALLOC_HOST_PTR 和CL_MEM_USEHOST_PTR

CL_MEM_COPY_HOST_PTR     如果指定了这个标志，表示应用程序希望OpenCL实现分配内存对象的内存，并从host_ptr引用的内存复制数据。
                         不能同时使用CL_MEM_CoPY_HOST_PTR和CL_MEM_USE_HOST_PTR
                         对于使用宿主机可访间的（例如，PCIe）内存分配的内存对象，可以结合使用CL_MEM_COPY_HOST_PTR和CL_MEM_ALLOC_HOST_PTR初始化这些内存对象的内容。
                         只有当host_ptr为非NULL时, 这个标志才合法

与其他内核参数类似，也使用函数clSetKernelArg将缓冲区作为参数传递到内核，在内核中定义为全局地址空间中一个期望数据类型的指针。下面的代码给出了一些简单的例子，展示如何创建缓冲区，以及如何用它来设置内核参数：

#define NUM_BUFFER_ELEMENTS 100
cl_int errNum;
cl_context;
cl_kernel kernel;
cl_command_queue queue;
float inputOutput[NUM_BUFFER_ELEMENTS];
cl_mem buffer;

//place code to create context, kernel, and command-queue here
//initialize inputOutput
buffer = clCreateBuffer(context,
                        CL_MEM_READ_WRITE | CL_MEM_COPY_HOST_PTR,
                        sizeof(float) * NUM_BUFFER_ELEMENTS,
                        &errNum);
//check for errors
errNum = setKernelArg(kernel, 0, sizeof(buffer), &buffer);

下面的内核定义给出一个简单例子，指出如何指定内核的缓冲区参数：

__kernel void square(__global float *buffer)
{
     size_t id = get_global_id(0);
     buffer[id] = buffer[id] * buffer[id];
}

进一步推广，将内核square完成的工作划分到与一个特定上下文关联的所有设备，clEnqueueNDRangeKernel的偏移量参数可以用来计算缓冲区中的偏移量。下面的代码展示了如何完成这个工作：

#define NUM_BUFFER_ELEMENTS 100
cl_int errNum;
cl_uint numDevices;
cl_device_id *deviceIDs;
cl_context;
cl_kernel kernel;
std::vector<cl_command_queue> queues;
float *inputOutput;
cl_mem buffer;

//place code to create context, kernel, and command-queue here
//initialize inputOutput

buffer = clCreateBuffer(context,
                        CL_MEM_READ_WRITE | CL_MEM_COPY_HOST_PTR,
                        sizeof(float) *NUM_BUFFER_ELEMENTS,
                        inputOutput,
                        &errNum);

//check for errors
errNum = setKernelArg(kernel, 0, sizeof(buffer), &buffer);
//Create a command-queue for each device
for(int i = 0; i < numDevices; i++)
{
     cl_command_queue queue = clCreateCommandQueue(context,
                                                   deviceIDs[i],
                                                   0,
                                                   &errNum);
     queues.push_back(queue);
}
//Submit kernel enqueue to each queue
for(int i = 0; i < queues.size(); i++)
{
     cl_command_queue = clCreateCommandQueue(context,
                                             deviceIDs[i],
                                             0,
                                             &errNum);
     queues.push_back(queue);
}
//Submit kernel enqueue to each queue
for(int i = 0; i < queues.size(); i++)
{
     cl_event event;
     size_t gWI = NUM_BUFFER_ELEMENTS;
     size_t offset = i * NUM_BUFFER_ELEMENTS * sizeof(int);

     errNum = clEnqueueNDRangeKernel(queues[i],
                                     kernel,
                                     1,
                                     (const size_t*)&offset,
                                     (const size_t*)&gWI,
                                     (const size_t*)NULL,
                                     0,
                                     0,
                                     &event);
     events.push_back(event); 
}
//wait for commands to complete
clWaitForEvents(events.size(), events.data());

还可以采用一种更一般的方法，将缓冲区上完成的工作进一步划分，使用子缓冲区来完成。子缓冲区为一个特定缓冲区提供一个视图，例如，允许开发人员将一个缓冲区划分为可以独立处理的小块。子缓冲区纯粹是一个软件抽象，可以用子缓冲区完成的工作都可以利用缓冲区并明确指定偏移量来完成。子缓冲区增加了一层模块性，如果只使用缓冲区则很难表述这一层抽象。与前面介绍的方法相比，子缓冲区的优点在于：子缓冲区使用的接口只需要缓冲区，而无需额外了解偏移值等信息。例如，考虑一个库接口，它设计为需要一个OpenCL缓冲区对象，不过总假设第一个元素偏移量为0。在这种情况下，如果不修改库的源代码，就无法使用前面介绍的方法。子缓冲区则为这个问题提供了一个解决方案。

子缓冲区不能从其他子缓冲区构建3。子缓冲区使用以下函数创建：

cl_mem clCreateSubBuffer(cl_mem buffer,
                         cl_mem_flags flags,
                         cl_buffer_create_type buffer_create_type,
                         const void *buffer_create_info,
                         cl_int *errcode_ref)

buffer 一个合法的缓冲区对象，不能是之前分配的一个子缓冲区

flags 这是一个位域，用于指定关于缓冲区创建的分配和使用信息。
      flags可取的合法值由枚举cl_mem_flags定义。

buffer_create_type 与buffer_create_info结合共同描述所要创建的缓冲区对象的类型
                   buffer_create_type可取的合法值由枚举cl_buffer_create_type定义

buffer_create_info 与buffer_create_info结合共同描述所要创建的缓冲区对象的类型

errcode_ret 如果为非NULL,函数返回的错误码将由这个参数返回

clCreateSubBuffer支持的名和值

cl_buffer_create_type
CL_BUFFER_CREATE_TYPE_REGION    创建一个缓冲区对象，表示buffer中一个特定的区域
                                buffer_create_info是以下结构的指针
                                typedef struct _cl_buffer_region {
                                     size_t origin;
                                     size_t size;
                                }cl_buffer_region;

CL_BUFFER_CREATE_TYPE_REGION    (origin,size)定义了buffer中的偏移量和大小(字节数)
                                 如果使用CL_MEM_USE_HOST_PTR创建buffer,与所返回缓冲区对象关联的host_ptr为host_ptr *origin
                                 返回的缓冲区对象会引用为buffer分配的数据存储库,并指向这个数据存储库中(origin,size)指定的一个特定区域
                                 如果(origin, size)指定的区域超出buffer,errcode_ret返回CL_INVALID_VALUE
                                 如果size为0,errcode_ret返回CL_INVALID_BUFFER_SIZE
                                 对于origin值与CL_DEVICE_MEM_BASE_ADDR_ALIGN值对齐的buffer,
                                 如果与这个buffer关联的上下文中没有设备,errcode_ret返回CL_MISALIGNED_SUB_BUFFER_OFFSET

再来看看前面的例子，下面的代码展示了如何将一个缓冲区划分到多个设备上：

#define NUM_BUFFER_ELEMENTS 100
cl_int errNum;
cl_uint numDevices;
cl_device_id *deviceIDs;
cl_context;
cl_kernel kernel;
std::vector<cl_command_queue> queues;
std::vector<cl_mem> buffers;
float *inputOutput;
cl_mem buffer;

//place code to create context, kernel, and command-queue here
//initialize inputOutput
buffer = clCreate(context,
                  CL_MEM_READ_WRITE | CL_MEM_COPY_HOST_PTR,
                  sizeof(float) *NUM_BUFFER_ELEMENTS,
                  inputOutput,
                  &errNum);
                  
buffers.push_back(buffer);
//Create command-queues
for(int i = 0; i < numDevices; i++)
{
     cl_command_queue queue = clCreateCommandQueue(context,
                                                   deviceIDs[i],
                                                   0,
                                                   &errNum);
     queues.push_back(queue);
     cl_kernel kernel = clCreateKernel(program,
                                       "square",
                                       &errNum);
    
     errNum = clSetKernelArg(kernel,
                             0,
                             sizeof(cl_mem),
                             (void *)&buffers[i]);
     
     kernels.push_back(kernel);
}
std::vector<cl_event> events;
//call kernel fo each device
for(int i = 0; i < queues.size(); i++)
{
     cl_event event;
     size_t gWI = NUM_BUFFER_ELEMENTS;
     errNum = clEnqueueNDRangeKernel(queues[i],
                                     kernels[i],
                                     1,
                                     NULL,
                                     (const size_t*)&gWI,
                                     (const size_t*)NULL,
                                     0,
                                     0,
                                     &event);
     events.push_back(event);
}
//Wait for commands submitted to complete
clWaitForEvents(events.size(), events.data());

与其他OpenCL对象类似，缓冲区和子缓冲区对象也有引用计数，下面两个操作将使引用计数递增和递减。

下面的例子将使一个缓冲区的引用计数递增：

cl_int clRetainMemObject(cl_mem buffer)
buffer 一个合法的缓冲区对象

下面的例子使一个缓冲区的引用计数递减：

cl_int clReleaseMemObject(cl_mem buffer)
buffer 一个合法的缓冲区对象

引用计数为0时，OpenCL实现会释放与这个缓冲区或子缓冲区关联的内存。一旦实现已经释放了一个缓冲区或子缓冲区的资源，程序中就不能再引用这个对象了。

例如，要正确地释放上一个子缓冲区例子中的OpenCL缓冲区资源，可以使用以下代码：

for(int i = 0; i < buffers.size(); i++)
{
     buffers.clReleaseMemObject(buffers[i]);
}

查询缓冲区和子缓冲区

与其他OpenCL对象类似，可以查询缓冲区和子缓冲区，返回它们如何构建、当前状态(例如引用计数）等有关信息。可以使用以下命令完成缓冲区和子缓冲区查询：

cl_int clGetMemObjectInfo(cl_mem buffer,
                          cl_mem_info param_name,
                          size_t param_value_size,
                          void *param_value,
                          size_t *param_value_size_ret)

buffer 要读取的一个合法的缓冲区对象
param_name 这是一个枚举，用来指定要查询的信息。
           param_name可取的合法值由枚举cl_mem_info定义
param_value_size param_value指向的内存的字节数。这个大小必须大于或等于返回类型的大小
param_value 这是一个内存指针，所查询的值将由这里返回。如果值为NULL，则忽略这个参数
param_value_size_ret 查询写至param_value的总字节数

OpenCL缓冲区和子缓冲区查询

cl_mem_info

CL_MEM_TYPE                      cl_mem_object_type   对于缓冲区和子缓冲区，返回CL_MEM_OBJECT_BUFFER
CL_MEM_FLAGS                     cl_mem_flage         返回缓冲区创建期间指定的flags域值
CL_MEM_SIZE                      size_t               返回与缓冲区关联的数据存储库的大小（字节数）
CL_MEM_HOST_PTR                  void*                返回创建缓冲区时指定的host_ptr参数，对于子缓冲区，则返回host_ptr *origin
CL_MEM_MAP_COUNT                 cl_uint              返回一个整数，表示当前映射缓冲区的次数
CL_MEM_REFERENCE_COUNT           cl_uint              返回一个整数，表示缓冲区的当前引用计数
CL_MEM_CONTEXT                   cl_context           返回创建缓冲区的OpenCL上下文对象
CL_MEM_ASSOCIATED_MEMOBJECT      cl_mem               对于一个子缓冲区，则返回创建子缓冲区的缓冲区，否则返回NULL
CL_MEM_OFFSET                    size_t               对于一个子缓冲区，返回偏移量，否则结果为0

下面的代码给出一个简单的例子，展示了如何查询一个内存对象以确定它是一个缓冲区还是另外某种OpenCL内存对象类型：

cl_int errNum;
cl_mem memory;
cl_mem_object_type type;
//initialize memory object and so on
errNum = clGetMemObjectInfo(memory,
                            CL_MEM_TYPE,
                            sizeof(cl_mem_object_type),
                            &type,
                            NULL);
switch(type)
{
     case CL_MEM_OBJECT_BUFFER:
     {
           //handle case when object is buffer or sub-buffer
           break;
     }
     case CL_MEM_OBJECT_IMAGE2D:
     case CL_MEM_OBJECT_IMAGE3D:
     {
          //handle case when object is a 2D or 3D image
          break;
     }
     default
     //something very bad has happened
     break;
}

读、写和复制缓冲区和子缓冲区

缓冲区和子缓冲区可以由宿主机应用程序读、写，将数据移入或移出宿主机内存。下面的命令使一个写命令人队，将宿主机内存中的内容复制到一个缓冲区区域中：

cl_int clEnqueueWriteBuffer(cl_command_queue command_queue,
                            cl_mem buffer,
                            cl_bool blocking_write,
                            size_t offset,
                            size_t cb,
                            void *ptr,
                            cl_uint num_events_in_wait_list,
                            const cl_event *event_wait_list,
                            cl_event *event)

command_queue 这是一个命令队列，写命令将在这个队列中排队
buffer 一个合法的缓冲区对象(数据将从这个缓冲区读取)

blocking_write 如果设置为CL_TRUE,则clEnqueueWriteBuffer阻塞,直至从ptr写数据，
               否则，直接返回，用户必须查询event来检查命令的状态

offset 缓冲区对象中写数据的起始偏移量（字节数）
cb 从缓冲区读取的字节数
ptr 宿主机内存中的一个指针，指示所写的数据从哪里读取

num_events_in_wait_list 数组event_wait_list中的项数。如果event_wait_list为NULL,这个参数必须为0，否则必须大于0

event_wait_list 如果为非NULL,则event_wait_list是一个事件数组，与必须完成的OpenCL命令关联。
                也就是说，在开始执行写命令之前，这些命令必须处于CL_COMPLETE状态

event 如果为非NULL,则函数返回的对应写命令的事件将由这个参数返回

继续完成之前的缓冲区例子，不过并非在缓冲区创建时从宿主机指针复制数据，下面的代码能实现同样的行为：

cl_mem buffer = clCreateBuffer(context,
                               CL_MEM_READ_WRITE,
                               sizeof(int)*NUM_BUFFER_ELEMENTS*numDevices,
                               NULL,
                               &errNum);
//code to create sub-buffers, command-queues, and so on
//write data to buffer zero using command-queue zero
clEnqueueWriteBuffer(queues[0],
                     buffers[0],
                     CL_TRUE,
                     0,
                     sizeof(int)*NUM_BUFFER_ELEMENTS*numDevices,
                     (void*)inputOutput,
                     0,
                     NULL,
                     NULL);

以下命令使一个读命令入队，将一个缓冲区对象中的内容复制到宿主机内存中：

cl_int clEnquueReadBuffer(cl_command_queue command_queue,
                          cl_mem buffer,
                          cl_bool blocking_read,
                          size_t offset,
                          size_t cb,
                          void *ptr,
                          cl_uint num_events_in_wait_list,
                          const cl_event *event_wait_list,
                          cl_event *event)

command_queue 这是一个命令队列，读命令将在这个队列中排队
buffer 一个合法的缓冲区对象（数据将从这个缓冲区读取）

blocking_read 如果设置为CL_TRUE，则clEnqueueReadBuffer阻塞，直至数据读入ptr
              否则直接返回，用户必须查询event来检查命令的状态

offset 缓冲区对象中读数据的起始偏移地址（字节数）
cb 从缓冲区读取的字节数
ptr 宿主机内存中的一个指针，指示所读的数据写至哪里

num_events_in_wait_list 数组event_wait_lis中的项数。如果event_wait_list为NULL,则这个参数必须为0;否则，必须大于0

event_wait_list 如果为非NULL,则event_wait_list是一个事件数组，与必须完成的OpenCL命令关联。
                也就是说，在开始执行读命令之前，这些命令必须处于CL_COMPLETE状态

event 如果为非NULL,则函数返回的对应读命令的事件将由这个参数返回

继续考虑缓冲区例子，下面的示例代码将读回并显示运行square内核的结果：

//Read back computed dat
clEnqueueReadBuffer(queues[0],
                    buffers[0],
                    CL_TRUE,
                    0,
                    sizeof(int)*NUM_BUFFER_ELEMENTS*numDevices,
                    (void*)inputOutput,
                    0,
                    NULL,
                    NULL);
//Display output in rows
for(unsigned i = 0; i < numDevices; i++)
{
     for(unsigned elems = i*NUM_BUFFER_ELEMEMNTS; elems < (i+1)*NUM_BUFFER_ELEMENTS; elems++)
     {
           std::cout << " " << inputOutput[elems];
     }
     std::cout << std::endl;
}

创建和读、写缓冲区和子缓冲区示例内核代码

__kernel void square(__global int *buffer)
{
     const size_t id = get_global_id(0);
     buffer[id] = buffer[id] * buffer[id];
}

创建和读、写缓冲区和子缓冲区示例代码
info.hpp

#ifndef __INFO_HDR__
#define __INFO_HDR__

// info.hpp
// Simple C++ code to abstract clGetInfo*, described in chapter 3.

#if defined(linux) || defined(__APPLE__) || defined(__MACOSX)
# include 
#endif // linux

#ifdef __APPLE__
#include 
#else
#include 
#endif

///
// Display information for a particular platform.
// Assumes that all calls to clGetPlatformInfo returns
// a value of type char[], which is valid for OpenCL 1.1.
//
static void DisplayPlatformInfo(
	cl_platform_id id, 
	cl_platform_info name,
	std::string str)
{
	cl_int errNum;
	std::size_t paramValueSize;

	errNum = clGetPlatformInfo(
		id,
		name,
		0,
		NULL,
		&paramValueSize);
	if (errNum != CL_SUCCESS)
	{
		std::cerr << "Failed to find OpenCL platform " << str << "." << std::endl;
		return;
	}

	char * info = (char *)alloca(sizeof(char) * paramValueSize);
	errNum = clGetPlatformInfo(
		id,
		name,
		paramValueSize,
		info,
		NULL);
	if (errNum != CL_SUCCESS)
	{
		std::cerr << "Failed to find OpenCL platform " << str << "." << std::endl;
		return;
	}

	std::cout << "\t" << str << ":\t" << info << std::endl; 
}

template<typename T>
void appendBitfield(T info, T value, std::string name, std::string & str)
{
	if (info & value) 
	{
		if (str.length() > 0)
		{
			str.append(" | ");
		}
		str.append(name);
	}
}		

///
// Display information for a particular device.
// As different calls to clGetDeviceInfo may return
// values of different types a template is used. 
// As some values returned are arrays of values, a templated class is
// used so it can be specialized for this case, see below.
//
template <typename T>
class InfoDevice
{
public:
	static void display(
		cl_device_id id, 
		cl_device_info name,
		std::string str)
	{
		cl_int errNum;
		std::size_t paramValueSize;

		errNum = clGetDeviceInfo(
			id,
			name,
			0,
			NULL,
			&paramValueSize);
		if (errNum != CL_SUCCESS)
		{
			std::cerr << "Failed to find OpenCL device info " << str << "." << std::endl;
			return;
		}

		T * info = (T *)alloca(sizeof(T) * paramValueSize);
		errNum = clGetDeviceInfo(
			id,
			name,
			paramValueSize,
			info,
			NULL);
		if (errNum != CL_SUCCESS)
		{
			std::cerr << "Failed to find OpenCL device info " << str << "." << std::endl;
			return;
		}

		// Handle a few special cases
		switch (name)
		{
		case CL_DEVICE_TYPE:
			{
				std::string deviceType;

				appendBitfield<cl_device_type>(
					*(reinterpret_cast<cl_device_type*>(info)),
					CL_DEVICE_TYPE_CPU, 
					"CL_DEVICE_TYPE_CPU", 
					deviceType);

				appendBitfield<cl_device_type>(
					*(reinterpret_cast<cl_device_type*>(info)),
					CL_DEVICE_TYPE_GPU, 
					"CL_DEVICE_TYPE_GPU", 
					deviceType);

				appendBitfield<cl_device_type>(
					*(reinterpret_cast<cl_device_type*>(info)),
					CL_DEVICE_TYPE_ACCELERATOR, 
					"CL_DEVICE_TYPE_ACCELERATOR", 
					deviceType);

				appendBitfield<cl_device_type>(
					*(reinterpret_cast<cl_device_type*>(info)),
					CL_DEVICE_TYPE_DEFAULT, 
					"CL_DEVICE_TYPE_DEFAULT", 
					deviceType);

				std::cout << "\t\t" << str << ":\t" << deviceType << std::endl;
			}
			break;
		case CL_DEVICE_SINGLE_FP_CONFIG:
			{
				std::string fpType;
				
				appendBitfield<cl_device_fp_config>(
					*(reinterpret_cast<cl_device_fp_config*>(info)),
					CL_FP_DENORM, 
					"CL_FP_DENORM", 
					fpType); 

				appendBitfield<cl_device_fp_config>(
					*(reinterpret_cast<cl_device_fp_config*>(info)),
					CL_FP_INF_NAN, 
					"CL_FP_INF_NAN", 
					fpType); 

				appendBitfield<cl_device_fp_config>(
					*(reinterpret_cast<cl_device_fp_config*>(info)),
					CL_FP_ROUND_TO_NEAREST, 
					"CL_FP_ROUND_TO_NEAREST", 
					fpType); 

				appendBitfield<cl_device_fp_config>(
					*(reinterpret_cast<cl_device_fp_config*>(info)),
					CL_FP_ROUND_TO_ZERO, 
					"CL_FP_ROUND_TO_ZERO", 
					fpType); 

				appendBitfield<cl_device_fp_config>(
					*(reinterpret_cast<cl_device_fp_config*>(info)),
					CL_FP_ROUND_TO_INF, 
					"CL_FP_ROUND_TO_INF", 
					fpType); 

				appendBitfield<cl_device_fp_config>(
					*(reinterpret_cast<cl_device_fp_config*>(info)),
					CL_FP_FMA, 
					"CL_FP_FMA", 
					fpType); 

				appendBitfield<cl_device_fp_config>(
					*(reinterpret_cast<cl_device_fp_config*>(info)),
					CL_FP_SOFT_FLOAT, 
					"CL_FP_SOFT_FLOAT", 
					fpType); 

				std::cout << "\t\t" << str << ":\t" << fpType << std::endl;
			}
		case CL_DEVICE_GLOBAL_MEM_CACHE_TYPE:
			{
				std::string memType;
				
				appendBitfield<cl_device_mem_cache_type>(
					*(reinterpret_cast<cl_device_mem_cache_type*>(info)), 
					CL_NONE, 
					"CL_NONE", 
					memType); 
				appendBitfield<cl_device_mem_cache_type>(
					*(reinterpret_cast<cl_device_mem_cache_type*>(info)), 
					CL_READ_ONLY_CACHE, 
					"CL_READ_ONLY_CACHE", 
					memType); 

				appendBitfield<cl_device_mem_cache_type>(
					*(reinterpret_cast<cl_device_mem_cache_type*>(info)), 
					CL_READ_WRITE_CACHE, 
					"CL_READ_WRITE_CACHE", 
					memType); 

				std::cout << "\t\t" << str << ":\t" << memType << std::endl;
			}
			break;
		case CL_DEVICE_LOCAL_MEM_TYPE:
			{
				std::string memType;
				
				appendBitfield<cl_device_local_mem_type>(
					*(reinterpret_cast<cl_device_local_mem_type*>(info)), 
					CL_GLOBAL, 
					"CL_LOCAL", 
					memType);

				appendBitfield<cl_device_local_mem_type>(
					*(reinterpret_cast<cl_device_local_mem_type*>(info)), 
					CL_GLOBAL, 
					"CL_GLOBAL", 
					memType);
				
				std::cout << "\t\t" << str << ":\t" << memType << std::endl;
			}
			break;
		case CL_DEVICE_EXECUTION_CAPABILITIES:
			{
				std::string memType;
				
				appendBitfield<cl_device_exec_capabilities>(
					*(reinterpret_cast<cl_device_exec_capabilities*>(info)), 
					CL_EXEC_KERNEL, 
					"CL_EXEC_KERNEL", 
					memType);

				appendBitfield<cl_device_exec_capabilities>(
					*(reinterpret_cast<cl_device_exec_capabilities*>(info)), 
					CL_EXEC_NATIVE_KERNEL, 
					"CL_EXEC_NATIVE_KERNEL", 
					memType);
				
				std::cout << "\t\t" << str << ":\t" << memType << std::endl;
			}
			break;
		case CL_DEVICE_QUEUE_PROPERTIES:
			{
				std::string memType;
				
				appendBitfield<cl_device_exec_capabilities>(
					*(reinterpret_cast<cl_device_exec_capabilities*>(info)), 
					CL_QUEUE_OUT_OF_ORDER_EXEC_MODE_ENABLE, 
					"CL_QUEUE_OUT_OF_ORDER_EXEC_MODE_ENABLE", 
					memType);

				appendBitfield<cl_device_exec_capabilities>(
					*(reinterpret_cast<cl_device_exec_capabilities*>(info)), 
					CL_QUEUE_PROFILING_ENABLE, 
					"CL_QUEUE_PROFILING_ENABLE", 
					memType);
				
				std::cout << "\t\t" << str << ":\t" << memType << std::endl;
			}
			break;
		default:
			std::cout << "\t\t" << str << ":\t" << *info << std::endl;
			break;
		}
	}
};

///
// Simple trait class used to wrap base types.
//
template <typename T>
class ArrayType
{
public:
	static bool isChar() { return false; }
};

///
// Specialized for the char (i.e. null terminated string case).
//
template<>
class ArrayType<char>
{
public:
	static bool isChar() { return true; }
};

///
// Specialized instance of class InfoDevice for array types.
//
template <typename T>
class InfoDevice<ArrayType<T> >
{
public:
	static void display(
		cl_device_id id, 
		cl_device_info name,
		std::string str)
	{
		cl_int errNum;
		std::size_t paramValueSize;

		errNum = clGetDeviceInfo(
			id,
			name,
			0,
			NULL,
			&paramValueSize);
		if (errNum != CL_SUCCESS)
		{
			std::cerr 
				<< "Failed to find OpenCL device info " 
				<< str 
				<< "." 
				<< std::endl;
			return;
		}

		T * info = (T *)alloca(sizeof(T) * paramValueSize);
		errNum = clGetDeviceInfo(
			id,
			name,
			paramValueSize,
			info,
			NULL);
		if (errNum != CL_SUCCESS)
		{
			std::cerr 
				<< "Failed to find OpenCL device info " 
				<< str 
				<< "." 
				<< std::endl;
			return;
		}

		if (ArrayType<T>::isChar())
		{
			std::cout << "\t" << str << ":\t" << info << std::endl; 
		}
		else if (name == CL_DEVICE_MAX_WORK_ITEM_SIZES)
		{
			cl_uint maxWorkItemDimensions;

			errNum = clGetDeviceInfo(
				id,
				CL_DEVICE_MAX_WORK_ITEM_DIMENSIONS,
				sizeof(cl_uint),
				&maxWorkItemDimensions,
				NULL);
			if (errNum != CL_SUCCESS)
			{
				std::cerr 
					<< "Failed to find OpenCL device info " 
					<< "CL_DEVICE_MAX_WORK_ITEM_DIMENSIONS." 
					<< std::endl;
				return;
			}
		
			std::cout << "\t" << str << ":\t" ; 
			for (cl_uint i = 0; i < maxWorkItemDimensions; i++)
			{
				std::cout << info[i] << " "; 
			}
			std::cout << std::endl;
		}
	}
};

#endif __INFO_HDR__

main.cpp

#include 
#include 
#include 
#include 
#include 

#include "info.hpp"

#define DEFAULT_PLATFORM 0
#define DEFAULT_USE_MAP false

#define NUM_BUFFER_ELEMENTS 16

// Function to check and handle OpenCL errors
inline void
checkErr(cl_int err, const char* name)
{
	if (err != CL_SUCCESS) {
		std::cerr << "ERROR: " << name << " (" << err << ")" << std::endl;
		exit(EXIT_FAILURE);
	}
}

///
//	main() for simple buffer and sub-buffer example
//
int main(int argc, char** argv)
{
	cl_int errNum;
	cl_uint numPlatforms;
	cl_uint numDevices;
	cl_platform_id* platformIDs;
	cl_device_id* deviceIDs;
	cl_context context;
	cl_program program;
	std::vector<cl_kernel> kernels;
	std::vector<cl_command_queue> queues;
	std::vector<cl_mem> buffers;
	int* inputOutput;

	int platform = DEFAULT_PLATFORM;
	bool useMap = DEFAULT_USE_MAP;

	std::cout << "Simple buffer and sub-buffer Example" << std::endl;

	for (int i = 1; i < argc; i++)
	{
		std::string input(argv[i]);

		if (!input.compare("--platform"))
		{
			input = std::string(argv[++i]);
			std::istringstream buffer(input);
			buffer >> platform;
		}
		else if (!input.compare("--useMap"))
		{
			useMap = true;
		}
		else
		{
			std::cout << "usage: --platform n --useMap" << std::endl;
			return 0;
		}
	}


	// First, select an OpenCL platform to run on.  
	errNum = clGetPlatformIDs(0, NULL, &numPlatforms);
	checkErr(
		(errNum != CL_SUCCESS) ? errNum : (numPlatforms <= 0 ? -1 : CL_SUCCESS),
		"clGetPlatformIDs");

	platformIDs = (cl_platform_id*)alloca(
		sizeof(cl_platform_id) * numPlatforms);

	std::cout << "Number of platforms: \t" << numPlatforms << std::endl;

	errNum = clGetPlatformIDs(numPlatforms, platformIDs, NULL);
	checkErr(
		(errNum != CL_SUCCESS) ? errNum : (numPlatforms <= 0 ? -1 : CL_SUCCESS),
		"clGetPlatformIDs");

	std::ifstream srcFile("simple.cl");
	checkErr(srcFile.is_open() ? CL_SUCCESS : -1, "reading simple.cl");

	std::string srcProg(
		std::istreambuf_iterator<char>(srcFile),
		(std::istreambuf_iterator<char>()));

	const char* src = srcProg.c_str();
	size_t length = srcProg.length();

	deviceIDs = NULL;
	DisplayPlatformInfo(
		platformIDs[platform],
		CL_PLATFORM_VENDOR,
		"CL_PLATFORM_VENDOR");

	errNum = clGetDeviceIDs(
		platformIDs[platform],
		CL_DEVICE_TYPE_ALL,
		0,
		NULL,
		&numDevices);
	if (errNum != CL_SUCCESS && errNum != CL_DEVICE_NOT_FOUND)
	{
		checkErr(errNum, "clGetDeviceIDs");
	}

	deviceIDs = (cl_device_id*)alloca(sizeof(cl_device_id) * numDevices);
	errNum = clGetDeviceIDs(
		platformIDs[platform],
		CL_DEVICE_TYPE_ALL,
		numDevices,
		&deviceIDs[0],
		NULL);
	checkErr(errNum, "clGetDeviceIDs");

	cl_context_properties contextProperties[] =
	{
		CL_CONTEXT_PLATFORM,
		(cl_context_properties)platformIDs[platform],
		0
	};

	context = clCreateContext(
		contextProperties,
		numDevices,
		deviceIDs,
		NULL,
		NULL,
		&errNum);
	checkErr(errNum, "clCreateContext");

	// Create program from source
	program = clCreateProgramWithSource(
		context,
		1,
		&src,
		&length,
		&errNum);
	checkErr(errNum, "clCreateProgramWithSource");

	// Build program
	errNum = clBuildProgram(
		program,
		numDevices,
		deviceIDs,
		"-I.",
		NULL,
		NULL);
	if (errNum != CL_SUCCESS)
	{
		// Determine the reason for the error
		char buildLog[16384];
		clGetProgramBuildInfo(
			program,
			deviceIDs[0],
			CL_PROGRAM_BUILD_LOG,
			sizeof(buildLog),
			buildLog,
			NULL);

		std::cerr << "Error in OpenCL C source: " << std::endl;
		std::cerr << buildLog;
		checkErr(errNum, "clBuildProgram");
	}

	// create buffers and sub-buffers
	inputOutput = new int[NUM_BUFFER_ELEMENTS * numDevices];
	for (unsigned int i = 0; i < NUM_BUFFER_ELEMENTS * numDevices; i++)
	{
		inputOutput[i] = i;
	}

	// create a single buffer to cover all the input data
	cl_mem buffer = clCreateBuffer(
		context,
		CL_MEM_READ_WRITE,
		sizeof(int) * NUM_BUFFER_ELEMENTS * numDevices,
		NULL,
		&errNum);
	checkErr(errNum, "clCreateBuffer");
	buffers.push_back(buffer);

	// now for all devices other than the first create a sub-buffer
	for (unsigned int i = 1; i < numDevices; i++)
	{
		cl_buffer_region region =
		{
			NUM_BUFFER_ELEMENTS * i * sizeof(int),
			NUM_BUFFER_ELEMENTS * sizeof(int)
		};
		buffer = clCreateSubBuffer(
			buffers[0],
			CL_MEM_READ_WRITE,
			CL_BUFFER_CREATE_TYPE_REGION,
			&region,
			&errNum);
		checkErr(errNum, "clCreateSubBuffer");

		buffers.push_back(buffer);
	}

	// Create command queues
	for (unsigned int i = 0; i < numDevices; i++)
	{
		InfoDevice<cl_device_type>::display(
			deviceIDs[i],
			CL_DEVICE_TYPE,
			"CL_DEVICE_TYPE");

		cl_command_queue queue =
			clCreateCommandQueue(
				context,
				deviceIDs[i],
				0,
				&errNum);
		checkErr(errNum, "clCreateCommandQueue");

		queues.push_back(queue);

		cl_kernel kernel = clCreateKernel(
			program,
			"square",
			&errNum);
		checkErr(errNum, "clCreateKernel(square)");

		errNum = clSetKernelArg(kernel, 0, sizeof(cl_mem), (void*)&buffers[i]);
		checkErr(errNum, "clSetKernelArg(square)");

		kernels.push_back(kernel);
	}

	if (useMap)
	{
		cl_int* mapPtr = (cl_int*)clEnqueueMapBuffer(
			queues[0],
			buffers[0],
			CL_TRUE,
			CL_MAP_WRITE,
			0,
			sizeof(cl_int) * NUM_BUFFER_ELEMENTS * numDevices,
			0,
			NULL,
			NULL,
			&errNum);
		checkErr(errNum, "clEnqueueMapBuffer(..)");

		for (unsigned int i = 0; i < NUM_BUFFER_ELEMENTS * numDevices; i++)
		{
			mapPtr[i] = inputOutput[i];
		}

		errNum = clEnqueueUnmapMemObject(
			queues[0],
			buffers[0],
			mapPtr,
			0,
			NULL,
			NULL);
		checkErr(errNum, "clEnqueueUnmapMemObject(..)");
	}
	else
	{
		// Write input data
		errNum = clEnqueueWriteBuffer(
			queues[0],
			buffers[0],
			CL_TRUE,
			0,
			sizeof(int) * NUM_BUFFER_ELEMENTS * numDevices,
			(void*)inputOutput,
			0,
			NULL,
			NULL);
	}

	std::vector<cl_event> events;
	// call kernel for each device
	for (unsigned int i = 0; i < queues.size(); i++)
	{
		cl_event event;

		size_t gWI = NUM_BUFFER_ELEMENTS;

		errNum = clEnqueueNDRangeKernel(
			queues[i],
			kernels[i],
			1,
			NULL,
			(const size_t*)&gWI,
			(const size_t*)NULL,
			0,
			0,
			&event);

		events.push_back(event);
	}

	// Technically don't need this as we are doing a blocking read
	// with in-order queue.
	clWaitForEvents(events.size(), &events[0]);

	if (useMap)
	{
		cl_int* mapPtr = (cl_int*)clEnqueueMapBuffer(
			queues[0],
			buffers[0],
			CL_TRUE,
			CL_MAP_READ,
			0,
			sizeof(cl_int) * NUM_BUFFER_ELEMENTS * numDevices,
			0,
			NULL,
			NULL,
			&errNum);
		checkErr(errNum, "clEnqueueMapBuffer(..)");

		for (unsigned int i = 0; i < NUM_BUFFER_ELEMENTS * numDevices; i++)
		{
			inputOutput[i] = mapPtr[i];
		}

		errNum = clEnqueueUnmapMemObject(
			queues[0],
			buffers[0],
			mapPtr,
			0,
			NULL,
			NULL);

		clFinish(queues[0]);
	}
	else
	{
		// Read back computed data
		clEnqueueReadBuffer(
			queues[0],
			buffers[0],
			CL_TRUE,
			0,
			sizeof(int) * NUM_BUFFER_ELEMENTS * numDevices,
			(void*)inputOutput,
			0,
			NULL,
			NULL);
	}

	// Display output in rows
	for (unsigned i = 0; i < numDevices; i++)
	{
		for (unsigned elems = i * NUM_BUFFER_ELEMENTS; elems < ((i + 1) * NUM_BUFFER_ELEMENTS); elems++)
		{
			std::cout << " " << inputOutput[elems];
		}

		std::cout << std::endl;
	}

	std::cout << "Program completed successfully" << std::endl;

	return 0;
}

simple.cl

__kernel void square(__global * buffer)
{
	size_t id = get_global_id(0);
	buffer[id] = buffer[id] * buffer[id];
}

OpenCL 1.1还允许读、写缓冲区中2维或3维的矩形区段。对于从概念上讲，维度至少大于1的数据（OpenCL将所有缓冲区对象都看做这种数据），处理这些数据时这个特性尤其有用。来看一个简单的例子，这里展示了一个2维数组（见图7-1a)，以及一个相应的区段，通常称为一个切片（slice），见图7-1b。

区段仅限于缓冲区中连续的内存区域，不过可以有一个行和切片长度，以处理诸如对齐约束等边界情况。对于寻址的宿主机内存和所读、写的缓冲区，这些可能有所不同。

缓冲区中的2维或3维区域可以用以下函数读入宿主机内存：

cl_int clEnqueueReadBufferRect(cl_command_queue command_queue,
                               cl_mem buffer,
                               cl_bool blocking_read,
                               const size_t buffer_origin[3],
                               const size_t host_origin[3],
                               const size_t region[3],
                               size_t buffer_row_pitch,
                               size_t buffer_slice_pitch,
                               size_t host_row_pitch,
                               size_t host_slice_pitch,
                               void *ptr,
                               cl_uint num_events_in_wait_list,
                               const cl_event *event_wait_list,
                               cl_event *event)

command_queue 这是一个命令队列。读命令将在这个队列中排队。
buffer 一个合法的缓冲区对象（数据将从这个缓冲区读取）。

blocking_read 如果设置为CL_TRUE，则elEnqueueReadBufferRect阻塞，直至数据从buffer读出并写至ptr;
              否则直接返画,用户必须查询event来检查命令的状态。
         
buffer_origin 定义与所读取缓冲区关联的内存区域中的(x, y, z)偏移量。
host_origin 定义ptr指示的内存区域中的(x, y, z)偏移量

region 按字节数定义所读取2维或3维矩形的(度，高度，深度)。
       对于一个2维矩形区域,region [2]必须为1。

buffer_row_pitch 按字节数定义所读取2维或3维矩形的(度，高度，深度)。
                 对于一个2维矩形区域,region[2]必须为1。

buffer_slice_pitch 与buffer关联的内存区域所用的各个2维切片的长度(字节数)。
                   如果buffer_slice_pitch为0，则buffer_slice_pitch计算为region[1]*buffer_row_pitch

ptr 宿主机内存中的一个指针，指示所读的数据写至哪里。

num_events_in_wait_list 数组event_wait_list中的项数。
                        如果event_wait_list为NULL，则这个参数必须为0;否则必须大于0。

event_wait_list  如果为非NULL，则event_wait_list是一个事件数组，与必须完成的OpencL命令关联。
                 也就是说，在开始执行读命令之前，这些命令必须处于CL_COMPLETE状态。

event 如果为非NULL,函数返回的对应读命令的事件将由这个参数返回

clEnqueueReadBufferRect实现计算缓冲区中区域和宿主机内存中区域时要用到一些规则，下面对这些规则做个总结：
1）与缓冲区关联的内存区域中的偏移量按如下方式计算：

buffer_origin[2] * buffer_slice_pitch +
buffer_origin[1] * buffer_row_pitch +
buffer_origin[0]

对于2维矩形区域，buffer_origin[2]必须为0。
2）与宿主机内存关联的内存区域中的偏移量按如下方式计算：

buffer_origin[2] * buffer_slice_pitch +
buffer_origin[1] * buffer_row_pitch +
buffer_origin[0]

对于2维矩形区域，buffer_origin[2]必须为0。

举一个简单的例子，如图7-1所示，下面的代码展示了如何从一个缓冲区读取一个2×2的区域，将它读入宿主机内存，并显示结果：

//
// Book:      OpenCL(R) Programming Guide
// Authors:   Aaftab Munshi, Benedict Gaster, Timothy Mattson, James Fung, Dan Ginsburg
// ISBN-10:   0-321-74964-2
// ISBN-13:   978-0-321-74964-2
// Publisher: Addison-Wesley Professional
// URLs:      http://safari.informit.com/9780132488006/
//            http://www.openclprogrammingguide.com
//

// raytracer.cpp
//
//    This is a (very) simple raytracer that is intended to demonstrate 
//    using OpenCL buffers.

#include 
#include 
#include 
#include 
#include 

#include "info.hpp"

#define DEFAULT_PLATFORM 0
#define DEFAULT_USE_MAP false

#define NUM_BUFFER_ELEMENTS 16

// Function to check and handle OpenCL errors
inline void
checkErr(cl_int err, const char* name)
{
	if (err != CL_SUCCESS) {
		std::cerr << "ERROR: " << name << " (" << err << ")" << std::endl;
		exit(EXIT_FAILURE);
	}
}

///
//	main() for simple buffer and sub-buffer example
//
int main(int argc, char** argv)
{
	cl_int errNum;
	cl_context context;
	cl_command_queue queue;
	cl_mem buffer;
	
	//initialize context,queue,and so on
	cl_int hostBuffer[NUM_BUFFER_ELEMENTS] =
	{
		0, 1, 2, 3, 4, 5, 6, 7,
		8, 9, 10, 11, 12, 13, 14, 15
	};

	buffer = clCreateBuffer(
		context,
		CL_MEM_READ_WRITE | CL_MEM_COPY_HOST_PTR,
		sizeof(int) * NUM_BUFFER_ELEMENTS,
		hostBuffer,
		&errNum);
	
	int ptr[4] = { -1, -1, -1, -1 };
	size_t buffer_origin[3] = { 1 * sizeof(int), 1, 0 };
	size_t host_origin[3] = { 0,0,0 };
	size_t region[3] = { 2 * sizeof(int), 2, 1 };
	errNum = clEnqueueReadBufferRect(
		queue,
		buffer,
		CL_TRUE,
		buffer_origin,
		host_origin,
		region,
		(NUM_BUFFER_ELEMENTS / 4) * sizeof(int),
		0,
		0,
		2 * sizeof(int),
		static_cast<void*>(ptr),
		0,
		NULL,
		NULL);

	std::cout << " " << ptr[0];
	std::cout << " " << ptr[1] << std::endl;
	std::cout << " " << ptr[2];
	std::cout << " " << ptr[3] << std::endl;
	
	return 0;
}

将这个代码放在一个完整的程序中，运行这个程序会得到以下输出。

5 6
9 10

可以用以下命令将一个2维或3维缓冲区区域从宿主机内存写入一个缓冲区：

cl_int clEnqueueWriteBufferRect(cl_command_queue command_queue,
                                cl_mem buffer,
                                cl_bool blocking_write,
                                const size_t buffer_origin[3],
                                const size_t host_origin[3],
                                const size_t region[3],
                                size_t buffer_row_pitch,
                                size_t buffer_slice_pitch,
                                size_t host_row_pitch,
                                size_t host_slice_pitch,
                                void *ptr,
                                cl_uint num_events_in_wait_list,
                                const cl_event *event_wait_list,
                                cl_event *event)

command_queue 这是一个命令队列，写命令将在这个队列中排队
buffer 一个合法的缓冲区对象（数据将从这个缓冲区读取）

blocking_write 如果设置为CL_TRUE,则clEnqueueWrtieBufferRect阻塞,直至数据从ptr写入
               否则直接返回,用户必须查询event来检查命令的状态

buffer_origin  定义与所写缓冲区关联的内存区域中的(x,y,z)偏移量
host_origin 定义ptr指示的内存区域中的(x,y,z)偏移量
region 按字节数定义所写2维或3维矩形的(宽度,高度,深度)
buffer_row_pitch 与buffer关联的内存区域所用的各个2维切片的长度(字节数)
buffer_slice_pitch 与buffer关联的内存区域所用的各个2维切片的长度(字节数)
ptr 宿主机内存中的一个指针,指示所写的数据从哪里读取

num_events_in_wait_list 数组event_wait_list中的项数。
                        如果event_wait_list为NULL,这个参数必须为0;否则必须大于0

event_wait_list 如果为非NULL,则event_wait_list是一个事件数组,与必须完成的OpenCL命令关联
                也就是说,在开始执行写命令之前,这些命令必须处于CL_COMPLETE状态

event 如果为非NULL,函数返回的对应写命令的事件将由这个参数返回

经常会遇到这样的情况：应用程序需要在两个缓冲区之间复制数据。OpenCL提供了以下命令来完成这个工作：

cl_int clEnqueueCopyBuffer(cl_command_queue command_queue,
                           cl_mem src_buffer,
                           cl_mem dst_buffer,
                           size_t src_offset,
                           size_t dst_offset,
                           size_t cb,
                           cl_uint num_events_in_wait_list,
                           const cl_event *event_wait_list,
                           cl_event *event)

command_queue 这是一个命令队列,写命令将在这个队列中排队
src_buffer 一个合法的缓冲区对象,用做源缓冲区
dst_buffer 一个合法的缓冲区对象,用做目标缓冲区
src_offset 从src_buffer复制数据的起始偏移量
dst_offset 向dst_buffer写入数据的起始偏移量
cb 复制的字节数

num_events_in_wait_list 数组event_wait_list中的项数
                        如果event_wait_list为NULL,则这个参数必须为0;否则必须大于0

event_wait_list 如果为非NULL,则event_wait_list是一个事件数组,与必须完成的OpenCL命令关联
                也就是说,在开始执行写命令之前,这些命令必须处于CL_COMPLETE状态

event 如果为非NULL,函数返回的对应写命令的事件将由这个参数返回

只需将数据读回宿主机，再写入目标缓冲区，就可以很容易地模拟这个功能，不过还是建议应用程序调用clEnqueueCopyBuffer（尽管并不绝对必要），因为这个函数调用允许OpenCL实现管理数据的放置和传输。类似于读、写缓冲区，还可以使用以下命令将缓冲区中一个2维或3维区域复制到另一个缓冲区：

cl_int clEnqueueCopyBufferRect(cl_command_queue commad_queue,
                               cl_mem src_buffer,
                               cl_mem dst_buffer,
                               const size_t src_origin[3],
                               const size_t dst_origin[3],
                               const size_t region[3],
                               size_t src_row_pitch,
                               size_t src_slice_pitch,
                               size_t dst_row_pitch,
                               size_t dst_slice_pitch,
                               cl_uint num_events_in_wait_list,
                               const cl_event *event_wait_list,
                               cl_event *event)

command_queue 这是一个命令队列,读命令将在这个队列中排队
src_buffer 一个合法的缓冲区对象,用做源缓冲区
dst_buffer 一个合法的缓冲区对象,用做目标缓冲区
src_origin 定义与src_buffer关联的内存区域中的(x,y,z)偏移量
dst_origin 定义与dst_buffer关联的内存区域中的(x,y,z)偏移量
region 按字节数定义所读取2维或3维矩形的(宽度,高度,深度)
src_row_pitch 与src_buffer关联的内存区域所用的每行长度(字节数)
src_slice_pitch 与src_buffer关联的内存区域所用的各个2维切片的长度(字节数)
dst_row_pitch 与dst_buffer关联的内存区域所用的每行长度(字节数)
dst_slice_pitch 与dst_buffer关联的内存区域所用的各个2维切片的长度(字节数)

num_events_in_wait_list 数组event_wait_list中的项数
                        如果event_wait_list为NULL,这个参数必须为0;否则必须大于0

event_wait_list 如果为非NULL,则event_wait_list是一个事件数组,与必须完成的OpenCL命令关联
                也就是说,在开始执行复制命令之前,这些命令必须处于CL_COMPLETE状态

event 如果为非NULL,函数返回的对应写命令的事件将由这个参数返回

映射缓冲区和子缓冲区

OpenCL支持将一个缓冲区的一个区域直接映射到宿主机内存，允许使用标准C/C++代码来回复制内存。映射缓冲区和子缓冲区有一个好处，返回的宿主机指针可以传入库和其他函数抽象，这些库和函数抽象可能并不知道所访问的内存实际上由OpenCL管理和使用。下面的函数将一个命令入队，从而将一个特定缓冲区对象的区域映射到宿主机地址空间，并返回这个映射区域的指针：

void *clEnqueueMapBuffer(cl_command_queue command_queue,
                         cl_mem buffer,
                         cl_bool blocking_map,
                         cl_map_flags map_flags,
                         size_t offset,
                         size_t cb,
                         cl_uint num_events_in_wait_list,
                         const cl_event *event_wait_list,
                         cl_event *event,
                         cl_int *errcode_ref)

command_queue 这是一个命令队列,读命令将在这个队列中排队
buffer 一个合法的缓冲区对象(数据将从这个缓冲区读取)

blocking_map 如果设置为CL_TRUE,则clEnqueueMapBuffer阻塞,直到数据映射到宿主机内存
             否则,直接返回,用户必须查询event来检查命令的状态

map_flags 这是一个位域,用来指示缓冲区对象中(offset,cb)指定的区域如何映射
          map_flags可取的合法值由枚举cl_map_flag定义

offset 缓冲区对象中读取数据的起始偏移量(字节数)
cb 从buffer读取的字节数

num_events_in_wait_list 数组event_wait_list中的项数
                        如果event_wait_list为NULL,这个参数必须为0;否则,必须大于0

event_wait_list 如果为非NULL,则event_wait_list是一个事件数组,与必须完成的OpenCL命令关联
                也就是说,在开始执行读命令之前,这些命令必须处于CL_COMPLETE状态

event 如果为非NULL,函数返回的对应读命令的事件将由这个参数返回
errcode_ret 如果为非NULL,函数返回的错误码将由这个参数返回

cl_map_flags支持的值

cl_map_flags                   描述
CL_MAP_READ                    映射完成读操作
CL_MAP_WRITE                   映射完成写操作

要释放额外的资源，告诉OpenCL运行时不再需要这个缓冲区映射，可以使用以下命令：

cl_in clEnqueueUnmapMemObject(cl_command_queue command_queue,
                              cl_mem buffer,
                              void *mapped_pointer,
                              cl_uint num_events_in_wait_list,
                              const cl_event *event_wait_list,
                              cl_event *event)

command_queue 这是一个命令队列,该命令将在这个队列中排队
buffer 之前映射到mapped_pointer的一个合法的缓冲区对象
mapped_pointer 对buffer前一个clEnqueueMapBuffer调用返回的宿主机地址

num_events_in_wait_list 数组event_wait_list中的项数
                        如果event_wait_list为NULL,这个参数必须为0;否则,必须大于0

event_wait_list 如果为非NULL，则event_wait_list是一个事件数组，与必须完成的openCL命令关联。
                也就是说，在开始执行读命令之前，这些命令必须处于CL_COMPLETE状态。

event 如果为非NULL,函数返回的对应读命令的事件将由这个参数返回

下面的代码展示了如何使用clEnqueueMapBuffer和 clEnqueueUnmapMemObject对所处理的缓冲区来回移动数据，而不是使用clEnqueueReadBuffer和 clEnqueuewriteBuffer完成复制。以下代码初始化这个缓冲区：

cl_int * mapPtr = (cl_int*) clEnqueueMapBuffer(
      queues[0],
      buffers[0],
      CL_TRUE,
      CL_MAP_WRITE, 
      0,
      sizeof(cl_int) * NUM_BUFFER_ELEMENTS * numDevices,
      0,
      NULL,
      NULL,
      &erriNum);
checkErr(errNum, *clEnqueueMapBuffer (..)*);
for (unsigned int i = 0; i < NUM_BUFFER_ELEMENTs *numDevices; i++)
{
    mapPtr[i] = inputoutput[i];
}
errNum = clEnqueueUnmapMemObject(
    queues[0],
    buffers[0],
    mapPtr,
    0,
    NULL,
    NULL);
clFinish(queues[0]);

下面的代码读回最终的数据：

cl_int * mapPtr = (cl_int*)clEnqueueMapBuffer(
     queues[0],
     buffers[0],
     CL_TRUE，
     CL_MAP_READ,
     0,
     sizeof(cl_int) *NUM_BUFFER__ELEMENTS * numDevices,
     0,
     NULL,
     NULL,
     &errNumy);
checkErr(errum, "clEnqueueMapBuffer(..) ");
for (unsigned int i = 0; i < NUM_BUFFER_ELEMENTS *numDevices; i++)
{
     inputoutput [i] = mapPtr[i];
}
errNum =clEnqueueUnmapMemObject(
   queues[0],
   buffers[0],
   mapPtr,
   0,
   NULL,
   NULL);
clFinish(queues[0]);

你可能感兴趣的:(OpenCL,服务器,linux,网络)

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
2023-04-17|篮球女孩长一木
1小学抑或初中阶段，在课外书了解到她的故事。“篮球女孩”。当时佩服她的顽强，也对生命多了一丝敬畏。今天刚好在公众号看到，长大后的“篮球女孩”。佩服之余又满是心疼。网络侵删祝那素未蒙面的女孩，未来一切顺遂。
在一台Ubuntu计算机上构建Hyperledger Fabric网络落叶无声9 区块链超级账本 Hyperledger fabric 区块链 ubuntu 构建 hyperledger fabric
在一台Ubuntu计算机上构建HyperledgerFabric网络Hyperledgerfabric是一个开源的区块链应用程序平台，为开发基于区块链的应用程序提供了一个起点。当我们提到HyperledgerFabric网络时，我们指的是使用HyperledgerFabric的正在运行的系统。即使只使用最少数量的组件，部署Fabric网络也不是一件容易的事。Fabric社区创建了一个名为Cello
git - Webhook让部署自动化大猪大猪
我们现在有一个需求，将项目打包上传到gitlab或者github后，程序能自动部署，不用手动地去服务器中进行项目更新并运行，如何做到？这里我们可以使用gitlab与github的挂钩，挂钩的原理就是，每当我们有请求到gitlab与github服务器时，这时他俩会根据我们配置的挂钩地扯进行访问，webhook挂钩程序会一直监听着某个端口请求，一但收到他们发过来的请求，这时就知道用户有请求提交了，这时
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
《在战“疫”中成长致敬生活》观后感梅子刘的刀
（作者：周晨）今天上午，我看了“我是接班人”网络大课堂《在战役中成长致敬生活》。有很多人拿出自己攒下的钱，默默地捐给了武汉，有几千块钱的、有几万块钱的，也有十几万块钱的。连小朋友也把自己的压岁钱捐给了武汉。有名环卫工人把自己五年的积蓄全部捐给了武汉。有名外卖小哥为医护人员买鞋子送吃的。还有已经治愈出院的新型肺炎病人捐了400毫升的血浆。还有位叫大树的叔叔，虽然他没有钱，但是他地里有蔬菜，捐了几大卡
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
中原焦点团队网络初中级30期阴丽丽坚持分享第三百八十八次2022.10.18分享约练次数（74）咨询师（6）来访者（53）观察者（15）阴丽丽
今天是忙碌的一天，一早起来，总想着找点把事情弄完，可总也弄不完。就这样弄着吧！孩子的事，自己的事都在那里搁置着，不想做，有点欧！今天总体还不错，只是在下午起床时走神了俩小时，也算是给自己的放松吧！今日难得1.儿子乖巧、听话，努力配合，一天下来也是忙忙碌碌，这真的很难得！2.儿子今天录的视频被班主任认可，这真的很难得3.我今天早上做核酸时，自己把教案整了一下，这真的很难得
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
【从浅识到熟知Linux】Linux发展史 Jammingpro 从浅学到熟知Linux linux 运维服务器
归属专栏：从浅学到熟知Linux个人主页：Jammingpro每日努力一点点，技术变化看得见文章前言：本篇文章记录Linux发展的历史，因在介绍Linux过程中涉及的其他操作系统及人物，本文对相关内容也有所介绍。文章目录Unix发展史Linux发展史开源Linux官网企业应用情况发行版本在学习Linux前，我们可能都会问Linux从哪里来？它是如何发展的。但在介绍Linux之前，需要先介绍一下Un
多子女家庭问题 3e5c5362403c
杨宁宁焦点解决网络初17中19坚持分享589天（2021.3.20）本周约练我1次，总计166次，读书打卡第256天案例督导收获：【家有老大篇】被爱与高期待下的独舞家里的第一个孩子往往集万千宠爱于一身。爸爸妈妈、爷爷奶奶、姥姥姥爷的目光都聚焦在他的身上。在这种光环下长大的孩子，就如小皇帝一般，衣来伸手、饭来张口。拥有爱的同时，也意味着拥有了更高的被期待，父母会花血本给你报各种各样的早教班，给你买各
父母教育孩子的方式，将影响孩子一生树英教育
为什么有些孩子总是充满自信与快乐？独立、有主见又坚强？而有些孩子却自卑、胆怯，软弱又过度依赖父母？为什么有些孩子总是健康、阳光又富于创造力？而有些孩子却悲观、孤僻又思想空乏？一个孩子的行为取决于孩子的思想，思想取决于环境和自己的认知，认知取决于教育。父母是孩子人生中的第一位教育者，父母养育孩子的方式，将决定他们人生的高度，影响他们的一生。网络图，侵权即删优秀的父母就像园丁，既要浇水施肥，又要修剪杂
linux 发展史种树的猴子内核 java 操作系统 linux 大数据
linux发展史说明此前对linux认识模糊一知半解，近期通过学习将自己对于linux的发展总结一下方便大家日后的学习。那Linux是目前一款非常火热的开源操作系统，可是linux是什么时候出现的，又是因为什么样的原因被开发出来的呢。以下将对linux的发展历程进行详细的讲解。目录一、Linux发展背景二、UINIX的诞生三、UNIX的重要分支-BSD的诞生四、Minix的诞生五、GNU与Free
Linux sh命令 fengyehongWorld Linux linux
目录一.基本语法二.选项2.1-c字符串中读取内容，并执行2.1.1基本用法2.1.2获取当前目录下失效的超链接2.2-x每个命令执行之前，将其打印出来2.3结合Here文档使用一.基本语法⏹Linux和Unix系统中用于执行shell脚本或运行命令的命令。sh[选项][脚本文件][参数...]⏹选项-c：从字符串中读取内容，并执行。-x：在每个命令执行之前，将其打印出来。-s：从标准流中读取内容
Linux vi常用命令 fengyehongWorld Linux linux
参考资料viコマンド（vimコマンド）リファレンス目录一.保存系命令二.删除系命令三.移动系命令四.复制粘贴系命令一.保存系命令⏹保存并退出:wq⏹强制保存并退出:wq!⏹退出(文件未编辑):q⏹强制退出(忽略已编辑内容):q!⏹另存为:w新文件名二.删除系命令⏹删除当前行dd⏹清空整个文档gg：移动到文档顶部dG：删除到最后一行ggdG三.移动系命令⏹移动到文档顶部gg⏹移动到文档底部#方式1G
2024.9.6 Python，华为笔试题总结，字符串格式化，字符串操作，广度优先搜索解决公司组织绩效互评问题，无向图 RaidenQ python 华为 leetcode 算法力扣广度优先无向图
1.字符串格式化name="Alice"age=30formatted_string="Name:{},Age:{}".format(name,age)print(formatted_string)或者name="Alice"age=30formatted_string=f"Name:{name},Age:{age}"print(formatted_string)2.网络健康检查第一行有两个整数m
戴容容中原焦点团队.网络初级第33期,坚持分享第19天 2022年3月9日 TessDai
《每个人眼中的世界都是不同的》“一千个人眼里有一千个哈姆雷特”世界是多元的,每个人都有自己的道理,人人按照自己的理解去看待这个世界的人和物.我们如此,其他人也是如此.因此,任何事情,我们要放下自己以为的真理,去理解他人认为的真理,只有同频方能共振.孩子在慢慢长大的过程中慢慢学会独立,甚至对抗.尤其当孩子处于青春期的时候,他们开始有很多自己独立的想法,和一些特立独行的做法,家长常常会觉得不可思议,觉
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc