【异构计算】OpenCL矩阵转置

介绍

矩阵转置，主要的技巧还是利用好local memory ,防止local memory,以及glabol memory的读取尽量是合并读写。

完整代码一：

main.cpp代码

#include <iostream>

#include <string>

#include <fstream>

#include <sstream>

#include <time.h>



#ifdef _APPLE_

#include <OpenCL/OpenCL.h>

#else

#include <CL/cl.h>

#endif



#define MATRIXMULLTIPLY



#define N  6

#define K  8

#define L  5



//Functio to check and handle OpenCL errors

inline void checkErr(cl_int err,const char *name)

{

	if(err !=CL_SUCCESS)

	{

		std::cerr <<"ERROR: "<< name <<"("<<err<< ")"<<std::endl;

		exit(EXIT_FAILURE);

	}

}

cl_context CreateContext()

{

    cl_int errNum;

    cl_uint numPlatforms;

    cl_platform_id firstPlatformId;

    cl_context context = NULL;



    // First, select an OpenCL platform to run on.  For this example, we simply choose the first available platform.  Normally, you would

    // query for all available platforms and select the most appropriate one.

    errNum = clGetPlatformIDs(1, &firstPlatformId, &numPlatforms);

    if (errNum != CL_SUCCESS || numPlatforms <= 0)

    {

        std::cerr << "Failed to find any OpenCL platforms." << std::endl;

        return NULL;

    }



    // Next, create an OpenCL context on the platform.  Attempt to create a GPU-based context, and if that fails, try to create

    // a CPU-based context.

    cl_context_properties contextProperties[] = { CL_CONTEXT_PLATFORM,(cl_context_properties)firstPlatformId, 0 };



	context = clCreateContextFromType(contextProperties, CL_DEVICE_TYPE_GPU,NULL, NULL, &errNum);

    if (errNum != CL_SUCCESS)

    {

        std::cout << "Could not create GPU context, trying CPU..." << std::endl;

        context = clCreateContextFromType(contextProperties, CL_DEVICE_TYPE_CPU,NULL, NULL, &errNum);

        if (errNum != CL_SUCCESS)

        {

            std::cerr << "Failed to create an OpenCL GPU or CPU context." << std::endl;

            return NULL;

        }

    }



    return context;

}



int main( int argc, char * argv[])

{

	// Use the first platform

	cl_int errNum;

	cl_platform_id platformID;

	cl_context context =NULL;

	cl_device_id  device;

  

	errNum = clGetPlatformIDs(1,&platformID,NULL);

	checkErr(errNum,"clGetPlatformIDS");

	std::cout<<"Platform ID: "<<platformID<<std::endl;



	context = CreateContext( );

	if(context == NULL)

	{

		std::cerr << "Failed to create OpenCL context." << std::endl;

        return NULL;

	}



	errNum = clGetDeviceIDs(platformID,CL_DEVICE_TYPE_GPU,1,&device,NULL);



	if(errNum !=CL_SUCCESS)

	{

		std::cerr <<"Could not create CL_DEVICE_TYPE_GPU context, trying CL_DEVICE_TYPE_CPU..."<<std::endl;

		errNum =clGetDeviceIDs(platformID,CL_DEVICE_TYPE_CPU,1,&device,NULL);

		std::cout <<"Device: "<<device<<std::endl;

		if(errNum !=CL_SUCCESS)

		{

			checkErr(errNum,"clGetDeviceIDs(..CL_DEVICE_TYPE_ALL..)");

		}

	}



	cl_command_queue commandQueue = clCreateCommandQueue(context,device,0,&errNum);

	checkErr(errNum,"clCreateCommandQueue( )");



	cl_int Mat_A_width  = N;

	cl_int Mat_A_height = K;

	cl_int Mat_B_width  = K;

	cl_int Mat_B_height = L;



	float *MatA =(float*)malloc(sizeof(float)*Mat_A_width*Mat_A_height);



	if(MatA ==NULL)

	{

		std::cerr<<"Failed to  Allocationing Memmey ."<<std::endl;

	}



#ifdef MATRIXMULLTIPLY

	float *MatB =(float*)malloc(sizeof(float)*Mat_B_width*Mat_B_height);

	float *MatC =(float*)malloc(sizeof(float)*Mat_A_width*Mat_B_height);

#else

	float *MatC =(float*)malloc(sizeof(float)*Mat_A_width*Mat_A_height);

#endif



	std::cout<<"=====MatA: " << Mat_A_width << "X" << Mat_A_height ;//<< std::endl;

	for(int i = 0; i< Mat_A_width*Mat_A_height; i++)

	{

		MatA[i] = std::rand()*0.25;

		//MatA[i] = 4.5;

	

		if((i%Mat_A_height ==0)||(i == 0))

		{

			std::cout << std::endl;

		}

		std::cout<<MatA[i]<< "\t";

	}

	std::cout<<std::endl;



	//Allocate space for Matrix A on the device

	cl_mem bufferA = clCreateBuffer(context,

									CL_MEM_READ_ONLY,//|CL_MEM_COPY_HOST_PTR,

									Mat_A_width*Mat_A_height*sizeof(float),

									NULL,

									&errNum);

	checkErr(errNum,"clCreateBuffer(...bufferA..)");

	errNum = clEnqueueWriteBuffer(commandQueue,bufferA,CL_TRUE,0,Mat_A_width*Mat_A_height*sizeof(float),(void*)MatA, 0, NULL,NULL);



#ifdef MATRIXMULLTIPLY

	std::cout<<"MatB: "<<Mat_B_width <<"X"<<Mat_B_height<<std::endl;

	for(int i = 0; i< Mat_B_width*Mat_B_height; i++)

	{

		MatB[i] = std::rand()*0.25;

		//MatB[i] = 2.0;

		if((i%Mat_B_height ==0)||(i == 0))

		{

			std::cout << std::endl;

		}

		std::cout<<MatA[i]<< " ";

	}

	std::cout<<std::endl;

    //Allocate space for Matrix B on the device

	cl_mem bufferB = clCreateBuffer(context,

									CL_MEM_READ_ONLY,//|CL_MEM_COPY_HOST_PTR,

									Mat_B_width*Mat_B_height*sizeof(float),

									NULL,

									&errNum);

	checkErr(errNum,"clCreateBuffer(...bufferB..)");



	//Copy Matrix B to the device

	errNum = clEnqueueWriteBuffer(commandQueue,bufferB,CL_TRUE,	0,Mat_B_width*Mat_B_height*sizeof(float),(void*)MatB,0,NULL,NULL);





    //Allocate space for Matrix C on the device

	cl_mem bufferC = clCreateBuffer(context,

									CL_MEM_READ_ONLY,//|CL_MEM_COPY_HOST_PTR,

									Mat_A_width*Mat_B_height*sizeof(float),

									NULL,

									&errNum);

	checkErr(errNum,"clCreateBuffer(...bufferC..)");

#else

	//Allocate space for Matrix C on the device

	cl_mem bufferC = clCreateBuffer(context,

									CL_MEM_READ_ONLY,//|CL_MEM_COPY_HOST_PTR,

									Mat_A_width*Mat_A_height*sizeof(float),

									NULL,

									&errNum);

	checkErr(errNum,"clCreateBuffer(...bufferC..)");

#endif	



    // We assume that the program source si stroed int the variable

	cl_program program;

	const char* fileName = "Matrixkernel.cl";

	std::ifstream kernelFile(fileName,std::ios::in);



	if( !kernelFile.is_open())

	{

		std::cerr <<"Failed to open file reading:"<<fileName<<std::endl;

		return NULL;

	}



	std::ostringstream oss;

	oss << kernelFile.rdbuf();



	std::string srcStdStr = oss.str();

    const char *srcStr = srcStdStr.c_str();

    program = clCreateProgramWithSource(context, 1,(const char**)&srcStr,NULL, NULL);

    if (program == NULL)

    {

        std::cerr << "Failed to create OpenCL program from source." << std::endl;

        return NULL;

    }



    errNum = clBuildProgram(program, 0, NULL, NULL, NULL, NULL);

    if (errNum != CL_SUCCESS)

    {

        // Determine the reason for the error

        char buildLog[16384];

        clGetProgramBuildInfo(program, device, CL_PROGRAM_BUILD_LOG,sizeof(buildLog), buildLog, NULL);



        std::cerr << "Error in kernel: " << std::endl;

        std::cerr << buildLog;

        clReleaseProgram(program);

        return NULL;

    }

#ifdef  MATRIXMULLTIPLY

	// Create the kernel

	cl_kernel kernel = clCreateKernel(program,"MulltiplySample",NULL);

	if(kernel ==NULL)

	{

		std::cerr<<"Faile to create kernel."<<std::endl;

		return NULL;

	}



	//set the kernel arguments

	clSetKernelArg(kernel, 0,sizeof(cl_mem), (void*) &bufferC);

	clSetKernelArg(kernel, 1,sizeof(cl_int), (void*) &Mat_A_width);

	clSetKernelArg(kernel, 2,sizeof(cl_int), (void*) &Mat_A_height);

	clSetKernelArg(kernel, 3,sizeof(cl_int), (void*) &Mat_B_width);

	clSetKernelArg(kernel, 4,sizeof(cl_int), (void*) &Mat_B_height);

	clSetKernelArg(kernel, 5,sizeof(cl_mem), (void*) &bufferA);

	clSetKernelArg(kernel, 6,sizeof(cl_mem), (void*) &bufferB);



	//Set Local and global workgroup sizes

	size_t globalws[2]={Mat_A_width,Mat_B_height};

	size_t localws[2]={Mat_A_width,Mat_B_height};



	//float strTime = clock();

	//Execte the kernel

	errNum = clEnqueueNDRangeKernel(commandQueue,kernel,2,NULL,globalws,localws,0,NULL,NULL);

	if(errNum !=CL_SUCCESS)

	{

		std::cerr<<"Faile to Execte the kernal.."<<std::endl;

		return NULL;

	}



	errNum = clEnqueueReadBuffer(commandQueue,bufferC,CL_TRUE,0,Mat_B_height*Mat_A_width*sizeof(float),(void*)MatC,0,NULL,NULL);



	std::cout<<"MatrixC:"<<Mat_A_width<<"X"<<Mat_B_height<<std::endl;

	for(int i =0; i< Mat_A_width*Mat_B_height; i++)

	{

		if((i != 0)&&(i%Mat_B_height == 0))

		{

			std::cout<<std::endl;

		}



		std::cout<<MatC[i]<<"\t";

	}

	std::cout << std::endl;

	clReleaseKernel(kernel);

#else

	cl_kernel Trapsposekernel;

	cl_int blockSize =16;



	if(Mat_A_width*Mat_A_height >1000)

	{

		Trapsposekernel = clCreateKernel(program,"MatrixTranspose",NULL);

		std::cout<<"CreateKernel in MatrixTranspose"<<std::endl;

		if(Trapsposekernel == NULL)

		{

			std::cerr<<"Faile to Create TrapsposeKernel."<< std::endl;

			return NULL;

		}

		

		clSetKernelArg(Trapsposekernel, 0,sizeof(cl_mem), (void*) &bufferC);

		clSetKernelArg(Trapsposekernel, 1,sizeof(cl_mem), (void*) &bufferA);

		clSetKernelArg(Trapsposekernel, 2,sizeof(cl_float)*blockSize*blockSize,NULL); //

		clSetKernelArg(Trapsposekernel, 3,sizeof(cl_int), (void*) &Mat_A_width);

		clSetKernelArg(Trapsposekernel, 4,sizeof(cl_int), (void*) &Mat_A_height);

		clSetKernelArg(Trapsposekernel, 5,sizeof(cl_mem), (void*) &blockSize);	//

	}



	else

	{

		Trapsposekernel = clCreateKernel(program,"TrapsposeMatrixSample",NULL);

		std::cout<<"CreateKernel in TrapsposeMatrixSample"<<std::endl;

		

		if(Trapsposekernel == NULL)

		{

			std::cerr<<"Faile to Create TrapsposeKernel."<< std::endl;

			return NULL;

		}

		

		clSetKernelArg(Trapsposekernel, 0,sizeof(cl_mem), (void*) &bufferC);

		clSetKernelArg(Trapsposekernel, 1,sizeof(cl_int), (void*) &Mat_A_width);

		clSetKernelArg(Trapsposekernel, 2,sizeof(cl_int), (void*) &Mat_A_height);

		clSetKernelArg(Trapsposekernel, 3,sizeof(cl_mem), (void*) &bufferA);

	}



	size_t localtr[2] = {Mat_A_height,Mat_A_width};

#ifdef MATRIXMULLTIPLY

	size_t globaltr[2] = {Mat_A_width,Mat_B_height}

#else

	size_t globaltr[2] = {Mat_A_height,Mat_A_width};

#endif //MATRIXMULLTIPLY

	cl_event  dev;



	//commandQueue the kernel up for executio across the array

	errNum = clEnqueueNDRangeKernel(commandQueue,Trapsposekernel,2,NULL,globaltr,localtr,0,NULL,&dev);

	if(errNum !=CL_SUCCESS)

	{

		std::cerr<<"Faile to Execte the kernel.."<<std::endl;

		return NULL;

	}



	std::cout<<"CommandQueue: "<<commandQueue<<std::endl;

	clFinish(commandQueue);



	cl_ulong startTime, endTime;

	clGetEventProfilingInfo(dev, CL_PROFILING_COMMAND_START,sizeof(cl_ulong), &startTime, NULL);

	clGetEventProfilingInfo(dev, CL_PROFILING_COMMAND_END,	sizeof(cl_ulong), &endTime, NULL);

	cl_ulong kernelExecTimeNs = endTime-startTime;

	printf("simple kernal exec time :%8.6f ms\n", kernelExecTimeNs*1e-6 );



	errNum = clEnqueueReadBuffer(commandQueue,bufferC,CL_TRUE,0,Mat_A_width*Mat_A_height*sizeof(float),(void*)MatC,0,NULL,NULL);



	std::cout<<"====Trapspose MatrixA : "<<Mat_A_height<<"X"<<Mat_A_width<<std::endl;

	for(int i =0; i< Mat_A_width*Mat_A_height; i++)

	{

		if((i != 0)&&(i%Mat_A_width == 0))

		{

			std::cout<<std::endl;

		}



		std::cout<<MatC[i]<<"\t";

	}

	std::cout << std::endl;



#endif



	clReleaseProgram(program);

	clReleaseCommandQueue(commandQueue);

	clReleaseContext(context);



	delete[] MatA;

	//delete[] MatB;

	delete[] MatC;





	return 0;

}

kernel代码

/*

 *@param outputC output Matrix

 *@param widthA is width of intputA in the Matrix A

 *@param heightA is height of intputA in the Matrix A

 *@param widthB is width of intputB in the Matrix B

 *@param heightB is height of intputB in the Matrix B

 *@param inputA is width of intputA in the Matrix A

 *@param inputB is width of intputA in the Matrix B

 */

__kernel void MulltiplySample(__global float* outputC,

						const int widthA, 

						const int heightA,

						const int widthB, 

						const int heightB, 

						__global float* inputA,

						__global float* inputB)

{

	int row = get_global_id(1);	// Get global position in Y direction 

	int col = get_global_id(0);	// Get global position in X direction



	float sum = 0.0f;



	//Calculat result of one element of Matrix C

	for( int i = 0; i< widthA; i++)

	{

		sum += inputA[row * widthA+i] * inputB[i * widthB + col];

	}



	outputC[row * widthB+col] = sum;

}



/*

 *@param TrapsposeMatrix  output Matrix

 *@param width  is InputMatrix width

 *@param height  is InputMatrix height

 *@param InputMatrix is Input Matrix

 */

__kernel void TrapsposeMatrixSample(__global float* TrapsposeMatrix,

									const uint width, const uint height, 

									__global float* InputMatrix)

{

	int row = get_global_id(0);

	int col = get_global_id(1);



	TrapsposeMatrix[row * width +col] = InputMatrix[col * height + row];

}



/*

 * Copies a block to the local memory 

 * and copies back the transpose from local memory to output

 * @param output output matrix

 * @param input  input matrix

 * @param block  local memory of size blockSize x blockSize

 * @param width  width of the input matrix

 * @param height height of the input matrix

 * @param blockSize size of the block

 */



__kernel void MatrixTranspose(__global float * output,

							  __global float * input,

							  __local  float * block,

							  const    uint    width,

							  const    uint    height,

							  const    uint blockSize)

{

	uint globalIdx = get_global_id(0);

	uint globalIdy = get_global_id(1);

	

	uint localIdx = get_local_id(0);

	uint localIdy = get_local_id(1);

	

    /* copy from input to local memory */

	block[localIdy*blockSize + localIdx] = input[globalIdy*width + globalIdx];



    /* wait until the whole block is filled */

	barrier(CLK_LOCAL_MEM_FENCE);



	uint groupIdx = get_group_id(0);

	uint groupIdy = get_group_id(1);



    /* calculate the corresponding target location for transpose  by inverting x and y values*/

	uint targetGlobalIdx = groupIdy*blockSize + localIdy;

	uint targetGlobalIdy = groupIdx*blockSize + localIdx;



    /* calculate the corresponding raster indices of source and target */

	uint targetIndex  = targetGlobalIdy*height     + targetGlobalIdx;

	uint sourceIndex  = localIdy       * blockSize + localIdx;

	

	output[targetIndex] = block[sourceIndex];

}

测试结果输出

【异构计算】OpenCL矩阵转置

完整代码二：

maincpp代码

// Matrix.cpp : Defines the entry point for the console application.



#include "stdafx.h"

#include <CL/cl.h>

#include <stdio.h>

#include <stdlib.h>

#include <time.h>

#include <iostream>

#include <fstream>



using namespace std;

#pragma comment (lib,"OpenCL.lib")



#define M 2048



int convertToString(const char *filename, std::string& s)

{

	size_t size;

	char*  str;



	std::fstream f(filename, (std::fstream::in | std::fstream::binary));

	if(f.is_open())

	{

		size_t fileSize;

		f.seekg(0, std::fstream::end);

		size = fileSize = (size_t)f.tellg();

		f.seekg(0, std::fstream::beg);



		str = new char[size+1];

		if(!str)

		{

			f.close();

			return NULL;

		}



		f.read(str, fileSize);

		f.close();

		str[size] = '\0';



		s = str;

		delete[] str;

		return 0;

	}

	printf("Error: Failed to open file %s\n", filename);

	return 1;

}



int main(int argc, char* argv[])

{

	float *src1=0;

	float *src2=0;



	src1 = (float*)malloc(M*M*sizeof(float));

	src2 = (float*)malloc(M*M*sizeof(float));



	int i, j;

	srand( (unsigned)time( NULL ) ); 

	for(i = 0; i < M*M; i++)

		src1[i] = rand()%50;



	for( i=0; i < M; i++)

	{

		for(j=0; j < M; j++)

		{

			src2[i*M+j] = src1[j*M+i];

		}

	}



	cl_uint status;

	cl_platform_id platform;



	status = clGetPlatformIDs( 1, &platform, NULL );

	cl_device_id device;



	clGetDeviceIDs( platform, CL_DEVICE_TYPE_ALL,1,	&device,NULL);

	cl_context context = clCreateContext( NULL,	1,&device,NULL, NULL, NULL);

	cl_command_queue queue = clCreateCommandQueue( context,device,

		CL_QUEUE_PROFILING_ENABLE, NULL );



	cl_mem clsrc1 = clCreateBuffer(context,CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,

		M*M*sizeof(cl_float),src1,NULL );

	cl_mem clsrc2 = clCreateBuffer( context,CL_MEM_WRITE_ONLY,

		M*M * sizeof(cl_float),	NULL, NULL );



	const char * filename  = "transpose.cl";

	std::string  sourceStr;

	status = convertToString(filename, sourceStr);

	const char * source    = sourceStr.c_str();

	size_t sourceSize[]    = { strlen(source) };



	cl_program program = clCreateProgramWithSource(context,	1, &source,sourceSize,NULL);



	status = clBuildProgram( program, 1, &device, NULL, NULL, NULL );

	if(status != 0)

	{

		printf("clBuild failed:%d\n", status);

		char tbuf[0x10000];

		clGetProgramBuildInfo(program, device, CL_PROGRAM_BUILD_LOG, 0x10000, tbuf, NULL);

		printf("\n%s\n", tbuf);

		return -1;

	}



	cl_kernel kernel = clCreateKernel( program, "matrixTransposeSimple", NULL );

	cl_int dimx = M;

	cl_int dimy = M;



	clSetKernelArg(kernel, 0, sizeof(cl_mem),  (void *)&clsrc2);

    clSetKernelArg(kernel, 1, sizeof(cl_mem),  (void *)&clsrc1);

	clSetKernelArg(kernel, 2, sizeof(cl_int),  (void *)&dimx);

	clSetKernelArg(kernel, 3, sizeof(cl_int),  (void *)&dimy);



	//Set local and global workgroup sizes

	size_t localws[2] = {16, 16} ; 

	size_t globalws[2] = {M,M};



    cl_event ev;

	clEnqueueNDRangeKernel( queue ,kernel,2, 0, globalws, localws,0, NULL, &ev);

	clFinish( queue );



	cl_ulong startTime, endTime;

	clGetEventProfilingInfo(ev, CL_PROFILING_COMMAND_START,sizeof(cl_ulong), &startTime, NULL);

	clGetEventProfilingInfo(ev, CL_PROFILING_COMMAND_END,sizeof(cl_ulong), &endTime, NULL);

	cl_ulong kernelExecTimeNs = endTime-startTime;

	printf("simple kernal exec time :%8.6f ms\n ", kernelExecTimeNs*1e-6 );



    float *op_data = 0;

	// copy results from device back to host

	op_data = (cl_float *) clEnqueueMapBuffer(queue,clsrc2,CL_TRUE,	CL_MAP_READ,0, 

		M*M*sizeof(cl_float),0, NULL, NULL, NULL );



	for(i = 0; i < M*M; i++)

	{

		if(abs(src2[i] - op_data[i]) > 0.0001)

		{

			printf("check failed\n");

			break;

		}

	}	

	if(i == M*M)

		printf("check passed\n");



	cl_uint blockSize = 16;

	kernel = clCreateKernel( program, "matrixTranspose", NULL );



	clSetKernelArg(kernel, 0, sizeof(cl_mem),  (void *)&clsrc2); 

	clSetKernelArg(kernel, 1, sizeof(cl_mem),  (void *)&clsrc1); 

    clSetKernelArg(kernel, 2, sizeof(cl_float)*blockSize*blockSize, NULL);

	clSetKernelArg(kernel, 3, sizeof(cl_int),  (void *)&dimx);

	clSetKernelArg(kernel, 4, sizeof(cl_int),  (void *)&dimy);

	clSetKernelArg(kernel, 5, sizeof(cl_int),  (void *)&blockSize);



	clEnqueueNDRangeKernel(queue ,kernel,2, 0, globalws, localws,0, NULL, &ev);



	clFinish( queue );

	clGetEventProfilingInfo(ev, CL_PROFILING_COMMAND_START,	sizeof(cl_ulong), &startTime, NULL);

	clGetEventProfilingInfo(ev, CL_PROFILING_COMMAND_END,sizeof(cl_ulong), &endTime, NULL);

	kernelExecTimeNs = endTime-startTime;

	printf("kernal exec time :%8.6f ms\n ", kernelExecTimeNs*1e-6 );



	// copy results from device back to host

	op_data = (cl_float *) clEnqueueMapBuffer( queue,clsrc2,CL_TRUE,CL_MAP_READ,0, 	

		M*M*sizeof(cl_float),0, NULL, NULL, NULL );



	for(i = 0; i < M*M; i++)

	{

		if(abs(src2[i] - op_data[i]) > 0.0001)

		{

			printf("check failed\n");

			break;

		}

	}	

	if(i == M*M)

		printf("check passed\n");



	if(src1)

		free(src1);

	if(src2)

		free(src2);



	clReleaseMemObject(clsrc1); 

	clReleaseMemObject(clsrc2);

	clReleaseProgram(program);

	clReleaseCommandQueue(queue);

	clReleaseContext(context);

	return 0;

}

kernel代码

/*

 * Copies a block to the local memory 

 * and copies back the transpose from local memory to output

 * @param output output matrix

 * @param input  input matrix

 * @param block  local memory of size blockSize x blockSize

 * @param width  width of the input matrix

 * @param height height of the input matrix

 * @param blockSize size of the block

 */



__kernel 

void matrixTranspose(__global float * output,

                     __global float * input,

                     __local  float * block,

                     const    uint    width,

                     const    uint    height,

                     const    uint blockSize

                       )

{

	uint globalIdx = get_global_id(0);

	uint globalIdy = get_global_id(1);

	

	uint localIdx = get_local_id(0);

	uint localIdy = get_local_id(1);

	

    /* copy from input to local memory */

	block[localIdy*blockSize + localIdx] = input[globalIdy*width + globalIdx];



    /* wait until the whole block is filled */

	barrier(CLK_LOCAL_MEM_FENCE);



	uint groupIdx = get_group_id(0);

	uint groupIdy = get_group_id(1);



    /* calculate the corresponding target location for transpose  by inverting x and y values*/

	uint targetGlobalIdx = groupIdy*blockSize + localIdy;

	uint targetGlobalIdy = groupIdx*blockSize + localIdx;



    /* calculate the corresponding raster indices of source and target */

	uint targetIndex  = targetGlobalIdy*height     + targetGlobalIdx;

	uint sourceIndex  = localIdy       * blockSize + localIdx;

	

	output[targetIndex] = block[sourceIndex];

}



__kernel void matrixTransposeSimple(__global float * output,

                     __global float * input,

                     const    uint    width,

                     const    uint    height

                       )

{

	uint gdx = get_global_id(0);

	uint gdy = get_global_id(1);

	output[gdy*width+gdx] = input[gdx*height+gdy] ;

}

测试结果输出

========================================================

转载请注明出处：http://blog.csdn.net/songzitea/article/details/12178619

========================================================

swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
openssl+keepalived安装部署 _小亦_ 项目部署 keepalived openssl
文章目录OpenSSL安装下载地址编译安装修改系统配置版本Keepalived安装下载地址安装遇到问题安装完成配置文件keepalived运行检查运行状态查看系统日志修改服务service重新加载systemd检查配置文件语法错误OpenSSL安装下载地址考虑到后面设备可能没法连接到外网，所以采用安装包的方式进行部署，下载地址：https://www.openssl.org/source/old/
用Python实现读取统计单词个数程序媛了了 python 游戏 java
完整实例代码：fromcollectionsimportCounterdefpythonit():danci={}withopen("pythonit.txt","r",encoding="utf-8")asf:foriinf:words=i.strip().split()forwordinwords:ifwordnotindanci:danci[word]=1else:danci[word]+=
tiff批量转png 诺有缸的高飞鸟 opencv 图像处理 python opencv 图像处理
目录写在前面代码完写在前面1、本文内容tiff批量转png2、平台/环境opencv,python3、转载请注明出处：https://blog.csdn.net/qq_41102371/article/details/132975023代码importnumpyasnpimportcv2importosdeffindAllFile(base):file_list=[]forroot,ds,fsin
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
python结束子进程_如何清除python中的子进程 weixin_39995943 python结束子进程
我们使用python进程来管理长时间运行的python子进程。有时需要终止子进程。kill命令不会完全终止进程，只会使其失效。运行以下脚本将演示此行为。importsubprocessp=subprocess.Popen(['sleep','400'],stdout=subprocess.PIPE,shell=False)或者p=subprocess.Popen('sleep400',stdout
windows下python opencv ffmpeg读取摄像头实现rtsp推流拉流图像处理大大大大大牛啊 opencv实战代码讲解视觉图像项目 windows python opencv
windows下pythonopencvffmpeg读取摄像头实现rtsp推流拉流整体流程1.下载所需文件1.1下载rtsp推流服务器1.2下载ffmpeg2.开启RTSP服务器3.opencv读取摄像头并调用ffmpeg进行推流4.opencv进行拉流5.opencv异步拉流整体流程1.下载所需文件1.1下载rtsp推流服务器下载RTSP服务器下载页面https://github.com/blu
c++ opencv4.3 sift匹配图像处理大大大大大牛啊图像处理 opencv实战代码讲解 opencv sift c++opencv4 特征点
c++opencv4.3sift匹配main.cppintmain(){vectorkeypoints1,keypoints2;Matimg1,img2,descriptors1,descriptors2;intnumF
【2023年】云计算金砖牛刀小试6 geekgold 云计算服务器网络 kubernetes 容器
第一套【任务1】私有云服务搭建[10分]【题目1】基础环境配置[0.5分]使用提供的用户名密码，登录提供的OpenStack私有云平台，在当前租户下，使用CentOS7.9镜像，创建两台云主机，云主机类型使用4vCPU/12G/100G_50G类型。当前租户下默认存在一张网卡，自行创建第二张网卡并连接至controller和compute节点（第二张网卡的网段为10.10.X.0/24，X为工位号
探索ASPICE V3.1：汽车行业软件开发的中文指南阮懿同
探索ASPICEV3.1：汽车行业软件开发的中文指南ASPICE_V3.1中文版.pdf.zip项目地址:https://gitcode.com/open-source-toolkit/422a2在汽车软件工程领域，高质量的标准对于确保行车安全和提升用户体验至关重要。今天，我们为您介绍一个珍贵的开源宝藏——ASPICEV3.1中文版资源。这是一篇专为国内汽车行业开发者、质量管理者准备的深度解读，旨
ubuntu安装opencv最快的方法 Derek重名了
最快方法，当然不能太多文字$sudoapt-getinstallpython-opencv借助python就可以把ubuntu的opencv环境搞起来，非常快非常容易参考：https://docs.opencv.org/trunk/d2/de6/tutorial_py_setup_in_ubuntu.html
Ubuntu常用命令整理十里染林
ubuntu16.04server开启ssh:使用x-shell连接主机，发现22端口没有打开，开启ssh服务：安装openssh-serversudoapt-getinstallopenssh-server检查安装是否成功sudops-e|grepssh开启ssh服务sudoservicesshstartUbuntu开启/关闭防火墙:开启防火墙sudoufwenable关闭防火墙sudoufwd
k8s证书过期问题处理 olina_qin kubernetes 容器云原生
k8s证书过期问题处理opensslx509-in/etc/kubernetes/pki/apiserver.crt-noout-dateskubeadmcertsrenewallsystemctlrestartkubeleopensslx509-in/etc/kubernetes/pki/apiserver.crt-noout-text|grep"NotAfter"cp/etc/kubernet
使用Python和Playwright破解滑动验证码 asfdsgdf python 开发语言
滑动验证码是一种常见的验证码形式，通过拖动滑块将缺失的拼图块对准原图中的空缺位置来验证用户操作。本文将介绍如何使用Python中的OpenCV进行模板匹配，并结合Playwright实现自动化破解滑动验证码的过程。所需技术OpenCV模板匹配：用于识别滑块在背景图中的正确位置。Python：主要编程语言。Playwright：用于浏览器自动化，模拟用户操作。破解过程概述获取验证码图像：下载背景图和
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
浅谈openresty 爱编码的钓鱼佬 nginx openresty 运维
熟悉了nginx后再来看openresty，不得不说openresty是比较优秀的。对nginx和openresty的历史等在这此就不介绍了。首先对标nginx，自然有优劣一、开发难度nginx：毫无疑问nginx的开发难度比较高，需要扎实的c/c++基础，而且还需要对nginx源码比较熟悉，开发效率慢，比如实现一个类似echo的功能，至少要上百行代码。而openresty只需要一句ngx.say
opencv学习：图像旋转的两种方法，旋转后的图片进行模板匹配代码实现夜清寒风学习 opencv 机器学习人工智能计算机视觉
图像旋转在图像处理中，rotate和rot90是两种常见的图像旋转方法，它们在功能和使用上有一些区别。下面我将分别介绍这两种方法，并解释它们的主要区别rot90方法rot90方法是NumPy提供的一种数组旋转函数，它主要用于对二维数组（如图像）进行90度的旋转。这个方法比较简单，只支持90度的倍数旋转，不支持任意角度旋转。使用NumPy进行旋转使用NumPy的rot90函数对模板图像进行旋转操作。
Python OpenCV图像处理：从基础到高级的全方位指南极客代码玩转Python 开发语言 python opencv 图像处理计算机视觉
目录第一部分：PythonOpenCV图像处理基础1.1OpenCV简介1.2PythonOpenCV安装1.3实战案例：图像显示与保存1.4注意事项第二部分：PythonOpenCV图像处理高级技巧2.1图像变换2.2图像增强2.3图像复原第三部分：PythonOpenCV图像处理实战项目3.1图像滤波3.2图像分割3.3图像特征提取第四部分：PythonOpenCV图像处理注意事项与优化策略4
Github 2024-09-12 Go开源项目日报Top10 老孙正经胡说 github golang 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2024-09-12统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Go项目10C项目1Terraform：基础设施即代码的开源工具创建周期：3626天开发语言：Go协议类型：OtherStar数量：40393个Fork数量：9397次关注人数：40393人贡献人数：358人OpenIssues数量：1943个Git
TA-Lib Python 库 Windows 64位安装包黄桥壮Quinn
TA-LibPython库Windows64位安装包TA.rar项目地址:https://gitcode.com/open-source-toolkit/3ff39简介本仓库提供了一个适用于Windows64位系统的TA-LibPython库安装包。TA-Lib是一个广泛用于金融技术分析的库，支持多种技术指标的计算。资源文件文件名TA-Lib-0.4.29-cp312-win-amd64.whl描
MacOS Catalina 从源码构建Qt6.2开发库之01: 编译Qt6.2源代码捕鲸叉 QT macos c++QT
安装xcode，cmake，ninjabrewinstallnodemac下安装OpenGL库并使之对各项目可见在macOS上安装OpenGL通常涉及到安装一些依赖库，如MGL、GLUT或者是GLEW等，同时确保LLVM的OpenGL框架和相关工具链的兼容性。以下是一个基本的安装步骤，你可以在终端中执行：安装Homebrew（如果还没有安装的话）：/bin/bash-c"$(curl-fsSLht
python图像匹配_opencvpython中的图像匹配 weixin_39585675 python图像匹配
我一直在做一个项目，用opencvpython识别相机中显示的标志。我已经尝试过使用surf、颜色直方图匹配和模板匹配。但在这3个问题中，它并不总是返回正确的答案。我现在想要的是，解决我这个问题的最好办法是什么。模板图像示例：以下是摄像头中显示的标志示例。如果这是我想要识别的图像，该怎么用？在更新matchTemplate中的代码flags=["Cambodia.jpg","Laos.jpg","
【代码模板】可视化 xuanyu22 SOP opencv 计算机视觉人工智能
PillowDocumentdataformat-(H,W,C),RGBdatadtype-np.uint8valuerange-(0,255)fromPILimportImage#Readimagesimg=Image.open("img.png").convert('RGB')#读取RGB图像img=Image.open("img.png").convert('L')#读取灰度图像(H,W)u
利用Python+OpenCV实现截图匹配图像，支持自适应缩放、灰度匹配、区域匹配、匹配多个结果 xu-jssy Python自动化脚本 python opencv 开发语言图像处理自动化
可以直接通过pip获取，无需手动安装其他依赖pipinstallxug示例：importxugxug.find_image_on_screen(,,,)=========================================================================一、依赖安装pipinstallopencv-pythonpipinstallpyautogui二、获
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

【异构计算】OpenCL矩阵转置

介绍

完整代码一：

main.cpp代码

kernel代码

测试结果输出

完整代码二：

maincpp代码

kernel代码

测试结果输出

你可能感兴趣的:(open)