lwjaiyjk3

Cuda编程总结--cuda c programming Guide

Cuda编程总结2013-10-120:32:46

--------余家奎

参加书籍：NVIDIACUDA C Programming Guide

OpenGL编程指南

学习cuda例子中的总结

1、__constant__和__device__,__shared__的使用说明...2

2、分配二位数组实现两个二位数组相加...2

3、用cudaMemcpyPitch和cudaMemcpy2D实现二位数组的分配和拷贝...5

4、cudaMalloc3D()和cudaMemcpy3D()函数的用法...7

5、不带共享存储器的矩阵的相乘...9

6、带shared memory的矩阵相乘...12

7、页锁定主机存储器Page-locked Host memory.16

8、纹理存储的使用texture memory.18

9、surface Memory的使用方法...20

10、opengl和cuda的交互...22

11、Formatted output---printf函数在device的函数中，但是其需要其的compute copability至少为2.0 27

12、Asserting在设备端的函数中，但是其要求其计算能力至少为2.0.28

13、Per Thread Allocation On heap每个线程在堆上分配...29

14、Per Thread Block Allocation每个线程块在堆上分配空间...29

15、Allocation Persisting Between Kernel Launches在堆上分配...30

如有错误的地方还请指正。。。谢谢

1、constant和device,shared的使用说明

其对应的程序：

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

#include

// __constant__ int device_global_var=5;

// __device__ int device_global_var=5;

__shared__ int device_global_var ;

__global__ void kernel()

{

__shared__ int xx;

}

int main()

{

int host_var=5;

cudaMemcpyToSymbol(device_global_var,&host_var,sizeof(int));

printf("value=%d\n",host_var);

cudaMemcpyFromSymbol(&host_var,device_global_var,sizeof(int));

printf("device_value=%d\n",host_var);

system("pause");

return 0;

}

2、分配二位数组实现两个二位数组相加

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

#include

#define N 16

__device__ intdevice_a[N][N],device_b[N][N],device_c[N][N];

__global__ void VecAdd(inta[N][N],int b[N][N],intc[N][N])

{

int global_threadId_x=blockIdx.x*blockDim.x+threadIdx.x;

int global_threadId_y=blockIdx.y*blockDim.y+threadIdx.y;

if (global_threadId_x

{

c[global_threadId_y][global_threadId_x]=a[global_threadId_y][global_threadId_x]+

b[global_threadId_y][global_threadId_x];

}

void printfArray(int data[N][N])

{

for (inti=0;i

{

for (intj=0;j

{

printf("%d ",data[i][j]);

}

printf("\n");

}

void host_Add(int a[N][N],int b[N][N],intc[N][N])

{

for (inti=0;i

{

for (int j=0;j

{

c[i][j]=a[i][j]+b[i][j];

}

int main()

{

int i,j;

int k=0;

int a[N][N],b[N][N];

int c[N][N];

for (i=0;i

{

for (j=0;j

{

a[i][j]=k;

b[i][j]=k;

k++;

}

int tempA[N][N];

//int (*device_aa)[N];

int **device_aa;

cudaMalloc((void**)&device_aa,sizeof(int)*N*N);

cudaMemcpyToSymbol(device_a,a,sizeof(int)*N*N);

cudaMemcpyFromSymbol(tempA,device_a,sizeof(int)*N*N);

printf("tempA====\n");

printfArray(tempA);

system("pause");

return 0;

}

3、用cudaMemcpyPitch和cudaMemcpy2D实现二位数组的分配和拷贝

代码：

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

#include

// kernel which copies data from d_arrayto destinationArray

__global__ void CopyData(float*d_array,

float* destinationArray,

size_tpitch,

int columnCount,

int rowCount)

{

for (int row = 0; row< rowCount; row++)

{

// update the pointer to point to the beginning of the nextrow

float* rowData = (float*)(((char*)d_array) +(row * pitch));

for (int column = 0;column < columnCount; column++)

{

rowData[column] =123.0; // make every value in the array123.0

destinationArray[(row*columnCount) + column] = rowData[column];

}

int main(int argc,char**argv)

{

int columnCount = 15;

int rowCount = 10;

float* d_array; // thedevice array which memory will be allocated to

float* d_destinationArray; //the device array

// allocate memory on the host

float* h_array = new float[columnCount*rowCount];

// the pitch value assigned by cudaMallocPitch

// (which ensures correct data structure alignment)

size_tpitch;

//allocated the device memory for source array

cudaMallocPitch(&d_array, &pitch,columnCount * sizeof(float), rowCount);

//allocate the device memory for destination array

cudaMalloc(&d_destinationArray,columnCount*rowCount*sizeof(float));

//call the kernel which copies values from d_array tod_destinationArray

CopyData<<<100, 512>>>(d_array, d_destinationArray,pitch, columnCount, rowCount);

//copy the data back to the host memory

float *h_result=(float*)malloc(sizeof(float)*columnCount*rowCount);

memset(h_result,0,sizeof(float)*columnCount*rowCount);

cudaMemcpy2D(h_result,columnCount*sizeof(float),d_array,pitch,columnCount*sizeof(float),rowCount,cudaMemcpyDeviceToHost);

cudaMemcpy(h_array,

d_destinationArray,

columnCount*rowCount*sizeof(float),

cudaMemcpyDeviceToHost);

for(int i = 0 ; i< rowCount ; i++)

{

for(int j = 0 ; j < columnCount ; j++)

{

cout << "h_result["<< (i*columnCount) + j <<"]="<< h_result[(i*columnCount) + j] << endl;

}

system("pause");

printf("h_array==\n");

//print out the values (all the values are 123.0)

for(int i = 0 ; i< rowCount ; i++)

{

for(int j = 0 ; j< columnCount ; j++)

{

cout<< "h_array[" <<(i*columnCount) + j <<"]="<< h_array[(i*columnCount) + j] << endl;

}

system("pause");

}

4、cudaMalloc3D()和cudaMemcpy3D()函数的用法

代码：

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

#include

// Device code

__global__ void MyKernel(cudaPitchedPtrdevPitchedPtr,cudaExtent extent)

{

char* devPtr = (char*)devPitchedPtr.ptr;

size_t pitch= devPitchedPtr.pitch;

size_tslicePitch = pitch * extent.height;

for(int k=0; k

char* slice = devPtr + k * slicePitch;

for(int j=0; j

float3* row = (float3*)(slice+j*pitch);

for (inti=0;i

{

row[i].x=2;

row[i].y=3;

row[i].z=4;

}

const int x=6;

const int y=60;

const int z=66;

int main(){

size_tbuf_pf=900000000;

// cudaPrintfInit(buf_pf);

cudaError_tstatus = cudaSuccess;

//======== Mem Host

float3 *mem_host = (float3*)malloc(sizeof(float3)*x*y*z);

float3 *mem_host2 = (float3*)malloc(sizeof(float3)*x*y*z);

for(int i=0;i

mem_host[i].x=10;

mem_host[i].y=100;

mem_host[i].z=1000;

}

//======== Mem Device

cudaExtentextent;

extent.width=x*sizeof(float3);

extent.height=y;

extent.depth=z;

cudaPitchedPtrmem_device;

status=cudaMalloc3D(&mem_device,extent);

// if(status!= cudaSuccess){fprintf(stderr, "Malloc: %s\n", cudaGetErrorString(status));}

// //========Cpy HostToDevice

// cudaMemcpy3DParmsp = { 0 };

// p.srcPtr= make_cudaPitchedPtr((void*)mem_host, x*sizeof(float3),x,y);

// p.dstPtr= mem_device;

// p.extent= extent;

// p.kind= cudaMemcpyHostToDevice;

// status=cudaMemcpy3D(&p);

// if(status!= cudaSuccess){fprintf(stderr, "MemcpyHtD: %s\n",cudaGetErrorString(status));}

MyKernel<<<1,1>>>(mem_device,extent);

//======== Cpy DeviceToHost !!!!!!! UNTESTED !!!!!!!!

cudaMemcpy3DParmsq = {0};

q.srcPtr =mem_device;

q.dstPtr =make_cudaPitchedPtr((void*)mem_host2,x*sizeof(float3),x,y);

q.extent=extent;

q.kind =cudaMemcpyDeviceToHost;

status=cudaMemcpy3D(&q);

if(status != cudaSuccess){fprintf(stderr,"MemcpyDtoH: %s\n",cudaGetErrorString(status));}

for(int i=0;i

printf("%f %f %f\n",mem_host2[i].x,mem_host2[i].y,mem_host2[i].z);

cudaFree(mem_device.ptr);

system("pause");

}

5、不带共享存储器的矩阵的相乘

代码：

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

#include

typedef struct

{

int width;

int height;

float *element;

}Matrix;

#define BLOCK_SIZE 16

__global__ void MatMulKernel(const Matrix,const Matrix,Matrix);

void printMatrix(const Matrix &A)

{

for (inti=0;i

{

for (intj=0;j

{

printf("%f ",A.element[i*A.width+j]);

}

printf("\n");

}

void MatMul(const Matrix &A,const Matrix &B,Matrix &C)

{

printf("matrix A");

printMatrix(A);

printf("matrix B");

printMatrix(B);

system("pause");

Matrix d_A;

d_A.width=A.width;

d_A.height=A.height;

size_tsize=A.width*A.height*sizeof(float);

cudaMalloc(&d_A.element,size);

cudaMemcpy(d_A.element,A.element,size,cudaMemcpyHostToDevice);

Matrix d_B;

d_B.width=B.width;

d_B.height=B.height;

size=B.width*B.height*sizeof(float);

cudaMalloc(&d_B.element,size);

cudaMemcpy(d_B.element,B.element,size,cudaMemcpyHostToDevice);

Matrix d_C;

d_C.width=C.width;

d_C.height=C.height;

size=C.width*C.height*sizeof(float);

cudaMalloc(&d_C.element,size);

dim3 dimBlock(BLOCK_SIZE,BLOCK_SIZE);

dim3 dimGrid(B.width/dimBlock.x,A.height/dimBlock.y);

MatMulKernel<<>>(d_A,d_B,d_C);

cudaMemcpy(C.element,d_C.element,size,cudaMemcpyDeviceToHost);

cudaFree(d_A.element);

cudaFree(d_B.element);

cudaFree(d_C.element);

for (inti=0;i

{

for (intj=0;j

{

printf("%f ",C.element[i*C.width+j]);

}

printf("\n");

}

system("pause");

}

void SetMatrixValue(Matrix &A,int value)

{

for (inti=0;i

{

for (intj=0;j

{

A.element[i*A.width+j]=value;

}

void main()

{

MatrixA,B,C;

A.width=128;

A.height=128;

A.element=(float*)malloc(A.width*A.height*sizeof(float));

SetMatrixValue(A,2);

B.width=128;

B.height=128;

B.element=(float*)malloc(B.width*B.height*sizeof(float));

//memset(B.element,2,sizeof(float)*B.width*B.height);

SetMatrixValue(B,2);

C.width=128;

C.height=128;

C.element=(float*)malloc(C.width*C.height*sizeof(float));

//memset(C.element,2,sizeof(float)*C.width*C.height);

MatMul(A,B,C);

for (inti=0;i

{

for (intj=0;j

{

printf("%f ",C.element[i*C.width+j]);

}

printf("\n");

}

system("pause");

}

__global__ void MatMulKernel(Matrix A,MatrixB,Matrix C)

{

float CValue=0;

int row=blockIdx.y*blockDim.y+threadIdx.y;

int col=blockIdx.x*blockDim.x+threadIdx.x;

for (inte=0;e

{

CValue+=A.element[row*A.width+e]*B.element[e*B.width+col];

}

C.element[row*C.width+col]=CValue;

}

6、带shared memory的矩阵相乘

代码：

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

#include

#define BLOCK_SIZE 16

typedef struct

{

int width;

int height;

int stride;

float *elements;

}Matrix;

__device__ float GetElement(constMatrix A, int row,intcol)

{

return A.elements[row*A.stride+col];

}

__device__ void SetElement(Matrix A,int row,int col,float value)

{

A.elements[row*A.stride+col]=value;

}

__device__ Matrix GetSubMatrix(Matrix A,int row,int col)

{

Matrix Asub;

Asub.width=BLOCK_SIZE;

Asub.height=BLOCK_SIZE;

Asub.stride=A.stride;

Asub.elements=&A.elements[A.stride*BLOCK_SIZE*row+BLOCK_SIZE*col];

return Asub;

}

__global__ void MatMulKernel(const Matrix,const Matrix,Matrix);

void MatMul(const Matrix &A,const Matrix &B,Matrix &C)

{

Matrix d_A;

d_A.width=A.width;

d_A.height=A.height;

d_A.stride=A.width;

size_tsize=d_A.width*d_A.height*sizeof(float);

cudaMalloc(&d_A.elements,size);

cudaMemcpy(d_A.elements,A.elements,size,cudaMemcpyHostToDevice);

Matrix d_B;

d_B.width=B.width;

d_B.height=B.height;

d_B.stride=B.width;

size=B.width*B.height*sizeof(float);

cudaMalloc(&d_B.elements,size);

cudaMemcpy(d_B.elements,B.elements,size,cudaMemcpyHostToDevice);

Matrix d_C;

d_C.width=C.width;

d_C.height=C.height;

d_C.stride=C.width;

size=C.width*C.height*sizeof(float);

cudaMalloc(&d_C.elements,size);

dim3 dimBlock(BLOCK_SIZE,BLOCK_SIZE);

dim3 dimGrid(B.width/BLOCK_SIZE,B.height/BLOCK_SIZE);

MatMulKernel<<>>(d_A,d_B,d_C);

cudaMemcpy(C.elements,d_C.elements,size,cudaMemcpyDeviceToHost);

cudaFree(d_A.elements);

cudaFree(d_B.elements);

cudaFree(d_C.elements);

}

__global__ void MatMulKernel(Matrix A,MatrixB,Matrix C)

{

int blockRow=blockIdx.y;

int blockCol=blockIdx.x;

MatrixCsub=GetSubMatrix(C,blockRow,blockCol);

float Cvalue=0;

int row=threadIdx.y;

int col=threadIdx.x;

for (intm=0;m

{

MatrixAsub=GetSubMatrix(A,blockRow,m);

MatrixBsub=GetSubMatrix(B,m,blockCol);

__shared__ floatAs[BLOCK_SIZE][BLOCK_SIZE];

__shared__ floatBs[BLOCK_SIZE][BLOCK_SIZE];

As[row][col]=GetElement(Asub,row,col);

Bs[row][col]=GetElement(Bsub,row,col);

__syncthreads();

for (inte=0;e

{

Cvalue+=As[row][e]*Bs[e][col];

}

__syncthreads();

}

SetElement(Csub,row,col,Cvalue);

}

void SetMatValue(Matrix A,int value)

{

for (inti=0;i

{

for (intj=0;j

{

A.elements[i*A.width+j]=value;

}

void PrintMat(const Matrix A)

{

for (int i=0;i

{

for(intj=0;j

{

printf("%f ",A.elements[i*A.width+j]);

}

printf("\n");

}

void main()

{

MatrixA,B,C;

A.width=128;

A.height=128;

A.elements=(float*)malloc(A.width*A.height*sizeof(float));

SetMatValue(A,2);

B.width=128;

B.height=128;

B.elements=(float*)malloc(B.width*B.height*sizeof(float));

SetMatValue(B,2);

C.width=128;

C.height=128;

C.elements=(float *)malloc(C.width*C.height*sizeof(float));

MatMul(A,B,C);

PrintMat(C);

system("pause");

}

7、页锁定主机存储器Page-lockedHost memory

代码：

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

#include

#define N 256

void SetArrayValue(float *pData,int size,float value)

{

for (inti=0;i

{

pData[i]=value;

}

__global__ void VecAdd(float*A,float *B,float*C)

{

int index=threadIdx.x;

C[index]=A[index]+B[index];

}

void PrintArray(float *data,int size)

{

for(inti=0;i

{

if((i+1)%10==0)

{

printf("\n");

}

printf("%f ",data[i]);

}

void main()

{

//cudaSetDeviceFlags(cudaDeviceMapHost);---可有可无

cudaDevicePropdeviceProp;

cudaGetDeviceProperties(&deviceProp,0);

if (deviceProp.integrated)

{

printf("GPU is integrated\n");

return;

}

if(!deviceProp.canMapHostMemory)

{

printf("can't map host memory\n");

return;

}

float *hostPtrA;

cudaHostAlloc(&hostPtrA,sizeof(float)*N,cudaHostAllocDefault| cudaHostAllocMapped);

SetArrayValue(hostPtrA,N,29);

PrintArray(hostPtrA,N);

system("pause");

float *hostPtrB;

cudaHostAlloc(&hostPtrB,sizeof(float)*N,cudaHostAllocDefault| cudaHostAllocMapped);

SetArrayValue(hostPtrB,N,31);

float *devPtrA,*devPtrB;

cudaHostGetDevicePointer(&devPtrA,hostPtrA,0);

cudaHostGetDevicePointer(&devPtrB,hostPtrB,0);

float *hostPtrC;

cudaHostAlloc(&hostPtrC,sizeof(float)*N,cudaHostAllocDefault| cudaHostAllocMapped);

float *devPtrC;

cudaHostGetDevicePointer(&devPtrC,hostPtrC,0);

VecAdd<<<1,N>>>(devPtrA,devPtrB,devPtrC);

cudaDeviceSynchronize();

for(inti=0;i

{

if ((i+1)%10==0)

{

printf("\n");

}

printf("%f ",hostPtrC[i]);

}

system("pause");

}

8、纹理存储的使用texturememory

代码：

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

#include

#define size 256

texture<float,cudaTextureType2D,cudaReadModeElementType>texRef;

__global__ void transformKernel(float *output,intwidth,int height,floattheta)

{

unsigned int x=blockIdx.x*blockDim.x+threadIdx.x;

unsigned int y=blockIdx.y*blockDim.y+threadIdx.y;

float u=x/(float)width;

float v=y/(float)height;

u-=0.5f;

v-=0.5f;

float tu=u*cosf(theta)-v*sin(theta)+0.5f;

float tv=v*cosf(theta)+u*sinf(theta)+0.5f;

output[y*width+x]=tex2D(texRef,tu,tv);

}

void main()

{

int width=25,height=25;

cudaChannelFormatDescchannelDesc=cudaCreateChannelDesc(32,0,0,0,cudaChannelFormatKindFloat);

cudaArray*cuArray;

cudaMallocArray(&cuArray,&channelDesc,width,height);

float *h_data=(float*)malloc(width*height*sizeof(float));

for (inti=0;i

{

for (intj=0;j

{

h_data[i*width+j]=i*width+j;

}

cudaMemcpyToArray(cuArray,0,0,h_data,width*height*sizeof(float),cudaMemcpyHostToDevice);

texRef.addressMode[0]=cudaAddressModeWrap;

texRef.addressMode[1]=cudaAddressModeWrap;

texRef.filterMode=cudaFilterModeLinear;

texRef.normalized=true;

cudaBindTextureToArray(texRef,cuArray,channelDesc);

float *output;

cudaMalloc(&output,width*height*sizeof(float));

dim3 dimBlock(16,16);

dim3dimGrid((width+dimBlock.x-1)/dimBlock.x,(height+dimBlock.y-1)/dimBlock.y);

float angle=30;

transformKernel<<>>(output,width,height,angle);

float *hostPtr=(float*)malloc(sizeof(float)*width*height);

cudaMemcpy(hostPtr,output,sizeof(float)*width*height,cudaMemcpyDeviceToHost);

for (inti=0;i

{

for (intj=0;j

{

printf("%f ",hostPtr[i*width+j]);

}

printf("\n");

}

free(hostPtr);

cudaFreeArray(cuArray);

cudaFree(output);

system("pause");

}

9、surface Memory的使用方法

代码：

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

#include

surface<void,2> inputSurfRef;

surface<void,2>outputSurfRef;

__global__ void copyKernel(intwidth,int height)

{

unsigned int x=blockIdx.x*blockDim.x+threadIdx.x;

unsigned int y=blockIdx.y*blockDim.y+threadIdx.y;

if(x

{

uchar4 data;

surf2Dread(&data,inputSurfRef,x*4,y);

surf2Dwrite(data,outputSurfRef,x*4,y);

}

void main()

{

int width=256,height=256;

unsigned int*h_data=(unsigned int*)malloc(width*height*sizeof(unsignedint));

for (inti=0;i

{

for (intj=0;j

{

h_data[i*width+j]=3;

}

int size=width*height*sizeof(unsignedint);

cudaChannelFormatDescchannelDesc=cudaCreateChannelDesc(8,8,8,8,cudaChannelFormatKindUnsigned);

cudaArray*cuInputArray;

cudaMallocArray(&cuInputArray,&channelDesc,width,height,cudaArraySurfaceLoadStore);

cudaArray*cuOutputArray;

cudaMallocArray(&cuOutputArray,&channelDesc,width,height,cudaArraySurfaceLoadStore);

cudaMemcpyToArray(cuInputArray,0,0,h_data,size,cudaMemcpyHostToDevice);

cudaBindSurfaceToArray(inputSurfRef,cuInputArray);

cudaBindSurfaceToArray(outputSurfRef,cuOutputArray);

dim3 dimBlock(16,16);

dim3dimGrid((width+dimBlock.x-1)/dimBlock.x,(height+dimBlock.y-1)/dimBlock.y);

copyKernel<<>>(width,height);

unsigned int*host_output=(unsigned int*)malloc(sizeof(unsignedint)*width*height);

cudaMemcpyFromArray(host_output,cuOutputArray,0,0,size,cudaMemcpyDeviceToHost);

for (inti=0;i

{

for (intj=0;j

{

printf("%u ",host_output[i*width+j]);

}

printf("\n");

}

system("pause");

free(host_output);

free(h_data);

cudaFreeArray(cuInputArray);

cudaFreeArray(cuOutputArray);

}

10、opengl和cuda的交互

代码：https://devtalk.nvidia.com/default/topic/502692/how-to-use-open_gl/

http://stackoverflow.com/questions/12082357/errors-while-using-opengl-buffers-using-visual-studio-2010-in-windows7

#include

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

#include //要放在下面这一句的前面

#include "cuda_gl_interop.h"

#include

//#include

#include

GLuint postionsVBO=1;

struct cudaGraphicsResource * postionsVBO_CUDA;

int width=256;

int height=256;

__device__ float dev_time=1;

float host_time=1;

__global__ void createVertices(float4 *positions,floattime,unsignedintwidth ,unsignedintheight);

void init()

{

glClearColor(0.f,0.f,0.f,1.f);

glClear(GL_DEPTH_BUFFER_BIT| GL_COLOR_BUFFER_BIT);

}

void reshape(int width,int height)

{

glMatrixMode(GL_PROJECTION);

glLoadIdentity();

if (width>height)

{

gluPerspective(45,(GLfloat)width/height,0.001,1000);

}else

{

gluPerspective(45,(GLfloat)height/width,0.001,1000);

}

glMatrixMode(GL_MATRIX_MODE);

glLoadIdentity();

}

void display()

{

float4 *positions;

cudaGraphicsMapResources(1,&postionsVBO_CUDA,0);

size_tnumb_bytes;

cudaGraphicsResourceGetMappedPointer((void**)&positions,&numb_bytes,postionsVBO_CUDA);

dim3 dimBlock(16,16,1);

dim3 dimGrid(width/dimBlock.x,height/dimBlock.y,1);

createVertices<<>>(positions,dev_time,width,height);

dev_time++;

cudaMemcpy(&time,&host_time,sizeof(float),cudaMemcpyHostToDevice);

cudaGraphicsUnmapResources(1,&postionsVBO_CUDA,0);

glClear(GL_COLOR_BUFFER_BIT| GL_DEPTH_BUFFER_BIT);

glBindBuffer(GL_ARRAY_BUFFER,postionsVBO);

glVertexPointer(4,GL_FLOAT,0,0);

glEnableClientState(GL_VERTEX_ARRAY);

glDrawArrays(GL_POINTS,0,width*height);

glDisableClientState(GL_VERTEX_ARRAY);

glutSwapBuffers();

glutPostRedisplay();

}

__global__ void createVertices(float4 *positions,floattime,unsignedintwidth ,unsignedintheight)

{

unsigned int x=blockIdx.x*blockDim.x+threadIdx.x;

unsigned int y=blockIdx.y*blockDim.y+threadIdx.y;

float u=x/(float)width;

float v=y/(float)height;

u=u*2.f-1.f;

v=v*2.f-1.f;

float freq=4.f;

float w=sinf(u*freq+time)*cosf(v*freq+time)*0.5f;

positions[y*width+x]=make_float4(u,w,v,1.f);

}

int main(int argc,char*argv[])

{

cudaGLSetGLDevice(0);

glutInit(&argc,argv);

glutInitDisplayMode(GLUT_DOUBLE| GLUT_RGB);

glutInitWindowPosition(0,0);

glutInitWindowSize(100,100);

glutCreateWindow("opengl-cuda");

init();

glutDisplayFunc(display);

glutReshapeFunc(reshape);

glewInit();//http://stackoverflow.com/questions/12344612/unusual-error-using-opengl-buffers-with-cuda-interop-on-ms-visual-studio-2010

glGenBuffers(1,&postionsVBO);

glBindBuffer(GL_ARRAY_BUFFER,postionsVBO);

unsigned intsize=width*height*4*sizeof(float);

glBufferData(GL_ARRAY_BUFFER,size,0,GL_DYNAMIC_DRAW);

glBindBuffer(GL_ARRAY_BUFFER,0);

cudaGraphicsGLRegisterBuffer(&postionsVBO_CUDA,postionsVBO,cudaGraphicsMapFlagsWriteDiscard);

glutMainLoop();

}

11、Formattedoutput---printf函数在device的函数中，但是其需要其的compute copability至少为2.0

代码：

#include

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

__global__ void bcast()

{

printf("%d\n",threadIdx.x);

}

void main()

{

bcast<<<1,32>>>();

cudaDeviceSynchronize();

system("pause");

}

12、Asserting在设备端的函数中，但是其要求其计算能力至少为2.0

代码：

#include

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

#include

#include

__global__ void testAssert(void)

{

int is_one=1;

int should_be_one=0;

assert(is_one);

assert(should_be_one);

}

void main()

{

testAssert<<<1,1>>>();

cudaDeviceSynchronize();

cudaDeviceReset();

system("pause");

}

13、Per ThreadAllocation On heap每个线程在堆上分配

代码：

#include

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

__global__ void mallocTestPerThread()

{

char *ptr=(char *)malloc(100);

printf("Thread %d got pointer:%p\n",threadIdx.x,ptr);

free(ptr);

}

int main()

{

cudaDeviceSetLimit(cudaLimitMallocHeapSize,128*1024*1024);

mallocTestPerThread<<<1,5>>>();

cudaDeviceSynchronize();

system("pause");

return 0;

}

14、Per Thread BlockAllocation每个线程块在堆上分配空间

代码：

#include

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

__global__ void mallocTestPerThreadBlock()

{

__shared__ int *data;

if (threadIdx.x==0)

{

data=(int*)malloc(blockDim.x*64);

}

__syncthreads();

if (data==NULL)

{

return;

}

int *ptr=data;

for (inti=0;i<64;++i)

{

ptr[i*blockDim.x+threadIdx.x]=threadIdx.x;

}

__syncthreads();

if (threadIdx.x==0)

{

free(data);

}

int main()

{

cudaDeviceSetLimit(cudaLimitMallocHeapSize,128*1024*1024);

mallocTestPerThreadBlock<<<10,128>>>();

cudaDeviceSynchronize();

system("pause");

return 0;

}

15、AllocationPersisting Between Kernel Launches在堆上分配

代码：

#include

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

#define NUM_BLOCKS 20

__device__ int *dataptr[NUM_BLOCKS];

__global__ void allocmem()

{

if (threadIdx.x==0)

{

dataptr[blockIdx.x]=(int*)malloc(blockDim.x*4);

}

__syncthreads();

if (dataptr[blockIdx.x]==NULL)

{

return;

}

dataptr[blockIdx.x][threadIdx.x]=0;

}

__global__ void usemem()

{

int *ptr=dataptr[blockIdx.x];

if (ptr!=NULL)

{

ptr[threadIdx.x]+=threadIdx.x;

}

__global__ void freemem()

{

int *ptr=dataptr[blockIdx.x];

if(ptr!=NULL)

printf("Block %d,Thread=%d:final value=%d\n",blockIdx.x,threadIdx.x,ptr[threadIdx.x]);

if (threadIdx.x==0)

{

free(ptr);

}

int main()

{

cudaDeviceSetLimit(cudaLimitMallocHeapSize,128*1024*1024);

allocmem<<>>();

usemem<<>>();

freemem<<>>();

cudaDeviceSynchronize();

system("pause");

return 0;

}

你可能感兴趣的:(C/C++,GPU,CUDA,C/C++VS2010,cuda,VS2010,VS2010,个人总结)

超级实用！汇总pytest中那些常用的参数测试开发Kevin Python 自动化测试测试开发单元测试 pytest
刚开始使用pytest的同学，可能感觉最复杂的点就是其提供的各种参数，丰富的命令行参数在带来了灵活控制测试行为的同时也增加了对于新手的上手难度。在这里，我总结了一下pytest常用参数的分类，并提供详细的使用方法！如果读者是pytest小白，可以参考下面的文章，快速上手pytest：用最精简的例子带您快速了解Pytest框架中最核心的功能-CSDN博客一、基础运行参数指定运行范围pytest运行指
Paimon：Range Partition and Sort优化无主键表（Append-Only Table）查询 lifallen Paimon 数据库大数据数据结构 java apache
这个优化是通过对数据进行全局排序，从而让查询时能够跳过大量不相关的数据文件（DataSkipping），极大地减少I/O，提升查询速度。只需要在执行INSERT语句时，通过OPTIONSHint来启用和配置这个功能即可。RangePartitionAndSortForUnawareBucketTableITCase测试文件本身就是最好的例子。比如测试中的这句SQL：INSERTINTOtest_t
Paimon 删除向量 lifallen Paimon 数据库大数据 java 数据结构 apache
RowKind可以标记删除，但它和DeletionVector（删除向量）是为解决不同场景下的问题而设计的两种机制，它们工作在不同的层面。简单来说：RowKind是“逻辑层”的变更指令，主要用于primary-key表的LSM-Tree合并过程。DeletionVector是“物理层”的读时过滤优化，用于在不重写数据文件的前提下，快速地“标记”某些行为无效，极大地提升了DELETE/UPDATE操
java并发编程LockSupport之park/unpark jmysql java java
【尚学堂】Java300集零基础适合初学者视频教程_Java300集零基础教程_Java初学入门视频基础巩固教程_Java语言入门到精通_哔哩哔哩_bilibili一、简介1.1主要方法Park/UnPark方法是LockSupport当中的方法。其常用方法有如下：park()：暂停当前线程。park(Objectblocker)：暂停当前线程，并指定负责此线程停放的同步对像。parkNanos(
tailwindcss报错于慨 javascript
warn-The`content`optioninyourTailwindCSSconfigurationismissingorempty.warn-ConfigureyourcontentsourcesoryourgeneratedCSSwillbemissingstyles.warn-https://tailwindcss.com/docs/content-configurationtrans
【C# in .NET】17. 探秘类成员-构造函数与析构函数：对象生命周期管理阿蒙Armon C#in .NET c#.net java
探秘类成员-构造函数与析构函数：对象生命周期管理在C#的类成员体系中，构造函数与析构函数承担着对象生命周期管理的核心职责。它们看似简单，却蕴含着与.NET运行时（CLR）深度交互的底层逻辑。本文将从IL代码解析、内存操作机制、CLR调度原理三个维度，全面揭秘这对特殊成员的工作原理，并结合实战场景提炼最佳实践。一、构造函数：对象诞生的幕后推手构造函数是类实例化过程中执行初始化操作的特殊方法，它的底层
【C# in .NET】9. 探秘委托：函数抽象的底层机制阿蒙Armon C#in .NET c#.net java
探秘委托：函数抽象的底层机制在C#的类型系统中，委托（Delegate）作为函数的抽象容器，架起了面向对象与函数式编程的桥梁。它不仅是事件驱动编程的核心，更是LINQ、异步编程等现代C#特性的基础。与类和结构体相比，委托的底层实现融合了引用类型的内存管理与函数指针的调用特性，涉及CLR对方法调度的深度优化。本文将从IL指令解析到JIT编译细节，全面揭示委托的本质机制，带你理解这一特殊类型如何在.N
【C# in .NET】2. 探秘数据类型：构建程序的基石阿蒙Armon C#in .NET c#.net java
探秘数据类型：构建程序的基石在C#编程中，数据类型是构建程序的基石。无论是简单的整数计算还是复杂的对象交互，都离不开对数据类型的精准运用。然而，大多数开发者对数据类型的理解往往停留在表面语法层面，忽视了其在.NET框架底层的运行机制。本文将从CLR（公共语言运行时）的视角，深入剖析C#数据类型的本质、内存布局与核心机制，带你看透数据类型背后的底层逻辑。一、数据类型的本质：CLR类型系统的双轨制.N
Julia视频教程 Bounce_aaba
在网易云课堂上直接搜索：Julia教程，就可以找到，教程的全名是：Julia教程从入门到进阶这是国内第一个免费的完整的Julia视频教程，非常适合Julia的入门。有兴趣的朋友可以去学习一下。教程链接：https://study.163.com/course/courseMain.htm?share=2&shareId=480000001854445&courseId=1208959805&_tr
Linux基础学习---文件相关命令
文件操作命令命令作用语法格式参数案例touch创建文件touch文件名-t时间：手动指定时间戳（格式：YYMMDDhhmm[.ss]）touchfile1.txt:在当前目录下创建file1.txttouchfile1.txtfile2.txtfile3.txt:创建多个文件touch-t202501011230.45file.txt:指定时间戳（设为2025年1月1日12:30:45）cp（co
Flink双流处理：实时对账实现1
Flink双流处理：实时对账实现1去发现同类优质开源项目:https://gitcode.com/资源描述本资源文件详细介绍了Flink双流处理的实时对账实现。内容涵盖了基础概念、双流处理的方法以及实战案例，帮助开发者深入理解Flink在实时对账场景中的应用。内容概述基础概念介绍了Flink的基本概念和架构，为后续的双流处理打下基础。双流处理方法详细讲解了Flink中双流处理的核心方法和技巧，帮助
#Datawhale组队学习#7月-强化学习Task1 fzyz123 Datawhale组队学习强化学习人工智能 AI
这里是Datawhale组织的组队学习《强化学习入门202507》，Datawhale是一个开源的社区。第一章绪论1.1为什么要学习强化学习？强化学习（ReinforcementLearning,RL）是机器学习中专注于智能体（Agent）如何通过与环境交互学习最优决策策略的分支。与监督学习依赖静态数据集、无监督学习聚焦数据内在结构不同，强化学习的核心在于序贯决策：智能体通过试错探索环境，根据行动
AUTOSAR汽车电子嵌入式编程精讲300篇-基于 FPGA 的 CAN 控制器设计与验证（续）格图素书汽车 fpga开发
目录3CAN控制器的设计3.1CAN的模块构成3.2CPI模块3.2.1CPI模块总设计3.2.2位时序设计3.2.3发送模块设计3.2.4接收模块设计3.2.5错误处理模块设计3.2.6过载帧模块设计3.3CAN控制器的操作模式4CAN控制器的验证4.1基于Vivado软件的CAN控制器仿真4.1.1CAN控制器配置及地址打包4.1.2其余端口配置说明4.1.3Testbench编写说明4.1.
Qt/C++音视频开发22-通用GPU显示 feiyangqingyun Qt/C++音视频开发 Qt视频监控 Qt音视频 Qt硬解码
一、前言采用GPU来绘制实时视频一直以来都是个难点，如果是安防行业的做视频监控开发这块的人员，这个坎必须迈过去，本人一直从事的是安防行业的电子围栏这个相当小众的细分市场的开发，视频监控这块仅仅是周边技术玩一玩探讨一下，关于GPU绘制这块着实走了不少的弯路。之前用ffmpeg解码的时候，已经做了硬解码的处理，比如支持qsv、dxva2、d3d11va等方式进行硬解码处理，但是当时解码出来以后，还是重
Perl中的数组操作
Push返回数组中的个数pop返回数组中被Pop出的数，最后一个shift返回数据中删除的数字，第一个unshift返回数组长度，从第一个添加printjoin(':',unshift(@numbers,0,10));Map1.会遍历整个数组，并对数组的每个值调用函数，例如mapuc,@word,输出全大写2.$_表示数组的每一个值，例如@word=qw(abcdefg);printmap{$_}
Linux和Windows保存Git账号和密码小米加大米Q
场景：Linux和Windows中每次pull的时候都会输入用户名和密码？如图：解决方案：在系统中输入命令：gitconfig--globalcredential.helperstore之后操作不在需要输入用户名和密码。
久远的操作系统笔记3 锦绣拾年
信号变量，条件变量，互斥锁解析来自：http://blog.chinaunix.net/space.php?uid=23061624&do=blog&cuid=2127853http://blog.163.com/huangguoqiang_123@126/blog/static/141043114201349112849554/信号量用在多线程多任务同步的，一个线程完成了某一个动作就通过信号量告
Gcn符号笔记 happydog007 笔记 python
KeyPoints邻接矩阵A通常表示无向图中结点之间的连接，尺寸为[N,N]，其中N是结点的数量。度矩阵D是对角矩阵，尺寸为[N,N]，对角元素表示每个结点的度。结点特征向量矩阵XXX的尺寸为[N,C]，其中C是每个结点的特征数量，包含结点的额外属性，如年龄或文本特征。邻接矩阵A邻接矩阵A是一个方阵，用于表示图中结点之间的连接关系。对于无向图，A[i,j]=1A[i,j]=1A[i,j]=1表示结
『大模型笔记』Geoffrey Hinton对Al研究人才选拔的直觉，未来影响及技术展望的深入见解！ AI大模型前沿研究大模型笔记大模型人工智能 Hinton llya 大语言模型多模态大脑工作方式
GeoffreyHinton对Al研究人才选拔的直觉，未来影响及技术展望的深入见解！文章目录一.整个访谈内容1.1.起点：理解大脑的工作方式以及隐藏层命名的由来1.2.谈Ilya：他有很好的直觉1.3.预测下一个词也需要推理1.4.模型能从语言中学到很多，但从多模态中学习会更容易1.5.关于认知的三种观点1.6.黄仁勋送了我一块GPU1.7.数字系统有人类无法比拟的优势1.8.需要得到重视的快速权
Java反射获取Class的三种方式喵星人ZC
packagecom.sou.reflection.classpkg;importorg.junit.Test;importjava.lang.reflect.Method;/***反射获取Class的三种方式*1）Class.forName()*2)obj.getClass*3)class.class*/publicclassReflectionApp{//Class.forName()@Tes
OpenAI 再放大招！Codex：云端 AI 编程助手，可自动执行编写功能代码 LinkTime_Cloud 人工智能
近日，OpenAI正式发布了一款颠覆性的云端代码智能体——Codex。这一工具不仅能够生成代码，还能通过自然语言指令完成包括错误修复、代码审查、拉取请求提交等全流程开发任务，标志着AI从辅助工具向自动化协作伙伴的跨越。Codex的推出，不仅是技术上的里程碑，更是对软件开发行业工作模式的革命性挑战。Codex的核心功能与技术创新1.多任务并行处理能力Codex可在独立的云端沙盒环境中同时处理多项任务
图机器学习（13）——图相似性检测
图机器学习（13）——图相似性检测0.前言1.基于图嵌入的方法2.基于图核的方法3.基于GNN的方法4.应用0.前言图机器学习(machinelearning,ML)方法能广泛应用于各类任务，其应用场景涵盖从药物设计到社交网络推荐系统等多个领域。值得注意的是，由于这类方法在设计上具有通用性，同一算法可用于解决不同问题。学习图之间相似性的定量度量是一个关键问题。事实上，这是网络分析的重要步骤，同时也
浪漫与性感兼具｜Julie Vino 2019婚纱系列服装设计禅言
以色列设计师婚纱品牌JulieVino释出2019「Paris巴黎」婚纱系列，本季婚纱以巴黎城市为拍摄背景和主题诉求，打造浪漫与性感兼具的现代礼服。来源|CFW服装设计最懂得穿衣服的是哪个职业？——设计师有穿不完的衣服是哪个职业？——设计师走在时装最顶端的职业是？没错还是设计师，想学习服装设计成为设计师，可以私信小编，免费带粉丝入门！
特朗普想换掉鲍威尔并不容易？一文详解美联储主席职位稳固性加百力科技知识财经研究数据库开发语言
根据《联邦储备法》，理事只能因"正当理由"被解职，而非政策分歧。最高法院在Trumpv.Wilcox案中特别认定"美联储是结构独特的准私人实体"，享有特殊保护地位。如果特朗普选择以“正当理由（装修）”解雇鲍威尔，可能导致漫长的法律程序。有分析认为，届时鲍威尔任期很可能结束。尽管特朗普一直批评鲍威尔不降息，且发表了可能撤换美联储主席的言论，但是想要换掉鲍威尔实际上不容易，因为法律和制度框架为美联储主
2023-03-15使用BASH SHELL执行命令以及快捷键运维小将
基本命令语法--bashshell执行方式：当准备好命令时，按下键盘上的Enter键。系统就会显示命令输出，然后显示下一个shell提示符[kaier@myhost~]$whoami#显示当前登录系统的用户kaier[kaier@myhost~]$--如果希望一行输入多个命令可以使用分号（;）作为命令分隔符[user@serverb~]$touchtest[user@serverb~]$whoam
pytest--1--pytest-mock常用的方法 Chasing__Dreams pytest pytest
1.mocker.patchmocker.patch是最常用的方法，用于替换指定的对象或方法。它可以用于模拟函数、方法、类或模块。语法mocker.patch(target,new=DEFAULT,spec=None,create=False,spec_set=None,autospec=None,new_callable=None,**kwargs)示例importpytestfrommy_mo
kafka--基础知识点--0 Chasing__Dreams kafka kafka 分布式
kafka架构https://cloud.tencent.com/developer/article/230789219张图生产者架构消息的磁盘存储文件结构https://cloud.tencent.com/developer/article/230789219张图produce消息分区策略kafka–基础知识点–5–生产者分区策略ISR、OSR、AR是什么？ISR：ISR，全称in-syncre
2019-04-16 小庄_94e5
《暗影格斗2》是一款融合了养成元素的动作手游，它的前作曾在Facebook上创下4000万用户的辉煌战绩。《暗影格斗2》在继承前作优点的基础之上增加了装备、技能、剧情等非常有意思的游戏元素。随着情节逐渐展开，玩家将与成群的敌人格斗，并将迎战邪恶的最终BOSS。游戏逼真流畅的操控系统使玩家很容易的就能完成踢腿、拳击、跳跃、抱摔等各种极具观赏性的格斗动作，能体验到最真实激烈的格斗快感！完美体验移动版《
PyTorch数据加载与预处理飘若随风 PyTorch pytorch 人工智能 python
数据加载与预处理详解1.数据集类(Dataset和DataLoader)1.1Dataset基类PyTorch中的Dataset是一个抽象类，所有自定义的数据集都应该继承这个类，并实现以下两个方法：__len__():返回数据集的大小__getitem__():根据索引返回一个样本概念解析：Dataset类提供了统一的数据访问接口通过继承Dataset，我们可以轻松地将数据集成到PyTorch的生
Mysql基本语法到表设计吴鹰飞侠 mysql 数据库
由于笔者之前了解过sql所以此篇仅作复习使用。1.MySQL基本语法1.1创建数据库createdatabaselogin_demo;1.2使用数据库uselogin_demo;1.3创建表CREATETABLEusers(idintprimarykeyauto_increment,usernamevarchar(50)notnull,passwordvarchar(255)notnull,ema
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方