caffe源码分析--SyncedMemory类代码研究



数据成员:

void*cpu_ptr_;数据在cpu的指针

void*gpu_ptr_;数据在gpu的指针

size_tsize_;数据的大小

SyncedHeadhead_;表示数据的状态,有四种状态,分别是未初始化,数据在cpu中,数据在gpu中,数据在cpugpu中都有

enumSyncedHead { UNINITIALIZED,HEAD_AT_CPU,HEAD_AT_GPU,SYNCED};



构造函数

SyncedMemory()

:cpu_ptr_(NULL),gpu_ptr_(NULL),size_(0),head_(UNINITIALIZED){}

简单的初始化


explicitSyncedMemory(size_tsize)

:cpu_ptr_(NULL),gpu_ptr_(NULL),size_(size),head_(UNINITIALIZED){}

只是把size(大小)设置了,并未申请内存


析构函数

SyncedMemory::~SyncedMemory(){

//如果cpu有数据,则释放

if(cpu_ptr_){

CaffeFreeHost(cpu_ptr_);

}

//如果gpu有数据,则释放

if(gpu_ptr_){

CUDA_CHECK(cudaFree(gpu_ptr_));

}

}


函数voidto_cpu()

功能:把数据放到cpu

1数据未初始化,则在cpu申请内存。此时状态为HEAD_AT_CPU

2数据本来在gpu,则从gpu拷贝内存到cpu。此时状态为SYNCED

3数据本来在cpu,不做处理

4数据在cpugpu都有,不做处理

inlinevoidSyncedMemory::to_cpu(){

switch(head_){

caseUNINITIALIZED:

CaffeMallocHost(&cpu_ptr_,size_);

memset(cpu_ptr_,0,size_);

head_=HEAD_AT_CPU;

break;

caseHEAD_AT_GPU:

if(cpu_ptr_==NULL){

CaffeMallocHost(&cpu_ptr_,size_);

}

CUDA_CHECK(cudaMemcpy(cpu_ptr_,gpu_ptr_,size_,cudaMemcpyDeviceToHost));

head_=SYNCED;

break;

caseHEAD_AT_CPU:

caseSYNCED:

break;

}

}




函数voidto_gpu();

功能:把数据放到gpu

1数据未初始化,在gpu申请内存。此时状态为HEAD_AT_GPU

2数据在cpu,从cpu拷贝到gpu。此时状态为SYNCED

3数据在gpu,不做操作。

4数据在cpugpu都有,不做操作。

inlinevoidSyncedMemory::to_gpu(){

switch(head_){

caseUNINITIALIZED:

CUDA_CHECK(cudaMalloc(&gpu_ptr_,size_));

CUDA_CHECK(cudaMemset(gpu_ptr_,0,size_));

head_=HEAD_AT_GPU;

break;

caseHEAD_AT_CPU:

if(gpu_ptr_==NULL){

CUDA_CHECK(cudaMalloc(&gpu_ptr_,size_));

}

CUDA_CHECK(cudaMemcpy(gpu_ptr_,cpu_ptr_,size_,cudaMemcpyHostToDevice));

head_=SYNCED;

break;

caseHEAD_AT_GPU:

caseSYNCED:

break;

}

}








constvoid*cpu_data();

功能:返回数据在cpu的指针

constvoid*SyncedMemory::cpu_data(){

to_cpu();

return(constvoid*)cpu_ptr_;

}


函数constvoid*gpu_data();

功能:返回数据在gpu的指针

constvoid*SyncedMemory::gpu_data(){

to_gpu();

return(constvoid*)gpu_ptr_;

}


函数void*mutable_cpu_data();

功能:返回数据在cpu的指针,并改变数据的状态为HEAD_AT_CPU

void*SyncedMemory::mutable_cpu_data(){

to_cpu();

head_=HEAD_AT_CPU;

returncpu_ptr_;

}


函数void*mutable_gpu_data();

功能:返回数据在cpu的指针,并改变数据的状态为HEAD_AT_GPU

void*SyncedMemory::mutable_gpu_data(){

to_gpu();

head_=HEAD_AT_GPU;

returngpu_ptr_;

}



函数SyncedHeadhead(){returnhead_;}

功能:返回数据的状态



函数size_tsize(){returnsize_;}

功能:返回数据的大小



DISABLE_COPY_AND_ASSIGN(SyncedMemory);

一个宏,把该类的拷贝函数和等号操作符给禁止掉

其实就是

private:\

SyncedMemory(constSyncedMemory&);\

SyncedMemory&operator=(constSyncedMemory&)


如果想让你的类不能使用copy构造函数和赋值操作符,只要将该类的copy构造函数和赋值操作符函数定义为private即可,并且只是声明,不用实现.






你可能感兴趣的:(CUDA,机器学习,神经网络,深度学习,caffe)