楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/
首先看到的是Blob这个类,Blob是作为Caffe中数据流通的一个基本类,网络各层之间的数据是通过Blob来传递的。这里整个代码是非常规范的,基本上条件编译,命名空间,模板类,各种不太经常看到的关键字如exlicit,inline等等。
首先提一下explicit关键字的作用是禁止单参数构造函数的隐式转换,具体含义谷歌即可。还有inline的作用,iniline主要是将代码进行复制,扩充,会使代码总量上升,好处就是可以节省调用的开销,能提高执行效率。
1主要变量
shared_ptrdata_;shared_ptr diff_;shared_ptr shape_data_;vector shape_;int count_;int capacity_;
BLob只是一个基本的数据结构,因此内部的变量相对较少,首先是data_
指针,指针类型是shared_ptr,属于boost库的一个智能指针,这一部分主要用来申请内存存储data,data主要是正向传播的时候用的。同理,diff_
主要用来存储偏差,update data,shape_data
和shape_
都是存储Blob的形状,一个是老版本一个是新版本。count
表示Blob中的元素个数,也就是个数*通道数*高度*宽度
,capacity
表示当前的元素个数,因为Blob可能会reshape。
2主要函数
templateclass Blob { public: Blob() : data_(), diff_(), count_(0), capacity_(0) {} /// @brief Deprecated; use Blob(const vector
. explicit Blob(const int num, const int channels, const int height, const int width); explicit Blob(const vector& shape) & shape); /// @brief Deprecated; use Reshape(const vector
. void Reshape(const int num, const int channels, const int height, const int width);& shape)
其中Blob作为一个最基础的类,其中构造函数开辟一个内存空间来存储数据,Reshape
函数在Layer中的reshape或者forward操作中来adjust dimension。同时在改变Blob大小时,内存将会被重新分配如果内存大小不够了,并且额外的内存将不会被释放。对input的blob进行reshape,如果立马调用Net::Backward
是会出错的,因为reshape之后,要么Net::forward
或者Net::Reshape
就会被调用来将新的input shape 传播到高层
Blob类里面有重载很多个count()
函数,主要还是为了统计Blob的容量(volume),或者是某一片(slice),从某个axis到具体某个axis的shape乘积。
inline int count(int start_axis, int end_axis)
并且Blob的Index是可以从负坐标开始读的,这一点跟Python好像
inline int CanonicalAxisIndex(int axis_index)
对于Blob中的4个基本变量num
,channel
,height
,width
可以直接通过shape(0),shape(1),shape(2),shape(3)
来访问。
计算offset
inline int offset(const int n, const int c = 0, const int h = 0, const int w = 0)inline int offset(const vector& indices)
offset计算的方式也支持两种方式,一种直接指定n,c,h,w或者放到一个vector中进行计算,偏差是根据对应的n,c,h,w,返回的offset是((n * channels() + c) * height() + h) * width() + w
其实里面稍加留意可以看到有很多的
CHECK_GE CHECK_LE CHECK_EQ ....
等等看意思就知道了,肯定是在做比较Geater or Eqal这样的意思。这其实是GLOG,谷歌的一个日志库,Caffe里面用用了大量这样的宏,看起来也比较直观
void CopyFrom(const Blob& source, bool copy_diff = false,bool reshape = false);
从一个blob中copy数据 ,通过开关控制是否copy_diff,如果是False则copy data。reshape控制是否需要reshape。好我们接着往下看
inline Dtype data_at(const int n, const int c, const int h, const int w)inline Dtype diff_at(const int n, const int c, const int h, const int w)inline Dtype data_at(const vector& index)inline Dtype diff_at(const vector & index)inline const shared_ptr & data()inline const shared_ptr & diff()
这一部分函数主要通过给定的位置访问数据,根据位置计算与数据起始的偏差offset,在通过cpu_data*指针获得地址。下面几个函数都是获得
const Dtype* cpu_data() const;void set_cpu_data(Dtype* data);const int* gpu_shape() const;const Dtype* gpu_data() const;const Dtype* cpu_diff() const;const Dtype* gpu_diff() const;Dtype* mutable_cpu_data();Dtype* mutable_gpu_data();Dtype* mutable_cpu_diff();Dtype* mutable_gpu_diff();
可以看到这里有data和diff两类数据,而这个diff就是我们所熟知的偏差,前者主要存储前向传递的数据,而后者存储的是反向传播中的梯度
void Update();
看到update里面面调用了
caffe_axpy(const int N, const float alpha, const float* X,float* Y) { cblas_saxpy(N, alpha, X, 1, Y, 1); }
这个函数在caffe的util下面的match-functions.cpp里面,主要是负责了线性代数库的调用,实现的功能是
Y=alphaX+betaYY=alphaX+betaY
也就是blob里面的data部分减去diff部分
void FromProto(const BlobProto& proto, bool reshape = true);void ToProto(BlobProto* proto, bool write_diff = false) const;
这两个函数主要是将数据序列化,存储到BlobProto,这里说到Proto是谷歌的一个数据序列化的存储格式,可以实现语言、平台无关、可扩展的序列化结构数据格式。Caffe里面数据的存储都采用这一结构,这里就不深入展开,具体可以参照这篇文章,对于proto的序列化和反序列都讲解的非常详细http://***/Article/34963
Dtype asum_data() const;//计算data的L1范数Dtype asum_diff() const;//计算diff的L1范数Dtype sumsq_data() const;//计算data的L2范数Dtype sumsq_diff() const;//计算diff的L2范数void scale_data(Dtype scale_factor);//将data部分乘以一个因子void scale_diff(Dtype scale_factor);//将diff部分乘一个因子
这几个函数是一些零散的功能,一看就懂。
void ShareData(const Blob& other);void ShareData(const Blob& other);
这两个函数看名字就知道了一个是共享data,一个是共享diff,具体就是将别的blob的data和响应的diff指针给这个Blob,实现数据的共享。同时需要注意的是这个操作会引起这个Blob里面的SyncedMemory被释放,因为shared_ptr指针被用=
重置的时候回调用响应的析构器。
bool ShapeEquals(const BlobProto& other);
这函数就不用说了,比较两个Blob形状是否相同
好了,基本上Blob的主要参数功能基本就涵盖在里面了,以上只是我的拙见,如有纰漏,还望指出,万分感谢。