Caffe模型详细介绍

Caffe(Convolutional Architecture for Fast Feature Embedding,快速特征嵌入的卷积体系结构),是一个高效的深度学习框架,底层核心语言是C++,它支持命令行、Python和Matlab接口,它既可以在CPU上运行也可以在GPU上运行,据文献显示目前部分科技公司在尝试将Caffe模型在NPU上运行,以提高系统处理效率。

Caffe的所有计算都由layer的形式表示,即接受数据,输出计算结果等。

1 Caffe框架

Caffe把网络中的数据抽象为Blob,各层网络抽象成Layer,整个网络抽象成Net,网络求解方法抽象为Solver。

(1) Model

models以Google Protocol Buffers的方式存储在磁盘上。

(2) Blobs

描述了layer与layer、layer与net之间的数据存储和通信等。通常Blob以4维数据矩阵(batch, channel, height, weight)的方式存储数据、参数以及loss。

Blob存储4维数据时:

  • Data blob:  batch * channel * height * weight
  • Kernel blob <卷积权重>: output * intput * height * weight
  • Bias blob <卷积偏置>:  output * 1 * 1 * 1

(3) Layers

是model计算的基础,是网络的基本单元。神经网络的一层对应一个layer,可以用一个或多个的blob作为输入(input blob)或输出(output blob)。layer的职责为前向传播和反向传播。

(4) Net

是layers组成的有向无环图。

(5) Solver

是Net的求解。

(6) Caffe

定义layer-by-layer网络。会保留完整的有向无环图保证前向和反向传播。

  • Caffe是端到端的ML系统,典型网络从data(数据)层开始到loss层结束。

特点

  • 模块化:允许对新数据格式、网络层和损失函数进行扩展。
  • 表示和实现分离:模型定义用Protocol Buffer语言写进配置文件,即通过文本构建模型和优化策略,而不是代码。 

你可能感兴趣的:(DL,深度学习)