沤江一流

（Caffe，LeNet）初始化训练网络（三）

本文地址：http://blog.csdn.net/mounty_fsc/article/details/51090306

1. Solver到Net

在SGDSolver的构造函数中详见本系列博文（二），主要执行了其父类Solver的构造函数，接着执行Solver::Init()函数，在Init()中，有两个函数值得注意：InitTrainNet()和InitTestNets()分别初始化训练网络和测试网络。

1.1 InitTrainNet

首先，ReadNetParamsFromTextFileOrDie(param_.net(), &net_param)把param_.net()（即examples/mnist/lenet_train_test.prototxt）中的信息读入net_param。
其次，net_.reset(new Net(net_param))重新构建网络，调用Net的构造方法。
然后，在构造方法中执行Net::init()，开始正式创建网络。其主要代码如下：

 template <typename Dtype>
    void Net::Init(const NetParameter& in_param) {
    ...
      for (int layer_id = 0; layer_id < param.layer_size(); ++layer_id) {

        // Setup layer.
        const LayerParameter& layer_param = param.layer(layer_id);

        // 在这里创建网络层
        layers_.push_back(LayerRegistry::CreateLayer(layer_param));

        // Figure out this layer's input and output
        for (int bottom_id = 0; bottom_id < layer_param.bottom_size();  ++bottom_id) {
          const int blob_id = AppendBottom(param, layer_id, bottom_id, &available_blobs, &blob_name_to_idx);
          // If a blob needs backward, this layer should provide it.
          need_backward |= blob_need_backward_[blob_id];
        }
        int num_top = layer_param.top_size();
        for (int top_id = 0; top_id < num_top; ++top_id) {
          AppendTop(param, layer_id, top_id, &available_blobs, &blob_name_to_idx);
        }
     ...

      // 在这里配置网络层
      layers_[layer_id]->SetUp(bottom_vecs_[layer_id], top_vecs_[layer_id]);
      ...
     }

    for (int param_id = 0; param_id < num_param_blobs; ++param_id) {
      AppendParam(param, layer_id, param_id);
    }

    ...
    }

说明：

Lenet5在caffe中共有9层，即param.layer_size()==9，以上代码每一次for循环创建一个网络层
每层网络是通过LayerRegistry::CreateLayer()创建的，类似与Solver的创建（详见本系列博文（二））
14行Net::AppendBottom()，对于layer_id这层，从Net::blob_中取出blob放入该层对应的bottom_vecs_[layer_id]中
20行Net::AppendTop()，对于layer_id这层，创建blob（未包含数据）并放入Net::blob_中
AppendParam中把每层网络的训练参数与网络变量learnable_params_绑定，在lenet中，只有conv1,conv2,ip1,ip2四层有参数，每层分别有参数与偏置参数两项参数，因而learnable_params_的size为8.

1.2 LayerRegistry::CreateLayer

工厂模式new出网络层对象，具体在后边每层详细说明。

1.3 Layer::SetUp

void SetUp(const vector*>& bottom,
   const vector*>& top) {
 InitMutex();

 CheckBlobCounts(bottom, top);

 //每层进行配置
 LayerSetUp(bottom, top);

 //修改输出数据的维数（即top_blob的维数）等
 //关注数据维数的应关注此函数
 Reshape(bottom, top);

 //设置损失权重
 SetLossWeights(top);
}

其中，Reshape函数中通过compute_output_shape计算输出blob的函数，

对于Convolution 层，公式如下，其中，input等数均可代表height或者width;dilation默认为1，所以默认kernel_extent=kernel：
output=(input+2∗pad−kernel_extent)stride+1
kernel_extent=dilation∗(kernel−1)+1
对于Pooling层，公式如下，其中ceil取下限：
output=ceil(input+2∗pad−kernelstride)+1

注意：Convolution、Pooling整体公式计算相同，但前者取下限（设局不够时舍弃）后者取上限（数据不够时不舍弃）。

1.4 InitTestNets

该部分内容见本系列博文：（Caffe，Lenet5）初始化测试网络（四）。

2 训练网络结构

序	Layer	layer Type Bottom	Blob Top	Blob Top	Blob Shape
1	minst	Data		data&&label	64 1 28 28 (50176) && 64 (64)
2	conv1	Convolution	data	conv1	64 20 24 24 (737280)
3	pool1	Pooling	conv1	pool1	64 20 12 12 (184320)
4	conv2	Convolution	pool1	conv2	64 50 8 8 (204800)
5	pool2	Pooling	conv2	pool2	64 50 4 4 (51200)
6	ip1	InnerProduct	pool2	ip1	64 500 (32000)
7	relu1	ReLU	ip1	ip1(in-place)	64 500 (32000)
8	ip2	InnerProduct	ip1	ip2	64 10 (640)
9	loss	SoftmaxWithLoss	ip2&&label	loss	(1)

注：Top Blob Shape格式为：BatchSize，ChannelSize，Height，Width（Total Count）

网络结构如图所示：

3 第一层：Data Layer

3.1 protobuff定义

训练网络的第一层protobuff定义为：

layer {
  name: "mnist"
  type: "Data"
  top: "data"
  top: "label"
  include {
    phase: TRAIN
  }
  transform_param {
    scale: 0.00390625
  }
  data_param {
    source: "examples/mnist/mnist_train_lmdb"
    batch_size: 64
    backend: LMDB
  }
}

3.2 函数LayerRegistry::CreateLayer

第1节中代码第一次通过调用LayerRegistry::CreateLayer()创建了DataLayer类，DataLayer类的继承关系如下图所示，详见[1]：

由继承图可知，调用DataLayer()的构造函数，依次执行的顺序为其基类构造函数：Layer()、BaseDataLayer()、InternalThread()（详见（Caffe）基本类InternalThread（三））、BasePrefetchingDataLayer()、及DataLayer()。

其中，值得注意的是DataLayer()，在调用基类构造函数BasePrefetchingDataLayer()之后，对 DataReader reader_ 进行赋值，在该DataLayer对象中维护了一个DataReader对象reader_，其作用是添加读取数据任务至，一个专门读取数据库（examples/mnist/mnist_train_lmdb）的线程（若还不存在该线程，则创建该线程），此处一共取出了4*64个样本至BlockingQueue DataReader::QueuePair::full_。详见（Caffe）基本类DataReader、QueuePair、Body（四）

template type>
DataLayertype>::DataLayer(const LayerParameter& param)
  : BasePrefetchingDataLayertype>(param),
    reader_(param) {
}

3.3 函数Layer::SetUp

此处按程序执行顺序值得关注的有：
在DataLayer::DataLayerSetUp中根据3.2DataReader中介绍的读取的数据中取出一个样本推测blob的形状

BasePrefetchingDataLayer::LayerSetUp如下代码prefetch_[i].data_.mutable_cpu_data()用到了涉及到gpu、cpu间复制数据的问题，见（Caffe）基本类Blob，Layer，Net（一）1.4SyncedMemory及引用[2]

 // Before starting the prefetch thread, we make cpu_data and gpu_data
 // calls so that the prefetch thread does not accidentally make simultaneous
 // cudaMalloc calls when the main thread is running. In some GPUs this
 // seems to cause failures if we do not so.
 for (int i = 0; i < PREFETCH_COUNT; ++i) {
   prefetch_[i].data_.mutable_cpu_data();
   if (this->output_labels_) {
     prefetch_[i].label_.mutable_cpu_data();
   }
 }

BasePrefetchingDataLayer类继承了InternalThread，BasePrefetchingDataLayer::LayerSetUp中通过调用StartInternalThread()开启了一个新线程，从而执行BasePrefetchingDataLayer::InternalThreadEntry
BasePrefetchingDataLayer::InternalThreadEntry关键代码如下，其中load_batch(batch)为，从2.2介绍的BlockingQueue DataReader::QueuePair::full_（包含从数据库读出的数据）中读取一个batch_size的数据到BlockingQueue*> BasePrefetchingDataLayer::prefetch_full_中。由于该线程在prefetch_free_为空时将挂起等待（PREFETCH_COUNT=3），prefetch_full_中用完的Batch将放回prefetch_free_中。该线程何时停止？
```
    while (!must_stop()) {
      Batch<Dtype>* batch = prefetch_free_.pop();
      load_batch(batch);

#ifndef CPU_ONLY

      if (Caffe::mode() == Caffe::GPU) {
        batch->data_.data().get()->async_gpu_push(stream);
        CUDA_CHECK(cudaStreamSynchronize(stream));
      }

#endif

      prefetch_full_.push(batch);
    }
```

关于线程的总结：

此外一共涉及到两个线程，分别为都是继承了InnerThread的BasePrefetchingDataLayer(DataLayer)类和DataReader中的Body类
Body为面向数据库的线程，不断从某个数据库中读出数据，存放至缓存为队列DataReader::QueuePair::BlockingQueue，一般保存4*64个单位数据，单位为Datum
BasePrefetchingDataLayer为面向网络的线程，从Body的缓存中不断读取数据。BasePrefetchingDataLayer的缓存为队列BlockingQueue，一般存放3个单位的数据，单位为Batch

static const int PREFETCH_COUNT = 3;
Batch prefetch_[PREFETCH_COUNT];
BlockingQueue*> prefetch_free_;
BlockingQueue*> prefetch_full_;

template <typename Dtype>
BasePrefetchingDataLayer::BasePrefetchingDataLayer(
    const LayerParameter& param)
    : BaseDataLayer(param),
      prefetch_free_(), prefetch_full_() {
  for (int i = 0; i < PREFETCH_COUNT; ++i) {
    prefetch_free_.push(&prefetch_[i]);
  }
}

prefetch_full_与prefetch_free_中的元素由prefetch_提供

4 第二层：Convolution Layer

4.1 protobuff定义

layer {
  name: "conv1"
  type: "Convolution"
  bottom: "data"
  top: "conv1"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 20
    kernel_size: 5
    stride: 1
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}

4.2 函数LayerRegistry::CreateLayer

说明：

不像DataLayer 直接执行的是构造函数，此时执行的是GetConvolutuionLayer()，然后调用ConvolutionLayer()，原因如下：

REGISTER_LAYER_CREATOR(Convolution, GetConvolutionLayer);

4.3 Layer::SetUp

在`Layer::SetUp`中，调用了`ConvolutionLayer`的基类`BaseConvolutionLayer`的`LayerSetUp及Reshape`函数，该类的主要成员变量如下：

/**
 * @brief Abstract base class that factors out the BLAS code common to
 *        ConvolutionLayer and DeconvolutionLayer.
 */
template <typename Dtype>
class BaseConvolutionLayer : public Layer {
 public:
  explicit BaseConvolutionLayer(const LayerParameter& param)
      : Layer(param) {}
  virtual void LayerSetUp(const vector*>& bottom,
      const vector*>& top);
  virtual void Reshape(const vector*>& bottom,
      const vector*>& top);

 ...
  /// @brief The spatial dimensions of a filter kernel.
  Blob<int> kernel_shape_;
  /// @brief The spatial dimensions of the stride.
  Blob<int> stride_;
  /// @brief The spatial dimensions of the padding.
  Blob<int> pad_;
  /// @brief The spatial dimensions of the dilation.
  Blob<int> dilation_;
  /// @brief The spatial dimensions of the convolution input.
  Blob<int> conv_input_shape_;
  /// @brief The spatial dimensions of the col_buffer.
  vector<int> col_buffer_shape_;
  /// @brief The spatial dimensions of the output.
  vector<int> output_shape_;
  const vector<int>* bottom_shape_;
...
};

**说明：**

LayerSetUp函数中，主要是初始化了kernel_shape_、stride_、pad_、dilation_以及初始化网络参数，并存放与Layer::blobs_中。
Reshape函数中，conv_input_shape_、bottom_shape_等

5 第三层：Pooling Layer

5.1 protobuff定义

layer {
  name: "pool1"
  type: "Pooling"
  bottom: "conv1"
  top: "pool1"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}

5.2 Layer::SetUp

通过调用虚函数LayerSetUp及Reshape对以下成员变量进行初始化

/**
 * @brief Pools the input image by taking the max, average, etc. within regions.
 *
 * TODO(dox): thorough documentation for Forward, Backward, and proto params.
 */
template 
class PoolingLayer : public Layer {
 ....
  int kernel_h_, kernel_w_;
  int stride_h_, stride_w_;
  int pad_h_, pad_w_;
  int channels_;
  int height_, width_;
  int pooled_height_, pooled_width_;
  bool global_pooling_;
  Blob rand_idx_;
  Blob<int> max_idx_;
};

6 第四层、第五层

基本同第二层、第三层

7 第六层：InnerProduct Layer

7.1 protobuff定义

layer {
  name: "ip1"
  type: "InnerProduct"
  bottom: "pool2"
  top: "ip1"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 500
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}

7.2 Layer::SetUp

/**
 * @brief Also known as a "fully-connected" layer, computes an inner product
 *        with a set of learned weights, and (optionally) adds biases.
 *
 * TODO(dox): thorough documentation for Forward, Backward, and proto params.
 */
template 
class InnerProductLayer : public Layer {
 ...
  int M_;
  int K_;
  int N_;
  bool bias_term_;
  Blob bias_multiplier_;
};

说明：

N_为输出大小，即等于protobuff中定义的num_output
K_为输入大小，对于该层Bottom Blob形状为(N, C, H, W)，N为batch_size，K_=C*H*W（Caffe）基本类Blob，Layer，Net（一），M_=N。其中只有C、H、W跟内积相关

8 第七层：ReLU Layer

8.1 protobuff定义

layer {
  name: "relu1"
  type: "ReLU"
  bottom: "ip1"
  top: "ip1"
}

8.2 说明

ReLULayer主要是用来做计算的，其继承关系如下，详细参加[4]、[5]

9 第八层：InnerProduct Layer

参见第7节

10 第九层：SoftmaxWithLoss Layer

10.1 protobuff定义

layer {
  name: "loss"
  type: "SoftmaxWithLoss"
  bottom: "ip2"
  bottom: "label"
  top: "loss"
}

10.2 LayerRegistry::CreateLayer

10.3 Layer::SetUp

值得注意的是：

类SoftmaxWithLossLayer包含类SoftmaxLayer的实例
shared_ptr > softmax_layer_
softmax_layer_在LayerSetUp中赋值。
此函数内调用Layer::SetLossWeights初始化了该层的Top Blob（loss）
两个类间的关系如下图：
成员变量prob_作为Softmaxlayer的top blob
bottom blob[0]作为softmaxlayer的bottom blob
所以经过softmaxlayer计算之后，得出64*10（每个样本的每个类别上的概率）存放在prob_中

11 剩余的工作

至此，训练网络基本创建完毕，接下来剩下的工作主要有：

反向检查一次网络，看哪些blobs会对loss产生影响，在LeNet5中，前面的9层均有影响
初始化权值共享

[1].http://caffe.berkeleyvision.org/doxygen/classcaffe_1_1BasePrefetchingDataLayer.html
[2].http://caffe.berkeleyvision.org/tutorial/net_layer_blob.html Implementation Details
[3].http://caffe.berkeleyvision.org/doxygen/classcaffe_1_1ConvolutionLayer.html
[4].http://caffe.berkeleyvision.org/doxygen/classcaffe_1_1ReLULayer.html
[5].http://caffe.berkeleyvision.org/tutorial/layers.html ReLU / Rectified-Linear and Leaky-ReLU

【深度学习-Day 36】CNN的开山鼻祖：从LeNet-5到AlexNet的架构演进之路吴师兄大模型深度学习入门到精通 python pytorch 开发语言人工智能 CNN 深度学习大模型
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
深度学习——CNN（3）飘涯
前言：前面介绍了最基本的Lenet，下面介绍几种其他的网络结构CNN-AlexNet网络结构如下图：从图中可以看出，采用双gpu训练增加LRN归一化层：本质上，这个层也是为了防止激活函数的饱和的。采用dropout防止过拟合基于AlexNet进行微调，诞生了ZF-netCNN-GoogleNetGoogLeNet借鉴了NIN的特性，在原先的卷积过程中附加了11的卷积核加上ReLU激活。这不仅仅提升
【AI】AI大模型发展史：从理论探索到技术爆发不想当程序汪的第N天 AI 人工智能
一、早期探索阶段—理论与技术奠基1.1符号主义与连接主义的博弈20世纪50-70年代，符号主义AI主导研究方向，通过专家系统模拟人类逻辑推理，但受限于计算能力和数据规模。80年代连接主义AI兴起，以神经网络为核心，反向传播算法的提出为深度学习奠定基础。1.2神经网络初步实践1980年：卷积神经网络（CNN）雏形诞生1998年：LeNet-5模型成功应用于手写数字识别，成为首个商用深度学习模型关键局
CNN-GRU混合模型学习笔记 weixin_54372988 cnn gru 学习
GRU学习笔记CNN：卷积神经网络GRU（GateRecurrentUnit），门控循环单元CNN：卷积神经网络3个组成部分：1.卷积层——提取图像局部特征2.池化层——降维（防止过拟合）3.全连接层——输出结果一个卷积核扫完整张图片，得到每个小区域的特征值具体应用中通常有多个卷积核CNN可能有多层结构，如LeNet-5：卷积层–池化层–卷积层–池化层–卷积层–全连接层处理时间序列（1D序列）：（
Python训练营---DAY54 2501_91182850 Python训练营 python 开发语言深度学习
DAY54Inception网络及其思考知识点回顾：传统计算机视觉发展史：LeNet-->AlexNet-->VGGNet-->nceptionNet-->ResNetinception模块和网络特征融合方法阶段性总结：逐元素相加、逐元素相乘、concat通道数增加等感受野与卷积核变体：深入理解不同模块和类的设计初衷作业：一次稍微有点学术感觉的作业：对inception网络在cifar10上观察精
深度学习“炼丹”实战：用LeNet驯服MNIST“神兽” AI妈妈手把手深度学习人工智能 LeNet cnn 模型训练学习笔记 MNIST
宝子们，在深度学习的神秘世界里，咱们就像一群“炼丹师”，而模型就是咱们精心炼制的“丹药”，数据集则是炼丹的“原材料”。今天，咱们就用经典的LeNet卷积神经网络模型，在MNIST手写数字数据集这个“原材料宝库”里，炼制出一颗能精准识别数字的“神奇丹药”！LeNet网络结构回顾，见：深度学习图像分类六大经典网络结构全解析一、MNIST数据集：炼丹的“珍贵原料”MNIST数据集可是深度学习界的“老牌明
计算机视觉卷积神经网络（CNN）基础：从LeNet到ResNet xcLeigh 计算机视觉CV 计算机视觉 cnn 人工智能 AI 卷积神经网络
计算机视觉卷积神经网络（CNN）基础：从LeNet到ResNet一、前言二、卷积神经网络基础概念2.1卷积层2.1.1卷积运算原理2.1.2卷积核的作用与参数2.2池化层2.2.1最大池化与平均池化2.2.2池化层的优势与应用2.3全连接层2.3.1全连接层的连接方式2.3.2全连接层在CNN中的角色三、LeNet网络3.1LeNet的网络结构3.1.1整体架构概述3.1.2各层详细介绍3.2Le
caffe之利用mnist数据集训练好的lenet_iter_10000.caffemodel模型测试一张自己的手写体数字 xunan003 深度学习 caffe
一、前沿写这篇博文，是因为一开始在做《21天学习caffe》第6天6.4练习题1的时候看着自己搜索的博文，在不理解其根本的情况下做的，结果显然是错的。在接下来阅读完源代码之后，在第10天学习完caffemodelzoo之后，明白了其中原理，反过来再去做那个习题，一开始在网上搜索并没有完完整整解释整个过程的一篇博文，而是写的不知所云，本着我们初学者互相共享的精神，也方便自己查阅，特详细写一下，将自己
Python----神经网络发（神经网络发展历程）蹦蹦跳跳真可爱589 Python 深度学习神经网络计算机视觉神经网络人工智能深度学习 python
年份网络名称突出点主要成就论文地址1989LeNet首个现代卷积神经网络（CNN），引入卷积、池化操作手写数字识别先驱，奠定CNN基础MNISTDemosonYannLeCun'swebsite2012AlexNet首次大规模使用深度卷积神经网络进行图像识别；引入ReLU、Dropout、重叠池化、GPU加速；大规模数据增强。2012年ImageNet图像识别竞赛冠军，Top-5错误率远低于第二名
cnn卷积神经变体 MYH516 cnn 人工智能神经网络
CNN（卷积神经网络）在计算机视觉领域取得了巨大成功，其变体主要围绕结构优化、计算效率、多尺度特征融合和注意力机制展开。以下是常见的CNN变体及其核心改进点：一、经典架构演进1.LeNet-5（1998）改进：首个成功应用的CNN，奠定了卷积、池化的基本结构。应用：手写数字识别（MNIST）。2.AlexNet（2012）改进：引入ReLU激活函数、Dropout、数据增强，开启深度学习时代。应用
Pytorch构建LeNet进行MNIST识别 #自用 BandieraRosa 深度学习随记 pytorch 人工智能 python
LeNet是一种经典的卷积神经网络（CNN）结构，由YannLeCun等人在1998年提出，主要用于手写数字识别（如MNIST数据集）。作为最早的实用化卷积神经网络，LeNet为现代深度学习模型奠定了基础，其设计思想至今仍被广泛采用。LeNet由7层组成，包含卷积层、池化层和全连接层：输入层输入为32x32像素的灰度图像（如手写数字扫描图），经过归一化处理。第一卷积层（C1）使用6个5x5的卷积核
【深度学习】6. 卷积神经网络，CNN反向传播，感受野，池化变种,局部连接机制，可视化实例 pen-ai 深度学习机器学习深度学习 cnn 人工智能
卷积神经网络（ConvolutionalNeuralNetworks）一、卷积神经网络的历史发展Neocognitron（1980）由KunihikoFukushima提出，Neocognitron是最早模拟人类视觉皮层结构的人工神经网络架构。它具备层级结构与局部连接机制，可以实现位置不变性的图像识别，是现代CNN的雏形。LeNet-5（1998）YannLeCun等人提出了LeNet-5，这是第
PyQT 做图像分类GUI，生成exe文件听风吹等浪起深度学习之应用篇 pyqt python 开发语言多分类人工智能
目录1.介绍2.LeNet神经网络3.其他代码4.生成exe可执行文件5.运行结果1.介绍这次文章目的是用PyQT做一个实际的项目因为图像分类的网络通过主流的网络框架很容易实现，但是想要真实的预测图像的话，之前的方法都是再pycharm里面生成一个predict.py文件。然后再里面用PIL去读取图像，传递给网络后再pycharm里面进行输出预测由于这样的方式预测图像很麻烦，而且电脑上没有pyth
卷积神经网络(CNN)原理与实战：从LeNet到ResNet 软考和人工智能学堂 #DeepSeek快速入门人工智能 #深度学习 cnn 人工智能神经网络
卷积神经网络(CNN)作为深度学习的核心技术之一，彻底改变了计算机视觉领域的格局。本文将全面解析CNN的工作原理，并通过PyTorch框架实现从经典LeNet到现代ResNet的完整代码示例，帮助读者深入理解这一强大工具。卷积神经网络的核心思想传统全连接神经网络在处理图像数据时面临巨大挑战。想象一下，一张普通的300x300像素彩色图像，如果将其展平作为输入，仅输入层就需要270,000个节点（3
神经网络与深度学习(三）——卷积神经网络基础阿健也会编程神经网络深度学习 cnn
卷积神经网络基础1.为什么要学习神经网络1.1全连接网络问题1.2深度学习平台简介1.3PyTorch简介1.4简单示例2.卷积神经网络基础2.1进化史2.2特征提取2.3基本结构3.学习算法3.1前向传播3.2误差反向传播3.2.1经典BP算法3.2.2卷积NN的BP算法4.LeNet-5网络4.1网络介绍4.2网络结构详解4.3LeNet5代码实现1.为什么要学习神经网络1.1全连接网络问题链
LeNet-5详解巷955 cnn 人工智能神经网络
LeNet-5是卷积神经网络（CNN）的开山之作，由YannLeCun团队于1998年提出，最初用于手写数字识别（MNIST数据集）。以下是其详细解析：1.网络结构LeNet-5由7层组成（不含输入层），包含2个卷积层、2个池化层和3个全连接层。以下是经典结构（输入为32×32灰度图像）：层类型参数说明输出尺寸输入层32×32×1（MNIST图像被填充至32×32）32×32×1卷积层C16个5×
常见的卷积神经网络列举巷955 cnn 人工智能神经网络
经典的卷积神经网络（CNN）在深度学习发展史上具有重要地位，以下是一些里程碑式的模型及其核心贡献：1.LeNet-5（1998）提出者：YannLeCun特点：首个成功应用于手写数字识别（MNIST）的CNN。结构：卷积层+池化层（当时用Subsampling）+全连接层。使用Tanh激活函数，后续被ReLU取代。意义：奠定了CNN的基本结构。2.AlexNet（2012）提出者：AlexKriz
从零实现LeNet5卷积神经网络：MNIST手写数字识别实战 loopdeloop cnn 人工智能神经网络
在深度学习领域，卷积神经网络(CNN)已成为图像处理的核心技术。本文将带您实现经典的LeNet5网络架构，并在MNIST手写数字数据集上进行训练与评估。我们将深入探讨数据预处理、网络设计、模型训练和性能分析等关键环节，帮助您全面理解卷积神经网络的工作原理。1.MNIST数据集简介MNIST是机器学习领域最著名的基准数据集之一，包含60,000张训练图像和10,000张测试图像，每张图像是28×28
Python----卷积神经网络（LeNet-5的手写体识别）蹦蹦跳跳真可爱589 Python 卷积神经网络 python cnn 深度学习人工智能神经网络
一、设置随机种子设置随机种子有助于结果的可复现性。importnumpyasnp#导入NumPy库importrandom#导入随机数生成库importos#导入操作系统相关功能importtorch#导入PyTorch库defsetup_seed(seed=0):#设置NumPy的随机种子np.random.seed(seed)#设置Python内置的随机数生成器的种子random.seed(s
卷积神经网络（CNN）的主要架构彩旗工作室人工智能 cnn 人工智能神经网络深度学习机器学习
卷积神经网络（CNN,ConvolutionalNeuralNetworks）是深度学习中最重要的模型之一，广泛应用于计算机视觉、目标检测、语义分割等任务。自LeNet诞生以来，CNN结构经历了多个重要发展阶段，出现了许多经典架构，包括AlexNet、VGG、GoogLeNet（Inception）、ResNet、DenseNet、MobileNet等。本文将详细介绍CNN的主要架构及其核心思想，
【DAY20240927】经典深度学习模型对比：LeNet5、CNN、ResNet20、AlexNet、TextCNN 与 VGG-11 胆小鬼~ 深度学习 cnn 人工智能
文章目录前言一、LeNet5二、CNN三、AlexNet四、ResNet20五、TextCNN六、VGG-11前言Weleverage6modelstodealwiththedata,i.e.,LeNet5(LeNet)(LeCunetal.1989),asyntheticCNNnetwork(CNN),ResNet20(ResNet)(Heetal.2016),AlexNet(Krizhevsk
卷积神经网络(CNN)详解：原理、核心组件与应用实践北辰alk AI cnn 人工智能神经网络
文章目录一、卷积神经网络概述二、CNN核心组件详解1.卷积层(ConvolutionalLayer)2.激活函数(ActivationFunction)3.池化层(PoolingLayer)4.全连接层(FullyConnectedLayer)5.批归一化层(BatchNormalization)6.Dropout层三、经典CNN架构1.LeNet-5(1998)2.AlexNet(2012)3.
手搓LeNet-5（基础模型）实现交通标志识别竹之却机器学习 LeNet-5 CNN 卷积神经网络基础模型神经网络 python
手搓LeNet-5（基础模型）实现交通标志识别一、环境准备1.安装Python环境2.安装CUDA（可选，仅需GPU加速时）3.配置虚拟环境4.安装PyTorch核心库5.安装辅助库6.验证安装7.准备数据集8.常见问题处理二、数据集处理三、模型实现四、训练流程五、模型部署5.1导出为ONNX格式5.2使用Flask部署服务5.3测试API六、总结本文将使用PyTorch从零实现经典的LeNet-
lenet神经网络 winnertakeall tensorflow lenet神经网络
lenet神经网络结构为：1.输入为32*32*1的图片大小，为单通道的输入：2.进行卷积，卷积核大小为5*5*1，个数为6，步长为1，非全零填充模式；3.将卷积结果通过非线性激活函数；t4.进行池化，池化大小为2*2，步长为1，全零填充模式；5.进行卷积，卷积核大小为5*5*6，个数为16，步长为1，非全零填充模式；6.将卷积结果通过非线性激活函数；7.进行池化，池化大小为2*2，步长为1，全零
Lenet 神经网络结构 loyalty-l
Lenet神经网络结构为:1输入为32*32*1的图片大小,为单通道的输入;2进行卷积,卷积核大小为5*5*1,个数为6,步长为1,非全零填充模式;3将卷积结果通过非线性激活函数;4进行池化,池化大小为2*2,步长为1,全零填充模式;5进行卷积,卷积核大小为5*5*6,个数为16,步长为1,非全零填充模式;6将卷积结果通过非线性激活函数;7进行池化,池化大小为2*2,步长为1,全零填充模式;8全连
卷积神经网络——LeNet网络 rookiexiong 机器学习神经网络机器学习深度学习
LeNet网络是一种经典的卷积神经网络(ConvolutionalNeuralNetwork，CNN)，由YannLeCun等人于1998年提出，LeNet的设计初衷是用于识别手写数字的邮政编码和地址。LeNet网络结构相对简单，不包括输入层的情况下，共有7层：2个卷积层、2个下采样层（池化层）、3个全连接层，各层次具体功能如下：卷积层(ConvolutionalLayer)：每个卷积层包含一个卷
LeNet神经网络 code 旭 AI人工智能学习神经网络人工智能深度学习
一、LeNet概述1.历史地位开创性模型：首个成功应用的卷积神经网络（1998年）应用场景：手写数字识别（MNIST数据集）、银行支票识别提出者：YannLeCun团队（论文《Gradient-BasedLearningAppliedtoDocumentRecognition》）2.核心创新传统全连接网络LeNet卷积操作权值共享下采样二、网络结构详解（LeNet-5）1.经典架构图2.各层参数说
基于CNN与VGG16的图像识别快速实现指南我太想进步了C～～ neo4j
基于CNN与VGG16的图像识别快速实现指南以下是从零实现代码到原理剖析的完整流程，包含TensorFlow/Keras框架的代码示例与关键优化技巧，满足快速实验需求。一、核心原理对比特性CNN（基础模型）VGG16结构深度5-10层（如LeNet、AlexNet）16层（13卷积层+3全连接层）卷积核大小混合使用（如5×5、3×3）全部使用3×33×3小卷积核（减少参数，增强非线性）2参数量约数
如何转行人工智能？该如何学习？放牛班的春天1 人工智能学习自然语言处理机器学习深度学习语言模型
对于本科没有相关基础，研究生被导师赶鸭子上架的学生，这里推荐两个星期左右补基础，剩下时间直接水论文。基础篇：第一步建议把pytorch的lenet手写数字识别每一行代码都看懂（耗时大概一下午）。第二步结合实验室研究方向和算力基础，开始根据关键词在谷歌搜3-10篇近5年的高引用论文，粗读完后挑一篇最相近的，涉及数学不多的，开始读（耗时大概1-2周）。论文最好带源码，这样一边读源码一边看论文。如果英语
《深度学习》课程之卷积神经网络原理与实践教学设计方案人工智能教学实践人工智能 DeepSeek
《深度学习》课程之卷积神经网络原理与实践教学设计方案一、教学目标设计（一）知识目标学生能够准确描述卷积神经网络（CNN）的基本定义，包括其核心组成部分（如卷积层、池化层、全连接层等）及其在图像识别任务中的作用。理解卷积神经网络的基本工作原理，掌握卷积运算、池化操作的数学定义和物理意义，以及它们对图像特征提取的影响。了解LeNet-5模型的网络结构，包括各层的参数设置、输入输出维度等。（二）技能目标
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe

（Caffe，LeNet）初始化训练网络（三）

1. Solver到Net

1.1 InitTrainNet

1.2 LayerRegistry::CreateLayer

1.3 Layer::SetUp

1.4 InitTestNets

2 训练网络结构

3 第一层：Data Layer

3.1 protobuff定义

3.2 函数LayerRegistry::CreateLayer

3.3 函数Layer::SetUp

4 第二层：Convolution Layer

4.1 protobuff定义

4.2 函数LayerRegistry::CreateLayer

4.3 Layer::SetUp

5 第三层：Pooling Layer

5.1 protobuff定义

5.2 Layer::SetUp

6 第四层、第五层

7 第六层：InnerProduct Layer

7.1 protobuff定义

7.2 Layer::SetUp

8 第七层：ReLU Layer

8.1 protobuff定义

8.2 说明

9 第八层：InnerProduct Layer

10 第九层：SoftmaxWithLoss Layer

10.1 protobuff定义

10.2 LayerRegistry::CreateLayer

10.3 Layer::SetUp

11 剩余的工作

你可能感兴趣的:(LeNet)