奋斗路上的产品狗

ResNet网络详解与keras实现

ResNet网络详解与keras实现
- - Resnet网络的概览
  - Pascal_VOC数据集
    - 第一层目录
    - 第二层目录
    - 第三层目录
  - 梯度退化
  - Residual Learning
  - Identity vs Projection Shortcuts
  - Bottleneck architecture
  - Resnet网络构建表
  - ResNet论文结果
    - 为了搭建Resnet网络我们使用了以下策略
    - 整个代码的流程如下
  - 实验结果
  - 实验结果分析
  - 本博客相关引用

本博客旨在给经典的ResNet网络进行详解与代码实现，如有不足或者其他的见解，请在本博客下面留言。

Resnet网络的概览

为了解决训练很深的网络时候出现的梯度退化(gradient degradation)的问题,Kaiming He提出了Resnet结构。由于使用了残差学习的方法(Resuidal learning)，使得网络的层数得到了大大的提升。
ResNet由于使用了shortcut,把原来需要学习逼近的未知函数H(x)恒等映射(Identity mapping),变成了逼近F(x)=H(x)-x的一个函数。作者认为这两种表达的效果相同，但是优化的难度却并不相同，作者假设F(x)的优化会比H(x)简单的多。这一想法也是源于图像处理中的残差向量编码，通过一个reformulation，将一个问题分解成多个尺度直接的残差问题，能够很好的起到优化训练的效果。
ResNet针对较深(层数大于等于50)的网络提出了BottleNeck的结构，这个结构可以减少运算的时间复杂度。
ResNet里存在两种shortcut,Identity shortcut & Projection shortcut。Identity shortcut使用零填充的方式保证其纬度不变，而Projection shortcut则具有下面的形式 y=F(x,Wi)+Wsx 来匹配纬度的变换。
ResNet这个模型在图像处理的相关任务中具有很好的泛化性，在2015年的ImageNet Recognization,ImageNet detection,ImageNet localization,COCO detection,COCO segmentation等等任务上取得第一的成绩。

在本篇博客中，将对Resnet的结构进行详细的解释，并用代码实现ResNet的网络结构。同时，本文还将引入另一篇论文<>，来更加深入的理解Resnet。本文使用VOC2012的数据集进行网络的训练，验证，与测试。为了快速开发，本次我们把Keras作为代码的框架。

Pascal_VOC数据集

Pascal VOC为图像识别，检测与分割提供了一整套标准化的优秀的数据集，每一年都会举办一次图像识别竞赛。下面是VOC2012，训练集(包括验证集)的下载地址。

VOC2012里面有20类物体的图片，图片总共有1.7万张。我把数据集分成了3个部分，训练集，验证集，测试集，比例为8:1:1。
下面是部分截图：

第一层目录

第二层目录

第三层目录

接着我们使用keras代码来使用这个数据集，代码如下：

IM_WIDTH=224 #图片宽度
IM_HEIGHT=224 #图片高度
batch_size=32 #批的大小

# train data
train_datagen = ImageDataGenerator(
    width_shift_range=0.1,
    height_shift_range=0.1,
    shear_range=0.1,
    zoom_range=0.1,
    horizontal_flip=True,
    rescale=1./255
)
train_generator = train_datagen.flow_from_directory(
    train_root,
    target_size=(IM_WIDTH, IM_HEIGHT),
    batch_size=batch_size,
    shuffle=True
)

# vaild data
vaild_datagen = ImageDataGenerator(
    width_shift_range=0.1,
    height_shift_range=0.1,
    shear_range=0.1,
    zoom_range=0.1,
    horizontal_flip=True,
    rescale=1./255
)
vaild_generator = train_datagen.flow_from_directory(
    vaildation_root,
    target_size=(IM_WIDTH, IM_HEIGHT),
    batch_size=batch_size,
)

# test data
test_datagen = ImageDataGenerator(
    rescale=1./255
)
test_generator = train_datagen.flow_from_directory(
    test_root,
    target_size=(IM_WIDTH, IM_HEIGHT),
    batch_size=batch_size,
)

我使用了3个ImageDataGenerator，分别来使用训练集，验证集与测试集的数据。使用ImageDataGenerator需要导入相应的模块，==from keras.preprocessing.image import ImageDataGenerator==。ImageDataGenrator可以用来做数据增强，提高模型的鲁棒性.它里面提供了许多变换，包括图片旋转，对称，平移等等操作。里面的flow_from_directory方法可以从相应的目录里面批量获取图片，这样就可以不用一次性读取所有图片(防止内存不足)。

梯度退化

按照我们的惯性思维，一个网络越深则这个网络就应该具有更好的学习能力，而梯度退化是指下面一种现象：随着网络层数的增加，网络的效果先是变好到饱和，然后立即下降的一个现象。在这里，我们引用一幅来自Resnet里面的图片，更加直观的理解这个现象：

从上图我们可以看出，一个56层的网络的训练误差和测试误差都大于一个20层的网络。

Residual Learning

为了解决梯度退化的问题，论文中提出了Residual learning这个方法，它通过构造一个Residual block来完成。如图Figure 2所示，引入残差结构以后，把原来需要学习逼近的未知函数H(x)恒等映射(Identity mapping),变成了逼近F(x)=H(x)-x的一个函数。作者认为这两种表达的效果相同，但是优化的难度却并不相同，作者假设F(x)的优化会比H(x)简单的多。这一想法也是源于图像处理中的残差向量编码，通过一个reformulation，将一个问题分解成多个尺度直接的残差问题，能够很好的起到优化训练的效果。

上图的恒等映射，是把一个输入x和其堆叠了2次后的输出F(x)的进行元素级和作为总的输出。因此它没有增加网络的运算复杂度，而且这个操作很容易被现在的一些常用库执行(e.g.,Caffe,tensorflow)。

下面是一张没有使用普通图(plain,即没有加入恒等映射的图)，与一张有shortcut图的对比：

最左边的图为经典的VGG-19图的网络结构，中间的图是一个类似于VGG-19的34层的普通图，最右边的图是34层的带有恒等映射的Resnet网络图。其中黑色的实线代表的是同一纬度(即卷积核的个数相同)下的恒等映射。而虚线指的是不同维度间(卷积核的个数不同)的恒等映射。

Identity vs Projection Shortcuts

除了最简单的Identity shortcuts(直接进行同纬度的元素级相加)，论文还研究了Projection shortcuts( $ y=F(x,{W_i})+W_sx$ ).论文研究了以下3种情况：

i. 对于纬度没有变化的连接进行直接相连，对于纬度增加的连接则通过补零填充后进行连接。由于shortcuts是恒等的，因此这个连接本身不会带来额外的参数。

ii. 对于纬度没有变化的连接进行直接相连，对于纬度增加的连接则通过投影相连，投影相连会增加参数。

iii. 对于所有的连接都采取投影相连。

作者对以上三种情况都进行了研究，发现iii的效果比ii好一点点点(marginly better)，发现ii的效果比i的效果好一点。这是因为 $W_s$ 中带来的额外参数所带来的效果。

Bottleneck architecture

如上图右边所示，作者在研究更深层次(层数大于50)的网络的时候，使用了Bottleneck这个网络结构。我觉得作者可能是参考了goolenet里面的Inception结构。我们可以看到在Bottleneck中，第一个1x1的卷积层用来在降低纬度(用来降低运算复杂度)，而后一个的1x1的卷积层则用来增加纬度，使其保持与原来的输入具有相同的纬度。(从而可以进行恒等映射)。

Resnet网络构建表

Tabel 1

上图是一个Resnet的网络构建表，它显示了resnet是怎么构成的。同时这个表还提供了各个网络的运算浮点数，虽然resnet的层数比较深，但是它的运算量都小于VGG-19（19.6x10的9次方)。

ResNet论文结果:

上图左边是普通的网络，右边是残差网络，较细的线代表验证误差，较粗的线则代表训练误差。我们可以看到普通的网络存在梯度退化的现象，即34层网络的训练和验证误差都大于18层的网络，而残差网络中则不存在这个现象。可见残差网络解决了梯度退化的问题。

为了搭建Resnet网络，我们使用了以下策略：

使用identity_block这个函数来搭建Resnet34,使用bottleneck这个函数来搭建Resnet50。
每个卷积层后都使用BatchNormalization，来防止模型过拟合，并且使输出满足高斯分布。
具体网络搭建可以参考Tabel.1，可以边看表里面的具体参数边搭网络。

整个代码的流程如下：

graph TD
A(导入相应库) --> Z[模型参数设置以及其它配置]
Z --> B[生成训练集,测试集,验证集的三个迭代器] 
B --> C[identity_block函数的编写]
C --> D[bottleneck_block函数的编写]
D --> F[根据resnet网络构建表来构建网络]
F --> G[模型训练与验证]
G --> H[模型保存]
H --> I(模型在测试集上测试)

# coding=utf-8
from keras.models import Model
from keras.layers import Input, Dense, Dropout, BatchNormalization, Conv2D, MaxPooling2D, AveragePooling2D, concatenate, \
    Activation, ZeroPadding2D
from keras.layers import add, Flatten
from keras.utils import plot_model
from keras.metrics import top_k_categorical_accuracy
from keras.preprocessing.image import ImageDataGenerator
from keras.models import load_model
import os

# Global Constants
NB_CLASS=20
IM_WIDTH=224
IM_HEIGHT=224
train_root='/home/faith/keras/dataset/traindata/'
vaildation_root='/home/faith/keras/dataset/vaildationdata/'
test_root='/home/faith/keras/dataset/testdata/'
batch_size=32
EPOCH=60

# train data
train_datagen = ImageDataGenerator(
    width_shift_range=0.1,
    height_shift_range=0.1,
    shear_range=0.1,
    zoom_range=0.1,
    horizontal_flip=True,
    rescale=1./255
)
train_generator = train_datagen.flow_from_directory(
    train_root,
    target_size=(IM_WIDTH, IM_HEIGHT),
    batch_size=batch_size,
    shuffle=True
)

# vaild data
vaild_datagen = ImageDataGenerator(
    width_shift_range=0.1,
    height_shift_range=0.1,
    shear_range=0.1,
    zoom_range=0.1,
    horizontal_flip=True,
    rescale=1./255
)
vaild_generator = train_datagen.flow_from_directory(
    vaildation_root,
    target_size=(IM_WIDTH, IM_HEIGHT),
    batch_size=batch_size,
)

# test data
test_datagen = ImageDataGenerator(
    rescale=1./255
)
test_generator = train_datagen.flow_from_directory(
    test_root,
    target_size=(IM_WIDTH, IM_HEIGHT),
    batch_size=batch_size,
)

def Conv2d_BN(x, nb_filter, kernel_size, strides=(1, 1), padding='same', name=None):
    if name is not None:
        bn_name = name + '_bn'
        conv_name = name + '_conv'
    else:
        bn_name = None
        conv_name = None

    x = Conv2D(nb_filter, kernel_size, padding=padding, strides=strides, activation='relu', name=conv_name)(x)
    x = BatchNormalization(axis=3, name=bn_name)(x)
    return x


def identity_Block(inpt, nb_filter, kernel_size, strides=(1, 1), with_conv_shortcut=False):
    x = Conv2d_BN(inpt, nb_filter=nb_filter, kernel_size=kernel_size, strides=strides, padding='same')
    x = Conv2d_BN(x, nb_filter=nb_filter, kernel_size=kernel_size, padding='same')
    if with_conv_shortcut:
        shortcut = Conv2d_BN(inpt, nb_filter=nb_filter, strides=strides, kernel_size=kernel_size)
        x = add([x, shortcut])
        return x
    else:
        x = add([x, inpt])
        return x

def bottleneck_Block(inpt,nb_filters,strides=(1,1),with_conv_shortcut=False):
    k1,k2,k3=nb_filters
    x = Conv2d_BN(inpt, nb_filter=k1, kernel_size=1, strides=strides, padding='same')
    x = Conv2d_BN(x, nb_filter=k2, kernel_size=3, padding='same')
    x = Conv2d_BN(x, nb_filter=k3, kernel_size=1, padding='same')
    if with_conv_shortcut:
        shortcut = Conv2d_BN(inpt, nb_filter=k3, strides=strides, kernel_size=1)
        x = add([x, shortcut])
        return x
    else:
        x = add([x, inpt])
        return x

def resnet_34(width,height,channel,classes):
    inpt = Input(shape=(width, height, channel))
    x = ZeroPadding2D((3, 3))(inpt)

    #conv1
    x = Conv2d_BN(x, nb_filter=64, kernel_size=(7, 7), strides=(2, 2), padding='valid')
    x = MaxPooling2D(pool_size=(3, 3), strides=(2, 2), padding='same')(x)

    #conv2_x
    x = identity_Block(x, nb_filter=64, kernel_size=(3, 3))
    x = identity_Block(x, nb_filter=64, kernel_size=(3, 3))
    x = identity_Block(x, nb_filter=64, kernel_size=(3, 3))

    #conv3_x
    x = identity_Block(x, nb_filter=128, kernel_size=(3, 3), strides=(2, 2), with_conv_shortcut=True)
    x = identity_Block(x, nb_filter=128, kernel_size=(3, 3))
    x = identity_Block(x, nb_filter=128, kernel_size=(3, 3))
    x = identity_Block(x, nb_filter=128, kernel_size=(3, 3))

    #conv4_x
    x = identity_Block(x, nb_filter=256, kernel_size=(3, 3), strides=(2, 2), with_conv_shortcut=True)
    x = identity_Block(x, nb_filter=256, kernel_size=(3, 3))
    x = identity_Block(x, nb_filter=256, kernel_size=(3, 3))
    x = identity_Block(x, nb_filter=256, kernel_size=(3, 3))
    x = identity_Block(x, nb_filter=256, kernel_size=(3, 3))
    x = identity_Block(x, nb_filter=256, kernel_size=(3, 3))

    #conv5_x
    x = identity_Block(x, nb_filter=512, kernel_size=(3, 3), strides=(2, 2), with_conv_shortcut=True)
    x = identity_Block(x, nb_filter=512, kernel_size=(3, 3))
    x = identity_Block(x, nb_filter=512, kernel_size=(3, 3))
    x = AveragePooling2D(pool_size=(7, 7))(x)
    x = Flatten()(x)
    x = Dense(classes, activation='softmax')(x)

    model = Model(inputs=inpt, outputs=x)
    return model

def resnet_50(width,height,channel,classes):
    inpt = Input(shape=(width, height, channel))
    x = ZeroPadding2D((3, 3))(inpt)
    x = Conv2d_BN(x, nb_filter=64, kernel_size=(7, 7), strides=(2, 2), padding='valid')
    x = MaxPooling2D(pool_size=(3, 3), strides=(2, 2), padding='same')(x)

    #conv2_x
    x = bottleneck_Block(x, nb_filters=[64,64,256],strides=(1,1),with_conv_shortcut=True)
    x = bottleneck_Block(x, nb_filters=[64,64,256])
    x = bottleneck_Block(x, nb_filters=[64,64,256])

    #conv3_x
    x = bottleneck_Block(x, nb_filters=[128, 128, 512],strides=(2,2),with_conv_shortcut=True)
    x = bottleneck_Block(x, nb_filters=[128, 128, 512])
    x = bottleneck_Block(x, nb_filters=[128, 128, 512])
    x = bottleneck_Block(x, nb_filters=[128, 128, 512])

    #conv4_x
    x = bottleneck_Block(x, nb_filters=[256, 256, 1024],strides=(2,2),with_conv_shortcut=True)
    x = bottleneck_Block(x, nb_filters=[256, 256, 1024])
    x = bottleneck_Block(x, nb_filters=[256, 256, 1024])
    x = bottleneck_Block(x, nb_filters=[256, 256, 1024])
    x = bottleneck_Block(x, nb_filters=[256, 256, 1024])
    x = bottleneck_Block(x, nb_filters=[256, 256, 1024])

    #conv5_x
    x = bottleneck_Block(x, nb_filters=[512, 512, 2048], strides=(2, 2), with_conv_shortcut=True)
    x = bottleneck_Block(x, nb_filters=[512, 512, 2048])
    x = bottleneck_Block(x, nb_filters=[512, 512, 2048])

    x = AveragePooling2D(pool_size=(7, 7))(x)
    x = Flatten()(x)
    x = Dense(classes, activation='softmax')(x)

    model = Model(inputs=inpt, outputs=x)
    return model

def acc_top2(y_true, y_pred):
    return top_k_categorical_accuracy(y_true, y_pred, k=2)


def check_print():
    # Create a Keras Model
    model = resnet_50(IM_WIDTH,IM_HEIGHT,3,NB_CLASS)
    model.summary()
    # Save a PNG of the Model Build
    plot_model(model, to_file='resnet.png')
    model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['acc',top_k_categorical_accuracy])
    print 'Model Compiled'
    return model


if __name__ == '__main__':
    if os.path.exists('resnet_50.h5'):
        model=load_model('resnet_50.h5')
    else:
        model=check_print()

    model.fit_generator(train_generator,validation_data=vaild_generator,epochs=EPOCH,steps_per_epoch=train_generator.n/batch_size
                        ,validation_steps=vaild_generator.n/batch_size)
    model.save('resnet_50.h5')
    loss,acc,top_acc=model.evaluate_generator(test_generator, steps=test_generator.n / batch_size)
    print 'Test result:loss:%f,acc:%f,top_acc:%f' % (loss, acc, top_acc)

实验结果

Data	Loss	Acc	Top5-acc
Training set	1.85	39.9%	85.3%
Vaildation set	2.01	36.6%	82.0%
Testing set	2.08	35.7%	78.1%
Dataset	VOC2012	Classes	20
Model	ResNet	Framework	Keras

实验结果分析

我们可以发现模型最后在测试集上的效果与训练集上的效果有一定程度上的差距，模型出现了一点过拟合。为了防止过拟合，而且为了加速收敛，本文在每一层之间都是用了BatchNormalization层。由于本文只训练了60个epoch，每个epoch差不多迭代500次，由于训练的次数太少，故效果并未具体显现。

本博客相关引用

以下是本博客的引用，再次本人对每个引用的作者表示感谢。读者如果对Resnet这个网络仍然存在一些疑虑，或者想要有更深的理解，可以参考以下的引用。

引用博客1

引用博客2

引用文献1:Deep Residual Learning for Image Recognition

引用文献2:Residual Networks are Exponential Ensembles of Relatively Shallow Networks

cnn卷积神经网络反向传播,卷积神经网络维度变化阳阳2013哈哈 PHP cnn 机器学习深度学习神经网络
卷积神经网络是如何反向调整参数的？卷积神经网络反向传播和bp有什么区别如何理解神经网络里面的反向传播算法反向传播算法（Backpropagation）是目前用来训练人工神经网络（ArtificialNeuralNetwork，ANN）的最常用且最有效的算法。其主要思想是：（1）将训练集数据输入到ANN的输入层，经过隐藏层，最后达到输出层并输出结果，这是ANN的前向传播过程；（2）由于ANN的输出结
10 中科院1区期刊优化算法|基于开普勒优化-卷积-双向长短期记忆网络-注意力时序预测Matlab程序KOA-CNN-BiLSTM-Attention 机器不会学习CSJ 时间序列预测算法网络 matlab cnn lstm 深度学习
文章目录一、开普勒优化算法二、CNN卷积神经网络三、BiLSTM双向长短期记忆网络四、注意力机制五、KOA-CNN-BiLSTM-Attention时间序列数据预测模型六、获取方式一、开普勒优化算法基于物理学定律的启发，开普勒优化算法（KeplerOptimizationAlgorithm，KOA）是一种元启发式算法，灵感来源于开普勒的行星运动规律。该算法模拟行星在不同时间的位置和速度，每个行星代
08 2024年1月最新优化算法美洲狮优化算法(PO) 基于美洲狮PO优化CNN-BiLSTM-Attention的时间序列数据预测算法PO-CNN-LSTM-Attention 优先使用就是创新！机器不会学习CSJ 算法 cnn lstm 机器学习人工智能神经网络 matlab
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、美洲狮优化算法二、CNN卷积神经网络三、BiLSTM双向长短期记忆网络四、注意力机制五、PO-CNN-BiLSTM-Attention时间序列数据预测模型六、核心代码七、结果展示八、获取方式一、美洲狮优化算法美洲狮是一种原产于美洲大陆的大型猫科动物，在南美洲的安第斯山脉到加拿大的育空地区都有它们的栖息地。作为美洲第二大的猫
07基于WOA-CNN-BiLSTM-Attention鲸鱼优化-卷积-双向长短时记忆-注意力机制的时间序列预测算法机器不会学习CSJ 时间序列预测 cnn 算法人工智能
文章目录鲸鱼优化算法CNN卷积神经网络BiLSTM双向长短期记忆网络Attention注意力机制WOA-CNN-BiLSTM-Attention鲸鱼优化-卷积-双向长短时记忆-注意力机制数据展示代码程序实验结果获取方式鲸鱼优化算法鲸鱼优化算法（WhaleOptimizationAlgorithm，WOA）是一种启发式优化算法，灵感来源于座头鲸的捕食行为。该算法最早由SeyedaliMirjalil
计算机设计大赛深度学习YOLOv5车辆颜色识别检测 - python opencv iuerfee python
文章目录1前言2实现效果3CNN卷积神经网络4Yolov56数据集处理及模型训练5最后1前言优质竞赛项目系列，今天要分享的是**基于深度学习YOLOv5车辆颜色识别检测**该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/post
基于BP神经网络粒子群优化BP神经网络 CNN卷积神经网络 LSTM 长短期记忆神经网络 chBbzEkkf 开发语言
基于BP神经网络粒子群优化BP神经网络CNN卷积神经网络LSTM长短期记忆神经网络ELMAN递归神经网络BiLSTM双向长短期记忆遗传算法神经网络七种神经网络回归预测算法汇总（基于Matlab实现）特殊要求：Matlab版本较高MATLAB代码，多输入单输出，换数据直接用，附样本供实验。代码运行无误，直接更换Excel数据即可实现。神经网络回归预测算法在工业、经济、自然科学等领域都有广泛的应用。其
2019年上半年收集到的人工智能卷积神经网络干货文章城市中迷途小书童
2019年上半年收集到的人工智能卷积神经网络干货文章了解CNN这一篇就够了——关于卷积神经网络的介绍关于卷积的6个基本知识一文读懂深度学习中的各种卷积CNN卷积神经网络的三种基本模式（不懂的话还得多努力啊！）CNN，GAN，AE和VAE概述理解卷积神经网络？看这篇论文就够了深度卷积神经网络的高级主题卷积神经网络的特征是如何学习的？教你如何运用可视化理解卷积神经网络（CNNs）的指南空洞卷积（Dil
故障诊断 | 一文解决，CNN卷积神经网络故障诊断（Matlab）机器学习之心 #CNN卷积神经网络故障诊断 CNN卷积神经网络故障诊断
文章目录效果一览文章概述专栏介绍源码设计参考资料效果一览文章概述故障诊断|一文解决，CNN卷积神经网络故障诊断（Matlab）专栏介绍订阅【故障诊断】专栏，不定期更新机器学习和深度学习在故障诊断中的应用；订阅
m基于CNN卷积神经网络的IBDFE单载波频域均衡算法 AI小白龙* cnn 算法人工智能深度学习 pytorch 机器学习 tensorflow
1.算法描述单载波频域均衡(SC-FDE)是解决符号间干扰(ISI)问题的一项重要技术。相比于单载波时域均衡(SC-TDE)技术和正交频分复用(OFDM)技术,SC-FDE技术具有复杂度低、峰均功率比小的优点。但是,SC-FDE技术中,均衡算法的性能与复杂度存在制约关系,传统均衡算法无法在二者之间取得较好的折衷。在单载波频域均衡系统中，线性均衡算法虽然简单易行，但是其抑制噪声干扰和符号间干扰的能力
Yann LeCun荣获全球AI大奖！Keras之父和Deepmind创始人也曾获奖夕小瑶人工智能 keras 深度学习
大家好，我是二狗。就在昨天，图灵奖得主、Meta首席人工智能科学家YannLeCun在推特上祝贺自己获得2023年全球瑞士人工智能奖（2023GlobalSwissAIAward）。在颁奖现场，YannLeCun短暂地用牛铃演奏了一首布鲁斯音乐。YannLeCun因为为深度学习作出的杰出贡献（主要是发明了CNN卷积神经网络）和Hinton和Bengio三人共同获得了图灵奖。最近几年，LeCun所领
cnn卷积神经网络（计算过程详析） wanghua609 cnn 深度学习神经网络
参考网址百度安全验证https://www.cnblogs.com/skyfsm/p/6790245.html一般的神经网络结构如下CNN卷积神经网络可以被分为许多层，其层级结构一般为•数据输入层/Inputlayer•卷积计算层/CONVlayer•ReLU激励层/ReLUlayer•池化层/Poolinglayer•全连接层/FClayer1.数据输入层该层要做的处理主要是对原始图像数据进行预
文本分类识别系统Python+卷积神经网络算法+TensorFlow+Django网页界面　子午计算机课设项目 python 算法分类
一、介绍文本分类系统，使用Python作为主要开发语言，通过选取的中文文本数据集（“体育类”,“财经类”,“房产类”,“家居类”,“教育类”,“科技类”,“时尚类”,“时政类”,“游戏类”,“娱乐类”），基于TensorFlow搭建CNN卷积神经网络算法模型，并进行多轮迭代训练最后得到一个识别精度较高的模型文件。然后使用Django框架开发网页端可视化界面平台。实现用户输入一段文本识别其所属的种类
自然语言NLP学习 wangqiaowq 自然语言处理学习人工智能
2-7门控循环单元（GRU）_哔哩哔哩_bilibiliGRULSTM双向RNNCNN卷积神经网络输入层转化为向量表示dropoutppl标量在物理学和数学中，标量（Scalar）是一个只有大小、没有方向的量。它只用一个数值就可以完全描述，且满足交换律。例如，质量、温度、时间、体积、密度、功、能量等都是标量。在向量代数中，标量与向量是相对的概念，标量可以与向量相乘，从而改变向量的长度但不改变其方向
Tensorflow高阶内容（五）- Deep Learning BingshengTian_Mamba 深度学习DL tensorflow tensorflow 神经网络深度学习
高阶内容5.1Classification分类学习5.2什么是过拟合（Overfitting）5.3Dropout解决Overfitting5.4什么是卷积神经网络CNN(ConvolutionalNeuralNetwork)5.5CNN卷积神经网络15.6CNN卷积神经网络25.7CNN卷积神经网络35.8Saver保存读取5.9什么是循环神经网络RNN(RecurrentNeuralNetwo
机器学习实验4——CNN卷积神经网络分类Minst数据集在半岛铁盒里机器学习机器学习 cnn 分类 MINST
文章目录实验内容原理CNN实现分类Minst代码数据预处理：设置基本参数：实验内容基于手写minst数据集，完成关于卷积网络CNN的模型训练、测试与评估。原理卷积层通过使用一组可学习的滤波器（也称为卷积核）对输入图像进行滑动窗口卷积操作，这样可以提取出不同位置的局部特征，从而捕捉到图像的空间结构信息。激活函数在卷积层之后，通常会应用一个非线性激活函数，如ReLU激活函数的作用是引入非线性，使得CN
neural network basics2-4 ringthebell 大模型深度学习人工智能
CNN卷积神经网络（convolutionalneuralnetworks，CNNs）CNN一般都是出现在图像领域，一开始出现是应用在计算机视觉领域里，但由于它结构特殊性，它也可以应用于NLP领域，例如在性态分类关系分类中有很好的应用，则归功于CNN比较擅长于提取局部和位置不变的模式，例如在计算机视觉里面的颜色边角等等，还有NLP里面的短语和一些局部的语法结构等CNN它提取局部模式的一个步骤。主要
pytorch详细探索各种cnn卷积神经网络 E寻数据 pytorch python 深度学习深度学习人工智能机器学习
目录torch.nn.functional子模块详解conv1d用法和用途使用技巧适用领域参数注意事项示例代码conv2d用法和用途使用技巧适用领域参数注意事项示例代码conv3d用法和用途使用技巧适用领域参数注意事项示例代码conv_transpose1d用法和用途使用技巧适用领域参数注意事项示例代码conv_transpose2d用法和用途使用技巧适用领域参数注意事项示例代码conv_tran
关于CNN卷积神经网络与Conv2D标准卷积的重要概念花花少年深度学习 cnn 人工智能神经网络
温故而知新，可以为师矣！一、参考资料深入解读卷积网络的工作原理（附实现代码）深入解读反卷积网络（附实现代码）WaveletU-net进行微光图像处理卷积知识点CNN网络的设计论：NASvsHandcraft二、卷积神经网络(CNN)相关介绍1.CNN网络简介1.1CNN特征提取学习输入到输出的映射，并对映射关系加以训练，训练好的模型也具备了这种映射能力。浅层网络一般学习的是边缘、颜色、亮度等，较深
图像分类任务的可视化脚本，生成类别json字典文件听风吹等浪起 #关于 classification 分类深度学习人工智能
1.前言之前的图像分类任务可视化，都是在train脚本里，用torch中dataloader将图片和类别加载，然后利用matplotlib库进行可视化。如这篇文章中：CNN卷积神经网络对染色血液细胞分类(blood-cells)在分类任务中，必定经历过图像预处理，缩放啊、随即裁剪啊之类的，可视化效果不太明显本章将从数据角度出发，直接根据数据目录将图像可视化，随机展示所有图片的四张图片，可视化后并且
经典 CNN 神经网络 LeNet-5 的 C++ 实现（MNIST数据集） Charles Chou 深度学习之旅 cnn 神经网络深度学习
前言：本文不对CNN卷积神经网络做深入探究，CNN卷积神经网络的基本知识请移步本文的相关链接；本文不对LeNet-5神经网络模型做深入探究，该部分的知识可以自行查阅或者查看本文的链接！MNIST数据集请自行在官网下载。此外，如果使用本文的代码，请将该数据集放置于源代码同级目录下。笔记：从单纯的BP算法，到DNN再到CNN，是一个奇妙的旅程。CNN于DNN的不同之处在于对于局部特征的抽取（个人理解）
RNN循环神经网络入门惊雲浅谈天机器学习 rnn 人工智能深度学习
前置知识：BP神经网络、CNN卷积神经网络网络会对前面的信息进行记忆并应用于当前输出的计算中，即隐藏层之间的节点不再无连接而是有连接的，并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。RNN结构X表示输入，O表示输出，St表示t时刻存储的状态信息W,U,V为权值矩阵，b为偏置值。在t=1时刻，一般初始化输入S0=0，随机初始化W,U,V。其中，f和g均为激活函数。f可以是tanh,
工智能基础知识总结--什么是CNN 北航程序员小C 深度学习专栏人工智能学习专栏机器学习专栏 cnn 人工智能神经网络
什么是CNN卷积神经网络（ConvolutionalNeuralNetworks,CNN）是一类包含卷积计算且具有深度结构的前馈神经网络（FeedforwardNeuralNetworks），是深度学习（deeplearning）的代表算法之一。CNN最常用于CV领域，但是在NLP等其他领域也有应用，如用于文本分类的TextCNN。下面是一个CNN的经典网络结构（LeNet）：CNN一般具有以下结
【Matlab】CNN卷积神经网络时序预测算法千源万码 Matlab matlab cnn 算法
资源下载：https://download.csdn.net/download/vvoennvv/88681558一，概述CNN（ConvolutionalNeuralNetwork，卷积神经网络）是一种前馈神经网络，主要用于处理具有类似网格结构的数据，例如图像和音频。CNN的主要特点是卷积层和池化层的交替使用来提取数据特征，以及使用全连接层对这些特征进行分类和识别。CNN的主要结构包括卷积层、池
大创项目推荐深度学习YOLOv5车辆颜色识别检测 - python opencv laafeer python
文章目录1前言2实现效果3CNN卷积神经网络4Yolov56数据集处理及模型训练5最后1前言优质竞赛项目系列，今天要分享的是**基于深度学习YOLOv5车辆颜色识别检测**该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/post
python 神经网络归纳霸王龙不吃芹菜 python 神经网络深度学习
CNN卷积神经网络一个卷积神经网络主要由以下5层组成：数据输入层/Inputlayer卷积计算层/CONVlayerReLU激励层/ReLUlayer池化层/Poolinglayer全连接层/FClayer1.数据输入层该层要做的处理主要是对原始图像数据进行预处理，其中包括：去均值：把输入数据各个维度都中心化为0，如下图所示，其目的就是把样本的中心拉回到坐标系原点上。归一化：幅度归一化到同样的范围
人工智能Keras图像分类器（CNN卷积神经网络的图片识别篇）人工智能研究所人工智能之计算机视觉人工智能 keras cnn
上期文章我们分享了人工智能Keras图像分类器（CNN卷积神经网络的图片识别的训练模型），本期我们使用预训练模型对图片进行识别：KerasCNN卷积神经网络模型训练导入第三方库fromkeras.preprocessing.imageimportimg_to_arrayfromkeras.modelsimportload_modelimportnumpyasnpimportimutilsimpor
基于CNN卷积神经网络的中文汉字识别检测 bbfbdfbfghfh 深度学习 pyqt cnn 人工智能
直接上效果演示图：通过点击按钮可以实现在画板上写汉字识别和加载图片识别两个功能。视频演示和demo仓库地址在b站视频001期：到此一游7758258的个人空间-到此一游7758258个人主页-哔哩哔哩视频所有代码展示：十分的简洁，主要是01,02,03.py文件运行01dataset.py可以将data文件下的图片数据集保存成txt格式记录。运行02train.py可以读取txt记录的图片数据进行
交通标识识别（神经网络与深度学习）领筹码大玩家图像处理数据分析生成对抗网络深度学习神经网络
引言本次博客将分享Udacity无人驾驶纳米学位的另一个项目，交通标志的识别。本次项目实现主要采用CNN卷积神经网络，具体的网络结构参考Lecun提出的LeNet结构。参考文献：LecunPaper项目流程图本项目的实现流程如下所示：代码实现及解释接下来我们就按照项目流程图来逐块实现,本项目数据集：Germandata如果打不开，则有备用链接：备用http://benchmark.ini.rub.
机器学习【05】CNN卷积神经网络 ihan1001 机器学习机器学习
版权声明：本文参考CSDN博主「IronmanJay」的原创文章，遵循CC4.0BY-SA版权协议原文链接：https://blog.csdn.net/IronmanJay/article/details/128434368版权声明：本文参考CSDN博主「北村南」的原创文章，遵循CC4.0BY-SA版权协议原文链接：https://blog.csdn.net/ccaoshangfei/articl
Swin-Transformer 在图像识别中的应用听风吹等浪起图像分类 transformer 深度学习人工智能
1.卷积神经网络简单介绍图像识别任务主要利用神经网络对图像进行特征提取，最后通过全连接层将特征和分类个数进行映射。传统的网络是利用线性网络对图像进行分类，然而图像信息是二维的，一般来说，图像像素点和周围邻域像素点相关。而线性分类网络将图像强行展平成一维，不仅仅忽略了图像的空间信息，而全连接层会大大增加网络的参数为了更好把握图像像素的空间信息，提出了CNN卷积神经网络，利用卷积核(滤波器)对图像进行
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

ResNet网络详解与keras实现

ResNet网络详解与keras实现

Resnet网络的概览

Pascal_VOC数据集

第一层目录

第二层目录

第三层目录

梯度退化

Residual Learning

Identity vs Projection Shortcuts

Bottleneck architecture

Resnet网络构建表

ResNet论文结果:

为了搭建Resnet网络，我们使用了以下策略：

整个代码的流程如下：

实验结果

实验结果分析

本博客相关引用

你可能感兴趣的:(cnn卷积神经网络)