姜君泽

卷积神经网络常见模块

深度学习常见模型子模块

常见模块
1.卷积
- 1.1 2D卷积（单通道和多通道）
- 1.2 1x1 卷积
- 1.3 转置卷积（反卷积 Transposed convolution）
- 1.4 分组卷积（Group convolution）
- 1.5 空洞卷积（Dilated convolution）
- 1.6 深度分离卷积（Depthwise convolution）
- 1.7 逐点分离卷积（Pointwise convolution）
2.激活函数
- 2.1 Sigmoid
- 2.2 Tanh
- 2.3 Softsign
- 2.4 ReLU
3.池化
- 3.1 最大池化
- 3.2 平均池化
4.view
5.全连接（FC）
6.批量归一化(Batch normlization)
- 6.1 对全连接层做批量归一化
- 6.2 对卷积层做批量归一化
7.Dropout
8.NIN
- pytorch实现
9.Residual 残差模块
- pytorch实现
10.bottlenect 瓶颈块
- pytorch实现
11.Dense 深度块
- pytorch实现
12.Inception Block

在构建深度学习算法模型时，每个模型都是由不同的子模块一步步搭建完成的，本文总结了，如下几类常见的构建模型的子模块，以及一些模块组合的子模型结构。

如下图所示大部分卷积神经网络算法都是由如下的模块组合构建完成，本文是基于pytorch api实现如下的模块的。

常见模块

1.卷积

卷积，是卷积神经网络中重要组件，不同的卷积结构有着不一样的功能，但本质上都是用于提取特征，比如在传统图像处理中，通过设定不同算子来提取图像的边缘、水平、垂直等固定的特征。
卷积分类：

1.1 2D卷积（单通道和多通道）

单通道

在深度学习中，卷积就是元素级别（ element-wise）的乘法和加法。对于一张仅有 1 个通道的图像，卷积过程如上图所示，过滤函数是一个组成部分为 $[[0, 1, 2], [2, 2, 0], [0, 1, 2]]$ 的 3 x 3 矩阵，它滑动穿过整个输入。在每一个位置，它都执行了元素级别的乘法和加法，而每个滑过的位置都得出一个数字，最终的输出就是一个 3 x 3 矩阵。（注意：在这个示例中，卷积步长=1；填充=0。我会在下面的算法部分介绍这些概念。）

多通道
通俗来说，单通道的图像就是一张黑白照片，多通道的图像就是一张彩色照片，每个通道对应这些不同颜色值的照片（例如RGB图像对应着三个通道R、G、B）。

下面让我们一起来看看多通道卷积。生成一个输出通道，就需要将每一个卷积核应用到前一层的输出通道上，这是一个卷积核级别的操作过程。我们对所有的卷积核都重复这个过程以生成多通道，之后，这些通道组合在一起共同形成一个单输出通道。下图可以让大家更清晰地看到这个过程。

这里假设输入层是一个 5 x 5 x 3 矩阵，它有 3 个通道。过滤器则是一个 3 x 3 x 3 矩阵。首先，过滤器中的每个卷积核都应用到输入层的 3 个通道，执行 3 次卷积后得到了尺寸为 3 x 3 的 3 个通道。

之后，这 3 个通道都合并到一起（元素级别的加法）组成了一个大小为 3 x 3 x 1 的单通道。这个通道是输入层（5 x 5 x 3 矩阵）使用了过滤器（3 x 3 x 3 矩阵）后得到的结果。

1.2 1x1 卷积

可以把1x1 卷积看作一种降维/升维操作，一种全连接层的处理方式。

实现1x1卷积有一个必须的条件就是卷积核的通道数和图像的通道数要相同。

如下图上半部分所示，为一个通道为1，1x1卷积，得出的结果就是原始图像的像素值，扩大一倍。

但是如果是通道数大于1的，比如说32通道，就会输出一个6x6x1的矩阵，再往下说，如果有N个这样的卷积核呢，就会输出Nx6x6x1的矩阵，也就是Nx6x6，这样N自然肯定要小于32，这样就是一个减少通道数的降维处理啦。

1.3 转置卷积（反卷积 Transposed convolution）

这里可以与正常的卷积做对比，平时我们的卷积都算是下采样，把尺寸大的矩阵变成小的，反卷积顾名思义把小的矩阵尺寸变成大的。

在处理图像应用中有时候我们需要对图像进行上采样，例如生成高分辨率图像。
传统技术上实现，可以通过应用插值方法来实现上采样，神经网络等现代架构则反过来趋向于让网络自己自动学习合适的转换，而不需要人类的干预。我们可以使用转置卷积来实现这一点。

我们可以直接使用卷积来实现转置卷积。例如在下图的案例中，我们 2 x 2 的输入上做转置卷积：其卷积核为 3 x 3，卷积步长为 1，填充padding为 2 x 2 的空格。上采样的输出大小为 4 x 4。

也可以将相同的 2 x 2 输入图像映射出不同的图像大小。下图中，在同一个卷积核为 3 x 3，卷积步长为 1，填充为 2 x 2 空格的 2 x 2 的输入（输入之间插入了一个空格）上做转置卷积，得出的输出大小为 5 x 5。

1.4 分组卷积（Group convolution）

这种卷积方式在卷积运算上没有任何改变，只是将所有的卷积核分成二组，将需要卷积的矩阵按照通道数也划分成二组。如下图所示：

这样卷积的目的，使模型在两个GPU进行训练，实现模型并行化计算。

1.5 空洞卷积（Dilated convolution）

大白话说，空洞卷积通过在卷积核部分之间插入空间让卷积核「膨胀」。这里增加一个参数 l（空洞率）。
这个参数表明了我们想要将卷积核放宽到多大。虽然各实现是不同的，但是在卷积核部分通常插入 $l = 1$ 空间。下图显示了当 $l = 1, 2, 4$ 时的卷积核大小。

1.6 深度分离卷积（Depthwise convolution）

再说深度分离卷积之前，先再认识一下常规的卷积方式，比如：1X1X100X20的卷积核，输出20个通道，此时是100个相同的数同时操作所有通道。

Depthwise Convolution：不同于常规卷积操作，Depthwise Convolution的一个卷积核负责一个通道，一个通道只被一个卷积核卷积。上面所提到的常规卷积每个卷积核是同时操作输入图片的每个通道。Depthwise Convolution完成后的Feature map数量与输入层的通道数相同，无法扩展Feature map。而且这种运算对输入层的每个通道独立进行卷积运算，没有有效的利用不同通道在相同空间位置上的feature信息。因此需要Pointwise Convolution来将这些Feature map进行组合生成新的Feature map。

1.7 逐点分离卷积（Pointwise convolution）

Pointwise Convolution：即采用卷积核大小为1x1来对特征图像逐点进行卷积。
Pointwise Convolution的运算与常规卷积运算非常相似，它的卷积核的尺寸为 1×1×M，M为上一层的通道数。所以这里的卷积运算会将上一步的map在深度方向上进行加权组合，生成新的Feature map。有几个卷积核就有几个输出Feature map。

深度可分离卷积就是由深度分离卷积和逐点分离卷积组合而成的

2.激活函数

在pytorch中有二种实现激活函数方式

from torch import nn（nn.ReLU）
from torch.nn import functional as F （F.relu）

这两种方法实现结果是一样的，只是添加的方式不同。
其中nn.ReLU作为一个层结构，必须添加到nn.Module容器中才能使用，而F.ReLU则作为一个函数调用，看上去作为一个函数调用更方便更简洁。

2.1 Sigmoid

F.sigmoid(x)
$Sigmoid(x)=\frac{1}{1+exp(-x)}$

2.2 Tanh

F.tanh(x)
$Tanh(x)=tanh(x)=\frac{e^x-e^{-x}}{e^x+e^{-x}}$

2.3 Softsign

F.softsign(x)
$SoftSign(x)=\frac{x}{1+|x|}$

2.4 ReLU

F.relu(x)
$R e L U (x) = m a x (0, x)$

还有一些激活函数，不算常用的就不列出了。

3.池化

池化也有二种方式，跟激活函数类似
池化层每次对输入数据的一个固定形状窗口（又称池化窗口）中元素计算输出，不同于卷积层里计算输入，池化层直接计算池化窗口内元素的最大值或平均值。

3.1 最大池化

class torch.nn.MaxPool2d(kernel_size, stride=None,padding=0, dilation=1, return_indices=False, ceil_mode=False)

参数：

kernel_size：窗口大小（H x W）
stride- 步长：默认值是kernel_size
padding：填充0
dilation：控制窗口中元素步幅的参数
return_indices：如果等于True，会返回输出最大值的序号，对于上采样操作会有帮助
ceil_mode：如果等于True，计算输出信号大小的时候，会使用向上取整，代替默认的向下取的操作

3.2 平均池化

class torch.nn.AvgPool2d(kernel_size, stride=None,padding=0, ceil_mode=False, count_include_pad=True)

4.view

在实现全连接层之前，需要把卷积层输出的多维度的tensor转化为一维的，通常使用出现在forward前向传播中，代码如下：

x = x.view(x.size()[0],-1)

这里对view函数解释一下：
在torch里面，view函数相当于numpy的reshape，来看几个例子：

a = torch.arange(1, 17)  # a's shape is (16,)
 
a.view(4, 4) # output below
tensor([[ 1,  2,  3,  4],
        [ 5,  6,  7,  8],
        [ 9, 10, 11, 12],
        [13, 14, 15, 16]])
[torch.FloatTensor of size 4x4]
 
a.view(2, 2, 4) # output below
tensor([[[ 1,  2,  3,  4],
         [ 5,  6,  7,  8]],
 
        [[ 9, 10, 11, 12],
         [13, 14, 15, 16]]])
[torch.FloatTensor of size 2x2x4]

例如一个长度的16向量x，
x.view(-1, 4)等价于x.view(4, 4)
x.view(-1, 2)等价于x.view(8，2)

5.全连接（FC）

class torch.nn.Linear（in_features，out_features，bias = True

对传入数据应用线性变换： $y = A x + b$
参数：

in_features：每个输入样本的大小
out_features：每个输出样本的大小
bias：如果设置为False，则图层不会学习附加偏差。默认值：True

6.批量归一化(Batch normlization)

批量归一化的好处：

可以给模型选择较大的初始学习率
可以不用考虑过拟合中存在的dropout、L2正则项参数选择问题
不需要使用局部归一化层

6.1 对全连接层做批量归一化

对全连接层做批量归一化，我们将批量归一化置于仿射变换和激活函数之间

批量归一化计算公式如下：

解释一下上图的公式：

输入为数值集合（ $B$ )，表示仿射变换输出的一个小批量 $B={x^{(1)},x^{(2)},...,x^{(m)}}$ 。可训练参数 $\gamma$ , $\beta$ ；
BN的具体操作为：先计算 $B$ 的均值和方差，之后将 $B$ 集合的均值、方差变换为0、1，最后将 $B$ 中每个元素乘以 $\gamma$ 再加 $\beta$ ，输出。
归一化的目的：将数据规整到统一区间，减少数据的发散程度，降低网络的学习难度。BN的精髓在于归一之后，使用 $\gamma$ 和 $\beta$ 作为还原参数，在一定程度上保留原数据的分布。

class torch.nn.BatchNorm2d(num_features, eps=1e-05,momentum=0.1, affine=True)

参数解释：

num_features：一般输入参数为batch_sizenum_featuresheight*width，即为其中特征的数量，channel数。

6.2 对卷积层做批量归一化

对卷积层来说，批量归一化发生在卷积计算之后，应用在激活函数之后。
如果卷积计算输出为多个通道，那需要对这些通道的输出分别做批量归一化。
设小批量中有m个样本，在单个通道上，假设卷积计算输出的高和宽分别为q和p，我们需要对该通道中m x p x q个元素同时做批量归一化，这些元素做标准计算时，我们使用相同的均值和方差，即该通道中m x p x q个元素的均值和方差。

7.Dropout

Dropout属于一种在神经网络下的正则化，对于一个正常的神经网络如下图所示：

假如针对说这个神经网络存在过拟合，dropout通过在训练的过程中随机丢掉部分神经元来减小神经网络的规模从而防止过拟合。
在训练过程中我们，随机丢掉部分神经元，这里设置一个概率P，它表示针对网络中每一层消除的神经网络节点的概率。

如下图所示红色X的神经元表示已经丢弃的，然后神经网络也删除一部分神经元连接的线。

class torch.nn.Dropout(p=0.5,inplace=False)

8.NIN

传统卷积层的输入和输出通常是一个四维数组（样本数，通道，高，宽），而全连接层输入和输出则是一个二维数组（样本，特征）。
如果在全连接层后接上卷积层，则需要将全连接层输出变换为四维。前面提到的1 x 1卷积层可以看成是一个全连接层，其中空间维度（高和宽）上的每个元素相当于样本，通道相当于特征。

因此NIN使用1 x 1卷积层来替换全连接层，从而使空间信息自然传递到后面层中。下图对比了NIN同AlexNet和VGG等网络在结构上的主要区别。

NIN模块分成两部分组成：

首先用1x1卷积实现，整合多个feature map特征
然后对特征进行全局平均池化替代全连接层

pytorch实现

import torch
from torch import nn
import torchvision
from datetime import datetime
 
#NiN块
def nin_block(in_channels, out_channels, kernel_size, stride, padding):
    blk = nn.Sequential(
        nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding),
        nn.ReLU(),
        #1*1卷积层
        nn.Conv2d(out_channels, out_channels, kernel_size=1),
        nn.ReLU(),
        #1*1卷积层
        nn.Conv2d(out_channels, out_channels, kernel_size=1),
        nn.ReLU()
    )
    return blk
 
net = nn.Sequential(
    #输入x是[128, 1, 224, 224]
    #第一个卷积块
    nin_block(1, 96, kernel_size=11, stride=4, padding=0),
    #x是[128, 96, 54, 54]
    nn.MaxPool2d(kernel_size=3, stride=2),
    #x是[128, 96, 26, 26]
 
    #第二个卷积块
    nin_block(96, 256, kernel_size=5, stride=1, padding=2),
    #x是[128, 256, 26, 26]
    nn.MaxPool2d(kernel_size=3, stride=2),
    #x是[128, 256, 12, 12]
 
    #第三个卷积块
    nin_block(256, 384, kernel_size=3, stride=1, padding=1),
    #x是[128,384,12,12]
    nn.MaxPool2d(kernel_size=3, stride=2),
    nn.Dropout(0.5),
    #x是[128, 384, 5, 5]
 
    #第四个卷积块
    # 标签类别数是10
    nin_block(384, 10, kernel_size=3, stride=1, padding=1),
    #x是[128, 10, 5, 5]
 
    #全局平均池化层
    #全局平均池化层可通过将窗口形状设置成输入的高和宽实现
    nn.AvgPool2d(kernel_size=5),
    #x是[128, 10, 1, 1]
    # 将四维的输出转成二维的输出，其形状为(批量大小, 10)
    nn.Flatten(start_dim=1, end_dim=3)
    #x是[128, 10]

9.Residual 残差模块

是不是神经网络层越深模型效果越好？

答案是错误的，随着网络层结构加深，可能会导致训练很难收敛，同时模型的准确率也会下滑的

而Residual learning 模块可以解决这种因为深度增加而导致性能下降问题

假定某段神经网络的输入是 x，期望输出是 H(x)，即 H(x) 是期望的复杂潜在映射，但学习难度大；如果我们直接把输入 x 传到输出作为初始结果，通过下图“shortcut connections（捷径连接）”，那么此时我们需要学习的目标就是 F(x)=H(x)-x，于是 ResNet 相当于将学习目标改变了，不再是学习一个完整的输出，而是最优解 H(X) 和全等映射 x 的差值，即残差 F(x) = H(x) - x;我们的目的就是使F(x)结果逼近于0，使到随着网络加深，准确率不下降。

这里直观的理解，可以理解为我们在加深层的输入端输入x后，我们的目的是希望加深层的输出端输出也是x。这样相当于只加深了层，经过这样的加深层处理后，x值只有微小的误差。

pytorch实现

class Residual(nn.Module):
    def __init__(self,in_channels,out_channels,conv1x1=False,stride=1):
        super(Residual, self).__init__()
        self.conv1=nn.Conv2d(in_channels,out_channels,kernel_size=3,padding=1,stride=stride)
        self.conv2=nn.Conv2d(out_channels,out_channels,kernel_size=3,padding=1)
        if conv1x1:
            self.conv3=nn.Conv2d(in_channels,out_channels,kernel_size=1,stride=stride)
        else:
            self.conv3=None
        self.bn1=nn.BatchNorm2d(out_channels)
        self.bn2=nn.BatchNorm2d(out_channels)
        
    def forward(self,x):
        y=F.relu(self.bn1(self.conv1(x)))
        y=self.bn2(self.conv2(y))
        if self.conv3:
            x=self.conv3(x)
        return F.relu(y+x)

10.bottlenect 瓶颈块

bottlenect模块是由残差模块衍生出来的，它主要的作用是对feature map进行降维

pytorch实现

# 50、101、152层残差块，三个卷积层，1*1，3*3，1*1
class Bottleneck(nn.Module):
    # 这里对应是4,对应每层中的64，64，256
    expansion=4
    
    def __init__(self,in_channel,out_channel,stride=1,downsample=None):
        super(Bottleneck,self).__init__()
        
        self.conv1=nn.Conv2d(in_channels=in_channel,out_channels=out_channel,
                             kernel_size=1,stride=1,bias=False)
        self.bn1=nn.BatchNorm2d(out_channel)
        
        self.conv2=nn.Conv2d(in_channels=out_channel,out_channels=out_channel,
                             kernel_size=3,stride=stride,padding=1,bias=False)
        self.bn2=nn.BatchNorm2d(out_channel)
        
        self.conv3=nn.Conv2d(in_channels=out_channel,out_channels=out_channel*self.expansion,
                             kernel_size=1,stride=1,bias=False)
        self.bn3=nn.BatchNorm2d(out_channel*self.expansion)
        
        self.relu=nn.ReLU(inplace=True)
        
        self.downsample=downsample
    
    def forward(self,x):
        identity=x
        if self.downsample is not None:
            identity=downsample(x)
        
        out=self.conv1(x)
        out=self.bn1(out)
        out=self.relu(out)
        
        out=self.conv2(out)
        out=self.bn2(out)
        out=self.relu(out)
        
        out=self.conv3(out)
        out=self.bn3(out)
        
        out+=identity
        out=self.relu(out)
        
        return out

11.Dense 深度块

深层的网络结构，越深越容易凸出一个关键问题：梯度消失，越往后求导，导数可能会越来越小，直至消失。

为了不极端的构建更深的网络，采用特征再利用的方式，提出了一种密集的压缩模型DenseNet

传统CNN每一层前进后，都会产生output，即特征图。这种级联结构，当前层的结果特征图，运至下一层，作为下一层的输入。
而DenseNet则是将当前层得到的特征图，输入到所有后续层。

用公式表示的话，这里设 $L$ 表示某一网络层， $x_L$ 表示 $L$ 层输出的值， $x_{L-1}$ 表示 $L$ 的上一层输出的值。

传统网络的 $x_L$ 与 $x_{L-1}$ 对应函数为
$x_L=H_L(x_{L-1})$
对于ResNet 残差模块 $x_L$ 与 $x_{L-1}$ 对应函数为
$x_L=H_L(x_{L-1})+x_{L-1}$
对于DenseNet $x_L$ 与 $x_{L-1}$ 对应函数为
$x_L=H_L([x_0,x_1,...,x_{L-1}])$

pytorch实现

def conv_block(in_channels,out_channels):
    block=nn.Sequential(nn.BatchNorm2d(in_channels),
                        nn.ReLU(),
                        nn.Conv2d(in_channels,out_channels,kernel_size=3,padding=1))
    return block

class DenseNet(nn.Module):
    def __init__(self,num_convs,in_channels,out_channels):
        super(DenseNet, self).__init__()
        net=[]
        for i in range(num_convs):
            in_c=in_channels+i*out_channels
            net.append(conv_block(in_c,out_channels))
            
        self.net=nn.ModuleList(net)
        self.out_channels=in_channels+num_convs*out_channels
        
    def forward(self,x):
        for block in self.net:
            y=block(x)
            x=torch.cat((x,y),dim=1)
        return x

12.Inception Block

Inception Block是通过不同卷积层组合而成的一种新的卷积模块，目的是希望将同一特征图像获得不同尺度下的特征，并最后通过拼接操作聚合输出表示，获得多尺度特征

常见的模块有Inception V1、V2、V3、V4
具体结构可以参考
https://blog.csdn.net/zzc15806/article/details/83447006

学会了这些模块，就可以结合实际的理论深度学习算法模型，来构造对应的模型代码了！！！

深度定制：Embedding与Reranker模型的微调艺术从零开始学习人工智能 embedding 人工智能
微调是深度学习中的一种常见做法，它允许模型在预训练的基础上进一步学习特定任务的特定特征。对于Embedding模型，微调的目的是让模型更适配特定的数据集，从而取得更好的召回效果。这通常涉及到使用特定的数据集对模型进行额外的训练，以便模型能够学习到数据集中的特定语义关系。微调过程可以使用不同的库和框架来实现，例如sentence-transformers库，它提供了便捷的API来调整Embeddin
3D卷积神经网络：原理、应用与深入解析从零开始学习人工智能 cnn 人工智能神经网络目标跟踪 3d opencv
3D卷积原理3D卷积，或称为三维卷积，是卷积神经网络（CNN）中的一种技术，用于处理三维数据，如医学图像（如MRI、CT扫描）或视频数据。与标准的二维卷积（处理图像）不同，3D卷积在三个维度（通常是深度、高度和宽度）上操作。在这个图示中，我们可以看到一个3x3x3的卷积核（也称为滤波器或特征检测器）在一个5x5x5的输入数据块上滑动。在每个位置，卷积核与其覆盖的输入数据块的部分进行元素乘法并求和，
【机器学习】—时序数据分析：机器学习与深度学习在预测、金融、气象等领域的应用云边有个稻草人热门文章机器学习数据分析深度学习笔记
云边有个稻草人-CSDN博客目录引言1.时序数据分析基础1.1时序数据的特点1.2时序数据分析的常见方法2.深度学习与时序数据分析2.1深度学习在时序数据分析中的应用2.1.1LSTM（长短期记忆网络）2.2深度学习在金融市场预测中的应用2.2.1股票市场预测2.3深度学习在设备故障检测中的应用3.强化学习与时序数据分析3.1强化学习的基本概念3.2强化学习在金融市场中的应用3.3强化学习在设备故
使用 AI 在医疗影像分析中的应用探索
摘要医疗影像分析是AI在医疗领域的重要应用方向，能够提高诊断效率，减少误诊率。本文将深入探讨AI技术在医疗影像数据分析中的应用，包括核心算法、关键实现步骤和实际案例，并提供一个基于卷积神经网络（CNN）的图像分类Demo。引言随着医疗影像数据的爆炸式增长，传统的人工分析已无法满足高效、精准诊断的需求。AI技术通过深度学习算法，在医疗影像的识别、分类和标注中发挥了重要作用。本文章将结合技术实现与案例
【机器学习】---神经架构搜索（NAS） Undoom 机器学习 Python 机器学习架构人工智能 python
这里写目录标题引言1.什么是神经架构搜索（NAS）1.1为什么需要NAS？2.NAS的三大组件2.1搜索空间搜索空间设计的考虑因素：2.2搜索策略2.3性能估计3.NAS的主要方法3.1基于强化学习的NAS3.2基于进化算法的NAS3.3基于梯度的NAS4.NAS的应用5.实现一个简单的NAS框架6.总结引言随着深度学习的成功应用，神经网络架构的设计变得越来越复杂。模型的性能不仅依赖于数据和训练方
Pytorch实现猫狗分类 NoKnowovo Python pytorch 分类人工智能
在进行编码之前，确保已经安装好Pytorch以及相关依赖环境模型定义构建构建一个较为简单的卷积神经网络模型#定义神经网络模型classCatDogClassifier(nn.Module):def__init__(self):super(CatDogClassifier,self).__init__()self.conv1=nn.Conv2d(3,16,kernel_size=5,stride=1
开源人工智能模型框架：探索与实践 CodeJourney. 人工智能能源
摘要本文深入探讨了开源人工智能模型框架，旨在为研究人员、开发者及相关从业者提供全面的理解与参考。通过对多个主流开源框架，如TensorFlow、PyTorch、Keras、Detectron2、OpenCV、HuggingFaceTransformers、AllenNLP、MindSpore和Fastai的详细分析，阐述其特点、应用场景、优势与不足，并结合具体示例说明其使用方法，同时配以相关架构图
【C#深度学习之路】如何使用C#读取pickle类型的大模型文件来瓶霸王防脱发 C#深度学习之路 c#机器学习
【C#深度学习之路】如何使用C#读取pickle类型的大模型文件背景Pickle文件的结构及读取思路读取方法以压缩文件的方式加载Pickle类型文件读取Header的内容读取tensor的权重值该方法的不足总结本文为原创文章，若需要转载，请注明出处。原文地址：https://blog.csdn.net/qq_30270773/article/details/141367057项目对应的Github
【C#深度学习之路】如何使用C#实现Yolov8模型的训练和推理来瓶霸王防脱发 C#深度学习之路 c#机器学习图像处理视觉检测 YOLO
【C#深度学习之路】如何使用C#实现Yolov8模型的训练和推理项目背景算法实现模型结构项目展望写在最后项目下载链接本文为原创文章，若需要转载，请注明出处。原文地址：https://blog.csdn.net/qq_30270773/article/details/143529308项目对应的Github地址：https://github.com/IntptrMax/YoloSharpC#深度学习
【C#深度学习之路】如何使用C#实现Yolov11模型的训练和推理来瓶霸王防脱发 C#深度学习之路 c#深度学习 YOLO
【C#深度学习之路】如何使用C#实现Yolov11模型的训练和推理项目背景算法实现模型结构项目展望写在最后项目下载链接本文为原创文章，若需要转载，请注明出处。原文地址：https://blog.csdn.net/qq_30270773/article/details/143722404项目对应的Github地址：https://github.com/IntptrMax/YoloSharpC#深度学
华为昇腾AI处理器，atc模型转换和推理过程，华为的CANN库对标的是NVIDIA的cuda，所以在华为昇腾AI处理器上安装了CANN后，就可以直接使用pytorch了，以及推理框架(参考学习) 鼾声鼾语嵌入式硬件学习 stm32 python 数据库
1，模型转换atc模型转换模型转换如图参考链接如下：https://toscode.mulanos.cn/ascend/samples/tree/master/inference/modelInference/sampleResnetQuickStart/cpp2，推理运行，这里需要注意用到了infer，有点类似的pytorch对模型的加载使用model=InferSession(0,model_
AlexNet：开启深度学习图像识别新纪元池央深度学习人工智能
一、引言在深度学习的璀璨星空中，AlexNet无疑是一颗极为耀眼的明星。它于2012年横空出世，并在ImageNet竞赛中一举夺冠，这一历史性的突破彻底改变了计算机视觉领域的发展轨迹，让全世界深刻认识到深度卷积神经网络在图像识别任务中的巨大潜力，从而掀起了深度学习研究与应用的热潮。二、AlexNet网络架构详解（一）输入层AlexNet的输入图像通常为224x224x3的彩色图像。这一尺寸的确定是
拯救者电脑安装Windows和Ubuntu双系统遇到黑屏或者花屏问题的解决方法，亲测有效我爱猪肉炖粉条 ubuntu 深度学习
最近想在电脑上跑深度学习，有一定基础的都知道，ubuntu更适合gpu、apex以及其他加速的使用，如果在Windows上总是遇到各种各样的问题，所以我给电脑安装了双系统。装系统的过程此处忽略，随便找个教程都可以。总结一下就是在C盘压缩一定的空间（比如80G），然后通过U盘工具制作一个Ubuntu启动盘，把系统安装到压缩的那个盘里。我使用的电脑是拯救者R7000P，英伟达RTX2060，AMD处理
AI大模型荆州克莱面试题汇总与解析技术 css3 spring cloud spring boot spring
系列简书文章目录https://www.jianshu.com/p/d47d5cdc8a3e本篇目录AI大模型什么是AI大模型AI大模型，通常指的是在人工智能领域中，特别是机器学习和深度学习范畴内，具有巨大参数量和复杂结构的模型。这些模型通过使用大规模数据集和先进的计算硬件进行训练，能够学习到数据中的复杂模式和特征，从而在多种任务上展现出卓越的性能。特点包括：参数量大：AI大模型的参数数量往往达到
深度学习：从基础到实践（上、下册）(安德鲁·格拉斯纳) fyjgfyjfg 深度学习人工智能
（pdf）:python33+(0m深度学习概述：深度学习是机器学习的一个分支，它试图通过使用深层神经网络来模拟人脑的学习过程。随机性与基础统计学：在深度学习中，随机性起着重要作用，了解基础统计学有助于更好地理解深度学习中的随机过程和不确定性。训练与测试：深度学习模型的训练过程包括使用训练数据来优化模型参数，而测试过程则使用测试数据来评估模型的性能。过拟合与欠拟合：过拟合是指模型在训练数据上表现过
《量子计算对人工智能发展的深远影响》 cc++人工智能深度学习
在科技发展的浪潮中，量子计算与人工智能无疑是两颗璀璨的明星，二者的融合正引领着一场深刻的科技变革.量子计算的独特之处在于其利用量子比特的叠加和纠缠特性，能够实现并行计算，从而在处理复杂问题时展现出超越传统计算的巨大潜力.这种强大的计算能力为人工智能的发展带来了诸多积极影响。加速机器学习训练机器学习，尤其是深度学习，通常需要处理海量数据和复杂的模型训练，耗时极长。量子计算的并行性可使训练过程大幅加速
Python基于YOLOv8和OpenCV实现车道线和车辆检测 old_power 计算机视觉 YOLO opencv 计算机视觉 python
使用YOLOv8（YouOnlyLookOnce）和OpenCV实现车道线和车辆检测，目标是创建一个可以检测道路上的车道并识别车辆的系统，并估计它们与摄像头的距离。该项目结合了计算机视觉技术和深度学习物体检测。1、系统主要功能车道检测：使用边缘检测和霍夫线变换检测道路车道。汽车检测：使用YOLOv8模型识别汽车并在汽车周围绘制边界框。距离估计：使用边界框大小计算检测到的汽车与摄像头的距离。2、环境
每天五分钟深度学习框架pytorch:快速搭建VGG网络的基础模块VGG块每天五分钟玩转人工智能深度学习框架pytorch 深度学习 pytorch 网络卷积神经网络卷积层人工智能
本文重点前面我们介绍了VGG神经网络，我们知道VGG是由许多的VGG块构成，那么本文我们将使用pytorch搭建VGG块代码实现：importtorchfromtorchimportnndefvgg_block(num_convs,in_channels,out_channels):net=[nn.Conv2d(in_channels,out_channels,kernel_size=3,padd
探秘6-DoF GraspNet：面向对象操纵的变分抓取生成庞锦宇
探秘6-DoFGraspNet：面向对象操纵的变分抓取生成项目地址:https://gitcode.com/gh_mirrors/py/pytorch_6dof-graspnet在人工智能和机器人领域，我们正逐步接近让机器模拟人类的手部动作，实现精准的六自由度（6-DoF）物体抓取。6-DoFGraspNet是一项革新性的技术，现在，这个强大的工具已有了PyTorch实现。本文将详细介绍这一开源项
AI如何帮助电商企业进行数据分析 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
电商数据分析，人工智能，机器学习，深度学习，推荐系统，预测模型，客户画像1.背景介绍在当今数字化时代，电商行业蓬勃发展，数据成为企业最重要的资产。电商企业每天都会产生海量的数据，包括用户行为、商品信息、交易记录等。如何有效地分析这些数据，挖掘其中的价值，对于电商企业的运营、营销和发展至关重要。传统的数据分析方法往往难以应对海量数据的处理和复杂分析需求，而人工智能（AI）技术的出现为电商数据分析带来
大规模语言模型从理论到实践大语言模型预训练数据 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大规模语言模型从理论到实践：大语言模型预训练数据关键词：大规模语言模型、预训练数据、数据集选择、数据清洗、数据增强、数据集评估、数据集扩展1.背景介绍1.1问题的由来随着深度学习和大规模神经网络的发展，大型语言模型（LargeLanguageModels,LLMs）成为了自然语言处理（NLP）领域的一项突破性技术。LLMs能够生成流畅且具有上下文关联性的文本，这得益于它们在海量文本数据上的预训练。
神经架构搜索在大模型效率优化中的应用 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
神经架构搜索，大模型，效率优化，自动机器学习，深度学习1.背景介绍近年来，深度学习模型取得了令人瞩目的成就，在图像识别、自然语言处理、语音识别等领域展现出强大的能力。然而，随着模型规模的不断扩大，训练和部署这些大模型也带来了巨大的挑战。计算资源消耗巨大:大模型的训练需要大量的计算资源，例如高性能GPU和TPU，这导致训练成本高昂，难以普及。内存占用量大:大模型的参数量庞大，需要大量的内存进行存储和
卷积神经网络（CNN）：深度学习中的核心模型任义礼智信深度学习 cnn 人工智能
引言卷积神经网络（ConvolutionalNeuralNetworks,CNNs）是深度学习领域的一种重要模型，广泛应用于图像处理、计算机视觉、自然语言处理等多个领域。CNN凭借其卓越的特征提取能力和参数共享机制，已成为计算机视觉任务中最主流的算法之一。本文将深入探讨CNN的基本原理、结构组件、应用场景及其发展方向。CNN的基本原理CNN是一种特殊的前馈神经网络（FeedforwardNeura
【机器学习：十五、神经网络的编译和训练】 KeyPan 机器学习机器学习神经网络人工智能深度学习 pytorch ubuntu linux
1.TensorFlow实现代码TensorFlow是深度学习中最为广泛使用的框架之一，提供了灵活的接口来构建、编译和训练神经网络。以下是实现神经网络的一个完整代码示例，以“手写数字识别”为例：importtensorflowastffromtensorflow.kerasimportlayers,models#加载MNIST数据集(x_train,y_train),(x_test,y_test)
【机器学习：十六、其他的激活函数】 KeyPan 机器学习机器学习人工智能算法服务器运维 ubuntu
1.Sigmoid激活函数的替代方案Sigmoid激活函数在神经网络中曾广泛使用，其数学公式为：σ(x)=11+e−x\sigma(x)=\frac{1}{1+e^{-x}}σ(x)=1+e−x1输出范围为(0,1)，适合二分类问题。但随着深度学习的发展，Sigmoid函数逐渐被替代，主要原因包括：梯度消失问题：当输入绝对值较大时，梯度趋近于零，导致权重更新困难。非零中心问题：输出值始终为正，可能
深度学习图像算法中的网络架构：Backbone、Neck 和 Head 详解肥猪猪爸 #深度学习深度学习算法人工智能数据结构神经网络计算机视觉机器学习
深度学习已经成为图像识别领域的核心技术，特别是在目标检测、图像分割等任务中，深度神经网络的应用取得了显著进展。在这些任务的网络架构中，通常可以分为三个主要部分：Backbone、Neck和Head。这些部分在整个网络中扮演着至关重要的角色，它们各自处理不同的任务，从特征提取到最终的预测输出，形成了一个完整的图像处理流程。本文将详细介绍这三部分的作用以及它们在目标检测和图像分割中的应用，帮助大家更好
频域增强通道注意力机制EFCAM模型详解及代码复现呆头鹅AI工作室深度学习算法详解及代码复现深度学习人工智能神经网络 conda python
背景与动机在深度学习领域，如何有效处理时间序列数据一直是一个重要的研究方向。近年来，频域分析技术在时间序列处理中展现出了巨大潜力，特别是离散余弦变换（DCT）因其能够高效捕捉低频信息并避免高频噪声干扰而受到广泛关注。FECAM模型的开发正是基于这一背景，旨在结合频域分析和通道注意力机制，以提高模型对时间序列数据的特征提取和表示能力。通过这种创新方法，FECAM模型能够更有效地捕捉时间序列中的关键特
PyTorch建模与应用：从深度学习到大模型屿小夏书籍推荐深度学习 pytorch 人工智能
文章目录一、内容简介二、值得一读1.从基础到深入，适合不同层次的读者2.丰富的实战案例3.全面的数据处理与模型构建三、适用人群1.AI技术初学者2.在校学生和从业者3.培训机构和高校教学四、总结一、内容简介《动手学PyTorch建模与应用:从深度学习到大模型》是一本从零基础上手深度学习和大模型的PyTorch实战指南。全书共11章，内容涵盖了从深度学习的基础概念到大语言模型的应用。第1章介绍了深度
遗传算法与深度学习实战（25）——使用Keras构建卷积神经网络盼小辉丶遗传算法与深度学习实战深度学习 keras cnn
遗传算法与深度学习实战（25）——使用Keras构建卷积神经网络0.前言1.卷积神经网络基本概念1.1卷积1.2步幅1.3填充1.4激活函数1.5池化2.使用Keras构建卷积神经网络3.CNN层的问题4.模型泛化小结系列链接0.前言卷积神经网络(ConvolutionalNeuralNetwork,CNN)的提出是为了解决传统神经网络的缺陷。即使对象位于图片中的不同位置或其在图像中具有不同占比，
【深度学习地学应用|滑坡制图、变化检测、多目标域适应、感知学习、深度学习】跨域大尺度遥感影像滑坡制图方法：基于原型引导的领域感知渐进表示学习（一）努力学习的大大论文推荐深度学习人工智能机器学习神经网络变化检测
【深度学习地学应用|滑坡制图、变化检测、多目标域适应、感知学习、深度学习】跨域大尺度遥感影像滑坡制图方法：基于原型引导的领域感知渐进表示学习（一）【深度学习地学应用|滑坡制图、变化检测、多目标域适应、感知学习、深度学习】跨域大尺度遥感影像滑坡制图方法：基于原型引导的领域感知渐进表示学习（一）文章目录【深度学习地学应用|滑坡制图、变化检测、多目标域适应、感知学习、深度学习】跨域大尺度遥感影像滑坡制图
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本

卷积神经网络常见模块

深度学习常见模型子模块

常见模块

1.卷积

1.1 2D卷积（单通道和多通道）

1.2 1x1 卷积

1.3 转置卷积（反卷积 Transposed convolution）

1.4 分组卷积（Group convolution）

1.5 空洞卷积（Dilated convolution）

1.6 深度分离卷积（Depthwise convolution）

1.7 逐点分离卷积（Pointwise convolution）

2.激活函数

2.1 Sigmoid

2.2 Tanh

2.3 Softsign

2.4 ReLU

3.池化

3.1 最大池化

3.2 平均池化

4.view

5.全连接（FC）

6.批量归一化(Batch normlization)

6.1 对全连接层做批量归一化

6.2 对卷积层做批量归一化

7.Dropout

8.NIN

pytorch实现

9.Residual 残差模块

pytorch实现

10.bottlenect 瓶颈块

pytorch实现

11.Dense 深度块

pytorch实现

12.Inception Block

你可能感兴趣的:(深度学习,Pytorch,深度学习,pytorch,卷积神经网络)