爱喝汽水的喵

Pytorch学习笔记:ResNet

1.残差块
2.残差网络结构
- 2.1 虚线与实线连接
- 2.2 Batch Normalization
3.网络搭建
- 3.1 18,34层网络的残差块
- 3.2 50,101,152层网络的残差块
- 3.3 ResNet的搭建
- - 3.3.1 conv_1的搭建
  - 3.3.2 _make_layer构建conv_2-conv_5
4.训练文件

主要参考b站up霹雳吧啦Wz视频，感谢up主做的极其详细并对小白友好的精彩分享。

代码来自up主的Github仓库开源项目，侵权删。

1.残差块

输入为X，前馈输出F(X)与一条直连通道的值X进行汇合相加后F(X)+X->H(X)，经过RELU激活层获得最终输出。

一种比较能接受的解释：
F是求和前网络映射，H是从输入到求和后的网络映射。比如把5映射到5.1，那么引入残差前是F’(5)=5.1，引入残差后是H(5)=5.1, H(5)=F(5)+5, F(5)=0.1。这里的F’和F都表示网络参数映射，引入残差后的映射对输出的变化更敏感。比如原来是从5.1到5.2，映射F’的输出增加了1/51=2%，而对于残差结构从5.1到5.2，映射F是从0.1到0.2，增加了100%。明显后者输出变化对权重的调整影响更大(因为基数更小)，所以效果更好。解释的传送门

残差块的提出是为了解决网络退化问题，显然从上面的分析可知，残差的学习会比原来的映射学习更容易，从而能够训练更深的网络。

2.残差网络结构

残差网络由conv1,conv2_x,conv3_x,conv4_x,conv5_x五层组成，通过调整conv2_x,conv3_x,conv4_x,conv5_x中残差块的数量即可搭建不同深度的残差网络。
由上表可知，18层和34层ResNet的残差块是由双卷积层构成的，并且两层卷积核的个数一致，不同类型的块之间过渡时，图像的宽高减半，深度加倍。50层，101层和152层ResNet的残差块是由三卷积层构成的，首尾是1×1卷积层，中间是3×3卷积层，因为引入1×1卷积可以降维，所以在搭建更深的网络时用选用这种类型的残差块会更好，三层残差块的前两个卷积层深度相同，第三个卷积层深度是之前的4倍，不同类型的块之间过渡时，宽高减半，深度减半。两种残差块的结构如下图所示。

残差块	双层型	三层型
块内层数	2	3
层间深度变化	翻倍	减半
层间size变化	减半	减半
层内块深度变化	不变	前两层不变，第三层翻4倍

层间是指从conv_2过渡到conv_3层这种跨层的变化，层内是指conv_2,3,4,5层内参数一样（实线虚线可能不一样）的残差块间过渡，层内块深度变化是指conv_2,3,4,5中的残差块的每个卷积层的深度，即卷积核个数的变化。

2.1 虚线与实线连接

虚线表示不能直连，直线表示可以输入可以通过直连通道直接与输出相加。在conv_3,conv_4,conv_5的结构中，为了统一直连通道与前馈通道的尺寸与深度，第一个残差块总是虚线连接。

上图右图为conv_3中的两层残差块(18,34层网络模块)的虚线连接，输入的图像为[64,56,56]，输出为[128,28,28]，故在直连通道首先要进行长宽的压缩，其次要进行深度的扩展，使用步长为2，尺寸为1的128个卷积核可实现。此外，前馈通道中也要使用步长为2的卷积核来压缩尺寸，如第一层卷积层。当在conv_3中继续传播时，通过padding操作可以对齐尺寸，深度也均已调整为128，故后续采用实线连接残差块即可。

上图右图为conv_3中的三层残差块(50,101,152层网络模块)的虚线连接，输入的图像为[256,56,56]，输出为[512,28,28]，故在直连通道首先要进行长宽的压缩，其次要进行深度的扩展，使用步长为2，尺寸为1的512个卷积核可实现。此外，前馈通道中也要使用步长为2的卷积核来压缩尺寸，如第二层卷积层。当在conv_3中继续传播时，通过padding操作可以对齐尺寸，深度也均已调整为512，故后续采用实线连接残差块即可。

2.2 Batch Normalization

如同机器学习进行数据标准化，深度学习中也存在Batch Normalization草做，以每个batch为单位，对一个batch中的所有图像的每个channel分别求均值和标准差用于标准化，加速收敛，具体说明见如下传送门。该操作通常用于卷积与激活层之间，
Batch Normalization传送门

3.网络搭建

3.1 18,34层网络的残差块

图解实线与虚线区别见2.1章节，该模块要能通过参数设定同时起到实线与虚线连接的功能。

class BasicBlock(nn.Module):
    expansion = 1
    #expansion是与三层残差块对应,三层残差块的最后一层深度会翻4倍

    def __init__(self, in_channel, out_channel, stride=1, downsample=None, **kwargs):
        """
        传入参数包括输入图像的深度,输出图像的深度,卷积步长默认是1,是否进行下采样
        """
        super(BasicBlock, self).__init__()
        self.conv1 = nn.Conv2d(in_channels=in_channel, out_channels=out_channel,
                               kernel_size=3, stride=stride, padding=1, bias=False)
        #两层型残差块的卷积核深度即为输入图像的深度,卷积核个数即为输出的深度,且均为3*3卷积核
        #第一层的卷积核步长当进行下采样时为2,故这里定为stride
        self.bn1 = nn.BatchNorm2d(out_channel)
        self.relu = nn.ReLU()
        self.conv2 = nn.Conv2d(in_channels=out_channel, out_channels=out_channel,
                               kernel_size=3, stride=1, padding=1, bias=False)
        self.bn2 = nn.BatchNorm2d(out_channel)
        self.downsample = downsample

    def forward(self, x):
        identity = x
        if self.downsample is not None:
            identity = self.downsample(x)

        out = self.conv1(x)
        out = self.bn1(out)
        out = self.relu(out)

        out = self.conv2(out)
        out = self.bn2(out)

        out += identity
        out = self.relu(out)

        return out

几点说明：
1.该残差结构要能实现虚线与实线的功能，通过downsample控制是否进行下采样,如果不为None则要进行下采样(表示虚线结构)，为None则为实线结构。

2.BatchNorm2d要先填入channel数初始化，并且加在卷积与池化层之间，在第二个卷积层进行输出时要先把前馈与直连通道相加再通过ReLU层。

3.虚线结构与实线结构的第一层卷积层的步长不同，必须是可调整的参数，默认参数设置为1，采用虚线连接时设置为2。

3.2 50,101,152层网络的残差块

class Bottleneck(nn.Module):
    """
    注意：原论文中，在虚线残差结构的主分支上，第一个1x1卷积层的步距是2，第二个3x3卷积层步距是1。
    但在pytorch官方实现过程中是第一个1x1卷积层的步距是1，第二个3x3卷积层步距是2，
    这么做的好处是能够在top1上提升大概0.5%的准确率。
    可参考Resnet v1.5 https://ngc.nvidia.com/catalog/model-scripts/nvidia:resnet_50_v1_5_for_pytorch
    """
    expansion = 4
    #取4是因为第三层的深度会翻4倍

    def __init__(self, in_channel, out_channel, stride=1, downsample=None,
                 groups=1, width_per_group=64):
        super(Bottleneck, self).__init__()
        #out_channel是指第1,2层的深度,width_per_group是指?,其余与2层残差块一致

        width = int(out_channel * (width_per_group / 64.)) * groups
        #width是指一通计算以后第1,2层的深度,理论上应该与out_channel相等
        """
        算例:以conv_3实线结构为例
        """


        self.conv1 = nn.Conv2d(in_channels=in_channel, out_channels=width,
                               kernel_size=1, stride=1, bias=False)  # squeeze channels
        self.bn1 = nn.BatchNorm2d(width)
        # -----------------------------------------
        self.conv2 = nn.Conv2d(in_channels=width, out_channels=width, groups=groups,
                               kernel_size=3, stride=stride, bias=False, padding=1)
        #第二层的卷积核步长当进行下采样(虚线连接)时为2,故这里定为stride
        self.bn2 = nn.BatchNorm2d(width)
        # -----------------------------------------
        self.conv3 = nn.Conv2d(in_channels=width, out_channels=out_channel*self.expansion,
                               kernel_size=1, stride=1, bias=False)  # unsqueeze channels
        #第三层要注意深度翻4倍
        self.bn3 = nn.BatchNorm2d(out_channel*self.expansion)
        self.relu = nn.ReLU(inplace=True)
        self.downsample = downsample

    def forward(self, x):
        identity = x
        if self.downsample is not None:
            identity = self.downsample(x)

        out = self.conv1(x)
        out = self.bn1(out)
        out = self.relu(out)

        out = self.conv2(out)
        out = self.bn2(out)
        out = self.relu(out)

        out = self.conv3(out)
        out = self.bn3(out)

        out += identity
        out = self.relu(out)

        return out

几点说明：
1.虚线结构与实线结构的第二层卷积层的步长不同，必须是可调整的参数，默认参数设置为1，采用虚线连接时设置为2，其余层步长均为1。
2.根据Python面向对象的规则，在类内声明expansion变量后，类内的函数使用该变量即调用self.expansion。

3.3 ResNet的搭建

3.3.1 conv_1的搭建

class ResNet(nn.Module):

    def __init__(self,
                 block,
                 blocks_num,
                 num_classes=1000,
                 include_top=True,
                 groups=1,
                 width_per_group=64):
        """
        block:残差块的类型
        blocks_num:每个conv_x(x=1,2,3,4)layer,对应conv_2,conv_3,conv_4和conv_5中的残差块数量
        num_classes:类别数量
        include_top:此处暂时不管
        width_per_group:不用管
        """
        super(ResNet, self).__init__()
        self.include_top = include_top
        self.in_channel = 64

        self.groups = groups
        self.width_per_group = width_per_group

        self.conv1 = nn.Conv2d(3, self.in_channel, kernel_size=7, stride=2,
                               padding=3, bias=False)
        self.bn1 = nn.BatchNorm2d(self.in_channel)
        self.relu = nn.ReLU(inplace=True)
        self.maxpool = nn.MaxPool2d(kernel_size=3, stride=2, padding=1)
        
        self.layer1 = self._make_layer(block, 64, blocks_num[0])
        self.layer2 = self._make_layer(block, 128, blocks_num[1], stride=2)
        self.layer3 = self._make_layer(block, 256, blocks_num[2], stride=2)
        self.layer4 = self._make_layer(block, 512, blocks_num[3], stride=2)
        if self.include_top:
            self.avgpool = nn.AdaptiveAvgPool2d((1, 1))  # output size = (1, 1)
            self.fc = nn.Linear(512 * block.expansion, num_classes)

        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')

上半段代码完成了对conv_1的搭建，并通过_make_layer函数完成对conv_2-conv_5的搭建，并对每个卷积层权重采用kaiming初始化,同时根据自定义类别对全连接层进行初始化。_make_layer是一个输入block类型，channel(第一层卷积核的个数)，block_num(块的数量)以及卷积步长来进行网络搭建的类内函数，下面介绍该函数。

3.3.2 _make_layer构建conv_2-conv_5

    def _make_layer(self, block, channel, block_num, stride=1):
    #这里的channel是第一层的卷积核个数,block_num是块数
        downsample = None
        if stride != 1 or self.in_channel != channel * block.expansion:
            downsample = nn.Sequential(
                nn.Conv2d(self.in_channel, channel * block.expansion, kernel_size=1, stride=stride, bias=False),
                nn.BatchNorm2d(channel * block.expansion))

        layers = []
        layers.append(block(self.in_channel,
                            channel,
                            downsample=downsample,
                            stride=stride,
                            groups=self.groups,
                            width_per_group=self.width_per_group))
        self.in_channel = channel * block.expansion

        for _ in range(1, block_num):
            layers.append(block(self.in_channel,
                                channel,
                                groups=self.groups,
                                width_per_group=self.width_per_group))

        return nn.Sequential(*layers)

通过if stride != 1 or self.in_channel != channel * block.expansion来判断是否构建下采样层，条件为步长不为1或者输入输出通道数不一致(18,34残差块与50,101,152残差块)，两层残差块与三层残差块的扩展因子分别为1和4，故三层残差块在输入时会被检测到输入输出通道数不一致从而添加一个虚线连接。经过虚线连接后输出的特征图的形状参数已被调整好，经过该layer的后续同类型残差块后形状参数不再发生变化，也就不再需要虚线连接。
使用_make_layer函数时，只需要给定残差块的类型，是否需要增加虚线连接(通过设置步长以及残差块的类型来决定)，并给出残差块第一层卷积层的深度，即可完成一个layer的搭建。
在构建ResNet34时残差块取BasicBlock, conv_x(x=2,3,4,5)的残差块数量分别为[3, 4, 6, 3]，该指令传到ResNet类中，调用以下四条命令。

self.layer1 = self._make_layer(block, 64, blocks_num[0])
self.layer2 = self._make_layer(block, 128, blocks_num[1], stride=2)
self.layer3 = self._make_layer(block, 256, blocks_num[2], stride=2)
self.layer4 = self._make_layer(block, 512, blocks_num[3], stride=2)

对于conv2，因为前馈通道的输出特征图尺寸和深度与输入保持一致，不需要虚线连接。对于conv_3，第一个残差块的前馈通道的输出特征图尺寸和深度与输入不一致，故需要进行虚线连接(下采样)，使得该层第一个残差块的输出形状参数等于该层的最终输出，从而可以采用直连。对conv_4，5的分析同理。

前向传播代码：

    def forward(self, x):
        x = self.conv1(x)
        x = self.bn1(x)
        x = self.relu(x)
        x = self.maxpool(x)

        x = self.layer1(x)
        x = self.layer2(x)
        x = self.layer3(x)
        x = self.layer4(x)

        if self.include_top:
            x = self.avgpool(x)
            x = torch.flatten(x, 1)
            x = self.fc(x)

        return x

最后是34层与50层残差网络的搭建命令。

def resnet34(num_classes=1000, include_top=True):
    # https://download.pytorch.org/models/resnet34-333f7ec4.pth
    return ResNet(BasicBlock, [3, 4, 6, 3], num_classes=num_classes, include_top=include_top)
    
def resnet50(num_classes=1000, include_top=True):
    # https://download.pytorch.org/models/resnet50-19c8e357.pth
    return ResNet(Bottleneck, [3, 4, 6, 3], num_classes=num_classes, include_top=include_top)

4.训练文件

因为直接训练ResNet比较困难，所以通常会采用迁移学习来进行网络的训练。
先下载在ImageNet上训练好的ResNet34的权重并载入模型，但是预加载的模型是一个1000分类的模型，而我们实验所用的数据是一个5分类的简单数据集，需要进行如下修改：

#加载模型参数
net.load_state_dict(torch.load(model_weight_path, map_location=device))
in_channel = net.fc.in_features#获取最后一个全连接层的输入深度
net.fc = nn.Linear(in_channel, 5)#修改全连接层的输出向量长度为5,因为花分类数据集就5类
params = [p for p in net.parameters() if p.requires_grad]#初始化优化器
optimizer = optim.Adam(params, lr=0.0001)

即可进行迁移学习，并且当第一个epoch迭代完毕时，分类精度已经达到90%！

充分展示了迁移学习的强大能力。预测文件同之前的网络。

Python深度学习实践：神经网络在异常检测中的应用 AI天才研究院 AI大模型企业级应用开发实战 Python实战 DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
Python深度学习实践：神经网络在异常检测中的应用关键词：深度学习，神经网络，异常检测，Python，TensorFlow，PyTorch，模型优化，实战案例摘要：本文深入探讨了深度学习在异常检测领域的应用。通过Python实现的神经网络，本文介绍了深度学习的基本概念、核心算法、模型优化方法，并提供了详细的实战案例，包括数据预处理、模型训练和评估。读者将了解如何使用深度学习技术检测金融欺诈、网络
Transformer 代码剖析15 - Transformer模型代码（pytorch实现） lczdyx Transformer代码剖析 transformer pytorch 深度学习 embedding 人工智能 python
一、模型架构全景解析1.1类定义与继承关系classTransformer(nn.Module):该实现继承PyTorch的nn.Module基类，采用面向对象设计模式。核心架构包含编码器-解码器双塔结构，通过参数配置实现NLP任务的通用处理能力。TransformerEncoderDecoderMulti-HeadAttentionFeedForwardMaskedMulti-HeadAtten
Pytorch实现之LSRGAN，轻量化SRGAN超分辨率SAR 这张生成的图像能检测吗优质GAN模型训练自己的数据集超分辨率重建人工智能图像处理计算机视觉深度学习 pytorch 机器学习
简介简介：在SRGAN的基础上设计了一个轻量化的SRGAN模型结构，通过DSConv+CA与残差结构的设计来减少参数量，同时利用SeLU激活函数构造。与多类SRGAN改进不同的是，很少使用BN层。论文题目：LightweightSuper-ResolutionGenerativeAdversarialNetworkforSARImages（SAR图像的轻量级超分辨率生成对抗网络）期刊：Remote
PyTorch 与 NVIDIA GPU 的适配版本及安装小赖同学啊人工智能 pytorch 人工智能 python
PyTorch与NVIDIAGPU的适配版本需要通过CUDA和cuDNN来实现。以下是详细的安装教程，包括如何选择合适的PyTorch版本以及如何配置NVIDIAGPU环境。1.检查NVIDIAGPU和驱动1.1检查GPU型号确保你的机器上有NVIDIAGPU，并知道其型号。可以通过以下命令检查：nvidia-smi输出示例：+-----------------------------------
C++使用Onnxruntime/TensorRT模型推理奇华智能 AI c++开发语言人工智能 AI 计算机视觉
onnxruntime和tensorrt是我们常用的两种推理方式，下面整理了两个推理示例，仅供参考。步骤流程模型训练，python下生成pytorch的模型.pth，并基于.pth模型进行推理python下依据模型推理实现从.pth转向.onnxpython下基于.onnx进行推理，与后续两种推理方式种的推理结果进行比较环境windows10+RTX308015GB显存cuda11.3onnxru
【图像去噪】论文复现：真实噪声转高斯噪声，提升高斯噪声训练的模型性能！Learning to Translate Noise的Pytorch源码复现，跑通流程，框架结构和损失函数详解！十小大 pytorch 人工智能 python 图像去噪图像处理深度学习计算机视觉
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）完整代码和训练好的模型权重文件下载链接见本文底部，订阅专栏免费获取！本文亮点：跑通LearningtoTranslateNoise源码，包含基于BasicSR的训练和测试代码，得
Python | Pytorch | Tensor知识点总结漂亮_大男孩 Python拾遗 python pytorch 深度学习人工智能
如是我闻：Tensor是我们接触Pytorch了解到的第一个概念，这里是一个关于PyTorchTensor主题的知识点总结，涵盖了Tensor的基本概念、创建方式、运算操作、梯度计算和GPU加速等内容。1.Tensor基本概念Tensor是PyTorch的核心数据结构，类似于NumPy的ndarray，但支持GPU加速和自动求导。PyTorch的Tensor具有动态计算图，可用于深度学习模型的前向
PyTorch 中结合迁移学习和强化学习的完整实现方案小赖同学啊人工智能 pytorch 迁移学习人工智能
结合迁移学习（TransferLearning）和强化学习（ReinforcementLearning,RL）是解决复杂任务的有效方法。迁移学习可以利用预训练模型的知识加速训练，而强化学习则通过与环境的交互优化策略。以下是如何在PyTorch中结合迁移学习和强化学习的完整实现方案。1.场景描述假设我们有一个任务：训练一个机器人手臂抓取物体。我们可以利用迁移学习从一个预训练的视觉模型（如ResNet
pytorch 模型测试小赖同学啊人工智能 pytorch 人工智能 python
在使用PyTorch进行模型测试时，一般包含加载测试数据、加载训练好的模型、进行推理以及评估模型性能等步骤。以下为你详细介绍每个步骤及对应的代码示例。1.导入必要的库importtorchimporttorch.nnasnnimporttorchvisionimporttorchvision.transformsastransforms2.加载测试数据假设我们使用的是CIFAR-10数据集作为示例
Pytorch实现之基于相对平均生成对抗网络的人脸图像超分辨率这张生成的图像能检测吗优质GAN模型训练自己的数据集生成对抗网络人工智能神经网络计算机视觉深度学习 python pytorch
简介简介：改进SRGAN，并使用相对平均生成对抗网络的人脸图像超分辨率训练自己的数据集论文题目：FaceImageSuper-resolutionBasedOnRelativeAverageGenerativeAdversarialNetworks（基于相对平均生成对抗网络的人脸图像超分辨率）会议：20212ndAsiaSymposiumonSignalProcessing(ASSP)摘要：人脸图
Self-Attentive Sequential Recommendation论文阅读笔记调包调参侠推荐系统学习深度学习机器学习神经网络算法
SASRec论文阅读笔记论文标题：Self-AttentiveSequentialRecommendation发表于：2018ICDM作者：Wang-ChengKang,JulianMcAuley论文代码：https://github.com/pmixer/SASRec.pytorch论文地址：https://arxiv.org/pdf/1808.09781v1.pdf摘要顺序动态是许多现代推荐系
NCU使用指南及模型性能测试（pytorch2.5.1） Jakari cuda gpu ncu python docker 深度学习 pytorch
本项目在原项目的基础上增加了NsightCompute(ncu)测试的功能，并对相关脚本功能做了一些健硕性的增强，同时，对一些框架的代码进行了更改（主要是数据集的大小和epoch等），增加模型性能测试的效率，同时完善了模型LSTM的有关功能。OverviewNsightCompute(NCU)是NVIDIA提供的GPU内核级性能分析工具，专注于CUDA程序的优化。它提供详细的计算资源、内存带宽、指
基于PyTorch的深度学习2——Numpy与Tensor Wis4e 深度学习 pytorch numpy
Tensor自称为神经网络界的Numpy，它与Numpy相似，二者可以共享内存，且之间的转换非常方便和高效。不过它们也有不同之处，最大的区别就是Numpy会把ndarray放在CPU中进行加速运算，而由Torch产生的Tensor会放在GPU中进行加速运算。1.创建创建Tensor的方法有很多，可以从列表或ndarray等类型进行构建，也可根据指定的形状构建。importtorch#根据list数
图像识别技术与应用课后总结（12）一元钱面包人工智能
全局平均池化（GlobalAveragePooling）1.导入库和设备配置importtorch.nnasnnimporttorch.nn.functionalasFdevice=torch.device("cuda:0"iftorch.cuda.is_available()else"cpu")-importtorch.nnasnn：导入PyTorch的神经网络模块，用于构建神经网络层。-imp
PyTorch RuntimeError: 张量 a 的大小必须与张量 b 的大小在非单例维度上匹配 PzBlockchain pytorch 人工智能 python 机器学习-深度学习
在使用PyTorch进行深度学习模型开发时，经常会遇到各种错误和异常。其中一个常见的错误是RuntimeError。这篇文章将详细介绍其中一个特定的RuntimeError，即“Thesizeoftensoramustmatchthesizeoftensorbatnon-singletondimension”错误。我们将讨论这个错误的原因，并提供一些解决方案。错误信息解读：错误信息“Thesize
私有部署 ChatGLM3-6B 张申傲 langchain 人工智能 aigc chatgpt ai
1.在AutoDL平台上租赁GPUGPU型号：RTX4090PyTorch版本：2.5.1**（推荐使用2.0及以上的版本，以获得最佳的推理性能）**2.开启学术资源加速source/etc/network_turbo3.拉取模型代码gitclonehttps://github.com/THUDM/ChatGLM34.安装依赖cdChatGLM3pipinstall-rrequirements.t
深度学习pytorch之4种归一化方法（Normalization）原理公式解析和参数使用 @Mr_LiuYang 计算机视觉基础归一化正则化 Normlization BatchNorm LayerNorm InstanceNrom GroupNorm
深度学习pytorch之22种损失函数数学公式和代码定义深度学习pytorch之19种优化算法（optimizer）解析深度学习pytorch之4种归一化方法（Normalization）原理公式解析和参数使用摘要归一化（Normalization）是提升模型性能、加速训练的重要技巧。归一化方法可以帮助减少梯度消失或爆炸的问题，提升模型的收敛速度，且对最终模型的性能有显著影响。本文将以PyTorc
PyTorch Lightning 的简单使用示例 idealmu pytorch 人工智能 python
1.环境准备与依赖导入首先，代码需要导入了实现模型、数据处理和训练所需的各个包：importtorchfromtorchimportnnfromtorch.utils.dataimportDataLoader,random_splitfromtorchvision.datasetsimportMNISTfromtorchvision.transformsimportToTensorimportpy
Torch-MLIR 项目使用教程穆声淼Germaine
Torch-MLIR项目使用教程torch-mlirTheTorch-MLIRprojectaimstoprovidefirstclasssupportfromthePyTorchecosystemtotheMLIRecosystem.项目地址:https://gitcode.com/gh_mirrors/to/torch-mlir1.项目目录结构及介绍Torch-MLIR项目的目录结构遵循典型的
2024 最新计算机视觉学习路线（入门篇）_计算机视觉课程主线 m0_60721823 计算机视觉学习人工智能
Python是机器学习项目中最流行的编程语言之一，因为与Java和C++等其他编程语言相比，它简单易读。Python附带了许多可以加快开发速度的库，其中一些重要的库是OpenCV、TensorFlow、PyTorch等，它们专门用于图像处理相关任务。本文旨在向初学者介绍这一领域，为他们提供有关涉及图像的机器学习应用程序背后概念的基本知识，并从高层次的角度深入了解这些库如何在底层协同工作，以便他们在
使用pytorch和opencv根据颜色相似性提取图像深蓝海拓机器视觉和人工智能学习 opencv学习笔记 pytorch opencv 人工智能
需求：将下图中的花朵提取出来。代码：importcv2importtorchimportnumpyasnpimporttimedefget_similar_colors(image,color_list,threshold):#将图像和颜色列表转换为torch张量device=torch.device('cuda'iftorch.cuda.is_available()else'cpu')image
PyTorch数据加载：实战入门秋‍. pytorch 人工智能 python 数据加载
"好的数据加载是成功训练的第一步"一、为什么要用DataLoader？当我们刚开始学习深度学习时，常常会这样处理数据：#传统方式加载数据images=[...]#所有图片数据labels=[...]#所有标签foriinrange(0,len(images),32):batch_images=images[i:i+32]batch_labels=labels[i:i+32]#训练代码...这种方式
大模型国产化迁移大模型到昇腾教程（Pytorch版）科技互联人生科技数码人工智能 AIGC 语言模型
大模型国产化适配10-快速迁移大模型到昇腾910B保姆级教程（Pytorch版）随着ChatGPT的火爆，AI大模型时代来临，但算力紧张。中美贸易战及美国制裁AI芯片，国产化势在必行。已有国产AI芯片和Mindformers框架，基于昇腾910训练大模型，使用MindIE实现大模型服务化。本文介绍如何迅速将大型模型迁移到昇腾910B,许多入门者都是从斯坦福羊驼开始的。我们将利用羊驼的训练代码和数据
大模型微调入门（Transformers + Pytorch）昵称不能为null python llm 机器学习人工智能
目标输入：你是谁？输出：我们预训练的名字。训练为了性能好下载小参数模型，普通机器都能运行。下载模型#方式1：使用魔搭社区SDK下载#down_deepseek.pyfrommodelscopeimportsnapshot_downloadmodel_dir=snapshot_download('deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B')#方式2：gitl
计算机视觉实战：YOLOv8在工业质检中的应用（附完整代码+数据集） emmm形成中深度学习人工智能 python 计算机视觉
计算机视觉实战：YOLOv8在工业质检中的应用（附完整代码+数据集）摘要：本文为零基础读者系统讲解目标检测核心原理，基于YOLOv8实现工业缺陷检测实战项目。从数据标注到模型部署，包含环境配置、数据增强、模型训练全流程详解，手把手教你打造高精度智能质检系统！关键词：YOLOv8、目标检测、工业质检、缺陷识别、PyTorch一、为什么选择YOLOv8做工业质检？1.1工业质检的三大痛点人工成本高：传
RNN原理+实战 pytorch--lstm--gru 甜辣uu python从入门到精通 tensorflow python pytorch 深度学习
rnn原理：https://blog.csdn.net/qq_39422642/article/details/78676567其中每个圆圈可以看作是一个单元，而且每个单元做的事情也是一样的，因此可以折叠呈左半图的样子。用一句话解释RNN，就是一个单元结构重复使用。RNN中的结构细节：1.可以把StSt当作隐状态，捕捉了之前时间点上的信息。就像你去考研一样，考的时候记住了你能记住的所有信息。2.o
大语言模型技术专栏（三）：Attention机制——从RNN到Transformer的惊世一跃！北海yy 大语言模型技术专栏语言模型 rnn transformer
文章目录概要一、Attention机制：让AI学会「划重点」二、Attention机制的核心原理三、Self-Attention：Transformer的核心四、代码实战：用PyTorch实现Attention五、Attention的进化：从Transformer到GPT概要大家好，我是北海yy，继续带来大语言模型技术专栏的深度解析！在上一期《RNN语言模型——让AI真正「记住」上下文的秘密武器》
Transformer 代码剖析7 - 词元嵌入(TokenEmbedding) （pytorch实现） lczdyx Transformer代码剖析 transformer pytorch 深度学习人工智能 python
一、类定义与继承关系剖析1.1代码结构图示神经网络基础模块词嵌入基类自定义词元嵌入构造函数定义基类初始化词汇量参数维度参数填充标识参数1.2代码实现精讲"""@author:Hyunwoong@when:2019-10-22@homepage:https://github.com/gusdnd852"""fromtorchimportnnclassTokenEmbedding(nn.Embeddi
使用深度学习模型U-Net进行训练基于哨兵2的作物分割数据集。PyTorch框架为例，如何构建和训练U-Net模型来完成基于哨兵2的作物分割检测计算机C9硕士_算法工程师分割数据深度学习 pytorch 人工智能
使用深度学习模型如U-Net进行训练基于哨兵2的作物分割。PyTorch框架为例，如何构建和训练U-Net模型来完成基于哨兵2的作物分割检测基于哨兵2的作物分割，共18种作物类型（背景，草地，软冬小麦，玉米，冬季大麦，冬季油菜，春季大麦，向日葵，葡萄藤，甜菜，冬季小黑麦，冬季硬质小麦，水果、蔬菜、花卉，土豆，豆科饲料，大豆，果园，混合谷物，高粱），38到61个不同时间段同一位置10通道多光谱图像，
深度学习框架之主流学习框架 uu1224 深度学习学习人工智能机器学习神经网络
深度学习框架是一类专门设计用来简化和加速神经网络模型开发过程的软件工具。它们提供了构建、训练和部署神经网络所需的各种功能和库。以下是一些主流的深度学习框架及其特点：TensorFlow：由Google开发，是一个广泛使用的开源深度学习框架。它以强大的图计算模型和分布式计算能力著称，并且通过高级API如Keras，为用户提供了易于上手的开发体验。PyTorch：由Facebook开发，以其动态计算图
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开

Pytorch学习笔记:ResNet