Skr.B

PyTorch 入门与实践（六）卷积神经网络进阶（DenseNet）

来自 B 站刘二大人的《PyTorch深度学习实践》P11 的学习笔记

上一篇卷积神经网络进阶（GoogLeNet、ResNet）我们实践了 GoogleNet 和 ResNet 两大经典网络：

GoogleNet 从多路选择学习（Inception Module）出发，构建更好的神经网络；
ResNet 从残差连接（Residual Block）保留浅层特征出发，构建更深的神经网络。

DenseNet¹ 紧随其后，再次研究了超深度神经网络的梯度消失问题和跳连解决方案。他们提到，ResNet 等的方法尽管在神经网络拓扑和训练过程上有所不同，但它们都有一个关键特征：使用短路径连接前后两层。

DenseNet 结构

DenseNet 更加偏执，为了确保网络在深度传播中能保留更多信息，他们不仅连接前后两层，在一个 Dense Block 中每一层都和后面所有层相连，并且是将特征在通道上堆叠再传入下一层（像 Inception Module 的输出），而不是 ResNet 那样的元素相加。

这当然能保留更多信息，不过这显存消耗可想而知，这就是为什么它叫 Dense，一个 L 层的 Dense Block 有 $\frac{L(L+1)}{2}$ 条连接。

一、Dense Block

每个 Dense Block 里的卷积层都是 3×3 卷积，下表第三列乘号后面的数表示一个 Dense Block 中有多少层这样的卷积。

Bottleneck Layers
在每个 3×3 卷积之前引入 1×1 卷积作为瓶颈层，可以减少输入特征的通道数，从而提高计算效率。

所以，如果 Dense Block 里面是 1×1 卷积和 3×3 卷积的组合，那么这些 Dense Blocks 组成的 DenseNet 被称为 DenseNet-B。

二、Transition Layer

当然，为了控制显存占用，DenseNet 主要结构除了这 Dense Block 外还有每个 Block 后连接的过渡层（Transition Layer），它通过一个 1×1 的卷积层来控制通道数，并使用平均池化来减半特征图的高和宽。

所以，Dense Blocks 之间存在过渡层，那么这些 Dense Blocks 组成的 DenseNet 被称为 DenseNet-C。

两者都存在的 DenseNet，称为 DenseNet-BC，这是 DenseNet 的终极配置。。。

三、Growth Rate

增长率 $k$ ，它表示每一个卷积层输出的通道数。论文中说：设 $k_0$ 是初始输入的图像的通道数，那么 $l$ 层的 Dense Net 就会产生 $k_0 + k(l-1)$ 个通道的特征图，这个 $k$ 就被称为增长率。

这表示通道数“爆炸”速度，但是多搞一个新名字出来吓唬人，我们当然可以直接说这是每个卷积层输出的通道数： $out\_channels$ ，但是在代码实现过程中你就能发现，这个 $k$ 要作为系数用于计算 Dense Block 中每一层卷积的输入通道，所以把输出通道称为增长率，着实细节！

利用 Bottleneck layer，Translation layer 以及较小的 Growth rate 使得网络变窄，参数减少，有效抑制了过拟合，同时计算量也减少了²。

DenseNet 最后的分类器使用全局平均池化接一层全连接层。

四、Implementation Details

对于图像较小的数据集，比如 CIFAR-10/100、SVHN，DenseNet 由 3 个 Dense Block 组成。

在输入第一个 Dense Block 之前先经过一个 padding=1 的 3×3 卷积，输出 32 通道；
使用 DenseNet-BC 配置，在每个 Dense Block 之间加入过渡层，使特征图通道数和宽高减半；
在最后一个 Dense Block 的末尾，执行全局平均池化，然后连接 Softmax 分类器。

输入 3 个 Dense Block 中的特征图大小分别为：32×32、16×16、8×8。采用 ${L = 40,k = 12\}$ 的 DenseNet-BC 配置。

五、代码实现

conv_block 是 Dense Block 的基础结构，包含一层 3×3 卷积的 basic_block，和一层可选的 1×1 卷积的 bottleneck：

关于 nn.Sequential 可以查阅官方文档，里面举的例子十分清晰易懂。

from collections import OrderedDict
import torch
from torch import nn

def conv_block(in_channels, out_channels, bo=True):
    """
    Dense Block 的基本组件, 一层 3×3 卷积和一层可选的 1×1 卷积
    :param in_channels:
    :param out_channels: growth rate k
    :param bo: 是否使用 bottleneck
    :return: 一个 conv_block
    """
    # 有无 bottleneck 会影响下面 3×3 卷积的输入通道数，所以要判断一下
    in_channels_ = out_channels * 2 if bo else in_channels

    bo_layers = nn.Sequential(OrderedDict([
        ('bn0', nn.BatchNorm2d(in_channels)),
        ('relu0', nn.ReLU()),
        ('conv1x1', nn.Conv2d(in_channels, in_channels_, kernel_size=1)),
    ]))

    basic_blk = nn.Sequential(OrderedDict([
        ('bn1', nn.BatchNorm2d(in_channels_)),
        ('relu1', nn.ReLU()),
        ('conv3x3', nn.Conv2d(in_channels_, out_channels, kernel_size=3, padding=1)),
    ]))

    # 如果不用 bottleneck 可以传入一个空的 Sequential
    bottleneck = bo_layers if bo else nn.Sequential()  

    blk = nn.Sequential()
    blk.add_module('bottleneck', bottleneck)
    blk.add_module('basic_blk', basic_blk)
    return blk

Dense Block

当前 conv_block 的输入是前面所有 conv_block 的输出堆叠起来的，所以第 $l$ 层的输入通道数为：
$k_0 + k \times (l - 1)$
$k_0$ 是初始输入层的通道数 $k$ 就是上面提到的 Growth Rate，也就是 conv_block 中每个卷积层的输出通道数 out_channels。

def dense_block(in_channels, conv_blk_num=4, k=12, bo=True):
    """
    dense_block 由上面多个 conv_block 组成，用 for 循环添加到 nn.Sequential() 中
    :param in_channels:
    :param conv_blk_num: 3×3卷积层个数
    :param k: = out_channels，每个3×3卷积层的输出通道数
    :param bo: 是否加入 bottleneck
    :return: 一个 dense_block
    """
    dense_block = nn.Sequential()
    for i in range(conv_blk_num):
        # 当前 conv_block 的输入是前面所有 conv_block 的输出堆叠起来的，所以输入通道数按照论文中这个公式变化
        in_channels_ = in_channels + i * k
        dense_block.add_module(f'conv_blk_{i}', conv_block(in_channels_, k, bo=bo))
    
    return dense_block

transition_layer 是 Dense Block 之间的过渡层，用 1×1 卷积减少 Dense Block 的输出通道数，否则会越叠越多，导致内存爆炸：

def transition_layer(input, in_channels, out_channels):
    """
    过渡层，在 Dense Block 和 Dense Block 之间，把前一个的输出通道减半
    :param in_channels: 前一个的输出通道
    :param out_channels: 输出通道减半
    :return:
    """
    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")  # 有 cuda 则使用 GPU
    blk = nn.Sequential(OrderedDict([
        ('bn', nn.BatchNorm2d(in_channels)),
        ('relu', nn.ReLU()),
        ('conv1x1', nn.Conv2d(in_channels, out_channels, kernel_size=1)),
        ('avgpool', nn.AvgPool2d(2))
    ]))
    blk.to(device)
    return blk(input)

我们可以先试验一个多层 1×1 和 3×3 卷积组成的 Dense Block 的网络结构和输出特征图的形状：

def forward(x, model, transition=True):
    for i, blk in enumerate(model):
        # 遍历 dense block 的每一层卷积，把它们的输出都堆叠起来
        print(i)
        y = blk(x)
        x = torch.cat((x, y), dim=1)
        print(x.shape)

    if transition:
        x = transition_layer(x, x.shape[1], x.shape[1]//2)
    print("x final size:", x.shape)

    return x

if __name__ == '__main__':
    in_channels = 16
    input = torch.randn(1, in_channels, 28, 28)  # (mini-batch, channels, H, W)
    # print(input.shape)

    # bo=True 则加入 bottleneck，用1×1卷积减少3×3卷积的运算通道
    dense_block = dense_block(in_channels=in_channels, conv_blk_num=4, k=12, bo=True)
    print(dense_block)  # 打印网络结构
    # transition=True 则把 dense_block 的输出减半
    output_dense = forward(input, model=dense_block, transition=False)

DenseNet 的基础结构由 3 个 Dense Blocks 以及可选的 Dense Block 之间的过渡层（Transition layers）组成，这些可选组件都可以通过参数来设定，因为我们已经全部实现了：

from collections import OrderedDict
import torch
from torch import nn
from torch.nn import functional as F

def transition_layer(input, in_channels, out_channels):
    """
    过渡层，在 Dense Block 和 Dense Block 之间，把前一个的输出通道和长宽减半
    :param in_channels: 前一个的输出通道
    :param out_channels: 输出通道减半
    :return:
    """
    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")  # 有 cuda 则使用 GPU
    blk = nn.Sequential(OrderedDict([
        ('bn', nn.BatchNorm2d(in_channels)),
        ('relu', nn.ReLU()),
        ('conv1x1', nn.Conv2d(in_channels, out_channels, kernel_size=1)),
        ('avgpool', nn.AvgPool2d(2))
    ]))
    blk.to(device)
    return blk(input)


def conv_block(in_channels, out_channels, bo=False):
    """
    Dense Block 的基本组件
    :param in_channels:
    :param out_channels: growth rate k
    :return:
    """
    in_channels_ = out_channels * 2 if bo else in_channels

    bo_layers = nn.Sequential(OrderedDict([
        ('bn0', nn.BatchNorm2d(in_channels)),
        ('relu0', nn.ReLU()),
        ('conv1x1', nn.Conv2d(in_channels, in_channels_, kernel_size=1)),
    ]))

    basic_blk = nn.Sequential(OrderedDict([
        ('bn1', nn.BatchNorm2d(in_channels_)),
        ('relu1', nn.ReLU()),
        ('conv3x3', nn.Conv2d(in_channels_, out_channels, kernel_size=3, padding=1)),
    ]))

    bottleneck = bo_layers if bo else nn.Sequential()

    blk = nn.Sequential()
    blk.add_module('bottleneck', bottleneck)
    blk.add_module('basic_blk', basic_blk)
    return blk


class DenseBlock(nn.Module):
    """
    由 conv_blk 组成
    :param in_channels: 动态的，由上一个 Dense Block 和过渡层决定
    :param out_channels: growth rate k
    :param dense_blk_num: 由多少 conv_blk 组成一个 Dense Block
    """
    def __init__(self,
                 in_channels,
                 out_channels,
                 conv_blk_num=4,
                 bo=False,
                 transition=True):
        super(DenseBlock, self).__init__()
        self.transition = transition
        self.net = nn.Sequential()
        
        for i in range(conv_blk_num):
            # 要多少就加多少
            in_channels_ = in_channels + i * out_channels
            self.net.add_module(f'conv_blk_{i}',
                                conv_block(in_channels_, out_channels, bo))

    def forward(self, x):
        for blk in self.net:
            y = blk(x)
            x = torch.cat((x, y), dim=1)
        if self.transition:
            out_channels = x.shape[1]
            x = transition_layer(x, out_channels, out_channels // 2)
        print(x.shape)
        return x


class DenceNet(nn.Module):
    """
    由 Dense Block 组成
    :param in_channels: 3-cifar-10, 1-mnist
    :param out_channels: growth rate k
    :param dense_blk_num: 由多少 Dense Block 组成
    """
    def __init__(self,
                 in_channels=16,
                 out_channels=12,
                 conv_blk_num=4,
                 dense_blk_num=3,
                 bo=False,
                 transition=True):
        super(DenceNet, self).__init__()
        self.bn0 = nn.BatchNorm2d(3)
        self.conv0 = nn.Conv2d(3, 16, kernel_size=3, padding=1)

        self.dense_net = nn.Sequential()
        in_channels_ = in_channels
        for i in range(dense_blk_num):
            # 计算通道数，有点绕，想搞清楚可以手动遍历
            in_channels_ += conv_blk_num * out_channels if i > 0 else 0
            in_channels_ = in_channels_ // 2 if i > 0 else in_channels_
            print("in_channels_:", in_channels_)

            if transition:
                self.is_transition = dense_blk_num - 1 - i  # 最后一个 dense Block 不用接过渡层

            self.dense_net.add_module(f"dense_blk_{i}",
                                      DenseBlock(in_channels_,
                                                 out_channels,
                                                 conv_blk_num=conv_blk_num,
                                                 bo=bo,
                                                 transition=self.is_transition))
        self.aap = nn.AdaptiveAvgPool2d(10)  # 全局平均池化，输出 10×10
        self.fc = nn.Linear(8800, 10)

    def forward(self, x):
        batch_size = x.size(0)

        x = self.conv0(F.relu(self.bn0(x)))  # N,16,,
        x = self.dense_net(x)
        x = self.aap(x)
        x = x.view(batch_size, -1)  # batch×通道数×10×10=8800
        x = F.softmax(self.fc(x))
        return x

if __name__ == '__main__':
    # 模拟数据输入网络
    in_channels, k = 16, 12
    model = DenceNet(in_channels=in_channels,
                     out_channels=k,
                     conv_blk_num=4,  # 每个Dense Block中的3×3卷积个数
                     dense_blk_num=3,  # 每个DenseNet包含的Dense Block个数
                     bo=False,
                     transition=True
                     )
    print(model)
    input = torch.randn(1, 3, 32, 32)
    output = model(input)
    print("final x shape:", output.shape)

Tips：在不知道全连接层接收的参数到底为多少的情况下（比如，这里的8800），我们可以注释掉 self.fc() 的调用，然后构造和训练数据集一个 mini-batch 相同大小的数据作为 input，得到的输出很轻易能告诉你答案。

六、实验结果

完整代码参见：dense_net.py
DenseNet 参数量不大，相同深度比 ResNet 的参数还少，这是参数共享的好处，但不断堆叠的特征导致了内存消耗很大，训练要很久。

下面是我用 Tesla T4 GPU 在 MNIST 数据集上训练 10 个 epochs 的实验结果，训练精度 0.96，后面的在测试集上的测试精度也是 0.96，至少说明没有过拟合，盲猜再多训练 10 个 epochs 能达到最佳。

训练精度和 loss 曲线
预测结果

Huang, Gao, et aI. “Densely Connected Convolutional Networks.” IEEE Conference on Computer Vision Pattern Recognition (2017): 2261-69. ↩︎
DenseNet算法详解 ↩︎

深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
卷积神经网络 - 理解卷积核的尺寸 k×k×Cin 谦亨有终 AI学习笔记 cnn 人工智能神经网络深度学习机器学习
卷积神经网络中，每个卷积核的尺寸为k×k×Cin，这一设计的核心原因在于多通道输入的数据结构和跨通道特征整合的需求。以下是详细解释：1.输入数据的结构输入形状：假设输入数据为三维张量，形状为H×W×Cin，其中：H：高度（Height）W：宽度（Width）Cin：通道数（Channelsin）多通道的物理意义：对于RGB图像，Cin=3（红、绿、蓝三通道）。对于中间层的特征图，Cin可能为64、
PyTorch核心基础知识点 niuTaylor 编程区 pytorch 人工智能 python
PyTorch核心基础知识点，结合最新特性与工业级实践，按优先级和逻辑关系分层解析：▍核心基石：张量编程（TensorProgramming）1.张量创建（8种生产级初始化）#设备自动选择（2024最佳实践）device="cuda"iftorch.cuda.is_available()else"mps"iftorch.backends.mps.is_available()else"cpu"#关键
Linux部署模型报错OSError: Error no file named pytorch_model.bin, tf_model.h5, model.ckpt.index or flax_mod dkgee linux pytorch 运维
报错内容：OSError:Errornofilenamedpytorch_model.bin,tf_model.h5,model.ckpt.indexorflax_model.msgpackfoundindirectory主要原因是transformer版本不对，需要升级pipinstall--upgradehuggingface_hubpipinstalltransformers[torch]其
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
模型优化驱动产业应用创新智能计算研究中心其他
内容概要当前模型优化技术的迭代正沿着多维路径快速演进，其核心驱动力在于突破算法性能与产业需求间的适配瓶颈。以自适应学习机制与迁移学习框架为基础的优化策略，显著提升了模型在跨场景应用中的泛化能力，而超参数自动调优技术则通过PyTorch、TensorFlow等主流框架的接口标准化，降低了复杂模型的开发门槛。在部署层面，边缘计算与联邦学习的协同应用不仅缩短了金融预测、医疗影像分析等场景的响应延迟，更通
基于roop/insightface将视频中包含指定人脸的视频片段提取并合并成新视频阆遤 python roop pytorch insightface
利用insightface.app.FaceAnalysis提最一个视频中包含指定人脸的视频片段，并将其合并成一个新视频，使用“buffalo_l”模型，模型需安装在代码当前目录下的.\models中。需要roop或其他支持pytorch、insightface、moviepy的环境。pytorch安装请见我其他文章。#cython:language_level=3str#-*-coding:ut
关于pytorch3d的安装诚威_lol_中大努力中人工智能 pytorch 人工智能 python
更新1：2025_2_04今天发现，原来的pytorch3d不见了，在我的aaa1环境中。重新安装，我发现最好用的还是去github下载最新的pytorch3d的zip，unzip之后，进去pipinstall-e.然后安装成功！1、参考文章1：windows安装PyTorch3D详细指南-哔哩哔哩(bilibili.com)这篇文章巨好2、参考文章2：pytorch3d/INSTALL.mdat
【零基础入门】一篇弄懂nn.Sequential以及ModuleList的使用（呕心沥血版）十二月的猫 PyTorch深度学习 pytorch 零基础入门
个人主页：十二月的猫-CSDN博客系列专栏：《PyTorch科研加速指南：即插即用式模块开发》CSDN博客十二月的寒冬阻挡不了春天的脚步，十二点的黑夜遮蔽不住黎明的曙光目录1.前言2.Sequential类的使用2.1序列容器简单注入2.2序列容器字典注入2.3序列容器函数注入2.4序列容器修改2.5序列容器删除3.nn.ModuleList()的使用3.1定义模型3.2使用模型4.总结1.前言《
pytorch v1.4.0安装问题大柠丶 pytorch 人工智能 python
直接使用conda安装报错：(CenterNet)C:\Users\16323>condainstallpytorch==1.4.0torchvision==0.5.0cudatoolkit=10.1-cpytorch-cconda-forgeChannels:-pytorch-conda-forge-defaultsPlatform:win-64Collectingpackagemetadata
Vision mamba(mamba_ssm)安装踩坑指南 ggitjcg 深度学习 python
在这篇博客中，我将分享我在linux环境安装和使用VisionMamba（mamba_ssm）过程中遇到的一些问题和解决方法。前置检查：PyTorch和Python版本在安装mamba_ssm前，请确保你的PyTorch和Python环境版本正确。以下代码可用来检查环境信息：importtorchprint("PyTorchVersion:{}".format(torch.__version__)
关于forward函数 oioz 深度学习
定义forward函数是模型的核心前向传播逻辑，定义了输入数据如何在模型中传递和计算。它将输入数据通过模型的各层（如卷积层、全连接层等），计算出模型的输出。作用负责模型的主要计算逻辑。在训练和验证过程中都会被调用。特点必须实现：在PyTorch中，forward函数是模型的核心部分，必须显式定义。灵活性高：可以根据模型需要，自由定义forward函数的内容，包括各种计算操作。示例（PyTorch）
卷积神经网络Batch Normalization的作用 arron8899 cnn batch 人工智能
BatchNormalization的作用（通俗版）1.像“稳定器”一样校准每层输入想象你在烤多层蛋糕，每层蛋糕的烘烤温度不同（相当于神经网络的每一层数据分布不同）。没有BN时，烤箱温度忽高忽低，导致有的层烤焦（梯度爆炸），有的层不熟（梯度消失）。BN的作用相当于给每一层装了一个自动温度调节器，实时将输入数据调整到标准温度（均值为0，方差为1），保证每层都能均匀受热，训练更稳定。2.让模型训练“少
使用PyTorch搭建Transformer神经网络:入门篇 DASA13 pytorch transformer 神经网络
1.简介Transformer是一种强大的神经网络架构,在自然语言处理等多个领域取得了巨大成功。本教程将指导您使用PyTorch框架从头开始构建一个Transformer模型。我们将逐步解释每个组件,并提供详细的代码实现。2.环境设置首先,确保您的系统中已安装Python(推荐3.7+版本)。然后,安装PyTorch和其他必要的库:pipinstalltorchnumpymatplotlib3.P
PyTorch数据归一化处理：transforms 2401_87555420 pytorch 人工智能 python
##1.数据归一化处理：transforms.Normalize###1.1理解torchvision*torchvision.transforms：常用的图像预处理方法*torchvision.datasets：常用的数据集Dataset实现*torchvision.models：常用的CV（预训练）模型实现torchvision.transforms:常用的数据预处理方法，提升泛化能力，包括：
Pytorch中的torch.utils.data.Dataset 类小白的高手之路深度学习（DL）Pytorch实战深度学习 python pytorch
1、使用方法fromtorch.utils.dataimportDataset2、torch.utils.data.Dataset类的定义classDataset(Generic[_T_co]):r"""Anabstractclassrepresentinga:class:`Dataset`.Alldatasetsthatrepresentamapfromkeystodatasamplesshou
从零搭建Pytorch模型教程（七）单机多卡和多机多卡训练 AI大模型探索者 pytorch 人工智能 python transformer 深度学习 ai 机器学习
前言本文主要介绍单机多卡训练和多机多卡训练的实现方法和一些注意事项。其中单机多卡训练介绍两种实现方式，一种是DP方式，一种是DDP方式。多机多卡训练主要介绍两种实现方式，一种是通过horovod库，一种是DDP方式。单机单卡训练前面我们已经介绍了一个完整的训练流程，但这里由于要介绍单机多卡和多机多卡训练的代码，为了能更好地理解它们之间的区别，这里先放一个单机单卡也就是一般情况下的代码流程。impo
PyTorch基础知识讲解（一）完整训练流程示例苏雨流丰机器学习 pytorch 人工智能 python 机器学习深度学习
文章目录Tutorial1.数据处理2.网络模型定义3.损失函数、模型优化、模型训练、模型评价4.模型保存、模型加载、模型推理Tutorial大多数机器学习工作流程涉及处理数据、创建模型、优化模型参数和保存训练好的模型。本教程向你介绍一个用PyTorch实现的完整的ML工作流程，并提供链接来了解这些概念中的每一个。我们将使用FashionMNIST数据集来训练一个神经网络，预测输入图像是否属于以下
用 pytorch 从零开始创建大语言模型（零）：汇总墨绿色的摆渡人用 pytorch 从零开始创建大语言模型 pytorch 语言模型人工智能
用pytorch从零开始创建大语言模型（零）：汇总本系列官方代码库：https://github.com/rasbt/LLMs-from-scratch/tree/main官方书籍：BuildaLargeLanguageModel(FromScratch)本系列文章：用pytorch从零开始创建大语言模型（一）：理解大型语言模型用pytorch从零开始创建大语言模型（二）：待更新用pytorch从
TensorFlow和Pytorch在功能上的区别以及优势 Honeysea_70 #算法 tensorflow pytorch 人工智能
功能上的区别1.计算图TensorFlow：使用静态计算图（StaticGraph）。在运行模型之前，需要先构建完整的计算图，然后通过会话（Session）运行图。优点是性能优化更高效，适合大规模分布式训练和生产环境部署。缺点是调试相对复杂，因为计算图的构建和运行是分离的。PyTorch：使用动态计算图（DynamicGraph）。计算图是动态构建和执行的，每次迭代都会重新构建图。优点是调试方便，
【北上广深杭大厂AI算法面试题】计算机视觉篇...如何解决多尺度问题？努力毕业的小土博^_^ AI算法题库人工智能算法计算机视觉深度学习神经网络
【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决多尺度问题？【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决多尺度问题？文章目录【北上广深杭大厂AI算法面试题】计算机视觉篇...如何解决多尺度问题？前言数据级别的多尺度模型架构上的多尺度表示FPN代码示例（PyTorch）说明其他多尺度处理方法总结欢迎铁子们点赞、关注、收藏！祝大家逢考必过！逢投必中！上岸上岸上岸！upupup大多数高校
【大模型书籍PDF】从零开始大模型开发与微调：基于PyTorch与ChatGLM （推荐）_从零开始大模型开发与微调 pdf 喝不喝奶茶丫 pytorch 人工智能语言模型大模型转行大模型 AI大模型微调
今天又来给大家推荐一本大模型方面的书籍。本书使用PyTorch2.0作为学习大模型的基本框架，以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术，为读者揭示大模型开发技术。本书配套示例源代码、PPT课件。（书籍分享）
树莓派4B arm平台aarch64 pip安装pytorch 纬领网络 pytorch arm 深度学习
比如你要安装torch1.7.1的版本，你执行下面这行命令pip3installtorch==1.7.1torchvision==0.8.2torchaudio==0.7.2-fhttps://torch.kmtea.eu/whl/stable-cn.html
深度学习与目标检测系列(六) 本文约(4.5万字) | 全面解读复现ResNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch 人工智能 ResNet 残差连接残差网络
文章目录解读Abstract—摘要翻译精读主要内容Introduction—介绍翻译精读背景RelatedWork—相关工作ResidualRepresentations—残差表达翻译精读主要内容ShortcutConnections—短路连接翻译精读主要内容DeepResidualLearning—深度残差学习ResidualLearning—残差学习翻译精读ResNet目的以前方法本文改进本质
深度学习与目标检测系列(三) 本文约(4万字) | 全面解读复现AlexNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch AlexNet 人工智能
文章目录解读Abstract-摘要翻译精读主要内容1.Introduction—前言翻译精读主要内容：本文主要贡献：2.TheDataset-数据集翻译精读主要内容：ImageNet简介：图像处理方法：3.TheArchitecture—网络结构3.1ReLUNonlinearity—非线性激活函数ReLU翻译精读传统方法及不足本文改进方法本文的改进结果3.2TrainingonMultipleG
python arm64_PyTorch-aarch64 人类0663号 python arm64
PyTorch源码编译步骤：1、源码编译环境：操作系统：debian9.12交换空间：1GPython版本：3.5硬件：CPU：RK3399(aarch64)内存：4G2、下载依赖包：下载pytorch及其依赖包时，默认从github上下载，如果网络不好、容易断开时，可在gitee上找到对应包克隆链接，然后修改对应配置文件，进行下载。需要细致耐心。3、编译主要参数：设置最大作业数：exportMA
Pytorch使用手册-DCGAN 指南（专题十四） AI专题精讲 Pytorch入门到精通 pytorch 人工智能 python
1.Introduction本教程将通过一个示例介绍DCGANs（深度卷积生成对抗网络）。我们将训练一个生成对抗网络（GAN），在给它展示大量真实名人照片后，它能够生成新的“名人”图片。这里的大部分代码来源于PyTorch官方示例中的DCGAN实现，而本文档将对该实现进行详细解释，并阐明这种模型的运行机制及其背后的原因。无需担心，你不需要事先了解GAN的知识，但初次接触的读者可能需要花一些时间来理
强化学习中的深度卷积神经网络设计与应用实例数字扫地僧计算机视觉 cnn 人工智能神经网络
I.引言强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，通过与环境的交互来学习最优策略。深度学习，特别是深度卷积神经网络（DeepConvolutionalNeuralNetworks，DCNNs）的引入，为强化学习在处理高维度数据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。II.深度卷积神经网络在强化学习中的
【猫狗分类】Pytorch VGG16 实现猫狗分类1-数据清洗+制作标签文件努力的小巴掌 pytorch分类项目 pytorch 分类人工智能
Pytorch猫狗分类用Pytorch框架，实现分类问题，好像是学习了一些基础知识后的一个小项目阶段，通过这个分类问题，可以知道整个pytorch的工作流程是什么，会了一个分类，那就可以解决其他的分类问题，当然了，其实最重要的还是，了解她的核心是怎么工作的。那首先，我们的第一个项目，就做猫狗的分类。声明：整个数据和代码来自于b站，链接：使用pytorch框架手把手教你利用VGG16网络编写猫狗分类
PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（二）凡人的AI工具箱深度学习 pytorch 学习 AI编程人工智能 python
PyTorch深度学习框架60天进阶学习计划-第28天：多模态模型实践（二）5.跨模态检索系统应用场景5.1图文匹配系统的实际应用应用领域具体场景优势电子商务商品图像搜索、视觉购物用户可以上传图片查找相似商品或使用文本描述查找商品智能媒体内容推荐、图片库搜索通过内容的语义理解提供更精准的推荐和搜索社交网络基于内容的帖子推荐理解用户兴趣，提供更相关的内容推荐教育技术多模态教学资源检索教师和学生可以更
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring