gaishi_hero

从图像超分辨率快速入门pytorch

文章目录

前言
正文

单一图像超分辨率（SISR）
训练4要素
网络模型
数据
训练
DataLoader

前言

最近又开始把pytorch拾起来，学习了github上一些项目之后，发现每个人都会用不同的方式来写深度学习的训练代码，而这些代码对于初学者来说是难以阅读的，因为关键和非关键代码糅杂在一起，让那些需要快速将代码跑起来的初学者摸不着头脑。

所以，本文打算从最基本的出发，只写关键代码，将完成一次深度学习训练需要哪些要素展现给各位初学者，以便你们能够快速上手。等到能够将自己的想法用最简洁的方式写出来并运行起来之后，再对自己的代码进行重构、扩展。我认为这种学习方式是较好的循序渐进的学习方式。

本文选择超分辨率作为入门案例，一是因为通过结合案例能够对训练中涉及到的东西有较好的体会，二是超分辨率是较为简单的任务，我们本次教程的目的是教会大家如何使用pytorch，所以不应该将难度设置在任务本身上。下面开始正文。。。

正文

单一图像超分辨率（SISR）

简单介绍一下图像超分辨率这一任务：超分辨率的任务就是将一张图像的尺寸放大并且要求失真越小越好，举例来说，我们需要将一张256*500的图像放大2倍，那么放大后的图像尺寸就应该是512*1000。用深度学习的方法，我们通常会先将图像缩小成原来的1/2，然后以原始图像作为标签，进行训练。训练的目标是让缩小后的图像放大2倍后与原图越近越好。所以通常会用L1或者L2作为损失函数。

训练4要素

一次训练要想完成，需要的要素我总结为4点：

网络模型
数据
损失函数
优化器

这4个对象都是一次训练必不可少的，通常情况下，需要我们自定义的是前两个：网络模型和数据，而后面两个较为统一，而且pytorch也提供了非常全面的实现供我们使用，它们分别在torch.nn包和torch.optim包下面，使用的时候可以到pytorch官网进行查看，后面我们用到的时候还会再次说明。

网络模型

在网络模型和数据两个当中，网络模型是比较简单的，数据加载稍微麻烦些。我们先来看网络模型的定义。自定义的网络模型都必须继承torch.nn.Module这个类，里面有两个方法需要重写：初始化方法__init__(self)和forward(self, *input)方法。在初始化方法中一般要写我们需要哪些层（卷积层、全连接层等），而在forward方法中我们需要写这些层的连接方式。举一个通俗的例子，搭积木需要一个个的积木块，这些积木块放在__init__方法中，而规定将这些积木块如何连接起来则是靠forward方法中的内容。

import torch.nn as nn
import torch.nn.functional as F


class VDSR(nn.Module):

    def __init__(self):
        super(VDSR, self).__init__()
        self.conv1 = nn.Conv2d(1, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv2 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv3 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv4 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv5 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv6 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv7 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv8 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv9 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv10 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv11 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv12 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv13 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv14 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv15 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv16 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv17 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv18 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv19 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)
        self.conv20 = nn.Conv2d(64, 1, kernel_size=3, stride=1, padding=1, bias=True)

    def forward(self, x):
        ori = x
        x = F.relu(self.conv1(x))
        x = F.relu(self.conv2(x))
        x = F.relu(self.conv3(x))
        x = F.relu(self.conv4(x))
        x = F.relu(self.conv5(x))
        x = F.relu(self.conv6(x))
        x = F.relu(self.conv7(x))
        x = F.relu(self.conv8(x))
        x = F.relu(self.conv9(x))
        x = F.relu(self.conv10(x))
        x = F.relu(self.conv11(x))
        x = F.relu(self.conv12(x))
        x = F.relu(self.conv13(x))
        x = F.relu(self.conv14(x))
        x = F.relu(self.conv15(x))
        x = F.relu(self.conv16(x))
        x = F.relu(self.conv17(x))
        x = F.relu(self.conv18(x))
        x = F.relu(self.conv19(x))
        x = self.conv20(x)

        return x + ori

上面代码中展示的是我们要用到的模型VDSR，这个模型很简单，就是连续的20层卷积，外加一个跳线连接。结构图如下：

在写网络模型时，用到的各个层都在torch.nn这个包中，在写自定义的网络结构时可以自行到pytorch官网的文档中进行查看。

数据

定义了网络模型之后，我们再来看“数据”。“数据”主要涉及到Dataset和DataLoader两个概念。

Dataset是数据加载的基础，我们一般在加载自己的数据集时都需要自定义一个Dataset，自定义的Dataset都需要继承torch.utils.data.Dataset这个类，当实现了__getitem__()和__len__()这两个方法后，我们就自定义了一个Map-style datasets，Dataset是一个可迭代对象，通过下标访问的方式就能够调用__getitem__()方法来实现数据加载。

这里面最关键的就算是__getitem__()如何来写了，我们需要让__getitem__()的返回值是一对，包括图像和它的label，这里我们的任务是超分辨率，那么图像和label分别是经过下采样的图像和与其对应的原始图像。所以我们Dataset的__getitem__()方法返回值就应该是两个3D Tensor，分别表示两种图像。

这里需要重点说明一下__getitem__()方法的返回值为什么应该是3D Tensor。根据pytorch官网的说法，二维卷积层只接受4D Tensor，它的每一维表示的内容分别是nSamples x nChannels x Height x Width，我们最后需要用批量的方式将数据送到网络中，所以__getitem__()方法的返回值就应该是后面三维的内容，即便是我们的通道数为1，也必须有这一维的存在，否则就会报错。后面代码中用到的unsqueeze(0)方法的作用就是如此。前面是说了为什么应该是3D的，为什么应该是Tensor呢？Tensor是跟NumPy中ndarray类似的东西，只是它能够被用于GPU中来加速计算。

下面来看一下我们的代码：

import os
import random

import cv2
import torch
from torch.utils.data import Dataset

patch_size = 64

def getPatch(y):
    h, w = y.shape
    randh = random.randrange(0, h - patch_size + 1)
    randw = random.randrange(0, w - patch_size + 1)
    lab = y[randh:randh + patch_size, randw:randw + patch_size]
    resized = cv2.resize(lab, None, fx=0.5, fy=0.5, interpolation=cv2.INTER_CUBIC)
    rresized = cv2.resize(resized, None, fx=2, fy=2, interpolation=cv2.INTER_CUBIC)
    return rresized, lab


class MyDateSet(Dataset):
    def __init__(self, imageFolder):
        self.imageFolder = imageFolder
        self.images = os.listdir(imageFolder)

    def __len__(self):
        return len(self.images)

    def __getitem__(self, index):
        name = self.images[index]
        name = os.path.join(self.imageFolder, name)
        imread = cv2.imread(name)
        # 转换颜色空间
        ycrcb = cv2.cvtColor(imread, cv2.COLOR_RGB2YCR_CB)
        # 提取y通道
        y = ycrcb[:, :, 0]
        # 裁剪成小块
        img, lab = getPatch(y)
        # 转为3D Tensor
        return torch.from_numpy(img).unsqueeze(0), torch.from_numpy(lab).unsqueeze(0)

其中MyDateSet的内容也不长，包括了初始化方法、__getitem__()和__len__()两个方法。__getitem__()有一个输入值是下标值，我们根据下标，利用OpenCV，读取了图像，并将其转换颜色空间，超分训练的时候我们只用了其中的y通道。还对图形进行了裁剪，最后返回了两个3D Tensor。

在写自定义数据集的时候，我们最需要关注的点就是__getitem__()方法的返回值是不是符合要求，能不能够被送到网络中去。至于中间该怎么操作，其实跟pytorch框架也没什么关系，根据需要来做。

训练

写好了Dataset之后，我们就能够通过下标的方式获取图像以及它的label。但是离开始训练还有两个要素：损失函数和优化器。前面我们也说了，这两部分，pytorch官方提供了大量的实现，多数情况下不需要我们自己来自定义，这里我们直接使用了提供的torch.nn.MSELoss(size_average=None, reduce=None, reduction='mean')作为损失函数和torch.optim.Adam(params, lr=0.001, betas=(0.9, 0.999), eps=1e-08, weight_decay=0, amsgrad=False)作为优化器。

训练示例代码：

import torch
import torch.nn as nn
import torch.optim as optim

import date
import model

date_set = date.MyDateSet("Train/")

model = model.VDSR()
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
model.to(device)
mse_loss = nn.MSELoss()
adam = optim.Adam(model.parameters())


for epoch in range(100):

    running_loss = 0.0
    for i in range(len(date_set)):
        rresized, y = date_set[i]
        adam.zero_grad()
        out = model(rresized.unsqueeze(0).to(device, torch.float))
        loss = mse_loss(out, y.unsqueeze(0).to(device, torch.float))
        loss.backward()
        adam.step()

        running_loss += loss
        if i % 100 == 99:  # print every 100
            print('[%d, %5d] loss: %.3f' %
                  (epoch + 1, i + 1, running_loss / 100))
            running_loss = 0.0


print('Finished Training')

整个训练代码非常简洁，只有短短几行，定义模型、将模型移至GPU、定义损失函数、定义优化器（模型移动至GPU一定要在定义优化器之前，因为移动前后的模型已经不是同一个模型对象）。

训练时，先用zero_grad()来将上一次的梯度清零，然后将数据输入网络，求误差，误差反向传播求每个requires_grad=True的Tensor（也就是网络权重）的梯度，根据优化规则对网络权重值进行更新，在一次次的更新迭代中，网络朝着loss降低的方向变化着。

值的注意的是，图像数据也需要移动至GPU，并且需要将其类型转换为与网络模型的权重相同的torch.float

DataLoader

到前面为止，其实已经能够实现训练的过程了，但是，通常情况下，我们都需要：

将数据打包成一个批量送入网络
每次随机将数据打乱送入网络
用多线程的方式加载数据（这样能够提升数据加载速度）

这些事情不需要我们自己实现，有torch.utils.data.DataLoader来帮我们实现。完整声明如下：

torch.utils.data.DataLoader(dataset, batch_size=1, shuffle=False, sampler=None, batch_sampler=None, num_workers=0, collate_fn=None, pin_memory=False, drop_last=False, timeout=0, worker_init_fn=None, multiprocessing_context=None)

其中的sampler、batch_sampler、collate_fn都是可以有自定义实现的。我们简单的使用默认的实现来构造DataLoader。使用了DataLoader之后的训练代码稍微有些不同，其中也添加了保存模型的代码（只保存参数的方式）：

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader

import date
import model

date_set = date.MyDateSet("Train/")
dataloader = DataLoader(date_set, batch_size=128,
                        shuffle=True, drop_last=True)

model = model.VDSR()
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
model.to(device)
mse_loss = nn.MSELoss()
adam = optim.Adam(model.parameters())

def train():
    for epoch in range(1000):

        running_loss = 0.0

        for i, images in enumerate(dataloader):
            rresized, y = images
            adam.zero_grad()
            out = model(rresized.to(device, torch.float))
            loss = mse_loss(out, y.to(device, torch.float))
            loss.backward()
            adam.step()

            running_loss += loss

        if epoch % 10 == 9:
            PATH = './trainedModel/net_' + str(epoch + 1) + '.pth'
            torch.save(model.state_dict(), PATH)

        print('[%d] loss: %.3f' %
              (epoch + 1, running_loss / 3))

    print('Finished Training')


if __name__ == '__main__':
    train()

Transformer底层原理解析及基于pytorch的代码实现 LiRuiJie 人工智能 transformer pytorch 深度学习
1.Transformer底层原理解析1.1核心架构突破Transformer是自然语言处理领域的革命性架构，其核心设计思想完全摒弃了循环结构，通过自注意力机制实现全局依赖建模。整体架构图如下：以下是其核心组件：1）自注意力机制（Self-Attention）-输入序列的每个位置都能直接关注所有位置-数学公式（缩放点积注意力）：-Q：查询矩阵（当前关注点）-K：键矩阵（被比较项）-V：值矩阵（实际
pytorch-数学运算码啥码深度学习之pytorch pytorch 深度学习 python
四则运算加减乘除add+sub-mul*div/a=torch.rand(3,4)b=torch.rand(4)a,b'''(tensor([[0.2384,0.5022,0.7100,0.0400],[0.1716,0.0894,0.0795,0.1456],[0.7635,0.9423,0.7649,0.3379]]),tensor([0.8526,0.8296,0.1845,0.7922])
【Python深度学习】零基础掌握Pytorch Pooling layers nn.MaxPool方法 Mr数据杨 Python 深度学习 python 深度学习 pytorch
在深度学习的世界中，MaxPooling是一种关键的操作，用于降低数据的维度并保留重要特征。这就像是从一堆照片中挑选出最能代表某个场景的那张。PyTorch提供了多种MaxPooling层，包括nn.MaxPool1d、nn.MaxPool2d和nn.MaxPool3d，它们分别适用于不同维度的数据处理。如果处理的是声音信号（一维数据），就会用到nn.MaxPool1d。而处理图像（二维数据）时，
Pytorch模型安卓部署 python&java pytorch 人工智能 python
Pytorch是一种流行的深度学习框架，用于算法开发，而Android是一种广泛应用的操作系统，多应用于移动设备当中。目前多数的研究都是在于算法上，个人觉得把算法落地是一件很有意思的事情，因此本人准备分享一些模型落地的文章(后续可能分享微信小程序部署，PyQt部署以及exe打包，ncnn部署，tensorRT部署，MNN部署)。本篇文章主要分享Pytorch的Android端部署。看这篇文章的读者
【PyTorch】保存和加载模型 Jackilina_Stone #Deep Learning pytorch python 人工智能深度学习模型
目录■state_dict■用于推理的保存和加载模型保存/加载state_dict保存/加载整个模型以TorchScript格式导出/加载模型■保存和加载用于推断和/或恢复训练的一般检查点(Checkpoint)■将多个模型保存在一个文件中■使用来自不同模型的参数进行暖启动(Warmstarting)模型■跨设备保存和加载模型保存在GPU,加载到CPU保存在GPU,加载到GPU保存在CPU,加载到
PyTorch教程：LSTM语言模型的动态量化技术解析怀灏其Prudent
PyTorch教程：LSTM语言模型的动态量化技术解析tutorialsPyTorchtutorials.项目地址:https://gitcode.com/gh_mirrors/tuto/tutorials前言在深度学习模型部署过程中，模型大小和推理速度是两个至关重要的考量因素。PyTorch提供的动态量化技术能够在不显著影响模型准确率的前提下，有效减小模型体积并提升推理速度。本文将深入解析如何对
【机器学习】数学基础——张量（傻瓜篇）一叶千舟深度学习【理论】机器学习人工智能
目录前言一、张量的定义1.标量（0维张量）2.向量（1维张量）3.矩阵（2维张量）4.高阶张量（≥3维张量）二、张量的数学表示2.1张量表示法示例三、张量的运算3.1常见张量运算四、张量在深度学习中的应用4.1PyTorch示例：张量在神经网络中的运用五、总结：张量的多维世界延伸阅读前言在机器学习、深度学习以及物理学中，张量是一个至关重要的概念。无论是在人工智能领域的神经网络中，还是在高等数学、物
【大模型学习 | 量化】pytorch量化基础知识（1）九年义务漏网鲨鱼算法学习 pytorch 人工智能
pytorch量化[!note]官方定义：performingcomputationsandstoringtensorsatlowerbitwidthsthanfloatingpointprecision.支持INT8量化，可以降低4倍的模型大小以及显存需求，加速2-4倍的推理速度通俗理解：降低权重和激活值的精度（FP32→INT8），从而提高模型大小以及显存需求。一、前置知识1.1算子融合将多个
pytorch 要点之雅可比向量积 AI大模型教程 pytorch 人工智能 python facebook 深度学习机器学习 webpack
自动微分是PyTorch深度学习框架的核心。既然是核心，就需要敲黑板、划重点学习。同时，带来另外一个重要的数学概念：雅可比向量积。PyTorch中的自动微分与雅可比向量积自动微分（AutomaticDifferentiation，AD）是深度学习框架中的关键技术之一，它使得模型训练变得更加简单和高效。且已知：PyTorch是一个广泛使用的深度学习框架，它内置了强大的自动微分功能。在本文中，我们将深
深度学习计算机视觉开源系统OpenMMLab（mmsegmentation、mmdetection、mmpose）环境配置【详细、可运行】 nomoremorphine 深度学习计算机视觉开源
OpenMMLab（mmsegmentation、mmdetection、mmpose）环境配置OpenMMLab简介优势：一、Windows/Linux下环境配置（以mmsegmentationv1.2.2（最新版）为例）0.确认安装版本信息1）确认电脑显卡版本2）确认mmcv对应版本3）确认版本1.安装CUDA和cuDNN2.创建conda环境，下载pytorch3.安装mmcv4.安装MMS
Python Robot Framework【自动化测试框架】简介老胖闲聊 Python库大全 python 开发语言
想全面了解DeepSeek的看过来【包邮】DeepSeek全攻略人人需要的AI通识课零基础掌握DeepSeek的实用操作手册指南【限量作者亲笔签名版售完即止】玩转DeepSeek这本就够了【自营包邮】DeepSeek实战指南deepseek从入门到精通实用操作指南现代科技科普读物AI普及知识读物人工智能使用教程中小学读物京东超级618Python初学者的入门教程动手学深度学习PyTorch版李沐和
PyTorch版本匹配终极指南：手把手教你避开99%的安装坑
被版本支配的恐惧（真实故事）上周我的学弟兴冲冲跑来：“师兄！我照着CSDN教程装PyTorch，结果训练时直接报错cudaruntimeerror！”我一看他的环境——Python3.12强行装PyTorch1.8，搭配CUDA11.6…（此时应有乌鸦飞过）这就像用Win11系统装XP时代的显卡驱动，能不翻车吗？！一、版本对应表（2024最新版）（掏出小本本记重点！！！）这是我整理的最新版本对应关
anaconda创建python3.7环境_anaconda使用以及创建python3.7+pytorch1.0虚拟环境以及Jupyter notebook初级使用... weixin_39837124
查看所有已安装的软件包$condalist#packagesinenvironmentatS:\Users\jiangshan\Anaconda3:##NameVersionBuildChannel_ipyw_jlab_nb_ext_conf0.1.0py37_0defaultsalabaster0.7.12py37_0defaultsanaconda2018.12py37_0defaults..
Anaconda 创建python3.9+pytorch1.10.1+cuda11.3环境 canny_kevin DeepLearning Python python conda
1.打开AnacondaPowershellPrompt2.创建conda环境condacreate--nameRordAIpython=3.9conda一些命令condainfo--envs：输出中带有【*】号的的就是当前所处的环境condalist:看这个环境下安装的包和版本condainstallnumpyscikit-learn:安装numpysklearn包condaenvremove-
Pytorch血泪安装史好吗（GPU版本+cuda12.1+python3.9.13）宇宙最强袋鼠 pytorch python 人工智能
1.安装cuda首先看下自己电脑是CPU还是GPU，看自己电脑对应的cuda版本看右下角英伟达标识，点击组件，我的cuda版本是12.3，但最后发现安12.1比较好2.安装12.1cuda版本对应的cudnn前两步可以看参考:Pytorch的安装，有点繁琐但是很详细，保姆级教程不信你安装不成功（Cuda+Cudnn+Anaconda+Pytorch）_pytorch安装-CSDN博客3.anaco
用 PyTorch 构建液态神经网络(LNN)：下一代动态深度学习模型点我头像干啥 AI 深度学习 pytorch 神经网络
引言在深度学习领域，研究人员不断探索更接近生物神经系统工作方式的模型。液态神经网络(LiquidNeuralNetworks,LNN)正是这样一种受生物神经元动态特性启发的创新架构。本文将带你了解LNN的核心概念，并展示如何使用PyTorch实现这种前沿模型。一、什么是液态神经网络？液态神经网络是由MIT研究人员提出的一种新型神经网络架构，它模仿了生物神经系统的几个关键特性：动态连接：神经元之间的
第37节：PyTorch数据加载与预处理点我头像干啥 pytorch 人工智能 python
1.引言在深度学习项目中，数据加载与预处理是构建高效模型的关键环节。PyTorch作为当前最流行的深度学习框架之一，提供了一套完整且灵活的数据处理工具链。本文将全面介绍PyTorch中的数据加载与预处理机制，涵盖从基础概念到高级技巧的各个方面。2.PyTorch数据加载核心组件2.1Dataset类torch.utils.data.Dataset是PyTorch中所有数据集处理的抽象基类，代表数据
python学习笔记（深度学习）天水幼麟 python 学习笔记
文章目录1、概述2、学习内容2.1、pytorch常见语法2.1.1、sum2.1.2、广播机制2.1.3、张量1、概述本篇博客用来记录，在深度学习过程中，常用的python语法内容2、学习内容2.1、pytorch常见语法2.1.1、sum在PyTorch中，torch.sum()是一个非常常用的函数，用于对张量（Tensor）进行求和操作。它的核心作用是沿着指定的维度对张量元素进行累加，支持灵
深入GPU编程：从硬件架构到内核优化 Kaydeon 硬件架构
深入GPU编程：从硬件架构到内核优化在当今由大型模型驱动的AI时代，GPU集群已成为推动技术进步的核心引擎。然而，仅仅让代码在GPU上“运行”与让其“高效运行”之间存在着巨大的性能鸿沟。对于动辄需要数千甚至数万GPU小时进行训练的超大规模模型而言，这一鸿沟直接关系到研发成本、迭代速度和最终的科研成果。一个未经优化的操作可能在不经意间将训练时间延长数倍，造成巨大的资源浪费。PyTorch、Tenso
理解python、anaconda、pytorch以及pycharm之间的关系幸运小仙 python pytorch pycharm
1.Python：编程语言，是基础Python是一种高级的、通用的编程语言。它以其简洁的语法、丰富的库和强大的社区支持而闻名。在数据科学、机器学习和深度学习领域，Python是主要的编程语言。可以使用Python编写代码来处理数据、构建模型、进行实验等。2.Anaconda：Python的发行版，提供便利Anaconda是一个流行的Python发行版，它包含了Python解释器以及许多常用的科学计
bitsandbytes 入门教程苏承根
bitsandbytes入门教程项目地址:https://gitcode.com/gh_mirrors/bi/bitsandbytes1.项目介绍bitsandbytes是一个用于PyTorch的库，专注于8位优化器和量化算法。它旨在通过高效的k比特量化技术，使得大型语言模型在资源受限的环境下也能运行，从而提高计算效率并降低内存占用。2.项目快速启动首先，确保你的环境中已经安装了PyTorch。如
bitsandbytes 安装和配置指南黎沁颖Desired
bitsandbytes安装和配置指南bitsandbytes8-bitCUDAfunctionsforPyTorch项目地址:https://gitcode.com/gh_mirrors/bi/bitsandbytes1.项目基础介绍和主要编程语言项目基础介绍bitsandbytes是一个轻量级的Python库，主要用于在PyTorch中实现k-bit量化，从而使得大规模语言模型（LLM）更加易
Python 里 PyTorch 的生成对抗网络架构 Python编程之道 python pytorch 生成对抗网络 ai
Python里PyTorch的生成对抗网络架构关键词：PyTorch、生成对抗网络(GAN)、深度学习、神经网络、计算机视觉、对抗训练、生成模型摘要：本文深入探讨了在PyTorch框架下实现生成对抗网络(GAN)的完整架构。我们将从GAN的基本原理出发，详细讲解其核心组件、数学基础，并通过PyTorch代码实现一个完整的GAN模型。文章涵盖了从理论到实践的各个方面，包括模型设计、训练技巧、常见问题
CUDA与PyTorch(GPU)的对应关系
CUDA与PyTorch(GPU)的对应关系：(需要自己按需求去找)：https://pytorch.org/get-started/previous-versions/表二：CUDAToolkit版本及可用PyTorch对应关系CUDAToolkit版本可用PyTorch版本7.50.4.1，0.3.0，0.2.0，0.1.12-0.1.68.01.1.0，1.0.0，0.4.19.01.1.0
Python学习Day33 m0_64472246 python打卡学习 python
学习来源：浙大疏锦行一、PyTorch和CUDA的安装：给电脑装“超级计算器”通俗解释PyTorch：是一个专门用于深度学习的“工具箱”，类似程序员的“智能积木”，能快速搭建神经网络。CUDA：是NVIDIA显卡的“加速引擎”，相当于给电脑的显卡装了一个“超级计算器”，让它能快速计算复杂的数学问题（如图像识别、数据训练）。安装逻辑：先装CUDA（显卡的“计算器驱动”），再装PyTorch（用这个计
人工智能算法工程师(中级)课程12-PyTorch神经网络之LSTM和GRU网络与代码详解1 微学AI AI算法工程师(中级)课程自然语言处理实战人工智能神经网络算法 LSTM gru
大家好，我是微学AI，今天给大家介绍一下人工智能算法工程师(中级)课程12-PyTorch神经网络之LSTM和GRU网络与代码详解。在深度学习领域，循环神经网络（RNN）因其处理序列数据的能力而备受关注。然而，传统的RNN存在梯度消失和梯度爆炸的问题，这使得它在长序列任务中的表现不尽如人意。为了解决这一问题，长短时记忆网络（LSTM）和门控循环单元（GRU）应运而生。本文将详细介绍LSTM和GRU
基于PyTorch的MNIST手写数字识别（配置手写板使用）热心不起来的市民小周 CV 项目实操 pytorch 人工智能 python
基于PyTorch的MNIST手写数字识别（配置手写板使用）代码详见：https://github.com/xiaozhou-alt/CNN_MNIST文章目录基于PyTorch的MNIST手写数字识别（配置手写板使用）一、项目介绍二、数据集介绍三、项目实现1.环境准备2.项目文件夹结构3.数据预处理4.开始训练！(1)数据加载(2)数据转换(3)模型定义(4)训练过程(5)评估测试四、结果展示一
开源项目教程：Learning to See in the Dark 包椒浩Leith
开源项目教程：LearningtoSeeintheDarkpytorch-Learning-to-See-in-the-Dark项目地址:https://gitcode.com/gh_mirrors/pyt/pytorch-Learning-to-See-in-the-Dark项目介绍pytorch-Learning-to-See-in-the-Dark是一个使用PyTorch框架实现的项目，旨在
Pytorch 实战三 Cifar 10 数据加载四川兔兔 Pytorch pytorch 人工智能 python
系列文章目录文章目录系列文章目录前言一、原始数据的读取二、数据的加载源代码标签加工辅助核心类前言前两个实战然我们基本学会了Pytorch的使用，本文的Cifar10是经典的人工智能深度学习数据集。将详细介绍数据输入、网络搭建等其中的细致处理，这几个工程下来，我们一定会学会Pytorch编程的。一、原始数据的读取 Cifar10的数据集下载地址（可以在官网，这里我给出网盘地址）：通过网盘分享的
【Pytorch学习笔记】模型模块09——VGG详解越轨 Pytorch学习笔记 pytorch 学习笔记深度学习人工智能 python
一、VGG核心设计原理小卷积核堆叠用多层3×3卷积替代大卷积核（如5×5/7×7）数学原理：2层3×3卷积感受野等效于5×5：RFout=(RFin−1)×stride+KRF_{out}=(RF_{in}-1)\timesstride+KRFout=(RFin−1)×stride+K参数量对比：3层3×3卷积（3×(32C2)=27C23×(3^2C^2)=27C^23×(32C2)=27C2）
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =