冉茂松

PyTorch:数据加载和预处理

Github地址
简书地址
CSDN地址

此教程翻译自PyTorch官方教程

作者: Sasank Chilamkurthy

在解决任何机器学习问题上，在准备数据上会付出很大努力。PyTorch 提供了许多工具，使数据加载变得简单，希望能使你的代码更具可读性。本教程中，我们将看到图和从一个不重要的数据集中加载和预处理/增强数据。

要运行本教程，请确保已安装一下软件包：
1. scikit-image: 用于图像 IO 和变换
2. pandas：更简单的 csv 解析

from __future__ import print_function, division
import os
import torch
import pandas as pd
from skimage import io, transform
import numpy as np
import matplotlib.pyplot as plt
from torch.utils.data import Dataset, DataLoader
from torchvision import transforms, utils

# Ignore warnings
import warnings
warnings.filterwarnings("ignore")

plt.ion()   # interactive mode

我们将要处理的数据集是面部姿势，意味着一张人脸将像下面这样被标注：

每张人脸总共有68个不同的地方被标注。

注意:
数据下载地址为 https://download.pytorch.org/tutorial/faces.zip，图像位于名为“faces/“的目录中。这个数据集实际上是通过对来自 imagenet 的几张标注为 ‘face’ 的图片应用优秀的 dlib 的姿态估计来生成的。

数据集带有一个 csv 标注文件，里面的标注内容看起来像下面这样：

image_name,part_0_x,part_0_y,part_1_x,part_1_y,part_2_x, ... ,part_67_x,part_67_y
0805personali01.jpg,27,83,27,98, ... 84,134
1084239450_e76e00b7e7.jpg,70,236,71,257, ... ,128,312

让我们快速读取 csv 文件，并把标记数据保存在一个(N, 2)的数组中，其中 N 是特征点的数量。

landmarks_frame = pd.read_csv("./data//faces/face_landmarks.csv")
n = 65
img_name = landmarks_frame.ix[n, 0]
landmarks = landmarks_frame.ix[n, 1:].as_matrix().astype('float')
landmarks = landmarks.reshape(-1, 2)

print("Image name: {}".format(img_name))
print("Landmarks shape: {}".format(landmarks.shape))
print("First 4 Landmarks: {}".format(landmarks[:4]))

输出：

Image name: person-7.jpg
Landmarks shape: (68, 2)
First 4 Landmarks: [[ 32.  65.]
 [ 33.  76.]
 [ 34.  86.]
 [ 34.  97.]]
 ```

 让我们写一个简单的帮主函数来显示图像及其特征点，并用他来显示一个样本。
 ```Python
def show_landmarks(image, landmarks):
    """SHow image with landmarks"""
    plt.imshow(image)
    plt.scatter(landmarks[:, 0], landmarks[:, 1], s=10, marker=".", c="r")

plt.figure()
img = io.imread(os.path.join("./data/faces/", img_name))
show_landmarks(io.imread(os.path.join("./data/faces/", img_name)), landmarks)
plt.show()
 ```
 输出：
 ![sphx_glr_data_loading_tutorial_001](http://upload-images.jianshu.io/upload_images/5208761-25de806f856b1028.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

**注意**：要得到以上结果，请把 `plt.ion()` 注释掉。

# Dataset 类

`torch.utils.data.Dataset` 是一个表示数据集的抽象类。你自定义的数据集类应该继承自 `Dataset` 并重写如下方法：

* `__len__`: 返回数据集的大小， `len(dataset)`
* `__getitem__ `: 是数据集支持索引操作, `dataset[i]`

让我们维我们的人脸特征点数据集创建一个数据集类。我们将在 `__init__` 中读取 csv， 但是让读取图片的操作在 `__getitem__` 中进行。这是内存高效的，因为所有的图像不是一次存储在内存中，而是根据需要进行读取。

我们数据集的样本将是一个字典`{'image': image, 'landmarks': landmarks}`。我们的数据集将接受一个可选参数`transform’ 以便可以对样本应用任何需要的处理。我们将在下一节看到 `transform` 的好处。

```Python
class FaceLandmarksDataset(Dataset):
    """Face Landmarks dataset."""

    def __init__(self, csv_file, root_dir, transform=None):
        """
        Args:
            csv_file (string): Path to the csv file with annotations.
            root_dir (string): Directory with all the images.
            transform (callable, optional): Optional transform to be applied
                on a sample.
        """
        self.landmarks_frame = pd.read_csv(csv_file)
        self.root_dir = root_dir
        self.transform = transform

    def __len__(self):
        return len(self.landmarks_frame)

    def __getitem__(self, idx):
        img_name = os.path.join(self.root_dir, self.landmarks_frame.ix[idx, 0])
        image = io.imread(img_name)
        landmarks = self.landmarks_frame.ix[idx, 1:].as_matrix().astype('float')
        landmarks = landmarks.reshape(-1, 2)
        sample = {'image': image, 'landmarks': landmarks}

        if self.transform:
            sample = self.transform(sample)

        return sample




class="se-preview-section-delimiter">div>

让我们初始化这个类的实例，并在数据样本上迭代。我们讲打印开始4个样本的大小并显示他们的特征点。

face_dataset = FaceLandmarksDataset(csv_file='faces/face_landmarks.csv',
                                    root_dir='faces/')

fig = plt.figure()

for i in range(len(face_dataset)):
    sample = face_dataset[i]

    print(i, sample['image'].shape, sample['landmarks'].shape)

    ax = plt.subplot(1, 4, i + 1)
    plt.tight_layout()
    ax.set_title('Sample #{}'.format(i))
    ax.axis('off')
    show_landmarks(**sample)

    if i == 3:
        plt.show()
        break




<div class="se-preview-section-delimiter">div>

输出：

0 (324, 215, 3) (68, 2)
1 (500, 333, 3) (68, 2)
2 (250, 258, 3) (68, 2)
3 (434, 290, 3) (68, 2)




<div class="se-preview-section-delimiter">div>

Transform (变换)

从上面的例子我们可以看到一个问题：样本的尺寸不一样。大部分的神经网络希望一个固定大小的图像。因此，我们需要写一些预处理代码。让我们来创建三种变换：

Rescale: 缩放图像
RandomCrop: 随机剪裁图像，这是一种数据增强的方法
ToTensor: 把 numpy 图像转换为 PyTorch 图像（我们需要交换轴）

我们将把它们写成一个可调用的类而不是函数，所以变换所需的参数不必在每次调用时都传递。为此，我们只需实现 __call__ 方法，如果需要可以实现 __init__ 方法。我们可以向下面这样使用他们：

tsfm = Transform(params)
transformed_sample = tsfm(sample)




<div class="se-preview-section-delimiter">div>

请观察下面的变换是如何应用在图像和特征点上的。

class Rescale(object):
    """Rescale the image in a sample to a given size.

    Args:
        output_size (tuple or int): Desired output size. If tuple, output is
            matched to output_size. If int, smaller of image edges is matched
            to output_size keeping aspect ratio the same.
    """

    def __init__(self, output_size):
        assert isinstance(output_size, (int, tuple))
        self.output_size = output_size

    def __call__(self, sample):
        image, landmarks = sample['image'], sample['landmarks']

        h, w = image.shape[:2]
        if isinstance(self.output_size, int):
            if h > w:
                new_h, new_w = self.output_size * h / w, self.output_size
            else:
                new_h, new_w = self.output_size, self.output_size * w / h
        else:
            new_h, new_w = self.output_size

        new_h, new_w = int(new_h), int(new_w)

        img = transform.resize(image, (new_h, new_w))

        # h and w are swapped for landmarks because for images,
        # x and y axes are axis 1 and 0 respectively
        landmarks = landmarks * [new_w / w, new_h / h]

        return {'image': img, 'landmarks': landmarks}


class RandomCrop(object):
    """Crop randomly the image in a sample.

    Args:
        output_size (tuple or int): Desired output size. If int, square crop
            is made.
    """

    def __init__(self, output_size):
        assert isinstance(output_size, (int, tuple))
        if isinstance(output_size, int):
            self.output_size = (output_size, output_size)
        else:
            assert len(output_size) == 2
            self.output_size = output_size

    def __call__(self, sample):
        image, landmarks = sample['image'], sample['landmarks']

        h, w = image.shape[:2]
        new_h, new_w = self.output_size

        top = np.random.randint(0, h - new_h)
        left = np.random.randint(0, w - new_w)

        image = image[top: top + new_h,
                      left: left + new_w]

        landmarks = landmarks - [left, top]

        return {'image': image, 'landmarks': landmarks}


class ToTensor(object):
    """Convert ndarrays in sample to Tensors."""

    def __call__(self, sample):
        image, landmarks = sample['image'], sample['landmarks']

        # swap color axis because
        # numpy image: H x W x C
        # torch image: C X H X W
        image = image.transpose((2, 0, 1))
        return {'image': torch.from_numpy(image),
                'landmarks': torch.from_numpy(landmarks)}




class="se-preview-section-delimiter">

组合变换

现在，我们应用这些变换到我们的样本上。

假如我们想先把图像的较短的一边缩放到256，然后从中随机剪裁一个224*224大小的图像。即我们想要组合 Rescale 和 RandomCrop 两个变换。

torchvision.transforms.Compose 是一个简单的可调用类，允许我们来组合多个变换

scale = Rescale(256)
crop = RandomCrop(128)
composed = transforms.Compose([Rescale(256),
                               RandomCrop(224)])





"se-preview-section-delimiter">

# Apply each of the above transforms on sample.
fig = plt.figure()
sample = face_dataset[65]
for i, tsfrm in enumerate([scale, crop, composed]):
    transformed_sample = tsfrm(sample)

    ax = plt.subplot(1, 3, i + 1)
    plt.tight_layout()
    ax.set_title(type(tsfrm).__name__)
    show_landmarks(**transformed_sample)

plt.show()




"se-preview-section-delimiter">

[站外图片上传中…(image-c83c50-1523363049459)]

迭代数据集

我们把这些放在一个来创建一个包含组合变换的数据集。总之，每当这个数据集被采样时执行一下操作：
* 即时从文件中读取图像。
* 对图像应用变换。
* 由于其中一个变换是随机的，因此数据的采样得到增强。

我们可以使用和之前一样的 for i in range 循环来迭代创建的数据集。

transformed_dataset = FaceLandmarksDataset(csv_file='faces/face_landmarks.csv',
                                           root_dir='faces/',
                                           transform=transforms.Compose([
                                               Rescale(256),
                                               RandomCrop(224),
                                               ToTensor()
                                           ]))

for i in range(len(transformed_dataset)):
    sample = transformed_dataset[i]

    print(i, sample['image'].size(), sample['landmarks'].size())

    if i == 3:
        break




<div class="se-preview-section-delimiter">div>

输出：

0 torch.Size([3, 224, 224]) torch.Size([68, 2])
1 torch.Size([3, 224, 224]) torch.Size([68, 2])
2 torch.Size([3, 224, 224]) torch.Size([68, 2])
3 torch.Size([3, 224, 224]) torch.Size([68, 2])




"se-preview-section-delimiter">

但是，通过使用简单的for循环遍历数据，我们将失去许多功能。特别是我们错过了：
* 批处理数据
* 打乱数据
* 使用多线程并行加载数据

torch.utils.data.DataLoader 是一个提供以上所有的功能的迭代器。下面使用的参数应该是清楚的。其中一个又去的参数是 collate_fn。你可以指定如何使用 collate_fn 对样本进行批处理。但是，对大多数情况来说，默认的自动分页应该可以正常工作的很好。

dataloader = DataLoader(transformed_dataset, batch_size=4,
                        shuffle=True, num_workers=4)






class="se-preview-section-delimiter">

# Helper function to show a batch
def show_landmarks_batch(sample_batched):
    """Show image with landmarks for a batch of samples."""
    images_batch, landmarks_batch = \
            sample_batched['image'], sample_batched['landmarks']
    batch_size = len(images_batch)
    im_size = images_batch.size(2)

    grid = utils.make_grid(images_batch)
    plt.imshow(grid.numpy().transpose((1, 2, 0)))

    for i in range(batch_size):
        plt.scatter(landmarks_batch[i, :, 0].numpy() + i * im_size,
                    landmarks_batch[i, :, 1].numpy(),
                    s=10, marker='.', c='r')

        plt.title('Batch from dataloader')

for i_batch, sample_batched in enumerate(dataloader):
    print(i_batch, sample_batched['image'].size(),
          sample_batched['landmarks'].size())

    # observe 4th batch and stop.
    if i_batch == 3:
        plt.figure()
        show_landmarks_batch(sample_batched)
        plt.axis('off')
        plt.ioff()
        plt.show()
        break




class="se-preview-section-delimiter">

输出:
“`
0 torch.Size([4, 3, 224, 224]) torch.Size([4, 68, 2])
1 torch.Size([4, 3, 224, 224]) torch.Size([4, 68, 2])
2 torch.Size([4, 3, 224, 224]) torch.Size([4, 68, 2])
3 torch.Size([4, 3, 224, 224]) torch.Size([4, 68, 2])

pytorch基础 nn.embedding yuweififi pytorch 人工智能 nlp
nn.Embedding是PyTorch中的一个模块，用于创建嵌入层（embeddinglayer），它将离散的索引（例如词汇表中的单词索引）映射为固定大小的稠密向量。这是许多NLP模型（包括Transformer）中的基本组件。示例用法：importtorchimporttorch.nnasnn#定义一个嵌入层vocab_size=10000#词汇表大小embedding_dim=512#嵌入向
pytorch基础-layernormal 与 batchnormal yuweififi pytorch 人工智能 python
nn.LayerNorm（层归一化）和nn.BatchNorm（批量归一化）是深度学习中常用的两种归一化方法，都有助于提高模型的训练效率和稳定性，但它们在归一化维度、应用场景、计算方式等方面存在明显区别，以下为你详细介绍：1、归一化维度nn.LayerNorm：对单个样本的特征维度进行归一化。无论输入数据的形状如何，它会计算每个样本在特征维度上的均值和方差，然后进行归一化。例如，对于一个形状为(b
Pytorch使用手册—使用TACOTRON2进行文本到语音转换（专题二十四） AI专题精讲 Pytorch入门到精通 pytorch 人工智能 python
一、概述本教程展示了如何使用torchaudio中的预训练Tacotron2构建文本到语音的管道。文本到语音的管道流程如下：文本预处理首先，输入的文本被编码为一系列符号。在本教程中，我们将使用英语字符和音标作为符号。谱图生成从编码后的文本中生成谱图。我们使用Tacotron2模型来完成这一步。3.时域转换最后一步是将谱图转换为波形。从谱图生成语音的过程也称为Vocder（声码器）。在本教程中，我们
Pytorch使用手册--将 PyTorch 模型导出为 ONNX（专题二十六） AI专题精讲 Pytorch入门到精通 pytorch 人工智能 python
注意截至PyTorch2.1，ONNX导出器有两个版本。torch.onnx.dynamo_export是最新的（仍处于测试阶段）导出器，基于PyTorch2.0发布的TorchDynamo技术。torch.onnx.export基于TorchScript后端，自PyTorch1.2.0起可用。一、torch.onnx.dynamo_export使用在60分钟入门中，我们有机会从高层次上了解PyT
Transformer 代码剖析2 - 模型训练（pytorch实现） lczdyx Transformer代码剖析 transformer pytorch 深度学习人工智能 python
一、模型初始化模块参考：项目代码1.1参数统计函数defcount_parameters(model):returnsum(p.numel()forpinmodel.parameters()ifp.requires_grad)遍历模型参数筛选可训练参数统计参数数量返回总数技术解析：numel()方法计算张量元素总数requires_grad筛选需要梯度更新的参数统计结果反映模型复杂度，典型Tran
Stable diffusion 3.5本地运行环境配置记录寸先生的牛马庄园扩散模型 stable diffusion
1.环境配置创建虚环境condacreate-nsd3.5python=3.10Pytorch(>2.0)condainstallpytorch==2.2.2torchvision==0.17.2torchaudio==2.2.2pytorch-cuda=12.1-cpytorch-cnvidiaJupyter能使用Anaconda虚环境condainstallipykernelpython-mi
PyTorch使用常见异常和解决办法汇总东哥说AI 机器学习与深度学习实战 PyTorch 异常解决办法
文章目录1.使用conda安装PyTorch后同时在Jupyter导入失败Nomodulenamed'torch'2.PyTorch使用张量时报错expectedscalartypeDoublebutfoundFloat3.PyTorch创建Embedding时报错IndexError:indexoutofrangeinself1.使用conda安装PyTorch后同时在Jupyter导入失败No
pytorch基础-比较矩阵是否相等 yuweififi pytorch 人工智能
1、使用NumPy库NumPy是Python中用于科学计算的常用库，它提供了array_equal和allclose函数来判断矩阵是否相等。array_equal用于精确比较，allclose用于考虑一定误差范围的近似比较，适合浮点数矩阵。importnumpyasnp#创建示例矩阵matrix_a=np.array([[1,2,3],[4,5,6]])matrix_b=np.array([[1,
深度学习模型优化与医疗诊断应用突破智能计算研究中心其他
内容概要近年来，深度学习技术的迭代演进正在重塑医疗诊断领域的实践范式。随着PyTorch与TensorFlow等开源框架的持续优化，模型开发效率显著提升，为医疗场景下的复杂数据处理提供了技术基座。当前研究聚焦于迁移学习与模型压缩算法的协同创新，通过复用预训练模型的泛化能力与降低计算负载，有效解决了医疗数据样本稀缺与硬件资源受限的痛点问题。与此同时，自适应学习机制通过动态调整网络参数更新策略，在病理
跨框架模型演进与行业应用路径智能计算研究中心其他
内容概要在人工智能技术持续迭代的背景下，模型框架的演进与行业应用的深度融合已成为推动产业智能化升级的核心驱动力。本文系统性梳理TensorFlow、PyTorch、MXNet等主流框架的技术发展脉络，重点分析其从通用计算架构向多模态、轻量化方向的转型路径。同时，针对模型优化技术领域，深入探讨迁移学习、超参数调优及模型压缩等方法的创新突破，揭示其在降低计算资源消耗、提升推理效率方面的关键作用。在行业
pytorch阶段性总结2 Colinnian pytorch 人工智能 python
nn神经网络functional当中卷积的使用importtorchimporttorch.nn.functionalasF#数据input=torch.tensor([[1,2,0,3,1],[0,1,2,3,1],[1,2,1,0,0],[5,2,3,1,1],[2,1,0,1,1]])#卷积核kernel=torch.tensor([[1,2,1],[0,1,0],[2,1,0]])#min
AI探索笔记：线性回归安意诚Matrix 机器学习笔记人工智能笔记线性回归
前言写这篇博客，主要是自己来练练手。网络上教程已经是数不胜数，也都讲得非常清楚了。但自己不动手，知识和能力还是别人的。下面分别用传统方法（sklearn）和神经网络（pytorch）来解决线性回归问题。内容什么是线性回归线性回归（LinearRegression）是统计学和机器学习中最基础且广泛使用的预测模型，用于建立**自变量（输入特征）与因变量（输出目标）**之间的线性关系模型。其核心思想是通
VIT（Vision Transformer）【超详细 pytorch实现周玄九计算机视觉 transformer 深度学习人工智能
CNN的局限性：传统的CNN通过局部卷积核提取特征，虽然可以通过堆叠多层卷积扩大感受野，但仍然依赖于局部信息的逐步聚合，难以直接建模全局依赖关系。ViT的优势：ViT使用自注意力机制（Self-Attention），能够直接捕捉图像中所有patch（图像块）之间的全局关系。这种全局建模能力在处理需要长距离依赖的任务（如图像分类、目标检测）时表现更好。全流程图像预处理+分块图像尺寸标准化，如(224
PyTorch模型安卓部署流程(NCNN)全流程实战（2）代码详细解析咕咕学不会咋办 pytorch android python
代码来源PyTorch模型安卓部署流程(NCNN)全流程实战（1）至于为什么要备注，因为我基础不好，就得一点一点来适合和我一样的慢羊羊学习项目整体结构1.布局文件不解析了比较简单最简单的线性布局main.xml2.资源文件string.xmlsqueezencnn在Android开发中，资源文件（通常以.xml结尾）用于定义静态内容，如字符串、颜色、尺寸等。res/values/strings.x
记一次pytorch训练loss异常的问题 lyyiangang pytorch 人工智能 python
记一次pytorch训练loss异常的问题问题描述使用mmdetection框架训练时，某项loss出现异常大的值，比如1781232349724294.000。这个问题只在多卡训练时才会出现。解决方法在确认target和predction没有问题后，发现是在dataset中的数据处理出现了问题。在dataset中的__getitem__函数中，对数据进行了处理，但是在处理时，将数据转换为了num
用PyTorch玩转数据：从整理到“看图说话开心快乐幸福一家人 pytorch 人工智能 python
最近在实验室鼓捣深度学习项目，发现PyTorch的数据处理流程简直像搭乐高——每个模块都精准卡位。今天就把这套"厨房级"工具链拆解给大家看看，连我这种手残党都能轻松上手。01数据收纳术：你的专属AI管家想象你有一堆杂乱照片需要整理。PyTorch的Dataset类就像智能相册，只要定义好__getitem__（怎么找照片）和__len__（总共有多少张），它就能瞬间把你的数据码得整整齐齐。而Dat
RuntimeError: expected dtype Double but got dtype Float 一穷二白到年薪百万报错专栏深度学习
在使用Pytorch时报了RuntimeError:expecteddtypeDoublebutgotdtypeFloat这个错误，仔细一查才发现是数据类型的问题。在处理数据时有时会用到numpy模块，处理完数据后为了加速计算然后转为tensor，用torch的计算方式进行运算。一运行结果发现报错了，报错的原因在于，numpy默认的数据类型是float64，而torch.tensor初始化默认
【pytorch_geometric报错】RuntimeError: softmax() Expected a value of type 一穷二白到年薪百万报错专栏
如果pytorch_geometric中的softmax函数报错，声明一下num_nodes变量即可。fromtransP=softmax(pipj,row,cd.size(0))totransP=softmax(pipj,row,num_nodes=cd.size(0))[1]RuntimeError:softmax()Expectedavalueoftype‘Optional[Tensor
Windows环境安装torch_geometric库报错一穷二白到年薪百万报错专栏 python anaconda pip
Windows下安装，最近在学习图神经网络需要用到geometric_torch结果怎么装都装不上。查阅了各种资料尝试了各种方法，有的说是因为visualc++buildtools没有安装博客链接，有的说升级conda甚至还有的说卸载pytorch重装命，令行如下：condaupdate#升级conda所有的包官网下载地址：https://pypi.org/project/torch-geom
用 PyTorch/TensorFlow 搭建简单全连接神经网络 gs80140 AI pytorch tensorflow 神经网络
目录用PyTorch/TensorFlow搭建简单全连接神经网络网络结构概述1.使用PyTorch构建网络2.使用TensorFlow构建网络总结用PyTorch/TensorFlow搭建简单全连接神经网络在本篇博客中，我们将介绍如何使用两大深度学习框架——PyTorch和TensorFlow，构建一个简单的全连接神经网络。该网络包含输入层、一个隐藏层和输出层，适合初学者理解神经网络的基本构建模块
用于训练基于pytorch构建的小型字符级语言模型的数据集汇总搏博大模型 pytorch 语言模型人工智能 python 学习机器学习
前文，我们从零开始基于transformer框架在pytorch上构建一个小型字符级语言模型，并编写了完整的python示例，模型是需要训练的，所以在原有代码的基础上，我们寻找一些公开的数据集对模型进行训练。本文需要先了解的前置内容以及代码（如果不训练，仅看如何获取数据集，就可以跳过这部分），可以看的我文章：从零开始构建一个小型字符级语言模型的完整详细教程（基于Transformer架构）-CSD
扣子和DIfy调用deepseek对比分析 ISDF-CodeInkVotex 人工智能+科技前沿杂谈人工智能
近日，与网络高人学习，用Coze调用deepseek火山引擎版满血R1大模型，可以构建自己的业务级智能体，觉得还挺好玩的。又闻言，Dify、TensorFlow、PyTorch、Keras、Fastai、HuggingFace等工具可以微调诸如deepseek、chatgpt、doubao等大模型。下面重点讲Dify和Coze在调用deepseek上的区别做一个简要分析，供个人认知扫盲。1.调用方
基于 YOLO 进行车道线检测与目标检测算法研究及开发的一般步骤 pk_xz123456 python 算法深度学习 YOLO 目标检测算法
基于深度学习的车道线检测与目标检测在自动驾驶等领域有着重要应用，使用YOLO（YouOnlyLookOnce）进行开发是一种常见且高效的方式。以下是关于基于YOLO进行车道线检测与目标检测算法研究及开发的一般步骤和相关内容：1.环境搭建首先确保你的开发环境安装了必要的软件和库，推荐使用Python语言，以下是一些关键库：PyTorch：YOLO通常基于PyTorch实现，安装适合你系统的PyTor
安装CUDA以及GPU版本的pytorch lskkkkkkkkkkkk Python pytorch 人工智能 python
使用pytorch进行深度学习的时候，往往想用GPU进行运算来提高速度。于是搜索便知道了CUDA。下面给出一个自检的建议：检查cuda的版本是否适配自己的GPU。打开NVDIA控制面板，点击左下角“系统信息”，然后就可以看到NVDIAGPU的详细信息，其中就包含了CUDA的版本。在官网安装合适版本的cuda-toolkit。安装了cuda，但是命令行输入nvcc-V报错显示没有nvcc这时候可能没
如何将 DeepSeek 模型与 PyTorch结合使用 LCG元大模型 pytorch 人工智能 python
目录环境准备系统要求安装PyCharm下载DeepSeek模型使用Ollama下载模型验证模型下载本地部署DeepSeek模型使用Flask创建HTTP服务使用PyCharm调用本地服务进一步集成到开发流程封装函数自定义快捷键（可选）✍️相关问答DeepSeek模型与PyTorch结合使用的性能优化策略有哪些如何在PyCharm中设置自定义快捷键来快速调用DeepSeek服务DeepSeek模型的
Windows 系统下，使用 PyTorch 的 DataLoader 时，如果 num_workers 参数设置为大于 0 的值，报错张三不嚣张 pytorch 人工智能 python
在Windows系统下，使用PyTorch的DataLoader时，如果num_workers参数设置为大于0的值，可能会遇到以下错误：RuntimeError:Anattempthasbeenmadetostartanewprocessbeforethecurrentprocesshasfinisheditsbootstrappingphase.Thisprobablymeansthatyoua
从零开始：使用PyTorch构建DeepSeek R1模型及其训练详解陆鳐LuLu pytorch 人工智能 python
本文将引导你使用PyTorch从零开始构建DeepSeekR1模型，并详细解释模型架构和训练步骤。DeepSeekR1是一个假设的模型名称，为了演示目的，我们将构建一个基于Transformer的简单文本生成模型。1.模型架构DeepSeekR1的核心是一个基于Transformer的编码器-解码器架构，包含以下关键组件：EmbeddingLayer:将输入的单词索引转换为密集向量表示。Posit
pytorch PIL对np和tensor 图像数据的显示 Tianwen_Burning pytorch深度学习 pytorch python
（显示图像）PIL可以显示np的图像数据，np是whc的格式。在np转换为tenser格式后会自动转换为cWH的格式，tenser再转回来时，依然是cwh格式np.tranpose（1,2,0）可以将cwh格式转换为whc的格式,也就是将原来的0,1,2代表的cwh，变成whc格式代码表示是====互转的代码“tensor_a=torch.tensor(array),np_array=tensor
IPEX-LLM: 英特尔硬件大语言模型加速库部署 Felix_bin 语言模型人工智能自然语言处理
IPEX-LLM:英特尔硬件大语言模型加速库部署大语言模型的本地部署正成为一个热门话题。本指南将帮助你掌握如何使用IPEX-LLM（IntelPyTorchExtensionforLargeLanguageModels）在英特尔硬件上实现最优化的模型部署。无论你是刚开始接触还是已经有一定经验，这份指南都能满足你的需求。IPEX-LLM的优势IPEX-LLM是英特尔基于PyTorch开发的专业优化库
在Intel GPU上使用IPEX-LLM进行本地BGE嵌入 shuoac python
在现代人工智能应用中，尤其在诸如检索增强生成（RAG）和文档问答等任务中，低延迟是一个至关重要的指标。Intel的IPEX-LLM是一种专门为IntelCPU和GPU优化的PyTorch库，能够在包括本地PC上的集成显卡和独立显卡（如Arc、Flex和Max）在内的Intel硬件上以极低的延迟运行大型语言模型（LLM）。本文将介绍如何在IntelGPU上结合LangChain使用IPEX-LLM进
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod

PyTorch:数据加载和预处理

Transform (变换)

组合变换

迭代数据集

你可能感兴趣的:(PyTorch)