你头发没有了喔

pytorch基础: Tensor数据类型与基础函数

1. Tensor的数据类型

在PyTorch中，主要有10种类型的tensor，其中重点使用的为以下八种(还有BoolTensor和BFloat16Tensor)：

Data type	dtype	dtype
32-bit floating point	torch.float32 or torch.float	torch.(cuda).FloatTensor
64-bit floating point	torch.float64 or torch.double	torch.(cuda).DoubleTensor
16-bit floating point	torch.float16 or torch.half	torch.(cuda).HalfTensor
8-bit integer(unsigned)	torch.uint8	torch.(cuda).ByteTensor
8-bit integer(signed)	torch.int8	torch. (cuda). CharTensor
16-bit integer(signed)	torch.int16 or torch.short	torch.(cuda).ShortTensor
32-bit integer(signed)	torch.int32 or torch.int	torch.(cuda).IntTensor
64-bit integer(signed)	torch.int64 or torch.long	torch.(cuda).LongTensor

在具体使用时可以根据网络模型所需的精度和显存容量进行选取。

一般情况而言，模型参数和训练数据都是采用默认的32位浮点型；16位半精度浮点是为在GPU上运行的模型所设计的，因为这样可以尽可能节省GPU的显存占用。
当然这样节省显存空间也会缩小所能表达数据的能力。因此自pytorch1.6自动混合精度(automatic mixed precision)被更新后，将半精度和单精度混合使用以达到减少显存、提升推理速度的方法就被大面积的推广开来。在这里不对自动混合精度(AMP)模块做过多介绍。
训练用的标签一般是整型中的32或64位，而在硬盘中存储数据集文件时则一般采用uint8来存分类标签(除非超过了255类)，总之就是尽可能在不损失信息的情况下压缩空间。

对于tensor之间的类型转换，可以通过type(),type_as(),int()等进行操作。其中不传入dtype参数的type()函数为查看当前类型，传入参数则是转换为该参数代表的类型。

# 创建新的Tensor时默认类型为float32位
>>> a = torch.randn(2, 2)
>>> a.type()
'torch.FloatTensor'

# 使用int()、float()、double()等进行数据转换
>>> b = a.double()
>>> b
tensor([[ 0.1975, -0.3009],
        [ 1.7323, -0.4336]], dtype=torch.float64)

# 使用传入dtype参数的type()函数
>>> a.type(torch.IntTensor)        
tensor([[0, 0],
        [1, 0]], dtype=torch.int32)

# 使用type_as()函数,将a的类型转换为b的类型
>>> a.type_as(b)
tensor([[ 0.1975, -0.3009],
        [ 1.7323, -0.4336]], dtype=torch.float64)

注意这里提到默认类型为float32，但是在使用from_numpy()函数时创建的tensor将会和原本的ndarray的类型保持一致，这个问题将在下一节具体讨论。

值得一提的是type_as()函数非常方便，在实际建立模型的过程中经常需要保持tensor之间的类型一致，我们只需要使用type_as()即可，不需要操心具体是什么类型。

2. Tensor的创建与查看

Tensor有很多创建方式，最常用基本的就是tensor()，而构造函数Tensor()用的很少。同时也有很多和numpy类似的创建方式，比如ones()、zeors()、randn()等等。
接下来我用代码的方式来介绍常见的创建方式，以及一些容易混淆的情况。

本节涉及函数

torch.tensor()、torch.Tensor()、torch.DoubleTensor()
torch.ones()、torch.zeros()、torch.eye()
torch.randn()、torch.randperm()、torch.randint()、torch.rand()
torch.ones_like()
torch.arange()、torch.linespace()、torch.logspace()

2.1. 基础tensor函数

tensor()是最常使用的，从data参数来构造一个新的tensor，下为官方文档的介绍

data (array_like) – Initial data for the tensor. Can be a list, tuple, NumPy ndarray, scalar, and other types.
基本上任何矩阵模样的数据都可通过tensor()被转换为tensor

Tensor()是最原始的构造函数，不建议使用

# Tensor()参数为每一维大小，得到数据为随机初始化
>>> torch.Tensor(2,2)
tensor([[0.0000, 4.4766],
        [0.0000, 0.0000]])

# tensor()的常见用法和特殊情况
>>> torch.tensor([[0.1, 1.2], [2.2, 3.1], [4.9, 5.2]])
tensor([[ 0.1000,  1.2000],
        [ 2.2000,  3.1000],
        [ 4.9000,  5.2000]])

>>> torch.tensor([0, 1])  # 会自行类型推断，创建int类型
tensor([ 0,  1])

>>> torch.tensor([])  # 创建一个空tensor (size (0,))
tensor([])

使用Tensor内置的各种数据类型进行创建

torch.DoubleTensor(2, 2)

2.2. 类numpy方法

2.2.1. 特殊矩阵创建方法

>>> torch.zeros(2,2)# 全为0的矩阵
>>> torch.ones(2,2) # 全为1的矩阵
>>> torch.eye(2,2) # 单位矩阵

2.2.2. 随机矩阵创建方法

# 按照所给维度创建矩阵，用标准正态分布(N(0,1))中的随机数来填充
>>> torch.randn(2,2)
tensor([[ 0.9798,  0.4567],
        [-0.4731, -0.3492]])

# 和randn一样，但是这次是用[0,1]均匀分布中的随机数来填充
>>> torch.rand(2,2)
tensor([[0.4497, 0.3038],
        [0.1431, 0.0814]])

# 生成长度为n的随机排列向量
>>> torch.randperm(5)
tensor([0, 4, 1, 3, 2])

# 用0-n的随机整数来填充矩阵，第二个参数为要求的维度
# 此为[0-4]的整数
>>> torch.randint(4, (2,3))
tensor([[2, 0, 3],
        [0, 0, 1]])

2.2.3. like方法

按照所给tensor维度生成相同维度的目标矩阵，这里就只举一个例子好了

>>> a = torch.randn(2, 3)
>>> torch.ones_like(a)
tensor([[1., 1., 1.],
        [1., 1., 1.]])

2.2.4. 序列创建方法

按照所给区间创建各种序列

注：range()函数是deprecated状态，不在此介绍

arange()函数区间为[start, end)

# 只传入一个参数end，根据[0, end)区间中创建序列
>>> torch.arange(5)
tensor([0, 1, 2, 3, 4])
# 传入两个参数start和end，根据[start, end)区间中创建序列
>>> torch.arange(1, 5)
tensor([1, 2, 3, 4])
# 传入step参数，代表间隔
>>> torch.arange(1, 8, step = 2)
tensor([1, 3, 5, 7])

linespace区间为[start,end]，但此处steps参数代表生成的tensor中元素数量
在区间中根据生成数量进行线性插值返回tensor，返回tensor元素为：
$\left(\text { start, start }+\frac{\text { end }-\text { start }}{\text { steps }-1}, \ldots, \text { start }+(\text { steps }-2) * \frac{\text { end }-\text { start }}{\text { steps }-1},\right. \text { end) }$

>>> torch.linspace(3, 10, steps=5)
tensor([  3.0000,   4.7500,   6.5000,   8.2500,  10.0000])
>>> torch.linspace(-10, 10, steps=5)
tensor([-10.,  -5.,   0.,   5.,  10.])
# 若steps为1，相当于间隔无限大，就只得到一个元素的tensor
>>> torch.linspace(start=-10, end=10, steps=1)
tensor([-10.])

logspace基本和linespace一致，不过使用的是指数函数进行插值
$\text { (base } \left.^{\text {start }}, \text { base }^{\text {(start+ } \left.\frac{\text { end - start }}{\text { steps }-1}\right)}, \ldots, \text { base }^{\text {(start } \left.+\text { (steps }-2) * \frac{\text { end - start }}{\text { steps }-1}\right)}, \text { base }^{\text {end }}\right)$

# base默认为10
>>> torch.logspace(start=-10, end=10, steps=5)
tensor([ 1.0000e-10,  1.0000e-05,  1.0000e+00,  1.0000e+05,  1.0000e+10])
>>> torch.logspace(start=0.1, end=1.0, steps=1)
tensor([1.2589])
# 可以传入base参数改变基底
>>> torch.logspace(start=2, end=2, steps=1, base=2)
tensor([4.0])

3. Tensor的组合与分块

本节涉及函数

torch.cat(),torch.stack()
torch.chunk(), torch.split()

3.1. 组合操作

组合是指将不同的Tensor叠加起来，主要有torch.cat()和torch.stack()两个函数。

cat()(或concat())是concatenate的意思，即沿着已有的数据的某一维度进行拼接，操作后数据的总维数不变，在进行拼接时，除了拼接的维度之外，其他维度必须相同

>>> x = torch.randn(2, 3)
>>> x
tensor([[ 0.6580, -1.0969, -0.4614],
        [-0.1034, -0.5790,  0.1497]])

# 按照第0个维度进行拼接
>>> y = torch.cat((x, x, x), 0) 
>>> y.shape
torch.Size([6, 3])

# 按照第1个维度进行拼接
>>> torch.cat((x, x, x), 1).shape 
torch.Size([2, 9])

# 用于拼接的维度可以不相等
>>> torch.cat((x, y), 0).shape 
torch.Size([8, 3])

stack()函数则是指新增维度，并按照指定的维度进行叠加，所有tensor的维度必须完全相同

>>> x = torch.randn(3, 4)

# 以第0维进行stack，输出维度为2x3x4,效果就是叠加序列本身
>>> torch.stack((x, x), 0).shape
torch.Size([2, 3, 4])

# 以第1维进行stack，输出维度为3x2x4，效果是按照每一行叠加
>>> torch.stack((x, x), 1).shape
torch.Size([3, 2, 4])

# 以第2维进行stack，输出维度为3x4x2，效果是按每一行的每一个元素进行叠加
>>> torch.stack((x, x), 2).shape
torch.Size([3, 4, 2])

3.2. 分块操作

分块是与组合相反的操作，指将Tensor分割成不同的子Tensor，主要有torch.chunk()和torch.split()两个函数，前者需要指定分块的数量而后者则需要指定每一块的大小。

chunk()需要指定分的块数和按照哪一维分块

>>> a = torch.arange(10) # size(10,)

# 可以除尽，返回五个tensor，每个tensor维度为2
>>> a.chunk(5)
(tensor([0, 1]),
 tensor([2, 3]),
 tensor([4, 5]),
 tensor([6, 7]),
 tensor([8, 9]))

# 无法除尽，则保证前面维数一致，最后一个tensor不一样
>>> a.chunk(4)
(tensor([0, 1, 2]), tensor([3, 4, 5]), tensor([6, 7, 8]), tensor([9]))

# 还有可能无法除尽同时也无法得到要求数量的tensor，那么返回tensor数量会减少
>>> torch.arange(11).chunk(5)
(tensor([0, 1, 2]), tensor([3, 4, 5]), tensor([6, 7, 8]), tensor([ 9, 10]))

# 按照其他维度分块的例子
# 按照第二个维度分成两块
>>> torch.randn(3, 4).chunk(2,1)
(tensor([[ 0.7786,  0.6219],
         [-0.1352, -0.3261],
         [-0.9451, -1.1154]]),
 tensor([[1.3665, 0.8111],
         [0.8320, 1.9941],
         [0.9997, 0.6056]]))
# 即得到两个3x2的tensor

split()函数需要指定每一块的大小和按照哪一维分块

# 沿着第0维分块，每一块维度为2，所以就是没分
>>> torch.randn(2,3).split(2,0)
(tensor([[ 0.2060,  1.0265, -1.0841],
         [ 1.2017,  0.1215,  0.7324]]),)

# 沿着第1维分块，要求每一块维度为2，无法除尽，所以第一个tensor为2x2，第二个tensor为2x1
>>> torch.randn(2,3).split(2,1)
(tensor([[ 0.0727,  0.4330],
         [-0.0220,  1.6440]]),
 tensor([[-0.0685],
         [ 0.3101]]))

4. Tensor的索引

涉及函数

index_select()、masked_select()
where()、clamp()

索引操作与Numpy非常类似，主要包括下标索引、表达式索引和选择索引

4.1. 下标索引

>>> a = torch.randn(2,3)

# 根据下标进行索引，用函数表达是index_select()
>>> a[1]
tensor([ 1.0374,  1.1266, -1.8777])
>>> a[1, 2]
tensor(-1.8777)

# index_select需要传进去dim和indices两个参数
>>>a.index_select(0,torch.tensor([0]))

# 选择符合条件的元素并返回，用函数表达是masked_select()
>>> a[a>0]
tensor([0.0258, 1.0374, 1.1266])
>>> a.masked_select(a>0)
tensor([0.0258, 1.0374, 1.1266])

4.2. 选择索引

# self.where()需要传入condition和other参数，即将other的数据填充到condition中False的地方
>>> a
tensor([[-1.0293, -2.0182,  0.0258],
        [ 1.0374,  1.1266, -1.8777]])
>>> a.where(a > 0, torch.ones(1, 3))
tensor([[1.0000, 1.0000, 0.0258],
        [1.0374, 1.1266, 1.0000]])

# 使用torch.where(condition, a, y)函数相当于a.where(condition, y)

where()非常值得注意的一点是，用于填充的other参数遵守torch的广播机制，并且需要保证最后一个维度和原tensor的最后一维保持一致或者为1

也就是说在上方代码的情况中，torch.ones的维度可以是(1)、(3)、(1,3)、(1,1)、(2,3)，但不能是(2)

# 对Tensor元素进行限制可以使用clamp()函数
>>> a.clamp(1, 2) # 将不在[1,2]范围内的元素放大到1或者缩小到2
tensor([[1.0000, 1.0000, 1.0000],
        [1.0374, 1.1266, 1.0000]])

5. Tensor的维度变形

维度转换指改变Tensor的维度，以适应在深度学习的计算中，数据维度经常变换的需求，在pytorch中主要有四类不同的变形方法

view()、resize()、reshape()
transpose()、permute()
squeeze()、unsqueeze()
expand()、expand_as()

下面将按照类别介绍它们

5.1. 调整形状

view()、resize()、reshape()函数可以在不改变Tensor数据的情况下任意改变Tensor的形状，调整前后共享内存，三者作用基本相同

resize()现在已经处于deprecated状态，只保留了进行in-place操作的resize_()

>>> a = torch.arange(0,4)
>>> a
tensor([0, 1, 2, 3])

>>> b = a.view(2, 2)
>>> b
tensor([[0, 1],
        [2, 3]])

>>> c = a.reshape(4, 1) # resize一样
>>> c
tensor([[0],
        [1],
        [2],
        [3]])
>>> c[1, 0]=0
>>> b
tensor([[0, 0],
        [2, 3]])

如果想要直接改变Tensor的尺寸，可以使用resize_()原地操作。在resize_()函数中，如果超过了原Tensor的大小则重新分配内存，多出部分置零，如果小于原Tensor大小则剩余的部分仍然会隐藏保留

5.2. 维度之间的转换

transpose()函数可以将指定的两个维度的元素进行转置，而permute()函数则可以按照给定的维度进行维度变换

>>> a=torch.randn(2,3,1)
>>> a
tensor([[[-1.1151],
         [ 2.6100],
         [-0.0333]],
        [[ 0.6966],
         [ 0.3621],
         [-0.7940]]])


# 将第0维和第1维的元素进行转置,且维度变为(3,2,1)
>>> a.transpose(0, 1)
tensor([[[-1.1151],
         [ 0.6966]],
        [[ 2.6100],
         [ 0.3621]],
        [[-0.0333],
         [-0.7940]]])


# 按照第2、1、0的维度顺序重新进行元素排列，维度变为(1,3,2)
>>> a.permute(2, 1, 0)
tensor([[[-1.1151,  0.6966],
         [ 2.6100,  0.3621],
         [-0.0333, -0.7940]]])

5.3. 处理size为1的维度

在实际的应用中，经常需要增加或减少Tensor的维度，尤其是维度为1的情况(特别是处理label的时候，经常有(n,1)和(n,)相互转换的需求)。
squeeze()用于去除size为1的维度，而unsqueeze()用于将指定的维度size变为1

>>> a=torch.arange(0,4)
>>> a.shape
torch.Size([4])

# 将第0维变为1，因此总维度为(1,4)
>>> b = a.unsqueeze(0)
>>> b.shape
torch.Size([1, 4])

# 第0维如果是1，则去掉该维度，如果不是则不进行任何操作
>>> b.squeeze(0).shape
torch.Size([4])
>>> b.squeeze(1).shape
torch.Size([1, 4])

5.4. 复制元素来扩展维度

有时需要采用复制元素的方式来扩展Tensor的维度，这时expand相关函数就派上用场了。expand()函数将size为1的维度复制扩展为指定大小，也可以使用expand_as()函数指定为目标Tensor的维度

>>> a=torch.randn(2,1)
>>> a
tensor([[-0.0026],
        [-0.8002]])

# 将第1维的维度由1变为3，则复制该维的元素，并扩展为3
>>> a.expand(2,3)
tensor([[-0.0026, -0.0026, -0.0026],
        [-0.8002, -0.8002, -0.8002]])

在进行Tensor操作时，有些操作比如transpose()、permute()可能会将Tensor在内存中变得不连续，而有些操作如view()是需要内存连续的，这种情况下可以采用contiguous()操作先将内存变为连续，而reshape()操作相当于帮助我们整合了这个情况，也就是self.reshape()函数等于self.contiguous().view()。
而resize()函数没有了自己独特的功能，如今已经被deprecated了

6. Tensor的内存共享

涉及函数

from_numpy()、numpy()
as_tensor()、tensor()、tolist()

6.1. 通过Tensor初始化Tensor

直接通过Tensor来初始化另一个Tensor，或是通过Tensor的组合、分块、索引、变形操作来初始化另一个Tensor，则这两个Tensor共享内存

>>> a=torch.randn(2, 2)
>>> a
tensor([[0.1783, 0.5609],
        [0.8006, 0.8315]])
# 用a初始化b，或者用a的变形操作初始化c，则这三者共享内存
>>> b=a
>>> c=a.view(4)
>>> b[0,0]=0
>>> c[3]=4
>>> a
tensor([[0.0000, 0.5609],
        [0.8006, 4.0000]])

6.2. Tensor与Numpy转换

>>> a=torch.randn(2,2)
>>> a
tensor([[-0.0560,  0.5018],
        [ 0.1275, -1.0663]])

# 转为numpy
>>> b = a.numpy()
>>> b
array([[-0.05598828,  0.50184375],
       [ 0.12752114, -1.0663038 ]], dtype=float32)
# 注意这里默认会保持相同的数据类型，也就是转换为单精度的float32

# numpy转为Tensor
>>> c = torch.from_numpy(b)
>>> c
tensor([[-0.0560,  0.5018],
        [ 0.1275, -1.0663]])
>>> torch.from_numpy()

在实际进行深度学习的过程中，总是会有双精度和单精度转换的问题，而from_numpy()函数会保留原ndarray的数据类型。

在pytorch训练中默认采用FloatTensor，所以如果其他来源的ndarray是float64的类型，那么from_numpy()转换过去将会变为pytorch中的DoubleTensor类型，从而导致数据类型不匹配

这时候就需要再使用float()函数，即torch.from_numpy().float()，来将双精度转换为单精度数据。

6.3. Tensor与其他类型数据转换

>>> a = np.array([1, 2, 3])
>>> t = torch.as_tensor(a) # 内存共享
>>> t
tensor([ 1,  2,  3])
>>> t[0] = -1
>>> a
array([-1,  2,  3])

>>> b = t.tolist() # 内存不共享
>>> t[0] = 1
>>> b
[-1, 2, 3]

最后我提供一个表格包含了上述的数据类型转换以及是否内存共享

函数	简述	是否和原数据内存共享
torch.tensor()	从任何类数组创建tensor	否
torch.as_tensor()	从任何类数组创建tensor	是
torch.from_numpy()	从numpy创建tensor	是
torch.numpy()	取出tensor内部存储的numpy数组	是
torch.tolist()	将tensor转换为list	否

注意这里使用的函数，均会和原数据的数据类型保持一致，所以float()应当会是一个相当常用的适配函数。

Reference

pytorch官方文档(1.10.0版)

Object Detection by Deep Learning：Core Technologie

你可能感兴趣的:(pytorch,深度学习,人工智能)

Pytorch 自学笔记（三）：利用自定义文本数据集构建Dataset和DataLoader JimmyTotoro Pytorch 自学笔记 pytorch 笔记人工智能
Pytorch自学笔记（三）1.Dataset与DataLoader1.1torch.utils.data.Dataset1.2torch.utils.data.DataLoaderPytorch自学笔记系列的第三篇。针对Pytorch的Dataset和DataLoader进行简单的介绍，同时，介绍如何使用自定义文本数据集构建Dataset和DataLoader，以实现数据集的随机采样与batch
【机器学习】多模态AI——融合多种数据源的智能系统 2的n次方_ 人工智能
随着人工智能的快速发展，单一模态（如文本、图像或语音）已经不能满足复杂任务的需求。多模态AI（MultimodalAI）通过结合多种数据源（如文本、图像、音频等）来提升模型的智能和表现，适用于多样化的应用场景，如自动驾驶、医疗诊断、跨语言翻译等。一、多模态AI简介多模态AI是一种将不同形式的数据（如文本、图像、音频等）融合在一起的技术，旨在让模型从多个维度感知和理解信息。这种融合使得AI系统能够从
Python OpenAI 库开发指南：从入门到实战精通 senger_lcc python 开发语言
在人工智能（AI）领域，OpenAI无疑是全球最受瞩目的机构之一。它推出的GPT系列模型、DALL·E等创新技术，正在深刻改变各行各业。作为Python开发者，我们该如何快速上手并高效利用OpenAI的API，成为了提升个人竞争力的关键。本文将带你从零开始，深入解析Python语言中的openAI库，助你掌握AI开发的核心工具，成为AI领域的专家。一、什么是openAI库？它能为开发者带来什么？1
Python3.13来了！编程爱好者必看 Python之栈人工智能 python 开发语言
Python3.13于近期发布，其中包含大量重要更新。Python作为机器学习、数据科学和人工智能领域使用最广泛的编程语言，一直在不断发展，以满足这些领域日益增长的需求。最新发布的Python3.13提供了多项具有影响力的改进，旨在提高性能和生产力，对于从事ML和AI项目的开发人员来说是一个重要的里程碑。Python在ML和AI领域的主导地位主要归功于它的简单性、广泛的库支持和庞大的社区。然而，随
Docker部署nnunetv2简洁教程 Tiandaren 模型部署 docker 容器运维 pytorch 人工智能深度学习 python
前言：感觉一些教程没必要说那么多，直接贴出重点的配置文件。如果有不懂的，可以把此文档丢给gpt，配合自己的环境一同服用。首先，在nnunet路径下创建一个Dockerfile。由于我已经完成了nnUNet的训练，所以不需要将相关数据全部上传到容器中，而是只保留源码。#使用适当的基础镜像（如pytorch官方镜像）FROMpytorch/pytorch:latest#更新apt-get并安装必要的工
基于YOLOv5、YOLOv8和YOLOv10的机场安检行李检测：深度学习应用与实现 2025年数学建模美赛 YOLO 深度学习人工智能目标跟踪目标检测
引言随着全球航空运输业的持续增长，机场的安全性变得越来越重要。机场安检作为航空安全的重要组成部分，主要负责对乘客和行李进行检查，防止危险物品进入机场或飞行器。传统的安检方式多依赖人工检查，效率低下且容易出错。因此，基于深度学习的自动化行李检测系统应运而生，通过计算机视觉技术，自动识别和分类行李中的物品，大大提高了安检的效率与准确性。YOLO（YouOnlyLookOnce）系列算法，由于其高效的目
人工智能之数学基础：一个小例子帮你快速搞懂极大线性无关向量组每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能线性代数机器学习极大线性无关向量组深度学习神经网络
本文重点在上一节课程中，我们学习了线性相关和线性无关。当线性相关的时候，那么说明这组向量至少存在一个向量可以被其它向量给表示，可以被表示就说明这个向量就是可有可无的，可以被替代的，这里就涉及到极大线性无关向量组的概念了，本文对此进行学习。极大无关向量组的定义与性质定义在线性空间中，如果存在一个向量组，它满足以下两个条件：一是它本身是线性无关的；二是向量空间中的任何包含它的向量组，如果仍然保持线性无
个人职业发展与AI赋能的前端开发前端
在瞬息万变的科技浪潮中，个人职业发展显得尤为重要。对于前端开发者而言，如何提升自身竞争力，适应日新月异的技术革新，是持续关注的核心问题。而近年来，人工智能（AI）技术的飞速发展，特别是AI代码生成器的兴起，正深刻地改变着前端开发的格局，为开发者们提供了前所未有的机遇。本文将以ScriptEcho为例，探讨AI技术如何赋能前端开发，助力个人职业发展。市场趋势与个人技能提升当前市场对前端开发人才的需求
Pytorch: torch.diag()创建对角线张量湫兮之风 pytorch pytorch 人工智能 python
torch.diag()torch.diag是PyTorch中的一个函数，用于从给定的矩阵中提取对角线元素，或者构造一个以给定对角线元素为值的对角矩阵。这个函数对于矩阵分解和转换等操作非常重要。如果输入是一个向量（1D张量），torch.diag会返回一个以该向量为对角线元素的2D方阵。如果输入是一个矩阵（2D张量），则返回一个包含输入矩阵对角线元素的1D张量。torch.diag还允许你指定对角
代码重构的革命：AI代码生成器如何改变游戏规则前端
在软件开发的世界里，代码重构是一项既重要又艰巨的任务。繁琐的重复性工作、低下的效率以及难以避免的错误，常常让开发者们疲惫不堪。然而，随着人工智能技术的飞速发展，智能化代码重构的时代已经到来，而AI代码生成器正成为这场革命的核心驱动力。代码重构的挑战：一个开发者的心声传统的代码重构过程充满了挑战。想象一下，你需要将一个庞大的、混乱的代码库改造成模块化、易于维护的结构。这需要你花费大量的时间去理解现有
Python 3.13性能大提升：免费多线程时代来临敖行客 Allthinker python java 开发语言爬虫
在编程的世界里，Python一直以其简洁、易读和强大的功能而备受青睐。随着技术的不断进步，Python的每一个新版本都带来了新的惊喜和改进。而Python3.13无疑是其中的一颗璀璨明星。在一个数据驱动的世界里，Python已经成为了一种无处不在的编程语言，它的性能和功能的提升始终是开发者们关注的热点。随着大数据、人工智能、云计算等技术的飞速发展，对编程语言性能的要求也在不断提高。在这样的背景下，
深入理解GPT底层原理--从n-gram到RNN到LSTM/GRU到Transformer/GPT的进化网络安全研发随想 rnn gpt lstm
从简单的RNN到复杂的LSTM/GRU,再到引入注意力机制,研究者们一直在努力解决序列建模的核心问题。每一步的进展都为下一步的突破奠定了基础,最终孕育出了革命性的Transformer架构和GPT大模型。1.从n-gram到循环神经网络(RNN)的诞生1.1N-gram模型在深度学习兴起之前,处理序列数据主要依靠统计方法,如n-gram模型。N-gram是一种基于统计的语言模型,它的核心思想是:一
深度学习理论基础（七）Transformer编码器和解码器小仇学长深度学习深度学习 transformer 人工智能编码器解码器
学习目录：深度学习理论基础（一）Python及Torch基础篇深度学习理论基础（二）深度神经网络DNN深度学习理论基础（三）封装数据集及手写数字识别深度学习理论基础（四）Parser命令行参数模块深度学习理论基础（五）卷积神经网络CNN深度学习理论基础（六）Transformer多头自注意力机制深度学习理论基础（七）Transformer编码器和解码器本文目录学习目录：前述：Transformer
Transformer架构原理详解：编码器（Encoder）和解码器（Decoder） AI大模型应用之禅 AI大模型与大数据 java python javascript kotlin golang 架构人工智能
Transformer,编码器,解码器,自注意力机制,多头注意力,位置编码,序列到序列,自然语言处理1.背景介绍近年来，深度学习在自然语言处理（NLP）领域取得了显著进展，其中Transformer架构扮演着至关重要的角色。自2017年谷歌发布了基于Transformer的机器翻译模型BERT以来，Transformer及其变体在各种NLP任务上取得了突破性的成果，例如文本分类、问答系统、文本摘要
【人工智能 | 大数据】基于人工智能的大数据分析方法用心去追梦人工智能大数据数据分析
基于人工智能（AI）的大数据分析方法是指利用机器学习、深度学习和其他AI技术来分析和处理大规模数据集。这些方法能够自动识别模式、提取有用信息，并做出预测或决策，从而帮助企业和组织更好地理解市场趋势、客户行为以及其他关键因素。以下是几种主要的基于AI的大数据分析方法：机器学习模型：通过训练算法让计算机从历史数据中学习并做出预测或分类。常见的机器学习技术包括监督学习（如回归分析、支持向量机）、非监督学
深度学习中超参数 fengbingchun Deep Learning hyperparameter
深度学习中的超参数(hyperparameters)是决定网络结构的变量(例如隐藏层数量)和决定网络训练方式的变量(例如学习率)。超参数的选择会显著影响训练模型所需的时间，也会影响模型的性能。超参数是在训练开始之前设置的，而不是从数据中学习的参数。超参数是模型训练期间无法学习的参数，需要事先设置。在深度学习中，模型由模型参数(如神经网络的权重和偏置)定义或表示。然而，训练模型的过程涉及选择最佳超参
基于MATLAB机器学习、深度学习实践技术应用梦想的初衷~ 机器学习人工智能 matlab 机器学习深度学习
近年来，MATLAB在机器学习和深度学习领域的发展取得了显著成就。其强大的计算能力和灵活的编程环境使其成为科研人员和工程师的首选工具。在无人驾驶汽车、医学影像智能诊疗、ImageNet竞赛等热门领域，MATLAB提供了丰富的算法库和工具箱，极大地推动了人工智能技术的应用和创新。原文链接https://mp.weixin.qq.com/s?__biz=Mzg2NDYxNjMyNA==&mid=224
深度求索DeepSeek V2.5-1210发布：AI代码生成器迎来全新升级前端
深度学习技术日新月异，而强大的AI代码生成器也随之不断进化。今天，我们将聚焦于深度求索团队发布的DeepSeekV2.5-1210版本，这款标志着DeepSeekV2系列收官之作，为我们带来了令人惊喜的Post-Training能力提升和备受期待的联网搜索功能。这篇文章将深入探讨DeepSeekV2.5-1210的各项改进，以及其开源带来的深远影响。DeepSeekV2系列的研发历程与V2.5-1
ChatGPT搜索漏洞：AI代码生成器安全隐患及应对策略前端
近年来，随着人工智能技术的飞速发展，各种AI代码生成器层出不穷，为程序员带来了极大的便利。然而，技术进步的同时也伴随着安全风险的提升。最近，OpenAI的ChatGPT搜索工具曝出重大安全漏洞，引发了业界广泛关注。本文将深入探讨该漏洞的细节、影响以及应对措施，并展望未来AI工具安全发展趋势。ChatGPT作为一款强大的AI工具，其搜索功能本意是帮助用户快速获取信息。然而，英国卫报近期报道揭露了Ch
深度学习学习笔记（第30周） qq_51339898 深度学习人工智能
一、摘要本周报的目的在于汇报第30周的学习成果，本周主要聚焦于基于深度学习的图像分割领域的常用模型U-net。 U-net是最常用、最简单的一种分割模型，在2015年被提出。UNet网络是一种用于图像分割的卷积神经网络，其特点是采用了U型网络结构，因此称为UNet。UNet算法的关键创新是在解码器中引入了跳跃连接（SkipConnections），即将编码器中的特征图与解码器中对应的特征图进行连接
深入解析如何进行TensorFlow框架下的算子开发与适配插件开发：基于昇腾AI的完整流程快撑死的鱼华为昇腾 Ascend C的算子开发系统学习人工智能 tensorflow python
深入解析如何进行TensorFlow框架下的算子开发与适配插件开发：基于昇腾AI的完整流程在人工智能领域中，算子（Operator）作为深度学习模型的基础执行单元，决定了整个模型的计算性能和结果准确性。随着硬件平台的多样化，如何将第三方深度学习框架中的算子适配到特定的硬件平台变得至关重要。本文将深入探讨如何在TensorFlow框架下开发适配昇腾AI处理器的算子插件，通过解析算子属性映射、数据排布
深入解析框架适配开发：基于CANN平台的自定义算子开发与第三方框架适配全流程详解快撑死的鱼华为昇腾 Ascend C的算子开发系统学习人工智能
深入解析框架适配开发：基于CANN平台的自定义算子开发与第三方框架适配全流程详解随着深度学习的发展，不同的深度学习框架如TensorFlow、PyTorch、ONNX等在AI开发者社区中占据了重要地位。然而，针对某些硬件平台（如华为昇腾AI处理器），算子库中的算子并非都已经适配了所有主流框架。为了解决这一问题，框架适配开发应运而生，它允许开发者将已存在于算子库中的算子适配到其他未支持的第三方框架上
深入解析CANN算子开发：TBE与AI CPU算子类型及其开发方法全指南快撑死的鱼华为昇腾 Ascend C的算子开发系统学习人工智能
深入解析CANN算子开发：TBE与AICPU算子类型及其开发方法全指南在现代AI计算领域中，高效的算子开发对于优化深度学习模型的推理与训练至关重要。CANN（ComputeArchitectureforNeuralNetworks）作为华为AscendAI处理器的开发平台，提供了两种类型的算子开发支持：TBE算子和AICPU算子。每种算子类型针对不同的计算任务和硬件架构，开发者需要根据具体场景选择
深度学习-90-大型语言模型LLM之基于LM Studio本地化部署运行自己的大模型皮皮冰燃深度学习深度学习语言模型人工智能
文章目录1LMStudio1.1LMStudio的优点1.2LMStudio的安装1.3配置国内下载模型2LMStudio的应用2.1查找/下载模型2.2模型名称的含义2.3查看已经下载的模型2.4使用聊天3配置服务端3.1启动服务3.2支持的接口3.2.1列出当前加载的模型/v1/models3.2.2聊天补全/v1/chat/completions3.2.3文本补全/v1/completion
Python从0到100（八十三）：神经网络-使用残差网络RESNET识别手写数字是Dream呀 python 神经网络网络
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
解锁辅助驾驶新境界：基于昇腾 AI 异构计算架构 CANN 的应用探秘倔强的石头_ AIGC 人工智能架构
博客主页：倔强的石头的CSDN主页Gitee主页：倔强的石头的gitee主页⏩文章专栏：《AI大模型》期待您的关注目录一、引言二、CANN是什么1.异构计算与人工智能的关系2.CANN的定义和作用3.CANN的技术优势三、基于CANN的辅助驾驶AI应用原理1.目标检测算法2.智能检测流程3.算力平台支持四、基于CANN的辅助驾驶AI优势1.高效训练2.精准检测3.快速编程4.产业应用五、部署实操六
探秘IO分布式模块设计：让大数据处理更高效清水湾落车分布式
一、引言随着互联网的飞速发展，大数据、云计算、人工智能等技术逐渐成为时代的主流。在这个数据爆炸的时代，如何高效地处理海量数据成为企业面临的重大挑战。IO分布式模块设计作为一种有效的解决方案，越来越受到关注。本文将带您了解IO分布式模块设计的基本概念、原理及其在实际应用中的优势。二、什么是IO分布式模块设计？IO分布式模块设计，是指将数据存储、数据处理、数据传输等IO操作进行分布式处理的一种设计方法
【人工智能】Python实战：构建高效的多任务学习模型蒙娜丽宁 Python杂谈 AI 人工智能 python 学习
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界多任务学习（Multi-taskLearning,MTL）作为机器学习领域中的一种重要方法，通过在单一模型中同时学习多个相关任务，不仅能够提高模型的泛化能力，还能有效利用任务间的共享信息。本文深入探讨了多任务学习的基本概念、优势及其在实际应用中的重要性。
以Python构建ONE FACE管理界面：从基础至进阶的实战探索 Allen_LVyingbo python python pyqt
一、引言1.1研究背景与意义在人工智能技术蓬勃发展的当下，面部识别技术凭借其独特优势，于安防、金融、智能终端等众多领域广泛应用。在安防领域，可助力监控系统精准识别潜在威胁人员，提升公共安全保障水平；金融行业中，实现刷脸支付、远程开户等便捷服务，优化用户体验并强化交易安全。智能终端方面，为设备解锁、身份验证等功能提供支持，提升设备使用的便捷性与安全性。然而，现有面部识别系统在数据安全、检索效率及用户
明达云：赋能化工园区，智绘安全高效新蓝图明达技术物联网网络
在日新月异的科技浪潮中，数字化转型已成为各行各业转型升级的关键驱动力。尤其在化工这一关乎国家经济命脉与安全环保的重要领域，如何实现智能化管理、提升运营效率、确保生产安全，成为了摆在众多化工园区面前的重大课题。在此背景下，明达云平台以其卓越的技术实力与深厚的行业经验，正逐步成为化工园区智慧化升级的首选伙伴。智慧监管，安全先行化工生产，安全为先。明达云平台通过集成物联网、大数据、人工智能等先进技术，为
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring