深度学习——基础知识:PyTorch基础数据操作

文章目录

  • 一、张量创建
    • 1. 创建连续整数(arrange)
    • 2. 访问形状(shape),检查元素总数(numel)
    • 3. 改变形状(reshape)
    • 4. zeros,ones,标准高斯(randn),嵌套创建
  • 二、张量运算
    • 1. +、-、*、/和**
    • 2.张量连结(cat)
    • 3. 逻辑运算与求和
  • 三. 广播机制
  • 四. 索引和切片
  • 五. 节省内存
    • 1. 访问内存地址(id)
    • 2. 创建同形状张量(zeros_like)
  • 六. 转换为其他 Python 对象
    • 1. 返回数据类型(type)
    • 2. 张量转化标量(item,float,int)


一、张量创建

import torch#虽然它被称为PyTorch,但应该导入torch而不是pytorch。

1. 创建连续整数(arrange)

x = torch.arange(12)#从0开始的前12个整数,默认创建浮点数
x
tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])

2. 访问形状(shape),检查元素总数(numel)

x.shape #每个轴的长度
torch.Size([12])
x.numel() #形状的所有元素乘积,因为这里在处理的是一个向量,所以它的shape与它的size相同。
12

3. 改变形状(reshape)

X = x.reshape(3, 4)#可以用x.reshape(-1,4)或x.reshape(3,-1)来取代x.reshape(3,4)
X
tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])

4. zeros,ones,标准高斯(randn),嵌套创建

torch.zeros((2, 3, 4))
tensor([[[0., 0., 0., 0.],
         [0., 0., 0., 0.],
         [0., 0., 0., 0.]],

        [[0., 0., 0., 0.],
         [0., 0., 0., 0.],
         [0., 0., 0., 0.]]])
torch.ones((2, 3, 4))
tensor([[[1., 1., 1., 1.],
         [1., 1., 1., 1.],
         [1., 1., 1., 1.]],

        [[1., 1., 1., 1.],
         [1., 1., 1., 1.],
         [1., 1., 1., 1.]]])
torch.randn(3, 4) #每个元素都从均值为0、标准差为1的标准高斯(正态)分布中随机采样
tensor([[-0.9464,  0.7712, -0.0070,  1.0236],
        [-2.1246, -0.7854, -1.9674, -0.1727],
        [ 0.0397, -0.0477, -0.0160, -0.0113]])
torch.tensor([[2, 1, 4, 3], [1, 2, 3, 4], [4, 3, 2, 1]]) #最外层的列表对应于轴0,内层的列表对应于轴1
tensor([[2, 1, 4, 3],
        [1, 2, 3, 4],
        [4, 3, 2, 1]])

二、张量运算

1. +、-、*、/和**

x = torch.tensor([1.0, 2, 4, 8])
y = torch.tensor([2, 2, 2, 2])
#按元素操作
x + y, x - y, x * y, x / y, x ** y  # **运算符是求幂运算
(tensor([ 3.,  4.,  6., 10.]),
 tensor([-1.,  0.,  2.,  6.]),
 tensor([ 2.,  4.,  8., 16.]),
 tensor([0.5000, 1.0000, 2.0000, 4.0000]),
 tensor([ 1.,  4., 16., 64.]))
torch.exp(x)
tensor([2.7183e+00, 7.3891e+00, 5.4598e+01, 2.9810e+03])

2.张量连结(cat)

沿行(轴-0,形状的第一个元素)和按列(轴-1,形状的第二个元素)

X = torch.arange(12, dtype=torch.float32).reshape((3,4))
Y = torch.tensor([[2.0, 1, 4, 3], [1, 2, 3, 4], [4, 3, 2, 1]])
torch.cat((X, Y), dim=0), torch.cat((X, Y), dim=1)
(tensor([[ 0.,  1.,  2.,  3.],
         [ 4.,  5.,  6.,  7.],
         [ 8.,  9., 10., 11.],
         [ 2.,  1.,  4.,  3.],
         [ 1.,  2.,  3.,  4.],
         [ 4.,  3.,  2.,  1.]]),
 tensor([[ 0.,  1.,  2.,  3.,  2.,  1.,  4.,  3.],
         [ 4.,  5.,  6.,  7.,  1.,  2.,  3.,  4.],
         [ 8.,  9., 10., 11.,  4.,  3.,  2.,  1.]]))

3. 逻辑运算与求和

X == Y
tensor([[False,  True, False,  True],
        [False, False, False, False],
        [False, False, False, False]])
X.sum()
tensor(66.)

三. 广播机制

a = torch.arange(3).reshape((3, 1))
b = torch.arange(2).reshape((1, 2))
a, b
(tensor([[0],
         [1],
         [2]]),
 tensor([[0, 1]]))

由于a和b分别是 3×1 和 1×2 矩阵,如果我们让它们相加,它们的形状不匹配。我们将两个矩阵广播为一个更大的 3×2 矩阵,如下所示:矩阵a将复制列,矩阵b将复制行,然后再按元素相加。

a + b
tensor([[0, 1],
        [1, 2],
        [2, 3]])

四. 索引和切片

X[-1], X[1:3]#用[-1]选择最后一个元素,用[1:3]连续选取
(tensor([ 8.,  9., 10., 11.]),
 tensor([[ 4.,  5.,  6.,  7.],
         [ 8.,  9., 10., 11.]]))
X[1, 2] = 9
X
tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  9.,  7.],
        [ 8.,  9., 10., 11.]])

[0:2, :]访问第1行和第2行,其中“:”代表沿轴1(列)的所有元素

X[0:2, :] = 12
X
tensor([[12., 12., 12., 12.],
        [12., 12., 12., 12.],
        [ 8.,  9., 10., 11.]])

五. 节省内存

1. 访问内存地址(id)

运行Y = Y + X后,我们会发现id(Y)指向另一个位置。这是因为Python首先计算Y + X,为结果分配新的内存,然后使Y指向内存中的这个新位置。

before = id(Y)
Y = Y + X
id(Y) == before

这可能是不可取的,原因有两个:首先,我们不想总是不必要地分配内存。在机器学习中,我们可能有数百兆的参数,并且在一秒内多次更新所有参数。通常情况下,我们希望原地执行这些更新。其次,我们可能通过多个变量指向相同参数。如果我们不原地更新,其他引用仍然会指向旧的内存位置,这样我们的某些代码可能会无意中引用旧的参数。

False

2. 创建同形状张量(zeros_like)

我们可以使用切片表示法将操作的结果分配给先前分配的数组,例如Y[:] = 。为了说明这一点,我们首先创建一个新的矩阵Z,其形状与另一个Y相同,使用zeros_like来分配一个全 0 的块。

Z = torch.zeros_like(Y)
print('id(Z):', id(Z))
Z[:] = X + Y
print('id(Z):', id(Z))

如果在后续计算中没有重复使用X,我们也可以使用X[:] = X + Y或X += Y来减少操作的内存开销。

id(Z): 2152120846784
id(Z): 2152120846784
before = id(X)
X += Y
id(X) == before
True

六. 转换为其他 Python 对象

1. 返回数据类型(type)

A = X.numpy()
B = torch.tensor(A)
type(A), type(B)
(numpy.ndarray, torch.Tensor)

2. 张量转化标量(item,float,int)

a = torch.tensor([3.5])
a, a.item(), float(a), int(a)
(tensor([3.5000]), 3.5, 3.5, 3)

你可能感兴趣的:(pytorch,python,深度学习)