什么是Tensor
Tensor
,又名张量,最早接触这个词是来自于TensorFlow,这个概念也被广泛的应用于不同的深度学习框架。
如果一个物理量,在物体的某个位置上只是一个单值,那么就是普通的标量,比如密度。如果它在同一个位置、从不同的方向上看,有不同的值,而且这个数恰好可以用矩阵乘观察方向来算出来,就是张量。几何代数中定义的张量是基于向量和矩阵的推广,通俗一点理解的话,我们可以将标量视为零阶张量,矢量视为一阶张量,那么矩阵就是二阶张量。
从工程角度来讲,可简单地认为它就是一个数组,且支持高效的科学计算。它可以是一个数(标量)、一维数组(向量)、二维数组(矩阵)和更高维的数组(高阶数据)。
PyTorch中的Tensor
Tensor
是PyTorch中重要的数据结构,可认为是一个高维数组。Tensor
和Numpy中的ndarrays
类似,但Tensor
可以使用GPU进行加速计算。PyTorch中有许多不同的方法可以创建Tensor
。
创建Tensor的方法:
torch.Tensor(*sizes)
:随机创建指定形状的Tensor。
使用该方法创建Tensor时,系统不会马上分配空间,只是会计算剩余的内存是否足够使用,使用到Tensor时才会分配。而其它操作都是在创建完Tensor之后马上进行空间分配。
>>> a = torch.Tensor(2, 3)
>>> a
tensor([[1.2748e-10, 4.5916e-41, 0.0000e+00],
[0.0000e+00, 0.0000e+00, 0.0000e+00]])
torch.Tensor(data)
:将List
转换为Tensor
。
>>> a = torch.Tensor([[1,2,3],[4,5,6]])
>>> a
tensor([[1., 2., 3.],
[4., 5., 6.]])
torch.ones(data)
:创建全1的Tensor。
>>> torch.ones(2, 3)
tensor([[1., 1., 1.],
[1., 1., 1.]])
torch.zeros(data)
:创建全0的Tensor。
>>> torch.zeros(2, 3)
tensor([[0., 0., 0.],
[0., 0., 0.]])
torch.eye(*size)
:创建对角Tensor。
>>> torch.eye(3, 3)
tensor([[1., 0., 0.],
[0., 1., 0.],
[0., 0., 1.]])
torch.arange(s, e, step)
:生成从s到e,步长为step的一维Tensor。
>>> torch.arange(1, 10, 2)
tensor([1, 3, 5, 7, 9])
torch.linspace(s, e, n)
:生成从s到e,size为n的一维Tensor。
>>> torch.linspace(1, 10, 2)
tensor([ 1., 10.])
torch.randn(*size)
:标准分布。
>>> torch.randn(2, 3)
tensor([[-0.8712, -0.2707, -0.4527],
[ 0.3612, 0.2612, -0.6841]])
torch.rand(*size)
:均匀分布。
>>> torch.rand(2, 3)
tensor([[0.5604, 0.5680, 0.5437],
[0.6341, 0.0839, 0.2817]])
torch.tensor
是在0.4版本新增加的一个新版本的创建tensor方法,使用的方法,和参数几乎和np.array
完全一致。不论输入的类型是什么,torch.tensor
都会进行数据拷贝,不会共享内存。
>>> a = np.array([1, 2, 3])
>>> b = torch.tensor(a)
>>> a[0] = 0
>>> a
array([0, 2, 3])
>>> b
tensor([1, 2, 3], dtype=torch.int32)
Tensor转换:
Torch定义了七种CPU tensor
类型和八种GPU tensor
类型:
他们之间可以通过内置函数互相转换:
将tensor投射为long类型:newtensor = tensor.long()
将tensor投射为半精度浮点(16位浮点)类型:newtensor = tensor.half()
将tensor投射为int类型:newtensor = tensor.int()
将tensor投射为double类型:newtensor = tensor.double()
将tensor投射为float类型:newtensor = tensor.float()
将tensor投射为char类型:newtensor = tensor.char()
将tensor投射为byte类型:newtensor = tensor.byte()
将tensor投射为short类型:newtensor = tensor.short()
>>> a.dtype
torch.float32
>>> a.int()
tensor([1, 2, 3], dtype=torch.int32)
>>> a.double()
tensor([1., 2., 3.], dtype=torch.float64)
>>> a.long()
tensor([1, 2, 3])
Tensor
可以存放在不同的device(cpu/gpu)。
cpu –> gpu,使用data.cuda()
。
gpu –> cpu,使用data.cpu()
。
>>> a = torch.Tensor([1, 2, 3], device=torch.device('cpu'))
>>> a.device
device(type='cpu')
Tensor
可以和Numpy的ndarray
互相转换。返回的新tensor
与源tensor
共享内存,也即更改其中的一个,另外一个也会跟着改变。 当numpy的数据类型和Tensor的类型不一样的时候,数据会被复制,不会共享内存。
Tensor –> Numpy.ndarray ,可以使用 data.numpy()
。
Numpy.ndarray –> Tensor ,可以使用torch.from_numpy(data)
。
>>> a.numpy()
array([1., 2., 3.], dtype=float32)
Tensor –>Python List,可以使用 data.tolist()
。
>>> a.tolist()
[1., 2., 3.]
一个tensor
如果想要转换为标准的python对象数值,需要调用tensor.item()
,这个方法只对包含一个元素的tensor
适用。
>>> a
tensor(10)
>>> a.item()
10
>>> c = torch.tensor([1, 2, 3])
>>> c.item()
Traceback (most recent call last):
File "", line 1, in
ValueError: only one element tensors can be converted to Python scalars
Tensor常规操作
查看Tensor的大小:tensor.size()
。
查看Tensor的大小:tensor.shape
。
>>> a.size()
torch.Size([3])
>>> a.shape
torch.Size([3])
统计Tensor的元素个数:Tensor.numel()
。
>>> a.numel()
3
调整tensor的形状:tensor.view()
。
该函数必须保证调整前后元素总数一致。view
不会修改自身的数据,返回的新tensor
与源tensor
共享内存,也即更改其中的一个,另外一个也会跟着改变。
>>> a.view(-1, 3)
tensor([[1., 2., 3.]])
为Tensor添加维度:tensor.unsqueeze()
。
为Tensor减少维度:tensor.squeeze()
。
>>> a
tensor([1., 2., 3.])
>>> b = a.unsqueeze(0)
>>> b
tensor([[1., 2., 3.]])
>>> b = b.squeeze(0)
>>> b
tensor([1., 2., 3.])
Tensor索引操作
Tensor
支持与numpy.ndarray
类似的索引操作,语法上也类似,索引出来的结果与原tensor
共享内存,也即修改一个,另一个会跟着修改。
索引示例如下:
>>> a = torch.rand(3, 3)
>>> a
tensor([[0.8817, 0.0785, 0.8402],
[0.9164, 0.9220, 0.8753],
[0.1414, 0.7123, 0.9890]])
>>> a[1]
tensor([0.9164, 0.9220, 0.8753])
>>> a[:, 0]
tensor([0.8817, 0.9164, 0.1414])
>>> a[a > 0.5]
tensor([0.8817, 0.8402, 0.9164, 0.9220, 0.8753, 0.7123, 0.9890])
Tensor运算
PyTorch支持几种不同的运算,如下示例所示:
Tensor内置函数:Tensor.sum()
。
Torch运算函数:Torch.sum()
。
>>> a.sum()
tensor(6.)
>>> torch.sum(a)
tensor(6.)
>>> a.sum_()
不修改Tensor的内置函数:Tensor.add(b)
。
修改Tensor的内置函数:Tensor.add_(b)
。
函数名以_结尾的都是inplace方式,即会修改调用者自己的数据。
>>> a = torch.tensor(6)
>>> b = torch.tensor(4)
>>> a.add(b)
tensor(10)
>>> a
tensor(6)
>>> a.add_(b)
tensor(10)
>>> a
tensor(10)
符号运算:tensor + tensor
。
>>> a + b
tensor(14)
常用的Tensor操作如上所示,但是以上介绍并不包括所有的Tensor
操作,详细的可以查看PyTorch手册。