*
说实话,我看了CSDN的好几篇这个问题的博客只说到二维的,但是我们搞图像的。处理数据起步都要三维了(RGB),另外网上一种言论的关于什么0代表行拼接,1代表列拼接,我就不做过多评价了,我先声明我是小菜鸡,但是总结的东西基本得到我师兄的认可的。你也可以再琢磨琢磨。
进入正题:
1:torch.cat((x0,x1),dim)
语义解释一下,torch.cat是拼接数据的一个模块(不知道这么说对不对,反正是实现这个功能)。第一个部分就是(,)输入要拼接的数据,第二个部分就是输入要拼接的维度。
import torch
a0 = torch.Tensor([[[[1,1,1],[2,2,2]]]])
a1 = torch.Tensor([[[[3,3,3],[4,4,4]]]])
x = torch.cat((a0,a1),3).type(torch.FloatTensor)
#拼接对象是数据a0和数据a1,维度是三维的。
print(x)
2.数据维度是什么?
a0 = torch.Tensor([[[[1,1,1],[2,2,2]]]])
a1 = torch.Tensor([[[[3,3,3],[4,4,4]]]])
判断一个张量是几维的,看看它前面有几个方括号就可以了,这是最简便的方法了。数一数。本例子中a0就是一个4维的张量。
3.拼接维度是什么?
import torch
a0 = torch.Tensor([[[[1,1,1],[2,2,2]]]])
a1 = torch.Tensor([[[[3,3,3],[4,4,4]]]])
x = torch.cat((a0,a1),3).type(torch.FloatTensor)
我们再用cat实现拼接时就要填写后面的dim数值,这里的维度是怎么看的呢?
[[[1,1,1],[2,2,2]]]——————这个就是第0维(3个方括号,原数据是4维张量)
[[1,1,1],[2,2,2]]——————这个就是第1维(2个方括号,原数据是4维张量)
[1,1,1],[2,2,2]——————这个就是第2维(1个方括号,原数据是4维张量)
1,1,1,2,2,2———————这个就是第3维(0个方括号,原数据是4维张量)
他们分别的拼接结果如下:
0维:
tensor([[[[1., 1., 1.],
[2., 2., 2.]]],
[[[3., 3., 3.],
[4., 4., 4.]]]])
1维:
tensor([[[[1., 1., 1.],
[2., 2., 2.]],
[[3., 3., 3.],
[4., 4., 4.]]]])
2.维:
tensor([[[[1., 1., 1.],
[2., 2., 2.],
[3., 3., 3.],
[4., 4., 4.]]]])
3维:
tensor([[[[1., 1., 1., 3., 3., 3.],
[2., 2., 2., 4., 4., 4.]]]]
如果你还有不理解的可以给我留言。