ne-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。
One-Hot编码是分类变量作为二进制向量的表示。这首先要求将分类值映射到整数值。然后,每个整数值被表示为二进制向量,除了整数的索引之外,它都是零值,它被标记为1。
例如
[1,2,4] 有三个数 数的范围是0-4 因此需要一个3x5的张量,可以编码为
[[0 1 0 0 0],
[0 0 1 0 0],
[0 0 0 0 1]]
target.scatter_(dim,index,data)
解释 使用 index中的索引用data中的数据对target沿着dim维度方向进行填充~
看起来很复杂,好好思考一下其实不难理解。
例如,考虑一个张量[1,2,4],需要转换成one-hot编码向量
import torch
index = torch.tensor([1,2,4])
a = index.unsqueeze(1)
print(a)
输出
tensor([[1],
[2],
[4]])
需要将index进行升维的原因是我们需要沿这第二个维度方向进行索引,如果不这样做的话,直接按照[1,2,4]进行索引,无法完成该操作,因为这样是沿着第1维度进行索引,索引结果是1,2,4。
import torch
index = torch.tensor([1, 2, 4])
a = index.unsqueeze(1)
result1 = torch.zeros(3,5).scatter_(1,a,1)
print(result1)
输出
tensor([[0., 1., 0., 0., 0.],
[0., 0., 1., 0., 0.],
[0., 0., 0., 0., 1.]])