今天在练习手写softmax系列函数的时候遇到了报错:
出错原因我的target不是index tensor。我是按照一个博客进行实践的,自己一个个代码打过来的怎么会有错呢?仔细一检查发现确实一个小地方跟人家不一样,人家的target = torch.tensor([0, 2, 4, 1, 3])这里的tensor是小写,其实这还是我第一次看到torch.tensor()这样构造一个tensor,于是下定决定好好把他们两个搞清楚。
我们首先明确这一点,这是python类,是默认张量类型torch.FloatTensor()的别名,我们每次调用torch.Tensor([1,2, 3, 4, 5])来构造一个tensor的时候,会调用Tensor类的构造函数,生成一个单精度浮点类型的张量。
它不能指定数据类型,除非转成一个已知数据类型的张量,使用type_as(tesnor)将张量转换为给定类型的张量
但是torch.tensor(注意这里是小写)仅仅是python的函数,函数原型是
torch.tensor(data, dtype=None, device=None, requires_grad=False)
其中data可以是:list,tuple,NumPy,ndarray等其他类型,torch.tensor会从data中的数据部分做拷贝(而不是直接引用),根据原始数据类型生成相应的torch.LongTensor torch.FloatTensor和torch.DoubleTensor
我们可以看到data变成了浮点型,tensor1.type()随之也变成相应的torch.FloatTensor, 此外我们看到函数定义,可以生成指定dtype的tensor。