一个Tensor包含两部分,一个是Data存数据,一个是Grad,存梯度,损失函数对权重的导数。构建计算图。
Pytorch构建张量:torch.Tensor([1.0])
计算梯度的加入 requires_grad =True字段。默认Tensor不计算梯度。
def forward(x, w):
return x * w
x不一定是Tensor,w是Tensor,将进行自动类型转换。
编写前馈,前馈结束后,编写损失函数。每调用一次损失函数,计算图动态构建出来。
前馈计算loss,反馈对loss张量,计算反向传播backward,把梯度求出来。计算图释放。
Grad是张量,grad.data取到其data,grad.data不会计算图。
Grad.item()梯度中值直接拿出来。
.data.zero_()梯度中数据全部清零。
__call__函数
def __call__(self, *args, **kwargs):
print("args:", args, "kwargs:", kwargs)
class ExecTest:
def __init__(self):
pass
def __call__(self, *args, **kwargs):
print("args:", args, "kwargs:", kwargs)
执行定义如下:
execTest = ExecTest()
execTest(3, 4, 5, x=1, y=2)
分别为参数不定的元祖和字典
线性模型:
初始化:__init__,self.linear = torch.nn.Linear(1, 1)
前馈:forward()
计算时,先计算前馈,然后计算损失,然后优化器清零,损失函数后向传播,优化器更新操作。
定义类,都要写__init__函数,且都是super(类名,super).__init__()
logistic回归,定义域(-无穷,+无穷),值域(0,1),公式:
引入torch.nn.functional函数,
import torch.nn.functional as F,取值 F.sigmoid即可
交叉熵损失函数:torch.nn.BCELoss(size_average=False)
采样函数:np.linspace(0, 10, 200),0-10之间采样200个数
x_t = torch.Tensor(x).view((200, 1)) y_t = model(x_t) y = y_t.data.numpy() 其中view相当于reshape函数,data.numpy()把数据转换为numpy类型的数据。 plt.grid()可以换出格子