刘二大人-视频课程第四讲-反向传播

back propagation 反向传播

  • 第一层
  • 第二层
  • 课后作业
    • 1、推导线性模型y=w*x,损失函数loss=(ŷ-y)²下,当数据集x=2,y=4的时候,反向传播的过程
    • 2、推导线性模型 y=w*x+b,损失函数loss=(ŷ-y)²下,当数据集x=1,y=2的时候,反向传播的过程
    • 3、画出二次模型y=w1x²+w2x+b,损失函数loss=(ŷ-y)²的计算图,并且手动推导反向传播,用pytorch实现

第一层

刘二大人-视频课程第四讲-反向传播_第1张图片

第二层

刘二大人-视频课程第四讲-反向传播_第2张图片

  • 为了避免能够展开合并,需要加入非线性函数
    刘二大人-视频课程第四讲-反向传播_第3张图片
  • 链式求导:
    刘二大人-视频课程第四讲-反向传播_第4张图片
    刘二大人-视频课程第四讲-反向传播_第5张图片
  • 计算过程
    刘二大人-视频课程第四讲-反向传播_第6张图片
    第四讲代码

刘二大人-视频课程第四讲-反向传播_第7张图片

课后作业

1、推导线性模型y=w*x,损失函数loss=(ŷ-y)²下,当数据集x=2,y=4的时候,反向传播的过程

刘二大人-视频课程第四讲-反向传播_第8张图片

2、推导线性模型 y=w*x+b,损失函数loss=(ŷ-y)²下,当数据集x=1,y=2的时候,反向传播的过程

刘二大人-视频课程第四讲-反向传播_第9张图片

3、画出二次模型y=w1x²+w2x+b,损失函数loss=(ŷ-y)²的计算图,并且手动推导反向传播,用pytorch实现

刘二大人-视频课程第四讲-反向传播_第10张图片

import numpy as np
import matplotlib.pyplot as plt
import torch

x_data = [1.0,2.0,3.0]
y_data = [2.0,4.0,6.0]

w1 = torch.Tensor([1.0])#初始权值
w1.requires_grad = True#计算梯度,默认是不计算的
w2 = torch.Tensor([1.0])
w2.requires_grad = True
b = torch.Tensor([1.0])
b.requires_grad = True

def forward(x):
    return w1 * x**2 + w2 * x + b

def loss(x,y):#构建计算图
    y_pred = forward(x)
    return (y_pred-y) **2

print('Predict (befortraining)',4,forward(4))

for epoch in range(100):
    l = loss(1, 2)#为了在for循环之前定义l,以便之后的输出,无实际意义
    for x,y in zip(x_data,y_data):
        l = loss(x, y)
        l.backward()
        print('\tgrad:',x,y,w1.grad.item(),w2.grad.item(),b.grad.item())
        w1.data = w1.data - 0.01*w1.grad.data #注意这里的grad是一个tensor,所以要取他的data
        w2.data = w2.data - 0.01 * w2.grad.data
        b.data = b.data - 0.01 * b.grad.data
        w1.grad.data.zero_() #释放之前计算的梯度
        w2.grad.data.zero_()
        b.grad.data.zero_()
    print('Epoch:',epoch,l.item())

print('Predict(after training)',4,forward(4).item())

你可能感兴趣的:(深度学习,python)