神经网络笔记——反向传播算法

神经网络输出的矩阵表示

神经网络笔记——反向传播算法_第1张图片

alj=σ(kwljkal1k+blj),

al=σ(wlal1+bl).

上式中,令:
zlwlal1+bl

关于cost函数的两个条件

条件1:cost函数可以被写成如下形式:

C=1nxCx

,其中x是单个训练样本,n为样本总数。

对于均方误差函数:

C=12nxy(x)aL(x)2,

满足条件1:
C=1nxCx,Cx=12yaL2

条件2:cost函数是神经网络最终层输出值 aL 的函数。

神经网络笔记——反向传播算法_第2张图片
可知均方误差函数也满足条件2:

C=12yaL2=12j(yjaLj)2,

Hadarmard乘积

[12][34]=[1324]=[38].

四条等式

神经网络笔记——反向传播算法_第3张图片

alj=σ(kwljkal1k+blj),

al=σ(wlal1+bl).

zlwlal1+bl

后向传播算法过程

  1. 输入 x :对输入层 a1 赋值。
  2. 前馈:对于每个 l=2,3,,L ,计算 zl=wlal1+bl al=σ(zl)
  3. 计算误差 δL :计算 δL=aCσ(zL)
  4. 反向传播误差:对于每个 l=L1,L2,,2 ,计算 δl=((wl+1)Tδl+1)σ(zl)
  5. 输出:计算每个 Cwljk=al1kδlj,Cblj=δlj

你可能感兴趣的:(神经网络笔记——反向传播算法)