矩阵和矩阵转置求导公式

##推导公式时用到的矩阵求导
1. Y = A ∗ X Y = A*X Y=AX -->> d Y d X = A T \frac{dY}{dX} = A^T dXdY=AT
2. Y = X ∗ A Y = X*A Y=XA -->> d Y d X = A \frac{dY}{dX} = A dXdY=A
3. Y = A ∗ X ∗ B Y = A*X*B Y=AXB

  1. 最最最重要的一个公式,其余的每个都可以用这个来推导
    已知 Y = A ∗ X ∗ B Y = A*X*B Y=AXB
    那么有对X求导,公式(1)
    d Y d X = A T ∗ B T \frac{dY}{dX} = A^T*B^T dXdY=ATBT
    和对 X T X^T XT求导,公式(2)
    d Y d X T = B ∗ A \frac{dY}{dX^T} = B*A dXTdY=BA
    下面我们来举例,如果要计算 Y = X ∗ B Y = X*B Y=XB中, d Y d X \frac{dY}{dX} dXdY的值,我们可以令 A = E A =E A=E 带入公式(1),有 d Y d X = B T \frac{dY}{dX} = B^T dXdY=BT
    其他计算同理。

有一个小窍门,平时在推导的时候,可以根据矩阵的行列数来判断。具体的规律可以自己私下尝试。

你可能感兴趣的:(机器学习)