向量与矩阵求导与实例分析

【说明】

1. 相关内容经过诸多学习内容整理

2.  比较权威的学习源可参考维基百科  https://en.wikipedia.org/wiki/Matrix_calculus#Scalar-by-vector_identities

3. 机器学习关联内容学习: 1)西瓜书第55页多元线性回归涉及到的公式推导   2)机器学习实战 第138页 

【目录】

一、布局的概念

二、一个求导的例子

三、另一个例子的推导

四、矩阵及向量求导法则

五、求导公司速查表

 

一、布局的概念

重要前提: 若 x 为向量,则默认 x 为列向量, x^{T}为行向量

布局简单地理解就是分子 y、分母 x 是行向量还是列向量。

  • 分子布局(Numerator-layout): 分子为 y 或者分母为  x^{T} (即,分子为列向量或者分母为行向量)
  • 分母布局(Denominator-layout): 分子为  y^{^{T}} 或者分母为 x (即,分子为行向量或者分母为列向量)

为了更加深刻地理解两种布局的特点和区别,下面是从维基百科中布局部分拿来的例子:

分子布局

  • 标量/向量: 标量/向量 (分母的向量为行向量)

  • 向量/标量: 向量与矩阵求导与实例分析_第1张图片 (分子的向量为列向量)

  • 向量/向量: 向量与矩阵求导与实例分析_第2张图片 (分子为列向量横向平铺,分母为行向量纵向平铺)

  • 标量/矩阵: 向量与矩阵求导与实例分析_第3张图片注意这个矩阵部分是转置的,而下面的分母布局是非转置的

  • 矩阵/标量: 向量与矩阵求导与实例分析_第4张图片

分母布局

  • 标量/向量: 向量与矩阵求导与实例分析_第5张图片 (分母的向量为列向量)

  • 向量/标量: 向量/标量 (分子的向量为行向量)

  • 向量/向量: 向量与矩阵求导与实例分析_第6张图片 (分子为行向量纵向平铺,分母为列向量横向平铺)

  • 标量/矩阵: 向量与矩阵求导与实例分析_第7张图片矩阵部分为原始矩阵

二、一个求导的例子

向量与矩阵求导与实例分析_第8张图片向量与矩阵求导与实例分析_第9张图片向量与矩阵求导与实例分析_第10张图片

三、另一个例子的推导

向量与矩阵求导与实例分析_第11张图片

看看红框部分的推导过程如下:
对谁求导数,就以谁(分母)作为主序,得出结果。比如这里x是列向量,求Ax关于x求导数,那么对x的每个分量分别求偏导数(写成一行),然后整理排成一列(同x一样是列向量)。 
向量与矩阵求导与实例分析_第12张图片 
同理有  
这里写图片描述 
关于x的转置x^{T}求导数,x^{T}是行向量,那么Ax分别对x^{T}向量中的分量求偏导(写成一列),然后整体排成一行(同x^{T}是行向量)。

这里,可以反过来再去理解下前面布局所述的行向量与列向量的差异。

四、矩阵及向量求导法则

向量与矩阵求导与实例分析_第13张图片

向量与矩阵求导与实例分析_第14张图片

向量与矩阵求导与实例分析_第15张图片

向量与矩阵求导与实例分析_第16张图片

五、求导公式速查表

向量与矩阵求导与实例分析_第17张图片

向量与矩阵求导与实例分析_第18张图片

向量与矩阵求导与实例分析_第19张图片

向量与矩阵求导与实例分析_第20张图片向量与矩阵求导与实例分析_第21张图片

........

更多公式见:

https://en.wikipedia.org/wiki/Matrix_calculus#Scalar-by-vector_identities

 

你可能感兴趣的:(数学基础)