向量对向量求导,链式法则

这还算不得向量微积分里多么主干的内容,只是一个小技术,但是数学推导很多时候就会用到。
http://cs231n.stanford.edu/vecDerivs.pdf
这个文献是一个好文献。
另优秀翻译:
https://zhuanlan.zhihu.com/p/142668996
链式法则注意:这里的乘法变成了inner product
推导过程中比较关键的点:除了利用这文献所讲的分量慢慢推,还有一个要点,首先确定求导完后张量(或说向量、矩阵)的形状,具体来说,求导会升维,且结果的维度为在被求导的那个量的维度cat求导的量的维度,即(*被求导量维度,*求导的量的维度)

其中有一个好的结论是说 y = W x y=Wx y=Wx,where x,y都是向量,y对x求导得到W;

其中有一个好的结论是说 y = W x y=Wx y=Wx,where x,y都是向量,y对x求导得到W;
但是请注意,如果y是个标量而x仍为向量,这个结论就不成立了,此时,y对x求导是W的转置,因为W是一个行向量,而x是列向量,Wx实际上就是个内积;总的来说,维度法则优先于这个结论,什么时候都要以维度法则为准。

你可能感兴趣的:(向量对向量求导)