cs231n课程记录

课程作业参考:
https://github.com/JPLAY0/CS231nAssignment

1.关于多维输入输出与kernel size 和deepth的关系。下面这篇文章解释的比较详细,可以参考。
https://blog.csdn.net/u011734144/article/details/84066867
比如输入是rgb三通道图片,则kernel的deepth一般就是3,也就是size就是width x heigth x deepth.最后计算的结果就是三个channel的数值相加再加上bias值就得到这一点的值。kernel的个数对应输出的channel。

  1. 关于卷积核权值的更新,可以参考如下几篇文章:
    https://zhuanlan.zhihu.com/p/64248652
    https://www.cnblogs.com/bnuvincent/p/8921956.html
    其实总结下来,就是因为卷积核的参数是很多连接共用的,所以针对每个卷积核的参数,其梯度是一个矩阵,那我们更新这个参数的时候,需要将这个梯度矩阵所有元素求和,然后利用这个和来更新权值。
    第二篇文章还介绍了对于pooling层导致的反向传播求梯度的时候矩阵维度不匹配的问题,需要上采样回去来匹配维度,上采样的方式就直接copy即可,也就是如果是2倍的上采样,则将每一个元素的值copy 3次,形成一个2x2的矩阵,其他元素都一样操作

你可能感兴趣的:(深度学习图像处理cv)