CS231N学习笔记4 Optimization: Stochastic Gradient Descent
OptimizationistheprocessoffindingthesetofparametersWWthatminimizethelossfunction.Visualizingthelossfunction从上一个chapter,得到lossfunction如下:换一种写法:其中wj是类j的权重向量.可以发现,L其实是wj的一个线性函数的和.假设现在每张图xi只有一个维度,给三个图,他们的