《动手学深度学习》戴口罩的胡萝卜组 - 户建坤 第一次打卡 (线性, Softmax, 多层感知机, 文本预处理, 语言模型, RNN)
线性回归1.数据集名词trainingsetsamplelabelfeature2.均方差损失函数均值差的平方损失(a-b)**2/2在batch中求平均,即sum/len(batch)为什么单个要除以2?其实标准的也可以不/2为什么均方差用的这么多?好处坏处,别的?均方差叫MSE,meansquarederror,RMSE,MAE3.随机梯度下降一个小的启发,如果trainingset的batc