第二次打卡

完成三个任务:过拟合及欠拟合等问题,欠拟合好解决,增加模型复杂度即可,过拟合需要考虑引入正则惩罚项、丢弃层、进行数据增强、模型集成等,这些可能在后续课程会提及,另外,梯度爆炸可以通过梯度裁剪来控制,梯度消失可以采取残差网络、跨层联接等方法来弥补,SENet值得一看;NMT、Attention、Transformer非常精彩,不知道这些跟Subword model结合的效果如何,很想了解这方面的进展;卷积神经网络演化脉络波澜壮阔,Object Detection的分支也不断翻新,期待相关内容的学习。

你可能感兴趣的:(第二次打卡)