大二小白进击深度学习(一)

 作为第一篇在csdn上编写的文章,居然不是我比较爱好的单片机,而是最近时代的一个热潮--深度学习。作为一个大二小白,初次来到深度学习的门前,稍稍做一些记录吧。
 首先是,我们究竟在学什么。这个问题是我提的,不是我解答的。在大致学习(或者说叫了解吧)了三章内容以后,我产生了这样的疑惑--模型都是现成的,很多函数也都很简单,训练的方法都是别人做好的,那我们究竟学的是什么呢。我的老师对此的解释是,网络(课程)的资料就是拐杖,我们先拄拐杖走路,理解了一定的原理了,我们才能有创新。我们需要的不是模仿别人,而是通过学习这些已有的东西来达到创新。
 说完了入门的困惑,后面根据章节简单的梳理一下内容。首先是线性回归、softmax模型和多层感知机。softmax是logistic回归模型在多分类问题上的推广、logistic回归是一种广义的线性回归模型。这些回归模型都是单层的网络,多层感知机,是从含一层隐含层的多层网络讲起。在学习过程中,还要注意概率论,高数,离散数学等多学科内容的交叉,比如全连接层、链式法则(求导)、仿射变换等。不懂的内容及时在网络上回忆起来。第二章讲了两对对应的问题,一个是过拟合与欠拟合的问题及解决办法,一个是梯度消失与梯度爆炸的问题。这些大问题,又分类为许多小问题,比如考虑环境变量引起梯度消失和梯度爆炸。
 路漫漫而修远兮,唯有坚持才能进步,加油!

你可能感兴趣的:(深度学习)