对深度学习算法的基本框架直观理解

本文想谈一谈深度学习算法的基本框架,认识其框架能有助于对深度学习算法的直观理解。

深度学习就是实现基于输入数据构造出合适的模型,从而可以用构造的模型来实现对新数据的预测。

比如猫的识别,深度学习算法就要基于输入的图片+标签(指明图片是否包含猫)来构造一个模型,从而使得当用户随意输入一张图片到该模型,其能判断该图片是否包含猫。

深度学习算法包括以下几个框架

  • 模型假设
    模型本质上就是函数,其实模型假设就是你来假设一个数据之间的函数关系。但这个模型还只是个框架,模型中还会有些待确定的参数W。

    针对不同的数据,可能会有不同的函数关系,所以需要不同的模型假设。这里举几个模型的例子,比如线性模型,逻辑回归模型,神经网络模型,广泛应用于图像领域的卷积神经网络模型CNN, 应用于语言识别的循环神经网络模型RNN。

    其实模型假设是深度学习算法的灵魂,这也是学习深度学习的关键之处。因为,只有构造出和数据之间函数关系贴近的模型才能最好的实现对数据的预测功能。

  • 模型评价
    构造了一个模型,我们需要有一个指标来评价这个模型的好坏,通常这个指标是关于模型参数的一个函数,称为损失函数。损失越小表示模型越好。

  • 优化算法
    既然损失越小模型越好,那我们需要一个优化的算法来更新模型参数W,使损失函数取得最小值,这就是优化算法,常用的就是梯度下降法。

总而言之,对于深度学习算法的最基础的学习,其实主要是对模型的学习,这也是难点,而模型评价函数常用的只有几个,优化算法常用也是只有几个。

你可能感兴趣的:(人工智能,人工智能,深度学习)