深度学习试图模仿人脑,尽管与大脑的能力相去甚远,使其能够从大量数据中“学习”。
旨在使系统能够以难以置信的准确度对数据进行聚类并做出预测。
深度学习是机器学习的一个子集,它本质上是一个三层或更多层的神经网络,虽然单层的神经网络仍然可以进行近似预测,但额外的隐藏层可以帮助优化和改进准确性。
深度学习驱动了许多人工智能 (AI)应用程序和服务,这些应用程序和服务可提高自动化、执行分析和物理任务而无需人工干预。
深度学习技术支持日常产品和服务(例如数字助理、支持语音的电视遥控器和信用卡欺诈检测)以及新兴技术(例如自动驾驶汽车)。
如果深度学习是机器学习的一个子集,它们有什么区别?
深度学习与经典机器学习的区别在于它使用的数据类型和学习方法。
机器学习算法利用结构化的标记数据进行预测——这意味着从模型的输入数据中定义特定特征并组织到表格中。
这并不一定意味着它不使用非结构化数据,通常会通过一些预处理将其组织成结构化的格式。
深度学习消除了机器学习通常涉及的一些数据预处理。
这些算法可以摄取和处理非结构化数据,如文本和图像,并自动提取特征,消除对人类专家的一些依赖。例如,假设我们有一组不同宠物的照片,我们想按“猫”、“狗”、“仓鼠”等进行分类。
深度学习算法可以确定哪些特征(例如耳朵)对于区分每只动物最重要。而不像在机器学习中,这种特征层次结构是由人类专家手动建立的。
然后,通过梯度下降和反向传播的过程,深度学习算法调整和适应自身的准确性,使其能够以更高的精度对动物的新照片进行预测。
机器学习和深度学习模型也能够进行不同类型的学习,通常分为监督学习、无监督学习和强化学习。
监督学习利用标记数据集进行分类或进行预测;需要某种人工干预来正确标记输入数据。相比之下,无监督学习不需要标记数据集,而是检测数据中的模式,并通过任何可区分的特征将它们聚类。强化学习是一个过程,在这个过程中,模型学习变得更加准确,以便根据反馈在环境中执行动作,以最大化奖励。
深度学习神经网络或人工神经网络试图通过数据输入、权重和偏差的组合来模仿人脑。这些元素协同工作以准确识别、分类和描述数据中的对象。
深度神经网络由多层互连节点组成,每一层都建立在前一层之上,以细化和优化预测或分类。通过网络进行的这种计算过程称为前向传播。深度神经网络的输入和输出层称为可见 层。输入层是深度学习模型摄取数据进行处理的地方,输出层是进行最终预测或分类的地方。
另一个称为反向传播的过程 使用诸如梯度下降之类的算法来计算预测中的误差,然后通过向后移动层以训练模型来调整函数的权重和偏差。前向传播和反向传播一起使神经网络能够做出预测并相应地纠正任何错误。随着时间的推移,算法逐渐变得更加准确。
上面用最简单的术语描述了最简单的深度神经网络类型。
然而,深度学习算法极其复杂,并且有不同类型的神经网络来解决特定的问题或数据集。
例如:
卷积神经网络CNN,主要用于计算机视觉和图像分类应用程序,可以检测图像中的特征和模式,从而实现目标检测或识别等任务。2015 年,CNN 首次在物体识别挑战中击败了人类。
循环神经网络RNN,通常用于自然语言和语音识别应用程序,因为它利用顺序或时间序列数据。
现实世界的深度学习应用程序是我们日常生活的一部分,但在大多数情况下,它们很好地集成到产品和服务中,以至于用户不知道在后台进行的复杂数据处理。其中一些示例包括:
执法
深度学习算法可以分析交易数据并从中学习,以识别表明可能存在欺诈或犯罪活动的危险模式。语音识别、计算机视觉和其他深度学习应用可以通过从录音、视频、图像和文档中提取模式和证据来提高调查分析的效率和有效性,帮助执法部门更快、更准确地分析大量数据。
金融服务
金融机构经常使用预测分析来推动股票的算法交易、评估贷款批准的业务风险、检测欺诈并帮助管理客户的信贷和投资组合。
客户服务
许多组织将深度学习技术纳入其客户服务流程。聊天机器人——用于各种应用程序、服务和客户服务门户——是一种简单的人工智能形式。传统的聊天机器人使用自然语言甚至视觉识别,常见于类似呼叫中心的菜单中。然而,更复杂的聊天机器人解决方案试图通过学习来确定是否对模棱两可的问题有多种回答。根据收到的回复,聊天机器人会尝试直接回答这些问题或将对话路由给人类用户。
Apple 的 Siri、Amazon Alexa 或 Google Assistant 等虚拟助手通过启用语音识别功能扩展了聊天机器人的概念。这创造了一种以个性化方式吸引用户的新方法。
卫生保健
自从医院记录和图像数字化以来,医疗保健行业从深度学习能力中受益匪浅。图像识别应用程序可以支持医学影像专家和放射科医生,帮助他们在更短的时间内分析和评估更多图像。
深度学习硬件要求
深度学习需要大量的计算能力。高性能图形处理单元CPU是理想的选择,因为它们可以在具有大量可用内存的多核中处理大量计算。但是,在本地管理多个 GPU 会对内部资源产生大量需求,并且扩展成本高得令人难以置信。