开发者分享|『啃书吧:深度学习与MindSpore实践』第一章

在MindSpore21天实战营结业答辩上,我夸下海口要做一个读《深度学习和MndSpore实践》的项目。立的Flag自己要吃下去,今天便推出第一篇。

望着满纸的长长的数学公式、不明觉厉的专业术语,大段大段的代码,我一个小白真是头大如斗。那为什么还要炸着胆子跳到这么深的大坑里呢?主要有两个原因:

1、坚定自己坚持下去决心。心中感念被人监督,行动上会克服惰性和恐惧。

2、独学而无友,则孤陋而寡闻。知识到底学没学到,自己的感觉不可靠。写出来请大家指导,进步尽量踩实一点。这次上21天实战营给我带来的提高比此前2年要多得多。我希望能够延续这个势头。

我现在还有两本《深度学习和与MindSpore实践》,有需要的小伙伴可以联系我。

闲话到此,以下干货。

啃书进度会在目录中标出来。今天的目标是完成第一章。

开发者分享|『啃书吧:深度学习与MindSpore实践』第一章_第1张图片

先来梳理一下这本书的整体脉络。

  • 第一章是通识性介绍,包括AI发展的几个阶段和代表技术,以及MindSpore的主要特点。  

  • 第二章到第四章,深度学习和深度网络的基础知识。

  • 第五章到第十一章,各种深度学习模型。这里有实战营里讲到的ResNet,BERT。没有听说过的更多,GAT,DQN,AutoML……。这部分是实践的主要载体,也应该是最难的部分。

  • 第十二章到第十四章,介绍MindSpore其他功能,像端云协同、可视化,以及数据的组织形式。

下面划第一章的重点,都是浅白文字描述,没有理解障碍。全部背下来,够我咋唬一气了。

第一章 引言

1.1 人工智能的历史变迁

1956年夏季达特茅斯人工智能研究会上,约翰•麦卡锡等人首次将不同领域中出现的”类人计算“”机器智能“等描述进行了统一,正式提出”人工智能“这一术语,明确了人工智能的首要使命是运用算法构建动态计算环境来模拟人类智能。早期技术有很大局限性,在实际应用中表现不尽如人意。另一方面,代表神经网络的感知机(Perception)理论一度受到强烈抨击,导致第一次人工智能进入第一轮寒冬。

20世纪80年代末,专家系统应运而生,研究者希望机器像人一样进行逻辑推理,进而模仿人的认知过程。因为专家系统需要昂贵的计算平台,随着个人计算机性能的不断提升,专家系统逐渐被价格低廉的个人计算机取代。人工智能进入第二轮寒冬。

从20世纪90年代开始,计算机运算能力呈指数级增长,各种机器学习算法得以快速验证、训练和应用。支持向量机(Support Vector Machine,SVM)、Boosting、Kernel等机器学习方法在数字识别、股票预测、情感分类、点击率预测等实际应用中取得了优异的表现。1997年,IBM公司的深蓝战胜了当时的国际象棋冠军卡斯帕罗夫,重燃了人们对人工智能的信心。

本轮热潮中,最具价值也是最具影响力的一项研究当属深度学习。深度学习得益于大数据的不断积累和计算机的飞速发展。海量数据解决了神经网络训练的过拟合问题,而高性能的硬件设备让模型训练成为可能。

人工智能广泛融入各个行业的实际应用,涉及计算机视觉、自然语言理解、语音识别、智能游戏等多个领域。

1.2 什么是深度学习

深度学习是使用多层结构从原始数据中自动学习并提取高层次特征的一类机器学习算法

深度学习将原始的数据表示成一个嵌套的特征层级,每层特征均可以由更简单的特征来定义和计算。尤为重要的是,深度学习可以自动地学习如何最优地将不同的特征置于哪一层。重点:传统机器学习算法需要提供人工定义的特征,深度学习可以自己学习如何提取特征

绝大多数深度学习模型以人工神经网络(Artificial Neural Network,ANN)为基础构建的。一个人工神经网络是由一个相互连接的被叫作神经元的单元组成的集合。神经元以层的形式被组织起来,不同的层对输入做不同的变换来获得不同层次的抽象和特征提取。不同的神经元之间的连接被赋予不同的权重,代表了一个神经元对另一个神经元的影响。

目前最典型的深度学习模型框架是前向神经网络(Feedforward Neural Network),也叫多层感知机(Multi Layer Perception, MLP)

整个结构中没有反馈连接,信息流是前向传递的(输入数据开始、经过中间层的计算,得到最终输出)

实际应用:卷积神经网络(Converlution Neural Network, CNN)

当前向神经网络被拓展到允许反馈连接时,被叫做循环神经网络(Recurrent  Neural Network,RNN)。

1.3 深度学习的现实应用

  • 1.3.1 自动语音识别(Automatic Speech Recognition, ASR)

将语音转换成文本的技术 。在深度学习模型出现之前:主流模型是隐马尔可夫模型(Hidden Markov Models, HMM)。目前主流深度学习模型是长短期记忆网络(Long Short Term Memory, LSTM),它是RNN的变种

  • 1.3.2 图像识别

图像识别是深度学习最成功的应用之一。深度学习在计算机视觉领域的突破发生在2012年,Hinon教授的研究小组利用卷积神经网络架构(AlexNet)大幅降低了ImageNet ILSVRC挑战中图像分类任务的错误率并取得冠军。之后不断有新的基于卷积神经网络的架构被提出,包括GoogleNet,VGGNet,ResNet,DenseNet和Inception。

深度学习也被应用于其他计算机视觉任务中,包括目标检测、图像分割、图像标注、行为分析、人脸识别,以及生成对抗网络(Generative Adversarial Network,GAN)的图形风格迁移、视频生成等。

起关键作用的是深度学习模型当属深度卷积神经网络。卷积神经网络中最重要的操作是卷积和池化。爱益于参数共享和稀疏连接,卷积神经网络非常适合处理图像数据。通过堆叠很多层,卷积神经网络可以不断地从低层特征中提取更高层的特征。

  • 1.3.3 自然语言处理

任务:成分解析、情感分析、信息抽取、机器翻译、文本分类

一项重要成果就是词向量学习。词向量可以看作是一种运用深度神经网络将词转换成隐含空间中的一个向量化的位置表示的方法。将词向量作为循环神经网络的输入,能有效利用合成式的向量语法对句子和短语进行解析。合成式的向量语法可以被认为是同循环神经网络实施的上下文无关的概率语法。

近年来,新的深度神经网络结构(如Transformer)也不断被提出,它们通过学习文本序列中的长期依赖和分层结构,在自然语言处理的任务上取得了显著的效果。

基于预训练的无监督模型,如建立在Transformer基础上的BERT(Bidirectional Encoder Representations from Transformers)模型,采用迁移学习和微调的方法,进一步刷新深度学习方法在自然语言处理任务上的技术 前沿。

  • 1.3.4 其他领域

生物:细胞图像分类,建立 基因组连接,加速药物开发

医疗:深度卷积神经网络被应用于癌细胞分类、病变检测、器官分割和图像增强等医疗图像分析任务

金融:欺诈检测、洗钱、模拟交易员行为,完成选股、择时、风控等较为复杂的任务、异常检测和信用评分等领域。

1.4 本书(各章)的组织 架构

理论:介绍深度学习的各类模型和算法

应用:在实际中的使用和表现

实践:用Mindspore实现模型

1.5 Mindspore简介

编程简单

端云协同

调试轻松

性能卓越

开源开放

今天先到这。感觉人工智能真是充满了韧性。感知机倒下了,多层感知机成功了,还变化出无穷花样。在哪里跌倒,在哪里爬起来,这种锲而不舍的精神正是人工智能不断前进的动力,真是大写的服。

你可能感兴趣的:(技术博客,深度学习,人工智能,机器学习)