深度学习基础知识了解

深度学习应用

  • 1.计算机视觉
  • 2.自然语言处理
  • 3.强化学习

1.计算机视觉

图片识别(Image Classification) 是常见的分类问题。神经网络的输入为图片数据,输出 值为当前样本属于每个类别的概率,通常选取概率值最大的类别作为样本的预测类别。图 片识别是最早成功应用深度学习的任务之一,经典的网络模型有 VGG 系列、Inception 系 列、ResNet 系列等。
目标检测(Object Detection)
是指通过算法自动检测出图片中常见物体的大致位置,通 常用边界框(Bounding box)表示,并分类出边界框中物体的类别信息,如图 1.15 所示。常 见的目标检测算法有 RCNN,Fast RCNN,Faster RCNN,Mask RCNN,SSD,YOLO 系列 等。
③**语义分割(Semantic Segmentation) 是通过算法自动分割并识别出图片中的内容,可以 将语义分割理解为每个像素点的分类问题,分析每个像素点属于物体的类别,如图 1.16 所 示。常见的语义分割模型有 FCN,U-net,SegNet,DeepLab 系列等。
视频理解(Video Understanding) 随着深度学习在 2D 图片的相关任务上取得较好的效 果,具有时间维度信息的 3D 视频理解任务受到越来越多的关注。常见的视频理解任务有 视频分类,行为检测,视频主体抽取等。常用的模型有 C3D,TSN,DOVF,TS_LSTM 等。
图片生成(Image Generation) **通过学习真实图片的分布,并从学习到的分布中采样而获 得逼真度较高的生成图片。目前主要的生成模型有 VAE 系列,GAN 系列等。其中 GAN 系 列算法近年来取得了巨大的进展,最新 GAN 模型产生的图片样本达到了肉眼难辨真伪的 效果,

2.自然语言处理

①**机器翻译(MachineTranslation) 过去的机器翻译算法通常是基于统计机器翻译模型,这 也是 2016 年前 Google 翻译系统采用的技术。2016 年 11 月,Google 基于 Seq2Seq 模型上 线了 Google 神经机器翻译系统(GNMT),首次实现了源语言到目标语言的直译技术,在多 项任务上实现了 50~90%的效果提升。常用的机器翻译模型有 Seq2Seq,BERT,GPT, GPT-2 等,其中 OpenAI 提出的 GPT-2 模型参数量高达 15 亿个,甚至发布之初以技术安全 考虑为由拒绝开源 GPT-2 模型。
聊天机器人(Chatbot) **聊天机器人也是自然语言处理的一项主流任务,通过机器自动与 人类对话,对于人类的简单诉求提供满意的自动回复,提高客户的服务效率和服务质量。 常应用在咨询系统、娱乐系统,智能家居等中。

3.强化学习

①**虚拟游戏 相对于真实环境,虚拟游戏平台既可以训练、测试强化学习算法,有可以避 免无关干扰,同时也能将实验代价降到最低。目前常用的虚拟游戏平台有 OpenAI Gym, OpenAI Universe,OpenAI Roboschool,DeepMind OpenSpiel,MuJoCo 等,常用的强化学 习算法有 DQN,A3C,A2C,PPO 等。在围棋领域,DeepMindAlaphGo 程序已经超越人 类围棋专家;在 Dota2 和星际争霸游戏上,OpenAI 和 DeepMind 开发的智能程序也在限制 规则下战胜了职业队伍。
机器人(Robotics) 在真实环境中,机器人的控制也取得了一定的进展。如 UC Berkeley 在机器人的 Imitation Learning,Meta Learning,Few-shot Learning 等方向取得了不少进展。 美国波士顿动力公司在人工智能应用中取得喜人的成就,其制造的机器人在复杂地形行 走,多智能体协作等任务上表现良好。
自动驾驶(Autonomous Driving) **被认为是强化学习短期内能技术落地的一个应用方 向,很多公司投入大量资源在自动驾驶上,如百度、Uber,Google 无人车等,其中百度的 无人巴士“阿波龙”已经在北京、雄安、武汉等地展开试运营。

你可能感兴趣的:(深度学习,自然语言处理,自动驾驶,机器学习)