OpenMMLab AI实战营 第一天打卡笔记

1.什么是计算机视觉

  计算机视觉是让计算机去处理图片,视频信息。让计算器能够进行对视频或者图片中的物品进行识别,跟随,分类。就像马斯克所说人类驾驶只需要眼睛,耳朵,多余的传感器未来也很可能被计算机视觉取代。计算机视觉的发展在2012年之后取得了很快的发展,这主要得益于深度卷积网络。

2.OpenMMlab体系简介

  OpenMMLab中一些重要的框架。

  • MMDetection:实现目标检查和分割
  • MMclassification:对目标进行分类
  • MMSegementation:无人驾驶,遥感,医疗影像分析
  • MMPose & MMHuman3D:对动作进行检测
  • MMTracking:对目标进行追踪
  • MMEditing:对图片进行修复,超分辨率,图像生成

目前已成为国际有名的计算机视觉算法库。

3.机器学习与卷积神经网络基础

  机器学习的一般步骤:训练,验证,应用。衡量一个模型的优劣就是损失函数,目标就是一直调参,使损失函数最小,而怎么优化,又有很多不同的算法,比如通过模拟动量的动量优化器。

  DNN与CNN:卷积核在图片上滑动,一个卷积核可以提取一个特征,一个神经网络有大量的卷积操作,目的就是为了尽可能多的提取特征。卷积网络由卷积层,池化层,输出层组成。

你可能感兴趣的:(计算机视觉,深度学习)