【OpenMMLab实战营打卡 - 第 2 课】CV基础和OpenMMLab介绍

第一讲:

【OpenMMLab实战营打卡 - 第 2 课】CV基础和OpenMMLab介绍_第1张图片

计算机视觉的任务:开发一套算法对图像的信息进行数据挖掘。通俗地说,是让计算机学会怎么看图片的学科。

图像分类、检测、分割。

【OpenMMLab实战营打卡 - 第 2 课】CV基础和OpenMMLab介绍_第2张图片

输出结果:输出点的坐标、输出抠图的结果、类别、目标的框等。总之是提取信息

深度学习:卷积 层数越来越多

图神经网络、全卷积神经网络、自然语言处理

人工智能的技术栈在不断更新;

【OpenMMLab实战营打卡 - 第 2 课】CV基础和OpenMMLab介绍_第3张图片

计算机视觉的发展:

计算机视觉是最早的人工智能问题。边缘提取是它的第一步(1964 Larry Roberts),三维提取(1982),人脸检测(2001),现在它们都是opencv的函数了。

传统计算机视觉的基本原理是设计卷积核,来找到图像的特征的过程。这种算法是鲁棒性很低的。ImageNet是李飞飞教授启动的项目,为计算机视觉算法提供了一个庞大的、高质量的图片库。在早期,特征底层不是AI驱动的。2012年开始,AlexNet突破了传统视觉系统的性能,使用深度卷积图形网络。

【OpenMMLab实战营打卡 - 第 2 课】CV基础和OpenMMLab介绍_第4张图片

Facebook的pytorch是最重要的。经过多年的竞争,pytorch在各个领域脱颖而出,是最成熟的框架。OpenMMLab是基于Pytorch搭建的算法框架,封装了很多模型。是CV时代最完整的工具包。

【OpenMMLab实战营打卡 - 第 2 课】CV基础和OpenMMLab介绍_第5张图片
【OpenMMLab实战营打卡 - 第 2 课】CV基础和OpenMMLab介绍_第6张图片

MMDetection是最受欢迎的功能-目标检测

MMDetection3D可以进行3D目标检测

MMClassification目标分类(之后进行水果分类的项目)

MMSegmentation语义分割

MMPose&MMHuman3d人体姿态

MMTracking轨迹检测

MMAction2行为检测

MMOCR 文本检测

MMRazor 模型压缩剪枝

【OpenMMLab实战营打卡 - 第 2 课】CV基础和OpenMMLab介绍_第7张图片

机器学习是数据驱动的,统计学习,从数据中学习经验解决特定问题。

线性分类器:关键问题是寻找分界线/分界面。通过迭代训练,得到完美的分界面。钢铁直男。

感知器:其实也是线性分类器;

机器学习的基本步骤:

训练、验证、应用。验证这一步很重要,其数据不能和训练重合,应用阶段的数据也应该是在训练、验证阶段没用过的。欠拟合:平时没学好,最后也没考好。过拟合:平时学得很好,最后没考好(训练过于严苛,导致细小的瑕疵也学进去了,钻牛角尖)

【OpenMMLab实战营打卡 - 第 2 课】CV基础和OpenMMLab介绍_第8张图片

有很多技巧:早停、数据扩增等等

【OpenMMLab实战营打卡 - 第 2 课】CV基础和OpenMMLab介绍_第9张图片

神经元:

【OpenMMLab实战营打卡 - 第 2 课】CV基础和OpenMMLab介绍_第10张图片

全连接神经网络:把神经元都连接在一起。单个神经元可以实现线性分类,多个神经元叠在一起就可以实现非线性分类了。

损失函数:用来判断分类准确度的,越小越准确

梯度下降算法:用来调整参数w,使得损失函数最小的算法

没听懂的地方:什么是softmax,什么是非线性分类,激活层是干什么的

神经网络的训练流程:计算样本的损失,计算样本损失的梯度,根据梯度信息更新参数

卷积神经网络CNN:专门用来解决计算机视觉问题的

【OpenMMLab实战营打卡 - 第 2 课】CV基础和OpenMMLab介绍_第11张图片

卷积神经网络是解决这两个问题而诞生的,卷积神经网络局部链接(每个卷积核只参与一部分图像),共享权重,大量节约参数,又有效提取了图像的特征。

不同的卷积核的定义特征不同。有的是边缘提取,有的是高斯模糊;卷积核的通道数与输入图像的通道数相同。生成feature map。输出特征图的通道数与卷积核的个数相同。

Pytorch

【OpenMMLab实战营打卡 - 第 2 课】CV基础和OpenMMLab介绍_第12张图片
【OpenMMLab实战营打卡 - 第 2 课】CV基础和OpenMMLab介绍_第13张图片

自动求导 torch.autograd

Kaggle

讲到了一个CUDA环境的配置

【OpenMMLab实战营打卡 - 第 2 课】CV基础和OpenMMLab介绍_第14张图片

你可能感兴趣的:(【OpenMMLab训练营】,计算机视觉,人工智能,图像处理)