计算机视觉与OpenMMLab开源算法体系-Lesson1

1 计算机视觉基础

计算机视觉与OpenMMLab开源算法体系-Lesson1_第1张图片

Classification 图像分类

Classification+Localization 介于分类和检测之间

Object Detection 目标检测

Segmentation 图像分割任务

Semantic Segmentation 语义分割

Instance Segmentation 实例分割

计算机视觉与OpenMMLab开源算法体系-Lesson1_第2张图片
计算机视觉与OpenMMLab开源算法体系-Lesson1_第3张图片

发展时间:

早期萌芽(1960-1980)

统计机器学习与模式识别 (1990~2000)

视觉特征:

计算机视觉与OpenMMLab开源算法体系-Lesson1_第4张图片

ImageNet 大型数据库 (2006)

斯坦福大学的李飞飞教授于 2006 年启动了 ImageNet 项目,旨在为计算机视觉算法研究提供一个大规模、优质的图片数据库, ImageNet 迄今包含约 2 万类,共计约 1500 万张图片。自 2010 年起, ImageNet 官方举办了一年一度的大规模视觉识别挑战赛 ILSVRC,图像分类赛道要求参赛组在一个包含

1000 类别、 100 万张图像的 ImageNet 子集上完成图像分类任务。

初有成效的视觉系统 (~2010)

深度学习的时代 (2012~)

计算机视觉与OpenMMLab开源算法体系-Lesson1_第5张图片

2 OpenMMLab算法体系

总体架构概览

计算机视觉与OpenMMLab开源算法体系-Lesson1_第6张图片

通用:强大的训练器

计算机视觉与OpenMMLab开源算法体系-Lesson1_第7张图片

统一:抽象模块

计算机视觉与OpenMMLab开源算法体系-Lesson1_第8张图片

统一:训练流程

计算机视觉与OpenMMLab开源算法体系-Lesson1_第9张图片

3 机器学习以及卷积神经网络基础知识

机器学习解决办法3步骤:

(1)训练

(2)验证

(3)应用

神经网络:

衡量神经网络的性能:损失函数

计算机视觉与OpenMMLab开源算法体系-Lesson1_第10张图片

调整w,降低损失函数的值:梯度下降算法

计算机视觉与OpenMMLab开源算法体系-Lesson1_第11张图片

神经网络训练流程:

(1)计算样本的损失

(2)计算样本损失的梯度

(3)根据梯度信息更新参数

欠拟合、拟合、过拟合:

计算机视觉与OpenMMLab开源算法体系-Lesson1_第12张图片

早停:

计算机视觉与OpenMMLab开源算法体系-Lesson1_第13张图片

如何理解Batch:

batch就是一批,你作为向量的一组

Batch大小是一个超参数,用于定义在更新内部模型参数之前要处理的样本数。将批处理视为循环迭代一个或多个样本并进行预测。在批处理结束时,将预测与预期输出变量进行比较,并计算误差。从该错误中,更新算法用于改进模型,例如沿误差梯度向下移动。训练数据集可以分为一个或多个Batch。当所有训练样本用于创建一个Batch时,学习算法称为批量梯度下降。当批量是一个样本的大小时,学习算法称为随机梯度下降。当批量大小超过一个样本且小于训练数据集的大小时,学习算法称为小批量梯度下降。

你可能感兴趣的:(计算机视觉,算法,人工智能)