计算机视觉算法基础与OpenMMLab介绍-笔记

CV的任务

分类 :属于哪一类物体

检测 (目标检测 关键点检测):每个物体用框框起,并注明名称

分割(语义分割 实例分割):后者需要区分每一个物体

后三者需要精准的定位图像上的每一个像素点

OpenMMLab

是深度学习时代最完整的计算机视觉算法体系,基于pytorch研发,总体架构概览如下图,可以大大节省论文阅读时间,更快捷的去了解一个领域的相关内容

机器学习和神经网络简介

机器学习的基础

让计算机从数据中学习经验,以解决特定问题

为什么要让机器学习呢,人脸识别、机器翻译、语音识别、强化学习这些可以看出,不同的数据模态对应不同的算法,考虑到问题的复杂度以及算法的鲁棒性,让机器从大量的数据中学习,通过数据驱动的方法去学习、去拟合、去归纳、去挖掘,从而可以解决复杂问题。

机器学习的典型范式包括:监督学习(有lable)、无监督学习(无 lable)、强化学习(自己去适应环境)、自监督学习(计算机自己找lable)

机器学习中的分类问题

例如对于垃圾信件的分类,垃圾邮件分类器首先提取、统计关键词,形成词频向量,用词频向量代表一个文本,成为特征。也就是说把不同的数据模态(语音、文字、图片)转成向量(特征),再由向量特征去学习n维空间的一个决策(分类)边界,如果拟合出来的分类边界是一条直线,称为线性分类器(假设类别和特征之间存在某种线性关系,即不同类的数据在特征空间中可以被一条线分开)。

计算机视觉算法基础与OpenMMLab介绍-笔记_第1张图片

W是权重向量

关键是如何求分界面,用标注的数据去预测得到损失函数的值,再按照使得损失函数最小化的方向去迭代的优化这些权重,然后经过随机梯度下降的不断的迭代训练最终收敛得到一个完美的决策边界。感知器算法(神经网络的雏形)其实也是一个线性分类器,可以作为神经元的一个基础单位。

机器学习的基本流程如下:

计算机视觉算法基础与OpenMMLab介绍-笔记_第2张图片

在训练集(平时的考试题)上训练,再拿到验证集(高考题)上去验证或者是拿到测试集上去评估,最后把它部署到真实的应用场景里。

神经网络

一种拟合能力很强的函数,是非线性分类器

神经元的构成如下:

计算机视觉算法基础与OpenMMLab介绍-笔记_第3张图片
计算机视觉算法基础与OpenMMLab介绍-笔记_第4张图片

神经网络是通过反向传播和梯度下降来求解的

基于梯度下降算法寻找最优参数,进而得到最优(性能最好)的网络

计算机视觉算法基础与OpenMMLab介绍-笔记_第5张图片

你可能感兴趣的:(计算机视觉,算法,深度学习)