神经网络学习引入-图像分类的基本概述

1. Motivation动机

尽管图像分类听起来很简单,但是它在现实中有大量的应用场景。
许多明显是计算机视觉的任务都可以被简化成图像分类问题。

2.挑战

图片分类问题主要存在的挑战有:
多视角问题(viewpoint variation):同一个物体的不同角度看到的图片
大小多样化问题(scale variation):同一种类的个体存在大小的差异
变形问题(deformation):研究的物体可能不是严格意义上不变的,会有多种呈现方式
遮挡问题(occlusion):研究的物体在图片中可能只有一小部分被看见
光线问题(illumination conditions):不同的光照强度会对图片像素产生巨大的影响
保护色问题(background clutter):研究的物体可能会和背景十分相似,混为一体
内部多样性问题(intra-class variation):研究的物体本身可能包含多种不同特征的个体
神经网络学习引入-图像分类的基本概述_第1张图片

3.数据驱动方法

我们将会为计算机提供不同种类个体的大量样本,然后使用一个学习算法来“看”这些样本,试图学习不同种类的视觉特点。这样的方法被称为数据驱动方法,因为它依赖于最初的有监督训练数据的学习积累。

4.图像分类流程

输入—>学习—>预测

你可能感兴趣的:(CS231n学习笔记)