CNN学习笔记——图像分类

CNN学习笔记——图像分类

笔记参考来源:CS231n课程笔记翻译 图像分类笔记

1、什么是图像分类

对于输入图像,从已有的固定标签集合中找出一个分类标签给该输入图像。

Eg. 比如图像是一只猫,就将猫作为该图像的标签。

2、计算机视觉难点

由于物体的大小、视角、形变、遮挡、光照条件、背景等干扰

3、解决方法

数据驱动方法:给计算机很多数据,实现学习算法,让计算机学习到每个类的外形。

4、流程

输入:输入训练集

学习:训练分类器

评价:让分类器预测未曾见过的图像,并且将预测标签真实标签对比。

5、具体分类器:K-NN分类器

流程:将测试图像和训练集中的每一张图像作比较,找出最相似的K张。在这K张的label中,找出最多的label类型给这张测试图。

(1)如何比较?

方法一:L1距离
在这里插入图片描述
将测试图像和训练图像的像素值相减的绝对值。如下图所示。
CNN学习笔记——图像分类_第1张图片
方法二:L2距离
在这里插入图片描述

(2)如何确定K值?

将训练集又分为训练集和验证集,在训练集中尝试不同的K值进行分类器训练,得到的分类器在验证集上验证结果。查看哪一个K值得分类效果最好,用最好的K值来跑真正的测试集。

!!!一定一定不能用测试集来调优 原因:如果用测试集调优的话,会造成过拟合(算法看起来效果不错,但性能会低于预期。相当于将测试集当做训练集,结果自然是看起来很好,但实际效果差很多)

(3)如何分训练集和验证集?

方法:交叉验证

将训练集分成5分,将这5份循环着取其中4份做测试集,1份做验证集。进行(2)中的K值得确定,将得到的5个K值取平均,得到最终的K值。

6、K-NN分类器的优劣

优势

(1)易于理解,实现简单。

(2)训练不需花时间。

劣势

(1)花大量时间进行测试图像和所有训练图像对比

(2)更多是基于背景的分类(原始像素比较),而不是语义的分类。

你可能感兴趣的:(CNN学习笔记,CNN,图像分类,CNN学习笔记)