图像操作中的上采样、下采样,过采样、欠采样等

9## 介绍
提前声明一点,过采样和欠采样是针对一组图像数据集来说的,而上采样和下采样是对与单张图片来说的。
1.过采样和前采样:
欠采样(undersampling):当数据不平衡的时,比如样本标签1有10000个数据,样本标签0有6000个数据时,为了保持样本数目的平衡,可以选择减少标签1的数据量,这个过程就叫做欠采样。
**过采样(oversampling)**减少数据量固然可以达到以上效果,并且在一定程度上防止过拟合,但是这也牺牲了数据,因此存在另一种增加样本的采样方法,也就是增加标签0的样本数,最经典的过采样算法就是SMOTE,这里就不深入介绍了。

  1. 上采样和下采样:
    这是针对一张图片来说的:重采样分为上采样和下采样
    下采样(downsampling or subsampling ): 缩小图像(或称为下采样(subsampled)或降采样(downsampled))的主要目的有两个:1、使得图像符合显示区域的大小;2、生成对应图像的缩略图。
    **上采样(upsampling)**原理:图像放大几乎都是采用内插值方法,即在原有图像像素的基础上在像素点之间采用合适的插值算法插入新的元素。无论缩放图像(下采样)还是放大图像(上采样),采样方式有很多种。如最近邻插值,双线性插值,均值插值,中值插值等方法。在AlexNet中就使用了较合适的插值方法。各种插值方法都有各自的优缺点。

你可能感兴趣的:(计算机视觉)