augmentor

作为一个图像处理,以及计算机视觉领域的一个小兵,在使用深度学习算法的过程中经常需要写一些图像增强的simple code。虽然不同的计算框架多多少少的都实现了不同的数据增强方法,但是个人认为使用起来还不是很方便,难以满足需求。尤其是涉及到一些相对“复杂”的数据增强手段,例如,物体检测,关键点检测,语义分割等任务,对图像做矩阵操作的同时还需要对标注信息做变换。
自己实现的方法用起来也会顺手一些,可控性也更高。
所以,自己构建了一个小小的augmentor,主要依赖于opencv和numpy。

下面我们来逐步,看一下这个小小的augmentor。

工程地址git

从pytorch tutorial中下载数据 facedata,
并解压到工程目录下:

看一下图像augmentor_第1张图片
依次是原始图像,旋转,带label旋转,仿射变换,heatmap,img_drop,blur,padding 和mirror。
图像变换可以插入到你的data flow 的图像增强管道里,随着更多的需求,这个小lib会支持更多的图像变换。
还有一些颜色,对比度等的变化,一般框架都支持,就不在多做重复工作。

原理上也没有很复杂,只是简单的矩阵运算,细节以及使用方法,在test.py

你可能感兴趣的:(DL)