深度学习中的图片对象

自2012年,AlexNet在ImageNet图像识别一战成名后,基于深度学习的图像识别快速发展。

图像识别也是深度学习研究的主要领域。

本文解释在机器角度,图片的存在形式,这也是图片在深度学习的输入对象。

单通道图片


单通道图片/灰度图在计算机中以数字的形式存储,数值范围在0-255(0是暗色,255是亮色)

深度学习中的图片对象_第1张图片

三通道图片


彩色图像通常由几个叠加的彩色通道构成。
例如,平时常见的图片一般都是RGB图片,即由红色、绿色、蓝色三个通道组成的图片,在表达每个像素点时用三个值表示,每个值取0~255。

可以把这三个值理解为各种颜色的深度,比如(0,255,0)就是绿色,是最深的那种绿色,比如(255,255,255)就是白色,因为红绿蓝组合一起就是白色

例如下图是一张的RGB图片,对应到计算机上是三张数据表,每张表有个数值。位置(i,j)的值为分别取三张表位置(i,j)的值组成

深度学习中的图片对象_第2张图片

你可能感兴趣的:(深度学习中的图片对象)