YUV原理和格式详解

什么是YVU?

YUV是指亮度参数和色度参量分开表示的像素格式,其中“Y”表示明亮度(Luminance或Luma),也就是灰度值;而“U”和“V”表示的则是色度(Chrominance或Chrima),作用是描述色彩及饱和度,用于指定像素的颜色。
Y:亮度分量,表示物理线性空间亮度。
U:蓝色投影。
V:红色投影。
YUV同RGB 类似,也是一种颜色编码方法,主要用于电视系统以及模拟视频领域,它讲亮度信息(Y)与色彩信息(UV)分离,没有UV信息一样能够显示完整的图像,只不过是黑白色的。YUV不像RGB那样需要三个独立的视频信号同时传输,YUV通过一些压缩手段,子啊用YUV传输时,占用的频带就减小了很多。
有些地方还会有 YCbCr或者YPbPr 来表示,其实概念都是一样的 。 在DVD中,色度信号被存储成Cb和Cr(C表颜色,b代表蓝色,r表示红色) 。

YUV压缩的原理

由于我们的眼睛中视网膜杆细胞多余视网膜的锥细胞,而视网膜的杆细胞时识别亮度的,锥细胞是识别色度的,所以我们的眼睛对于明暗的分辨要比对演示的分辨精细,也就是对亮度的敏感程度大于色度的敏感程度。 YUV模式就是利用这一特点,通过缩减色度采样以减少数据量,并且图像质量不会明显下降的色彩模式,其在采样时会保留每个像素的Y分量,但会适当丢弃UV分量。数据量通常会比RGB要小,因此常用于视频传输。YUV按照采样方式通常分为YUV444YUV422YUV420YUV411,按照存储方式可分为Planar、Packed、SemiPlanar,而Y、U、V每个通道变量通常可以为8位、10位、16位,不同的组合方式也使YUV出现了各种各样的类型。

YUV的采集方式

YUV 4:4:4 采样

YUV 4:4:4 采样,意味着 Y、U、V 三个分量的采样比例相同,因此在生成的图像里,每个像素的三个分量信息完整,都是 8 bit,也就是一个字节。
如下图所示:YUV 4:4:4 采样,意味着 Y、U、V 三个分量的采样比例相同,因此在生成的图像里,每个像素的三个分量信息完整,都是 8 bit,也就是一个字节。
Y 分量用叉表示,UV 分量用圆圈表示。
YUV原理和格式详解_第1张图片

可以看到这种采样方式的图像和 RGB 颜色模型的图像大小是一样,并没有达到节省带宽的目的,当将 RGB 图像转换为 YUV 图像时,也是先转换为 YUV 4:4:4 采样的图像。
举个例子:
假如图像像素为:[Y0 U0 V0]、[Y1 U1 V1]、[Y2 U2 V2]、[Y3 U3 V3]
那么采样的码流为:Y0 U0 V0 Y1 U1 V1 Y2 U2 V2 Y3 U3 V3
最后映射出的像素点依旧为 [Y0 U0 V0]、[Y1 U1 V1]、[Y2 U2 V2]、[Y3 U3 V3]
有多少个Y分量,就有多少个UV分量.
一张 1280 * 720 大小的图片,在 YUV 4:4:4 采样时的大小为:
12807208/8/1024/1024 =2.63MB

YUV 4:2:2 采样

YUV 4:2:2 采样,意味着 UV 分量是 Y 分量采样的一半,Y 分量和 UV 分量按照 2 : 1 的比例采样。如果水平方向有 10 个像素点,那么采样了 10 个 Y 分量,而只采样了 5 个 UV 分量。
Y 分量用叉表示,UV 分量用圆圈表示。
YUV原理和格式详解_第2张图片

举个例子:
假如图像像素为:[Y0 U0 V0]、[Y1 U1 V1]、[Y2 U2 V2]、[Y3 U3 V3]
那么采样的码流为:Y0 U0 Y1 V1 Y2 U2 Y3 V3
其中,每采样过一个像素点,都会采样其 Y 分量,而 U、V 分量就会间隔一个采集一个。
最后映射出的像素点为 [Y0 U0 V1]、[Y1 U0 V1]、[Y2 U2 V3]、[Y3 U2 V3]
采样的码流映射为像素点,还是要满足每个像素点有 Y、U、V 三个分量。但是可以看到,第一和第二像素点公用了 U0、V1 分量,第三和第四个像素点公用了 U2、V3 分量,这样就节省了图像空间。
一张 1280 * 720 大小的图片,在 YUV 4:2:2 采样时的大小为:
(1280 * 720 * 8 + 1280 * 720 * 0.5 * 8 * 2)/ 8 / 1024 / 1024 = 1.76 MB 。

YUV 4:2:0 采样

YUV 4:2:0 采样,并不是指只采样 U 分量而不采样 V 分量。而是指,在每一行扫描时,只扫描一种色度分量(U 或者 V),和 Y 分量按照 2 : 1 的方式采样。比如,第一行扫描时,YU 按照 2 : 1 的方式采样,那么第二行扫描时,YV 分量按照 2:1 的方式采样。对于每个色度分量来说,它的水平方向和竖直方向的采样和 Y 分量相比都是 2:1
Y 分量用叉表示,UV 分量用圆圈表示。
YUV原理和格式详解_第3张图片

举个例子:
假设图像像素为:
[Y0 U0 V0]、[Y1 U1 V1]、 [Y2 U2 V2]、 [Y3 U3 V3][Y5 U5 V5]、[Y6 U6 V6]、 [Y7 U7 V7] 、[Y8 U8 V8]
那么采样的码流为:Y0 U0 Y1 Y2 U2 Y3 Y5 V5 Y6 Y7 V7 Y8
其中,每采样过一个像素点,都会采样其 Y 分量,而 U、V 分量就会间隔一行按照 2 : 1 进行采样。
最后映射出的像素点为:
[Y0 U0 V5]、[Y1 U0 V5]、[Y2 U2 V7]、[Y3 U2 V7][Y5 U0 V5]、[Y6 U0 V6]、[Y7 U2 V7]、[Y8 U2 V8]
从映射出的像素点中可以看到,四个 Y 分量是共用了一套 UV 分量,而且是按照 2*2 的小方格的形式分布的,相比 YUV 4:2:2 采样中两个 Y 分量共用一套 UV 分量,这样更能够节省空间。
一张 1280 * 720 大小的图片,在 YUV 4:2:0 采样时的大小为:
(1280 * 720 * 8 + 1280 * 720 * 0.25 * 8 * 2)/ 8 / 1024 / 1024 = 1.32MB 。

YUV的存储格式

Packed(打包格式):连续存储每个像素点的Y、U、V分量,丢弃的分量不存储。
YUV422形如YUYV YUYV YUYV YUYV
YUV420形如YUYYUY YVYYVY
planar(平面格式):先存储所有像素点的Y分量,在存储所有像素点的U分量,最后存储所有像素点的V分量。
YUV422形如YYYYYYYY UUUU VVVV
YUV420形如YYYYYYYY UU VV
Semiplanar(半平面格式):先存储所有像素点的Y分量,在交错存储U、V分量
YUV422形如YYYYYYYY UVUVUVUV
YUV420形如YYYYYYYY UVUV

Planar 平面格式

平面格式有时也称为三面格式(Triplanar),即 Y, U, V 三个分量各自使用单独的数组保存,这种三平面分离的格式比较方便视频编码。
YV12 (I420)
YV12 : 亮度(行×列) + V(行×列/4) + U(行×列/4)
I420 : 亮度(行×列) + U(行×列/4) + V(行×列/4)
可以看出,YV12和I420基本上是一样的,就是UV的顺序不同。
YV12 即 I420,也叫 IYUV,属于 YUV420P 格式。三个平面,分别存储 Y U V 分量。每四个 Y 分量共享一组 UV 分量。U、V 平面的 strides, width 和 height 都是 Y 平面的一半,因此一个像素 12 bits,内存排列如下图所示:
YUV原理和格式详解_第4张图片

从图中可看出,U、V 平面的每行字节数(strides)、高(height)都是 Y 平面的一半。I420 是音视频开发中常用的一种格式。
J420
J420 与 I420 完全相同,但具有完整范围(0-255,full range)的亮度(Y)分量,而不是有限范围(16-240,limited range,在 iOS 上也叫做 video range)。色度(UV)分量与 I420 中的完全相同。
IMC1
IMC1 与 I420 类似,U, V 平面的宽(width)、高(height)是 Y 平面的一半,但是每行字节数(strides)与 Y 平面一致,因此 U, V 平面在内存上会有留空(padding),因此一个像素 16 bits,如图所示:
YUV原理和格式详解_第5张图片

IMC3
IMC3 与 IMC1 几乎一样,仅改变了 U, V 平面的顺序。内存排列如下图所示:
YUV原理和格式详解_第6张图片

I422
I422 属于 YUV422P 格式。三个平面,分别存储 Y U V 分量。每两个 Y 分量共享一组 UV 分量。U、V 平面的 strides, width 是 Y 平面的一半,但 height 与 Y 平面一致,因此一个像素 16 bits,内存排列如下图所示:
YUV原理和格式详解_第7张图片

从图中可看出,U、V 平面的每行字节数(strides)是 Y 平面的一半,高(height)与 Y 平面一致。
J422
J422 与 I422 完全相同,但具有完整范围(0-255,full range)的亮度(Y)分量,而不是有限范围(16-240,limited range,在 iOS 上也叫做 video range)。色度(UV)分量与 I420 中的完全相同。

Semi-Planar 半平面格式

半平面格式具有两个平面而不是三个平面,一个平面存储亮度(Y)分量,另一个平面存储两个色度(UV)分量。有时也将它们称为双平面格式(BiPlanar)。
NV12
NV12 属于 YUV420SP 格式。两个平面,分别存储 Y 分量 和 UV 分量。其中 UV 分量共用一个平面并且以 U, V, U, V 的顺序交错排列。每四个 Y 分量共享一组 UV 分量。
UV 平面的 strides, width 与 Y 平面一样长,但 height 仅为 Y 平面的一半。因此一个像素 12 bits,内存排列如下图所示:
YUV原理和格式详解_第8张图片

从图中可看出,UV 平面的每行字节数(strides)与 Y 平面一致,高(height)是 Y 平面的一半。
NV12 是 iOS 相机(AVCaptureOutput)可直接输出的两种视频帧格式之一,另外一种是 BGRA32(kCVPixelFormatType_32BGRA)。
NV21
NV21 属于 YUV420SP,与 NV12 几乎一致,区别是 UV 平面中 U 与 V 的排列顺序颠倒,以 V, U, V, U 的顺序交错排列,内存排列如图所示:
YUV原理和格式详解_第9张图片

NV21 是 Android 相机(Camera)默认的输出格式。

Packed 打包格式

打包格式通常只有一个平面,所有亮度(Y)和色度(UV)数据都交织在一起。有点类似于 RGB 格式,只是使用了不同的色彩空间。
打包格式在网络摄像头中较为常见。硬件设备使用多平面格式效率较低,因为每个像素需要多次内存访问。而打包格式由于仅一个平面,访问内存的开销较小。
AYUV:4:4:4
AYUV 是 Packed 打包格式,其中每个像素编码为四个连续字节,每个像素在内存中按照 V, U, Y, A 的顺序排列(A 指 alpha 通道),如下图所示:
在这里插入图片描述

YUYV (V422 / YUY2 / YUNV)4:2:2
YUYV 通常也称作 V422、YUY2、YUNV
YUY2 是 Packed 打包格式,其中两个像素共用一组 UV 分量,内存中按照 Y U Y V 的顺序排列,如下图所示:
在这里插入图片描述

UYVY (Y422 / UYNV)4:2:2
UYVY 通常也称作 Y422、UYNV
UYVY 与 YUYV 类似,只是亮度(Y)分量与色度(UV)分量排列顺序颠倒,如下图所示:
在这里插入图片描述

下图更直观的展示了三种方式中YUV三种分量的关系:
YUV原理和格式详解_第10张图片

YUV原理和格式详解_第11张图片

YUV原理和格式详解_第12张图片

你可能感兴趣的:(视频编解码)