RAW、RGB和YUV格式

RAW 

       RAW数据是图像感应器(CMOS or CCD)将捕捉到的光源信号转化为数字信号之后的原始数据,它含有图像原始的颜色信息等等。

  • Bayer      

       RAW 数据格式一般采用的是 Bayer 排列方式,sensor的像素点上覆盖着CFA(Color Filter Array,彩色滤波阵列),因此sensor上每个像素只采集特定颜色的光的强度,所以sensor的每个像素只能记录R或G或B的信息,所以RAW数据里表示了sensor接受到的各种光的强度。鉴于人眼对绿色波段的色彩比较敏感,所以绿色分量的比重最大,Bayer 中R\G\B分量的成分为gif.latex?R%3AG%3AB%20%3D%201%3A2%3A1

       一般BAYER格式分为GBRG、GRBG、BGGR、RGGB四种模式。因为采用Bayer排列方式的这种RAW图,看起来像打了马赛克一样,所以也经常称其为马赛克(mosaic)图像。比如,RGGB的排列方式如下图。

               

RAW、RGB和YUV格式_第1张图片

  • 4cell

       RAW数据也可以用4 cell结构来表达,但其实4 cell仍然是采用的Bayer结构,只是4 cell对具体像素的排列做了调整,如下图所示,它使用4个颜色相同的像素合成一个像素,其整体上仍然是符合Bayer结构的,4 cell也叫Quad-Bayer

RAW、RGB和YUV格式_第2张图片

       有了Bayer格式的图之后,为什么还会出现4 cell呢? 是因为高像素可以带来高分辨率的画质,大像素能够带来暗态高感度低噪声的画质,但是在模组尺寸一定的基础上,高像素和大像素之间会是互相矛盾的,在这样一个背景下,4 cell就出现了,4 cell的出现就兼顾了高像素和大像素这两者的优点

      1. 正常环境拍摄

       在正常拍照的情况下,由于光线充足,此时采用高分辨率输出即可,4 cell结构经过Remosaic算法转换,将这些颜色重新进行排列组合了之后,就变成了前面所说的Bayer结构,图像大小就是实际大小(full size),这样就实现了高像素的拍摄。Remosaic可以分为硬件和软件两类,硬件模式可以通过sensor实时输出Bayer模式的图像,软件模式则需要通过调用专用的库对图像进行调整。

RAW、RGB和YUV格式_第3张图片

     2. 暗环镜拍摄

       在暗环镜下,把4个相同颜色的小像素作为一个整体来看的话,这个像素会有更大的感光面积,随之会带来更好的感光效果,如下图所示,可以看到,4个小像素合成一个大像素之后会变成经典的拜耳阵列结构。由于每4个像素被合并成1个像素,此时图像的size缩小为原来的1/4。

RAW、RGB和YUV格式_第4张图片


RGB

       根据三基色原理,自然界中的任何一种颜色都可由不同比例的红色、绿色和蓝色组合得到。根据这种原理来表示彩色图像的方法就是RGB彩色空间,即彩色图像的每个pixel都是由一组(R,G,B)数值来表示的,这三个分量别取不同的值,就会呈现出不同的颜色。

        所以RGB图像和前面的Bayer排列方式的RAW图不同,后者的每个pixel只含有某单种颜色的强度,而RGB图一个Pixel包含了3三种颜色的强度。 在camera当中,很多Sensor出来的是采用Bayer排列方式的RAW图,而有些ISP 模块或者算法需要处理的是RGB的图,这时就需要将Bayer排列方式的图转换成RGB了。

  Demosaic  

        Bayer数据所反映的颜色信息不是真实的颜色信息,Demosaic的目的就是通过插值算法就是在Bayer数据基础上,恢复出每个pixel完整的RGB数据,得到RGB的图。前面提过Bayer排列方式的图,看起来就像是mosaic一样,所以这个操作叫Demosaic

    那么具体怎么做Demosaic呢?简单来说,就是通过插值算法,把拜耳阵列中的GRRB分别插值为4个RGB,从而得到一幅看起来正常的图像。

常见的RGB格式

  • RGB565 :占2个字节,分别是R-5bit,G-6bit,B-5bit

RAW、RGB和YUV格式_第5张图片

  • RGB555 :每个pixel占2个字节,分别是R-5bit,G-5bit,B-5bit,即RGB分量都使用5位(最高位不用)

RAW、RGB和YUV格式_第6张图片

  • RGB888 :每个pixel占3个字节,分别是R-8bit,G-8bit,B-8bit ,其实这就是RGB24


YUV

        YUV也是一种颜色表示模型,它将图像亮度分量和色度分量分开来表示。YUV分为三个分量,Y表示亮度(Luminance或Luma),也就是灰度值;U和V 则表示的是色度(Chrominance或Chroma),它描述了图像的色调以及饱和度,用于指定像素的颜色。YUV这样表达方式很好地解决了彩色电视机与黑白电视的兼容问题,因为如果只有Y分量,没有UV分量一样可以显示完整的图像,只不过图像是黑白的,再加上UV就是彩色图像了。

      YUV通常用于电视机模拟信号的色彩,而YCbCr 是一种用数字信号的色彩表达方法,它是世界数字组织视频标准研制过程中作为ITU-R BT1601 建议的一部分,  其实是YUV经过缩放和偏移的翻版,也是来源于YUV模型,Y和YUV的Y含义一样,都是指亮度分量,Cb指蓝色色度分量,而Cr指红色色度分量,YCbCr 应用在数字视频方面,视频编码中常提到的YUV444、YUV420都是基于YCbCr颜色空间的下采样方式。现在,一般人们所讲的YUV大多就是指YCbCr,每一个Pixel由一组(Y,U,V)数值来表示。

       另外,通常人眼对亮度会比色彩更加敏感,所以YUV在压缩时,可以适当地多压缩一些U\V分量,从这一点来说,在保证图像质量降低不明显的前提下,YUV相对RGB更适合存储和传输。

    常见的YUV格式

     YUV的三个分量在存储的时候,通常以它们形成的平面(plane)来区分

  • NV21

       NV21是一种2 plane的YUV格式,分为Y plane和UV plane,其中4个Y分量对应到同一组UV分量,如下图所示。所以可见对于一幅w\times h大小的NV21 format图像,会占据1.5\times w\times h个字节大小的空间。

RAW、RGB和YUV格式_第7张图片

  • NV12

       NV12和NV21相比,差别只在于UVpalne里,两者UV的交替顺序是反的,NV12是VU交替。其余的和NV21是一样的,也是4个Y分量对应同一组UV分量;w\times h大小的图像,占据1.5\times w\times h个字节大小的空间。

RAW、RGB和YUV格式_第8张图片

  • YV12

       YV12是3 plane的YUV格式,Y\U\V各自一个plane,如下图所示所以对于一幅w\times h大小的YV12 format图像,也是占据1.5\times w\times h个字节大小的空间。

RAW、RGB和YUV格式_第9张图片

RGB与YUV之间的转换

          在图像处理过程中,经常会遇到YCbCr与RGB之间的转换,RGB转换成YCbCr的转换公式可以简单表达如下:

   \begin{bmatrix} Y\\ C_{b}\\C_{r} \end{bmatrix}=\begin{bmatrix} \omega _{11}& \omega _{12}&\omega _{13} \\ \omega _{21}& \omega _{22}&\omega _{23} \\ \omega _{31}& \omega _{32}& \omega _{33} \end{bmatrix}\times \begin{bmatrix} R\\ G\\ B \end{bmatrix}

        同样,YCbCr转换成RGB,也可以通过一个转换矩阵来转换。

       这个公式里面所使用的转换矩阵,不同的ColorSpace是不相同的,目前比较常见的colorSpace有BT601、BT709和BT2020,它们对应的矩阵是长什么样子的,这个网上也有很多的介绍,比如:MATLAB:RGB转BT601、BT709协议中各种YUV格式的转换函数_llljjlj的博客-CSDN博客。

       有时,YCbCr转换RGB,和RGB转换YCbCr之间的转换矩阵由于没有成对的匹配上,导致了效果异常,所以要注意相互转换时所使用的矩阵要匹配。

你可能感兴趣的:(图像处理,Android,Camera,人工智能,音视频,计算机视觉)