Color Space (2)

常见颜色空间

color model & color space

我们每天说的RGB,这个称呼严格来讲应该归属于color model,而不是color space。这里我们区分一下color model和color space。

  • color model色彩模型是指一个抽象的数学模型,用来描述一个颜色怎么样被表达成一组数字,通常来讲会用3个或者4个数值来表示。
  • color space当色彩模型有了对组成元素数值具体的表述方式和规则的时候,也就是把色彩模型具体规定到了一个颜色的集合,这个集合有着具体的表示方式和计算方式的时候,这就叫color space了。

对比一下概念,color space是具体化了的color model,可以被用来表达一个颜色。也就是需要指定具体的颜色表述方式。我们常见的色彩模型有CIE系列、RGB、CMYK、HSV/HSL、YUV都算是色彩模型。我们最常见的RGB color model中又包含sRGB、AdobeRGB、Apple RGB、ProPhoto RGB、ScRGB等。上面一章中讲的CIE系列这里归为moel,它是与设备无关的,包括CIE RGB XYZ Lab等,CIE是个很特殊的存在,它们都是从人眼原理经过实验得到的色彩空间,
比如拿CIE XYZ来说,一方面它们有primary colors,有一定的规则和表述方式,但是另一方面它们的primary colors(可以将上面图中的Cr Cg Cb变换后的值作为他的primary colors)又不是真实存在的,这里所以吧CIE系列单独归为一类color model,在第二章中已经具体讲了几个主要的CIE标准,这里就不再补充了。另外,CIE XYZ通常是其他color space的参考。比如,我们最常见的sRGB颜色空间RGB对应CIE XYZ参考的定义如下:

Color Space (2)_第1张图片
sRGB三原色定义


RGB

Color Space (2)_第2张图片
RGB cube

如上所述,单纯讲RGB是addtive color model,它根据三原色原理规定了一个坐标轴分别代表RGB的立方体数学模型,它是最常见的色彩模型,但是其实并不友好,鬼知道给你一组RGB混合出来是什么样子,除了纯色,我现在连双色等比例混合的公式都没背下来。这个color model中包含很多color spaces,这些color spaces之间的区别是它们的primary colors不同,像上面说的sRGB的(0,255,0)绿色对应的CIE xyY标准中的色域图中颜色是(0.30,0.60),但是AdobeRGB中为(0.21,0.71)。注意,色彩空间的标准文档中一半找不到具体的Y的值,是因为通过Y值代表色彩的亮度,与色彩空间所默认遵循的Standard illuminant有关,标准照明的规则(常见的如D65和D60)中会指明white的xy值(一般来说也是只给出在CIE XYZ色域图中的xy色度值,Y规则化到1.0),也就是说大多数的色彩空间primary colors的定义都是只给出RGB的xy和white的xy,然后自己需要计算出来对应的真实颜色的XYZ的值,步骤基本包括计算white的Y、计算RGB unadapted XYZ矩阵并求逆、矩阵相乘得到adapted RGB的Y值、计算RGB XYZ值,具体的例子见 sRGB色彩空间XYZ值计算方式,最后面稍微改改就能算出来sRGB和XYZ之间的转换矩阵。下图给出来了。这里我们发现从XYZ到sRGB的时候矩阵中有负值出现,看一下下面的sRGb的色域图,它其实只有很小的一个色域范围,负值意味着是在三角形外部的,这种出现负值的RGB最简单的方式就是归一化到0-1之间,也就是三角形外面的颜色简单的直接用三角形边界上的值表示。从计算出来的值需要写到图像到描述中,如jpeg的icc profile中的PCS。例如,标准照明D65定义的white point为xy(0.31271,0.32902),关于照明标准还很复杂,大分类ABCDEFL,别问我为什么没有GHIJK,这里ABCDEFL不是按的字母序取的名字,而是都有一定的含义,如A是什么钨丝光源,B是noon sunlight,D是natural daylight,L是LED,另外照明标准还有什么standard observer的因素会影响white的定义,刚刚说的值是standard 2 degree obserer。
Color Space (2)_第3张图片
sRGB2xyz.png

Color Space (2)_第4张图片
xyz2sRGB.png

Color Space (2)_第5张图片
D50标准下各色彩空间primary colors

sRGB

sRGB由微软和惠普1996年提出的色彩空间标准,一般用于显示器、打印机和网络,这也基本是我们最常见的色彩空间,广泛应用于我们通常说的RGB也基本(default color space)是建立在sRGB上的。我们见到的图片基本都使用的sRGB。sRGB为了适应更多的设备,色域很小,基本是色彩空间中色域最小的了,甚至都不能包含打印用的CMYK空间。

Color Space (2)_第6张图片
color spaces.png

sRGB_IN_Yxy

Color Space (2)_第7张图片
sRGB与JC2001C_cmyk色域对比

提到sRGB不得不提到一个国际电信联盟ITU-R推荐的色彩标准Rec.709,也就是视频领域经常看到的bt709,它是在1990年为了HDTV高清电视提出来的,但是sRGB也使用了Rec709标准的一部分。对应的还有一个bt601,是用在标清电视SDTV上的。BT709中定义了编码和transfermation coefficients,在bt601中只定义了encoding相关的东西。
sRGB在primary colors使用和bt709一致,使用的照明也相同都是D65,也就是说sRGB和bt709的色域是相同的。它们的不同主要在transfer function上,sRGB和bt709的transfer function都是一个分段函数,在特别小的范围内是一段线性函数,剩下的是指数函数,前半截是直线的原因是防止取全局的平均下来sRGB的decoding gamma为2.2,bt709的transfer gamma为1.96左右。
Color Space (2)_第8张图片
Gamma-sRGB-Rec709

至于为什么要有gamma这东西的存在,有很多的历史原因,也有很多的物理设备和人的感知的原因,简单来说就是1,历史中大量使用了CRT显示器,由于电压和显示非线性会偏暗,2,物理设备的采集中高亮区域色阶过剩,暗部色阶不够用,3,人眼也对亮度其实也是非线性的,具体见最后一章讲解gamma correction。采集设备在编码的时候会根据gamma值(encoding gamma,通常小于1,sRGB 1/2.2,bt709 1/1.96),进行非线性映射,在decoding进行显示的时候用gamma值校正,将图像压暗。
一个真实在XYZ表示的真实颜色进行encode的过程,首先要映射为sRGB颜色,经过计算,映射矩阵如下图中的表示,然后进行gamma映射,decoding的时候过程相反。
Color Space (2)_第9张图片
XYZ-sRGB

Color Space (2)_第10张图片
encoding gamma

Color Space (2)_第11张图片
decoding gamma

Color Space (2)_第12张图片
sRGB-XYZ

bt709是一个很丰富的标准,除了primary color、D65规定了色域、给出了transfer function以外,还包含了对HDTV中pixel count规定了分辨率1080p/1080i,frame rate规定了60 Hz, 50 Hz, 30 Hz, 25 Hz and 24 Hz,digital representation规定了两种编码方式R'G'B'和Y'CbCr,使用8bits或10bits编码。

AdobeRGB

由Adobe这个lazy company于1998年提出,提出的主要目的是为了解决sRGB不能覆盖CMYK的问题,也就是为了在显示器使用RGB原色model看到打印需要的全色域,主要是在蓝绿色方向进行了扩展,完全覆盖sRGB,基本覆盖CMYK。

Apple RGB

早期的苹果产品,目前已转向sRGB。

prophoto RGB

由柯达提出的参考color space,它的RGB原色定义已经超出了visible color范围,基本包含了90%的CIE LAB色域,主要都是为了专业处理考虑的。

scRGB

Color Space (2)_第13张图片
600px-ScRGB.svg.png

微软和HP脑洞的产物,色域非常大,RGB原色允许负值,基本包含了所有的CIE color space色域,而且与sRGB兼容,不过用起来好像不太方便。


CMYK

C青M洋红Y黄,注意这里K严格来讲并不是指Black,而是单词Key,是指Key color,因为实际条件下用CMY很难混合出来纯粹的深灰或者黑色,那么加了一个K,这个K一般就是黑色。主要用于印刷行业,相比于RGB model的addtive model,CMYK是减性模型,说白了就是越混合颜色越黑。CMYK与RGB有一定的对应关系,CMY非别是BRG的补色,比如30%C其实是70%的B。

Color Space (2)_第14张图片
cmyk.png


HSL & HSV

HSL和HSV(也叫HSB)是对人很友好的色彩空间,因为给你说了每个值,脑海中就能想象出来颜色的基本的样子。两个都对RGB modol来讲都可以看成是圆柱坐标系表示。这里H都是Hue色相,通常的取值范围是0-360度,S都是saturation饱和度,L是亮度,V是明度。另外它们对饱和度、亮度的拆分比例不同。L这里是值Lightness/Luminance,叫亮度,V和B代表Value和Brightness,叫明度。L是指从最暗的的黑色到色相纯色再到白色,也就是说在最大L的时候,不光H是多少,都是白色。V是从黑色到标准色相,明度最大的时候是就是纯色H,只有在S最小的时候才是白色。也就是HSL中轴是代表黑到白的灰色,HSV中轴是白色。PhotoShop中的拾色器是HSL模型,色相/饱和度命令用的是HSV。

Color Space (2)_第15张图片
hsl.png

下面是LV的对比:


Color Space (2)_第16张图片
lightnessVSbrightness.png

YUV family

YUV models

YUV最初的目的是为了将Y亮度和色彩分开,Y在这里是指Luminance亮度,UV是指色彩。YUV是为了电视机和媒体产生的,最早的时候为了使得彩色电视机和黑白电视机兼容,Y可以单独传输。这里Y也是说了是Luminance是指视觉亮度,而不是Luma,还是与HSL不太相同,HSL更加的偏重颜色本身的特性,而YUV中Y调制的比例更符合人眼,这与XYZ模型基本保持一致,名字也直接沿用过来了。YUV严格来说这个称呼更多的是指color model,而不是color space。下面的图中Blue和Green在HSL和HSV中亮度是相同的,但是在YUV中(更确切的说是在Y'CbCr中)RGB纯色的亮度比例为0.299:0.587:0.114。

Color Space (2)_第17张图片
blue green lightness

Color Space (2)_第18张图片
interfaces video

在视频领域中,其实我们说的YUV严格来讲是叫Y'UV,这里Y'是指经过gamma校正后的值,因为我们的视频都有gamma校正的存在。只不过默认值是2.2(Bt 709的transfer为1.96)。另外,我们常见的Y'CbCr是为了数字信号表示出现的,色彩表示上相比YUV的向RB有一定的偏移,是为了各种压缩来做的,比如视频、图片基本都是Y'CbCr来进行压缩的。对比一下Y'UV主要是用于传统模拟电视,而Y'CbCr用于数字电视。总之,我们现在大多数讲的YUV,基本是指Y'CbCr。
说多一点,咱们原来老电视上分PAL模式、NTSC模式、SECAM模式,这些模式就是就决定了采用哪种色彩模型,PAL和SECAM基于Y'UV,NTSC基于Y'IQ。Y'IQ和Y'UV基本一样,就不介绍了。
到这里我们再说一下Bt601和Bt709的问题,bt601用在SDTV和jpeg(有一部分老标准使用的是bt601)中,也就是Y'CbCr(后面我还是直接称为YUV吧)在使用的时候需要指定color space。bt601计算出来的RGB转YUV matrix如下:
Color Space (2)_第19张图片
bt601 yuv-rgb.png

Color Space (2)_第20张图片
bt709 yuv-rgb.png

虽然它们的transfer function 相同(即gamma约定相同),工作中对于视频转码时要注意所用的color space的问题,从bt601和709互转的时候可能出现颜色不一致的问题。

YUV数据格式PixFmt

YUV格式从YUV分量的存放位置分为两大类,planar和packed,planar模式是指一幅图像的YUV分别用三个独立的数组表示,pakced是指连续交错存储YUV分量。YUV实际应用中有三种主要的采样方式,YUV 444 422 411 420 420p。444就是只每个像素3个字节,422每两个Y取一对UV分量,也就是每两个像素4四个字节,411就是每4个Y一对UV分量,也就是4个像素6个字节,420并不是指缺了一个U或者V,而是指UV分量隔行采样一次。

Color Space (2)_第21张图片
YUV sampling

这里就拿YUV422举个例子说一下存储方式:

  • YUY2 (不叫YUYV)
    Color Space (2)_第22张图片
    202410157.png

    两个Y共用相邻的UV(CbCr),即Y00和Y01两个点都是使用Cb00 Cr00,往后依次类推。
  • UYVY
    Color Space (2)_第23张图片
    202455202.png

    相比YUYV排列顺序换了一下。
  • YUV422p
    Color Space (2)_第24张图片
    3.png

    这里p的意思是planar的意思,不是像上面的交错存储,而是先存所有的Y,然后是U,然后是V,使用方法和422相同。
  • YUV420p & YV12
    Color Space (2)_第25张图片
    yuv420p.png

    YUV420p是一种plane模式,也叫I420,遵循420的提取方式,Y'00、Y'01、Y'10、Y'11共用Cr00、Cb00。YV12同YUV420p一样,不过UV是反的。
  • NV12
    Color Space (2)_第26张图片
    nv12.png

    NV12和NV21也都是YUV420的一种,不过不像YUV420p有三个plane分别存放YUV,只有两个plane,UV交错存放。

比如一个6404803的图像,要存储成YUV420p,那么总大小需要6404801.5=460800字节,相比444节省了一半空间。三个部分内部均是行优先存储,三个部分之间是Y,U,V 顺序存储。即YUV数据的0--640×480字节是Y分量值,640×480--640×480×5/4字节是U分量,640×480×5/4 --640×480×3/2字节是V分量。
实际存储是按行存储的,那么YUV420p的大概是这样样子的:

Color Space (2)_第27张图片
yuv420p mem.png

即:
I420: YYYYYYYY UU VV =>YUV420P
YV12: YYYYYYYY VV UU =>YUV420P
NV12: YYYYYYYY UVUV =>YUV420SP
NV21: YYYYYYYY VUVU =>YUV420SP

更多:有时候我们见到的视频虽然大多是YUV420p或者YUV420sp,但是有时候也会遇到YUVj420p,这里讲一下yuvj420p。

YUV420P vs. YUVJ420P
简单来看,两个格式的唯一区别就是YUV420P的色彩值范围是[16, 235],而YUVJ420P是[0,255]。有些硬件设备包括一些手机硬编码出来的可能是YUVJ420P。Numerical approximations中说明了一下为什么是[16,235],大致是说由于处理为了加速很多运算的最后几位精度会被丢弃,在丢弃以后由于color space转换的问题,加上中间的gamma校正问题,以及显示问题可能会出现负数,产生invalid RGB,所以这里BT709就加了个[16,235]的限制。而且恰好1-15可以用来传输负脉冲信号,236-254传输过冲信号,0和255用来同步脉冲(写完这些我都太没看懂……)


gamma correction

单独简单讲一下gamma校正吧。为什么有gamma校正的存在,众说纷纭,主要是有下面几个原因:

  1. 老的CRT显示器自带2.2的gamma,end to end 1
  2. 人眼对暗部细节更敏感,对亮度感知不均匀,0.2左右的反射率产生的灰认为是中灰,灰阶紧张,充分利用编码空间,人其实对他的感受也是非线性的
  3. 后来干脆微软和Hp推出sRGB标准,定义了2.2,也是很多显示器使用的
  4. 相机其实是为了模仿人眼

我更支持2的说法,人眼感受亮度的非线性问题,由于目前我们大多数表示方式都是8bits的,这就严重限制了能表示的色阶,但是人眼又是非线性的,即对于高亮度的范围内,人眼的分辨能力要比暗部的时候差一些,我们从黑色到白色画一个均匀的变化图如下:

Color Space (2)_第28张图片
weibo1.png

Color Space (2)_第29张图片
weibo2.png

第一张图所示,我们想要的中灰色其实位于0.2左右的位置,这么对于高亮分配到的色阶太多就浪费了,暗部人眼明明更敏感,单分配到的色阶很少。假如我们直接按线性的方式定义色阶,那么暗部的很多细节注定要在量化的时候很丢掉,导致暗部细节丢失严重。为了解决这个问题,我们就需要想要的中灰色实际表示成0.5,恰好着对应了一个2.2左右的gamma变换:
Color Space (2)_第30张图片
eye gray nonlinear.png

依据这个gamma变化用在相机的采样中,即采样的时候执行1/2.2左右的gamma变化,提升暗部色阶,整个图像会变亮,我们就可以得到更多的暗部细节,保留更多细节。
有了gamma变化以后,是很方便了,显示器也定义了自己的display gamma(sRGB即显示器遵循的)大概在2.2左右,恰好能还原采样的时候的gamma变换。但是也引来很多的新问题,下面说两个。

  • gamma meta信息的不同应用解释不一致问题
    这有个很有意思的图片,它的gamma值为0.02,在safari中我们看到的是一个apple,但是在chrome中看到的是一个pear,很奇妙吧。其实就是利用了不同应用对图片的gamma值的处理不同,safri中解释了gamma值,看起来是个apple(存储在高亮范围内,gamma变化会把高亮压低,看到apple,会把pear压到看不清楚),而chrome忽视了gamma值,所以我们只能看到正常范围内的亮度值表示的东西,是个pear(存储在正常灰度范围内)。
  • 对实际应用的RGB带来坑爹的问题
    youtube上有个有意思的视频,说的是在我们使用instagram和ps的时候,如果我们画了一个红色和绿色,相互接触,我们想要在中间加个模糊效果,一般来说大多数软件的做法是取两边颜色的平均值。但是我们发现这么做以后中间会出现灰色的间隔(中间那个图),而不是我们想要的RG混合的黄色(最后那个图)!这其实是因为我们处理的红色和绿色的色值都是做过gamma变换以后的值,举个例子吧,如果我们的gamma值取0.5,那么encoding gamma就是一个开方操作,decoding gamma是一个平方操作,软件取平均是对开方以后的值进行的变化(gamma变换后的值),但是这么做并不是我们想要的对实际颜色取平均的目的!根据下面的公式,这样得到的值是小于我们要的目标值的。所以正确的做法是先做一遍gamma display,得到值以后取平均,然后在encoding gamma变换以下,为了最后的显示!

Color Space (2)_第31张图片
gamma problem.png

Color Space (2)_第32张图片
gamma problem2.png

对于我们采集的图像和pc自己制作的图像是不一样的,我们采集的图像已经做过gamma变化了,但是我们自己制作的图像并没有,所有软件在display的时候会又一个buffer来做gamma变换,为了预览展示:

Color Space (2)_第33张图片
gamma device.png


The processing Flow

总结一下,从物理图像到我们的显示设备的整理流程:

Color Space (2)_第34张图片
the flow.png


FFMPEG相关

AVPixelFormat

AVColorPrimaries

AVColorTransferCharacteristic

AVColorSpace

AVColorRange


其他

color space转换

基本灰度变换

color correction


References:

  1. wikipedia color space
  2. wikipedia color primary
  3. csdn blog: color space
  4. a bt709 story, to Bt2020
  5. YUV
  6. BT709
  7. difference between YUV YCbcr
  8. a color matrix discuss
  9. gamma correction
  10. Rec709 vs sRGB
  11. Color correction handbook
  12. HDR
  13. LUT
  14. Color wiki
  15. color vision
  16. color space CIE 1931
  17. primary color
  18. RGB color space
  19. rg chromaticity
  20. color model
  21. color space
  22. difference between color model and space disscus
  23. UI 设计知识库
  24. RGB color spaces在xyY中的参考值表
  25. Standard illuminant
  26. sRGB xyY RGB & white compute
  27. icc profile
  28. sRGB
  29. sRGB vs BT709
  30. 知乎一篇gamma讲解
  31. gamma correction wikipedia
  32. A good gamma correction blog
  33. Adobe RGB
  34. 明度、亮度、辉度
  35. Luma & Luminance
  36. YUV
  37. where is purple
  38. yuv 420 csdn blog
  39. chroma subsampling
  40. 雷神 yuv420p
  41. why yuv420p 16-235
  42. 8bit vs. 10bit video sample youtube
  43. thought of 42 comparision video
  44. What makes a good display
  45. HDR wiki
  46. 知乎 色彩空间的表示与转换
  47. 知乎 色温与白平衡
  48. bt 601 & bt 709 matrix

你可能感兴趣的:(Color Space (2))