Ø RGB 型颜色空间/计算机图形颜色空间:这类模型主要用于电视机和计算机的颜色显示系统。例如,RGB,HSI, HSL和HSV等颜色空间。
Ø XYZ 型颜色空间/CIE颜色空间:这类颜色空间是由国际照明委员会定义的颜色空间,通常作为国际性的颜色空间标准,用作颜色的基本度量方法。例如,CIE 1931 XYZ,L*a*b,L*u*v和LCH等颜色空间就可作为过渡性的转换空间。
Ø YUV型颜色空间/电视系统颜色空间:由广播电视需求的推动而开发的颜色空间,主要目的是通过压缩色度信息以有效地播送彩色电视图像。例 如,YUV,YIQ,ITU-R BT.601 Y'CbCr, ITU-R BT.709 Y'CbCr和SMPTE-240M Y'PbPr等颜色空间。
4 颜色空间的转换
不同颜色可以通过一定的数学关系相互转换:
Ø 有些颜色空间之间可以直接变换。例如,RGB和HSL,RGB和 HSB,RGB和R'G'B', R'G'B'和Y'CrCb,CIE XYZ和CIE L*a*b*等。
Ø 有些颜色空间之间不能直接变换。例如,RGB 和CIE La*b*, CIE XYZ和HSL,HSL和Y'CbCr等,它们之间的变换需要借助其他颜色空间进行过渡。
R'G'B'和Y'CbCr两个彩色空间之间的转换关系用 下式表示:
Y = 0.299R + 0.587G + 0.114B
Cr = (0.500R - 0.4187G - 0.0813B) + 128
Cb = (-0.1687R - 0.3313G + 0.500B) + 128
二、彩色电视的制式及其颜色空间
1、彩色电视制式
目前世界上现行的彩色电视制式有三种:NTSC 制、PAL制和SECAM制。这里不包括高清晰度彩色电视HDTV (High-Definition television)。
NTSC(National Television Systems Committee)彩色电视制是1952年美国国家电视标准委员会定义的彩色电视广播标准,称为正交平衡调幅制。美国、 加拿大等大部分西半球国家,以及日本、韩国、菲律宾等国和中国的台湾采用这种制式。
NTSC彩色电视制的主要特性是:
(1) 525行/帧, 30帧/秒(29.97 fps, 33.37 ms/frame)
(2) 高宽比:电视画面的长宽比(电视为4:3;电影为3:2;高清晰度电视为16:9)
(3) 隔行扫描,一帧分成2场(field),262.5线/场
(4) 在每场的开始部分保留20扫描线作为控制信息,因此只有485条线的可视数据。Laser disc约~420线,S-VHS约~320线
(5) 每行63.5微秒,水平回扫时间10微秒(包含5微秒的水平同步脉冲),所以显示时间是53.5微秒。
(6) 颜色模型:YIQ
一帧图像的总行数为525行,分两场扫描。行扫描频率为15 750 Hz, 周期为63.5μs;场扫描频率是60 Hz,周期为16.67 ms;帧频是30 Hz,周期33.33 ms。每一场的扫描行数为525/2=262.5行。除了两场的场回扫外,实际传送图像的行数为480行。
由于NTSC制存在相位敏感造成彩色失真的缺 点,因此德国(当时的西德)于1962年制定了PAL(Phase-Alternative Line)制彩色电视广播标准,称为逐行倒相正交平衡 调幅制。德国、英国等一些西欧国家,以及中国、朝鲜等国家采用这种制式。
PAL电视制的主要扫描特性是:
(1) 625行(扫描线)/帧,25帧/秒(40 ms/帧)
(2) 长宽比(aspect ratio):4:3
(3) 隔行扫描,2场/帧,312.5行/场
(4) 颜色模型:YUV
法国制定了SECAM (法文:Sequential Coleur Avec Memoire)彩色电视广播标准,称为顺序传送 彩色与存储制。法国、苏联及东欧国家采用这种制式。世界上约有65个地区和国家试验这种制式。
这种制式与PAL制类似,其差别是SECAM 中的色度信号是频率调制(FM),而且它的两个色差信号:红色差(R'-Y')和蓝色差(B'-Y')信号是按行的顺序传输的。法国、俄罗斯、东欧和中东 等约有65个地区和国家使用这种制式,图像格式为4:3,625线,50 Hz,6 MHz电视信号带宽,总带宽8 MHz。
2、彩色电视的颜色空间
在彩色电视中,用Y、C1, C2彩色表示法分别表示亮度信号和两个色差信号,C1,C2的含义与具体的应用有关。在NTSC彩色电视制中,C1,C2分别表示I、Q两个色差信号;在 PAL彩色电视制中,C1,C2分别表示U、V两个色差信号;在CCIR 601数字电视标准中,C1,C2分别表示Cr,Cb两个色差信号。所谓色差是指基色信号中的三个分量信号(即R、G、B)与亮度信号之差。
NTSC的YIQ颜色空间与RGB颜色空间的转换关系如 下:
Y=0.30R+0.59G+0.11B
I=0.74(R-Y)-0.27(B-Y) = 0.60R+0.28G+0.32B
Q=0.48(R-Y)-0.27(B-Y) = 0.21R+0.52G+0.31B
PAL的YUV颜色空间与RGB颜色空间的转换关系如下:
Y=0.30R+0.59G+0.11B
U=0.493(B-Y) = -0.15R-0.29G+0.44B
Q=0.877(R-Y) = 0.62R-0.52G-0.10B
三、视频图像采样
模拟视频的数字化包括不少技术问题,如电视信号具有不同的制式而且采用复合的YUV信号方式,而计算机工作在RGB空间;电视机是隔行扫描,计算机显示器大多逐行扫描;电视图像的分辨率与显示器的分辨率 也不尽相同等等。因此,模拟视频的数字化主要包括色彩空间的转换、光栅扫描的转换以及分辨率的统一。
模拟视频一般采用分量数字化方式,先把复合视频信号中的亮度和色度分离,得到YUV或YIQ分量,然后用三个模/数转换器对三个分量分别采样并进行数字化,最后再转换成RGB空间。
1、图像子采样
对彩色电视图像进行采样时,可以采用两种采样方法。一种是使用相同的采样频率对图像的 亮度信号(Y)和色差信号(Cr,Cb)进行采样,另一种是对亮度信号和色差信号分别采用不同的采样频率进行采 样。如果对色差信号使用的采样频率比对亮度信号使用的采样频率低,这种采样就称为图像子采样(subsampling)。由于人的视觉对亮度信号的敏感度 高于对色差的敏感度,这样做利用人的视觉特性来节省信号的带宽和功率,通过选择合适的颜色模型,可以使两个色差信号所占的带宽明显低于Y的带宽,而又不明 显影响重显彩色图像的观看。
目前使用的子采样格式有如下几种:
(1) 4:4:4 这种采样格式不是子采样格式,它是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、4个红色差Cr样本和4个蓝色差Cb样本,这就相当于每个像素用 3个样本表示。
(2) 4:2:2 这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、2个红色差Cr样本和2个蓝色差Cb样本,平均每个像素用2个样本表示。
(3) 4:1:1 这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表示。
(4) 4:2:0 这种子采样格式是指在水平和垂直方 向上每2个连续的采样点上取2个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样 本表示。
2、CIF、QCIF和SQCIF格式
为了既可用625行的电视图像又可用525行 的电视图像,CCITT规定了称为公用中分辨率格式CIF(Common Intermediate Format),1/4公用中分辨率格式(Quarter-CIF,QCIF)和(Sub-Quarter Common Intermediate Format,SQCIF)格式对电视图像进行采样。
CIF格式具有如下特性:
(1) 电视图像的空间分辨率为家用录像 系统(Video Home System,VHS)的分辨率,即352×288。
(2) 使用非隔行扫描(non-interlaced scan)。
(3) 使用NTSC帧速率,电视图像的最大帧速率为30 000/1001≈29.97幅/秒。
(4) 使用1/2的PAL水平分辨率,即288线。
(5) 对亮度和两个色差信号(Y、Cb和Cr)分量分别进行编码,它们的取值范围同ITU-R BT.601。即黑色=16,白色=235,色差的最大值等于240,最小值等于16。
下面为5种 CIF 图 像格式的参数说明。参数次序为“图象格式 亮度取样的象素个数(dx) 亮度取样的行数 (dy) 色度取样的象素个数(dx/2) 色度取样的行数(dy/2)”。
sub-QCIF 128 96 64 48
QCIF 176 144 88 72
CIF 352 288 176 144
4CIF 704 576 352 288
16CIF 1408 1152 704 576
H.263数字视频压缩
一、视频压缩编码的基本概念
视频压缩的目标是在尽可能保证视觉效果的前提下减少视频数据率。视频压缩比一般指压缩后的数据量与压缩前的数据量之比。
在视频压缩中常需用到以下的一些基本概念:
1 有损和无损压缩:在视频压缩中有损(Lossy )和无损(Lossless)的概念与静态图像中基本类似。 无损压缩也即压缩前和解压缩后的数据完全一致。有损压缩意味着解压缩后的数据与压缩前的数据不一致。在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或 音频信息,而且丢失的信息不可恢复。丢失的数据率与压缩比有关,压缩比越小,丢失的数据越多,解压缩后的效果一般越差。此外,某些有损压缩算法采用多次重 复压缩的方式,这样还会引起额外的数据丢失。
2 帧内和帧间压缩:帧内(Intraframe)压缩也称为空间压缩(Spatial compression)。当压缩一帧图像时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息,这实际上与静态图像压缩类似。帧内压缩一般 达不到很高的压缩。
采用帧间(Interframe)压缩是基于许多视频或动画的连 续前后两帧具有很大的相关性,或者说前后两帧信息变化很小的特点。也即连续的视频其相邻帧之间具有冗余信息,根据这一特性,压缩相邻帧之间的冗余量就可以 进一步提高压缩量,减小压缩比。帧间压缩也称为时间压缩(Temporal compression),它通过比较时间轴上不同帧之间的数据进行压缩。帧间压缩一般是无损 的。
3 对称和不对称编码:对称性(symmetric)是压缩编码的一个关键特征。对称意味着压缩和解压缩占用相同的计算处理能力和时间, 对称算法适合于实时压缩和传送视频,如视频会议应用就以采用对称的压缩编码算法为好。不对称或非对称意味着压缩时需要花费大量的处理能力和时间,而解压缩 时则能较好地实时回放,也即以不同的速度进行压缩和解压缩。一般地说,压缩一段视频的时间比回放(解压缩)该视频的时间要多得多。
二、H.263压缩编码格式
1 H.263压缩编码格式
H.263 视频编码标准是专为中高质量运动 图像压缩所设计的低码率图像压缩标准。H.263 采用运动视频编码中常见的编码方法,将编码过程分为帧内编码和帧间编码两个部分。I帧内用改进的DCT 变换并量化,在帧间采用1/2 象素运动矢量预测补偿技术,使运动 补偿更加精确,量化后适用改进的变长编码表(VLC)地量化数据进行熵编码,得到最终的编码系数。