格式化(formatting)是信号处理最基本的步骤,其目的是使消息(源信号)适合于数字处理。传输格式化(transmit formatting)是从源信息到数字码元的变换(在接收端则是相反的变换)。如果除了格式化之外,该步骤中还用到数据压缩,则称为信源编码(source coding)。一些学者认为格式化是信源编码的特例。本文讨论格式化(以及基带调制)。
在图 2.1 中,标号为“格式化”的突出部分涉及到一系列如何将模拟信息数字化的问题。数字消息在被进一步变换到基带(脉冲)波形之前,处于二进制 1
和 0
的逻辑状态,这个重要的变换称为脉冲调制,这些基带(脉冲)波形可以通过电缆传输。图 2.1 中标号为“基带信号处理”的方框包括了一系列将在本文描述的脉冲调制波形。所谓基带信号,通常指的是其频谱从直流(或直流附近)到不超过兆赫的有限值的信号。
图 2.1 给出了典型数字通信系统的框图。图 2.2 则以格式化和基带信号传输为重点,给出了此功能图的另一种描述。已经是数字格式的数据将不再格式化;而文本信息则由编码器转换成二进制数;模拟信息经过采样、量化和编码 3 个独立的过程而被格式化。格式化的结果均为二进制数字序列。
数字信号经由诸如金属导线或同轴电缆等基带信道进行传输。但如果不先将数字信号转换成适合信道传输的波形,这些二进制数字信号就不能在信道中传输。对于基带信道而言,脉冲即是适合的波形。
在图 2.2 中,从比特流到脉冲波形序列的变换发生在脉冲调制方框中。调制器的输出通常是一个脉冲序列,其特性与传输的数字信号有关。经信道传输后,恢复(解调)和检测脉冲波形并生成所传输的数字信号的一个估计值;最后一步(反)格式化,生成源信息的估计值。
大多数通信数据(计算机之间的传输除外)的原始形式是文本信息或模拟信息。如果数据由文字、数字组成,这些数据将按照某一标准格式进行字符编码,常用的标准格式有用于信息交换
的 7
比特美国信息交换标准码(ASCII)、扩展二进制编码的十进制交换码(EBCDIC)、博多码和霍尔瑞斯码,由此可以将文本转换成数字格式。ASCII 码格式见图 2.3,EBCDIC 码的格式见图 2.4。
比特位表示串行传输的顺序,比特数 1
是第一个信号单元。因此,字符编码就是将文本转换为二进制数字(比特)。有时会修改现有的字符代码以用于某些特殊场合,比如 7
比特 ASCII 码(图 2.3)加一位后可用于差错检测。另一方面,有时字符代码被压缩为 6
比特的 ASCII 码,6
比特的 ASCII 码仅能提供 64
个字符,而 7
比特的 ASCII 码可以提供 128
个字符。
文本消息由包括文字和数字的字符序列组成。数字化传输时,这些字符首先被编码成比特序列,称为比特流(bits tream)或基带信号(base band signal)。然后从有限的码元组或 M = 2 k M= 2^k M=2k 个码元的字符表中,将 k k k 比特的码组组合成新的数字或码元。使用码元集大小为 M M M 的系统称为 M M M 进制系统( M M M-ary system)。在任何数字通信系统的设计中, k k k 或 M M M 的值是首要考虑的参数。对 k = 1 k = 1 k=1 的二进制系统而言,码元集大小 M = 2 M=2 M=2,调制器使用两个不同波形中的一个来代表二进制 1
,另一个波形代表二进制 0
。在这个特例中,码元与比特是相等的。对 k = 2
的四进制系统而言,在每个码元时间内,调制器使用 4
个不同波形之一来代表该码元。消息比特序列的划分取决于码组大小 M M M。下面的例子有助于阐明“消息”、“字符” 、“码元” 、“比特”和“数字波形”之间的关系。
图 2.5 给出了比特流划分的例子,它基于对 k k k 值或 M M M 值的系统标准规范。图中的文本消息为单词“THINK”,使用 6
比特的 ASCII 字符编码(图 2.3 中 1 比特位到 6 比特位)生成了由 30 个比特组成的比特流。图 2.5a 中码组的大小 M M M 定为 8(即每个码元代表一个八进制数),因此比特流被分成 3 个比特一组( k = log 2 8 k =\log_28 k=log28),产生的 10 个代表 8 进制码元的数字被发送。发射机必须能够发送 8 个不同的波形 s i ( t ) ( i = 1 , ⋯ , 8 ) s_i\left( t \right)\left( i = 1, \cdots, 8 \right) si(t)(i=1,⋯,8),来代表各种可能的码元,每个波形必须在一个码元周期中发送。图 2.5a 中的最后一行列出了 8 进制调制系统中传输的代表文本消息“THINK” 的 10 个波形。
在图 2.5b 中码组的大小 M M M 定为 32(即每个码元代表一个32 进制数),因此比特流被分成 5 个比特一组, 产生的 6 个代表 32 进制码元的数字被发送。注意,没有必要使码元边界和字符边界一致,第一个码元代表第一个字符“T”的 5/6 , 第二个码元代表字符“F”剩余的 1/6 和下一个字符“H”的 4/6, 依此类推,字符不一定要划分得很美观。系统将字符视为一串待传输的数字, 而不像终端用户(或用户的电传打字机)要从接收到的比特序列中获得文本信息。在 32 进制系统中,发射机要能够发送 32 个不同的波形 s i ( t ) ( i = 1 , ⋯ , 32 ) s_i\left( t \right)\left( i = 1, \cdots, 32 \right) si(t)(i=1,⋯,32),来代表可能被传输的码元。图 2.5b 中最后行列出了 32 进制调制系统中传输的代表文本消息“THINK”的 6 个波形。
模拟信息不像文本数据那样能够直接编码为字符,它必须首先转换成数字格式。将模拟波形转换成适合于数字通信系统传输的格式,首先必须对其进行采样,以形成离散的脉冲调制波形,下面讨论这一过程。
模拟波形及其采样信号之间的联系由采样过程确定,这个过程可以用几种方法实现,最常用的是采样保持(sample-and-hold)。此时, 一个转换和存储装置(比如晶体管与电容,或者快门与胶卷)产生连续输入波形的一个采样序列。采样过程的输出称为脉冲幅度调制(PAM),因为待续的输出间隔可以由一个幅度经输入波形样值获取的脉冲序列来描述。将 PAM 波形通过简单的低通滤波器可以近似恢复出模拟波形。重要的问题是,滤波后的 PAM 波形与原始输入波形能达到什么样的近似程度?回顾一下采样定理: 频谱不超过 f m f_m fm 赫兹的带限信号可以由其等间隔采样值唯一确定,采样间隔为
T s ⩽ 1 2 f m 秒 T_s\leqslant \frac{1}{2f_m}秒 Ts⩽2fm1秒这也称为均匀采样定理(uniform sampling theorem),换句话说,采样间隔 T s T_s Ts 的上限可以由采样速率 f s f_s fs 来表示, 即 f s = 1 T s f_s = \dfrac{1}{T_s} fs=Ts1。对采样速率的限制称为奈奎斯特准则:
f s ⩾ 2 f m f_s\geqslant2f_m fs⩾2fm采样速率 f s = 2 f m f_s=2f_m fs=2fm 称为奈奎斯特频率。奈奎斯特准则是模拟信号能够由一组等间隔、离散时间样值在理论上完全恢复的充分条件。后续将用不同的采样方法证明采样定理的正确性。
下面利用傅里叶变换的频域卷积性质来证明采样定理。首先考虑使用一系列单位冲激函数进行理想采样的情况。假设如图 2.6a 所示的模拟波形 x ( t ) x\left( t \right) x(t) 的傅里叶变换为 X ( f ) X \left( f \right) X(f),在区间 − f m < f < f m -f_m < f
x δ ( t ) = ∑ n = − ∞ ∞ δ ( t − n T s ) x_{\delta}\left( t \right) =\sum_{n=-\infty}^{\infty}{\delta \left( t-nT_s \right)} xδ(t)=n=−∞∑∞δ(t−nTs)其中, T s T_s Ts 是采样周期, δ ( t ) \delta \left( t \right) δ(t)是单位冲激函数,或称为狄拉克德尔塔函数。 T s = 1 2 f m T_s =\dfrac{1}{2}f_m Ts=21fm时恰好满足奈奎斯特准则。
根据冲激函数的筛分性质 x ( t ) δ ( t − t 0 ) = x ( t 0 ) δ ( t − t 0 ) x\left( t \right) \delta \left( t-t_0 \right) =x\left( t_0 \right) \delta \left( t-t_0 \right) x(t)δ(t−t0)=x(t0)δ(t−t0),可得 x ( t ) x\left( t \right) x(t) 的采样信号 x s ( t ) x_s\left( t \right) xs(t) 为(如图 2.6e 所示)
x s ( t ) = x ( t ) x δ ( t ) = ∑ n = − ∞ ∞ x ( t ) δ ( t − n T s ) = ∑ n = − ∞ ∞ x ( n T s ) δ ( t − n T s ) x_s\left( t \right) =x\left( t \right) x_{\delta}\left( t \right) =\sum_{n=-\infty}^{\infty}{x\left( t \right) \delta \left( t-nT_s \right)}=\sum_{n=-\infty}^{\infty}{x\left( nT_s \right) \delta \left( t-nT_s \right)} xs(t)=x(t)xδ(t)=n=−∞∑∞x(t)δ(t−nTs)=n=−∞∑∞x(nTs)δ(t−nTs) 根据傅里叶变换的频域卷积性质,时域乘积 x ( t ) x δ ( t ) x\left( t \right) x_{\delta}\left( t \right) x(t)xδ(t) 对应于频域卷积 X ( f ) ∗ X δ ( f ) X\left( f \right) \ast X_{\delta}\left( f \right) X(f)∗Xδ(f),其中
X δ ( f ) = 1 T s ∑ n = − ∞ ∞ δ ( f − n f s ) X_{\delta}\left( f \right) =\frac{1}{T_s}\sum_{n=-\infty}^{\infty}{\delta \left( f-nf_s \right)} Xδ(f)=Ts1n=−∞∑∞δ(f−nfs)是冲激序列 x δ ( t ) x_{\delta}\left( t \right) xδ(t) 的傅里叶变换, f s = 1 T s f_s=\dfrac{1}{T_s} fs=Ts1 是采样速率。注意,一个冲激序列的傅里叶变换是另—个冲激序列,两个序列的周期值互为倒数关系,图 2.6c 和图 2.6d 分别表示冲激序列 x δ ( t ) x_{\delta}\left( t \right) xδ(t) 及其傅里叶变换 X δ ( f ) X_{\delta}\left( f \right) Xδ(f)。
函数与冲激函数相卷积时,只需对原函数进行如下的简单移位:
X ( f ) ∗ δ ( f − n f s ) = X ( f − n f s ) X\left( f \right) \ast \delta \left( f-nf_s \right) =X\left( f-nf_s \right) X(f)∗δ(f−nfs)=X(f−nfs)由此,采样波形的傅里叶变换 X s ( f ) X_s\left( f \right) Xs(f) 为
X s ( f ) = X ( f ) ∗ X δ ( f ) = X ( f ) ∗ [ 1 T s ∑ n = − ∞ ∞ δ ( f − n f s ) ] = 1 T s ∑ n = − ∞ ∞ X ( f − n f s ) X_s\left( f \right) =X\left( f \right) \ast X_{\delta}\left( f \right) =X\left( f \right) \ast \left[ \frac{1}{T_s}\sum_{n=-\infty}^{\infty}{\delta \left( f-nf_s \right)} \right] =\frac{1}{T_s}\sum_{n=-\infty}^{\infty}{X\left( f-nf_s \right)} Xs(f)=X(f)∗Xδ(f)=X(f)∗[Ts1n=−∞∑∞δ(f−nfs)]=Ts1n=−∞∑∞X(f−nfs) 因此,可以得出这样的结论: 在原来的频带范围内,采样信号 x s ( t ) x_s\left( t \right) xs(t) 的频谱 X s ( f ) X_s\left( f \right) Xs(f) 与原信号的频谱只差一个常数因子 1 T s \dfrac{1}{T_s} Ts1。另外,每隔 f s f_s fs 赫兹,采样信号频谱对自已进行周期性的复制。冲激函数的筛分性质使得冲激序列与其他函数的卷积变得非常容易。因此,将冲激函数作为采样函数,只需将图 2.6d 的冲激序列 X δ ( f ) X_{\delta}\left( f \right) Xδ(f) 与图 2.6b 中原函数的傅里叶变换 ∣ X ( f ) ∣ \left| X\left( f \right) \right| ∣X(f)∣ 相卷积,在冲激序列中每个冲激到来的频率处对 ∣ X ( f ) ∣ \left| X\left( f \right) \right| ∣X(f)∣ 进行复制就得到 ∣ X s ( f ) ∣ \left| X_s\left( f \right) \right| ∣Xs(f)∣,如图 2.6f 所示。
当采样速率选定后,例如 f s = 2 f m f_s=2f_m fs=2fm,频谱中每个波形与其相邻的波形之间在频率上相隔为 f s f_s fs 赫兹,经过滤波,理论上可以由样值完全恢复出模拟波形。但这时需要有无限陡峭边缘的滤波器。很明显,如果 f s > 2 f m f_s>2f_m fs>2fm,则相邻频谱之间在频率上间隔较远, 如图 2.7a 所示,这就使滤波变得容易实现。能够分离出基带频谱分量的典型低通滤波器特性如图中虚线所示。当采样速率降低到 f s < 2 f m f_s < 2f_m fs<2fm 时,各个复制频谱将会重叠,如图 2.7b 所示,某些信息将会丢失。这种因欠采样(采样速率太低)引起的现象称为混叠(aliasing)。当采样速率低于奈奎斯特采样速率 f s = 2 f m f_s=2f_m fs=2fm 时,就会出现混叠现象;为了避免混叠,采样速率必须满足奈奎斯特准则,即 f s ⩾ 2 f m f_s\geqslant2f_m fs⩾2fm。
在实际应用中,无论工程上的波形还是可实现的带限滤波器都不是严格带限的。严格带限的信号实际上并不存在,因此对于可实现的信号,即使我们将其看做带限的,采样时也总是会有一些混叠。但是,这些信号和滤波器可以看做基本带限的,因为如果在某一频率外频谱分量小到可以忽略不计时,就可以认为其带宽是有限的。
下面利用傅里叶变换的频移特性来证明采样定理的有效性。虽然瞬时采样的方法很方便,但是如果对如图 2.8a 所示的带限模拟信号 x ( t ) x\left( t\right) x(t) 进行采样,更实际的方法是将 x ( t ) x\left( t\right) x(t) 与如图 2.8c 所示的脉冲序列或开关波形 x p ( t ) x_p\left( t\right) xp(t) 相乘。 x p ( t ) x_p\left( t\right) xp(t) 中每个脉冲宽度为 T T T,幅度为 1 T \dfrac1T T1。与 x p ( t ) x_p\left( t\right) xp(t) 相乘可以认为是开关的打开和闭合。与前面一样,采样速率为 f s f_s fs,其倒数,即采样间隔为 T s T_s Ts。得到的采样数据序列 x s ( t ) x_s\left( t\right) xs(t) 如图 2.8e 所示,即
x s ( t ) = x ( t ) x p ( t ) x_s\left( t \right) =x\left( t \right) x_p\left( t \right) xs(t)=x(t)xp(t)这种采样之所以称为自然采样(natural sampling),是因为 x s ( t ) x_s\left( t\right) xs(t) 中每个脉冲的顶部都保持了脉冲时间内相应的模拟部分的形状。将周期脉冲序列表示成傅里叶级数:
x p ( t ) = ∑ n = − ∞ ∞ c n e j 2 π n f s t x_p\left( t \right) =\sum_{n=-\infty}^{\infty}{c_ne^{j2\pi nf_st}} xp(t)=n=−∞∑∞cnej2πnfst其中,采样速率 f = 1 T s = 2 f m f=\dfrac{1}{T_s}=2f_m f=Ts1=2fm,这时恰好满足奈奎斯特准则。由傅里叶级数的性质,有
c n = 1 T s sinc n T T s c_n=\frac{1}{T_s}\text{sinc}\frac{nT}{T_s} cn=Ts1sincTsnT其中, T T T 为脉冲宽度, 1 T \dfrac1T T1 为脉冲幅度, 并且有
sinc y = sin π y π y \text{sinc}\, y=\frac{\sin\pi y}{\pi y} sincy=πysinπy图 2.8d 虚线所示的脉冲序列频谱幅度的包络具有 sinc \text{sinc} sinc 函数形状。进一步将 x s ( t ) x_s\left( t \right) xs(t)表示为
x s ( t ) = x ( t ) ∑ n = − ∞ ∞ c n e j 2 π n f s t x_s\left( t \right) =x\left( t \right) \sum_{n=-\infty}^{\infty}{c_ne^{j2\pi nf_st}} xs(t)=x(t)n=−∞∑∞cnej2πnfst采样波形 x s ( t ) x_s\left( t \right) xs(t) 的傅里叶变换如下:
X s ( f ) = ∑ n = − ∞ ∞ c n F { x ( t ) e j 2 π n f s t } X_s\left( f \right) =\sum_{n=-\infty}^{\infty}{c_n\mathscr{F}\left\{ x\left( t \right) e^{j2\pi nf_st} \right\}} Xs(f)=n=−∞∑∞cnF{x(t)ej2πnfst}利用傅里叶变换的移频特性,求得 X s ( f ) X_s\left( f \right) Xs(f) 如下:
X s ( f ) = ∑ n = − ∞ ∞ c n X ( f − n f s ) X_s\left( f \right) =\sum_{n=-\infty}^{\infty}{c_nX\left( f-nf_s \right)} Xs(f)=n=−∞∑∞cnX(f−nfs)与单位冲激采样类似,上式和图 2.8f 表明 X s ( f ) X_s\left( f \right) Xs(f) 是频谱上每隔 f s f_s fs 对 X s ( f ) X_s\left( f \right) Xs(f) 的周期性复制。但是在这种自然采样情况下,可以看出 X s ( f ) X_s\left( f \right) Xs(f) 被脉冲序列的傅里叶级数系数加权,而在冲激采样中 X s ( f ) X_s\left( f \right) Xs(f) 则是个常数。在极限情况下,当脉冲宽度 T T T 趋向于 0 0 0 时, c n c_n cn 对所有 n n n 均趋向于 1 T \dfrac1T T1, X s ( f ) X_s\left( f \right) Xs(f) 收敛于 1 T s ∑ n = − ∞ ∞ X ( f − n f s ) \displaystyle\frac{1}{T_s}\sum_{n=-\infty}^{\infty}{X\left( f-nf_s \right)} Ts1n=−∞∑∞X(f−nfs)。
最简单因而最常用的采样方法是采样保持,它由图 2.6e 所示的采样脉冲序列 [ x ( t ) x δ ( t ) ] \left[ x\left( t \right) x_{\delta}\left( t \right) \right] [x(t)xδ(t)] 与脉宽为 T s T_s Ts 的单位幅度矩形脉冲 p ( t ) p \left( t \right) p(t) 两者的卷积来描述。这时卷积的结果为平顶采样序列:
x s ( t ) = p ( t ) ∗ [ x ( t ) x δ ( t ) ] = p ( t ) ∗ [ x ( t ) ∑ n = − ∞ ∞ δ ( t − n T s ) ] x_s\left( t \right) =p\left( t \right) \ast \left[ x\left( t \right) x_{\delta}\left( t \right) \right] =p\left( t \right) \ast \left[ x\left( t \right) \sum_{n=-\infty}^{\infty}{\delta \left( t-nT_s \right)} \right] xs(t)=p(t)∗[x(t)xδ(t)]=p(t)∗[x(t)n=−∞∑∞δ(t−nTs)]另外,时域卷积的傅里叶变换 X s ( f ) X_s\left( f\right) Xs(f),在频域中等于矩形脉冲的傅里叶变换 P ( f ) P\left( f\right) P(f) 与图 2.6f 中冲激采样的周期频谱的乘积:
X s ( f ) = P ( f ) F { x ( t ) ∑ n = − ∞ ∞ δ ( t − n T s ) } = P ( f ) { X ( f ) ∗ [ 1 T s ∑ n = − ∞ ∞ δ ( f − n f s ) ] } = P ( f ) 1 T s ∑ n = − ∞ ∞ X ( f − n f s ) \begin{aligned} X_s\left( f \right) &=P\left( f \right) \mathscr{F}\left\{ x\left( t \right) \sum_{n=-\infty}^{\infty}{\delta \left( t-nT_s \right)} \right\} =P\left( f \right) \left\{ X\left( f \right) \ast \left[ \frac{1}{T_s}\sum_{n=-\infty}^{\infty}{\delta \left( f-nf_s \right)} \right] \right\} \\ &=P\left( f \right) \frac{1}{T_s}\sum_{n=-\infty}^{\infty}{X\left( f-nf_s \right)} \end{aligned} Xs(f)=P(f)F{x(t)n=−∞∑∞δ(t−nTs)}=P(f){X(f)∗[Ts1n=−∞∑∞δ(f−nfs)]}=P(f)Ts1n=−∞∑∞X(f−nfs)其中, P ( f ) P\left( f\right) P(f) 形如 T s sinc f T s T_s\text{sinc}\,fT_s TssincfTs 相乘所得的频谱外观上与图 2.8f 所示的自然采样频谱相似。将图 2.8f 与图 2.6f 相比较可见,保持操作最明显的影响就是高频部分的频谱复制具有很大的衰减,这是所期待的结果。模拟信号的后置滤波,通常要通过进一步衰减采样速率整数倍处的残留频谱分量来完成滤波过程。保待操作第二个影响是将非均匀谱增益 P ( f ) P\left( f\right) P(f) 施加于上式所示的理想基带频谱。后置滤波将 P ( f ) P\left( f\right) P(f) 的倒数与通频带内信号相乘来补偿这一衰减。
图 2.9 是基带频谱的正半部分以及由图 2.7b 得到的某个频谱复制,它阐明了频域中的混叠现象。图 2.9b 中所示的重叠区域,是由于采样速率太低而导致混叠的频谱部分。混叠的频谱分最将会导致在 ( f s − f m ) \left( f_s - f_m \right) (fs−fm) 到 f m f_m fm 之间的频带范围内的信息丢失。图 2.10 表明将采样速率提高到 f s ′ f_s^{'} fs′ 即可将复制的各部分频谱隔开以消除混叠,图 2.10b 中得到的频谱与图 2.7a 中的频谱是一致的。图 2.11 和图 2.12 说明了利用抗混叠滤波器来消除混叠干扰的两种方式。在图 2.11 中,模拟信号经前置滤波后,最大频率 f m ′ f_m^{'} fm′ 降低到 f s 2 \dfrac{f_s}{2} 2fs 或者更低,由于 f s > 2 f ′ f_s>2f^{'} fs>2f′,图 2.11b 中不会有混叠的频谱。采样之前消除混叠在工程实际应用上大有益处。若信号结构已知,也可以在采样之后将采样数据通过一个低通滤波器以消除混叠。在图 2.12 中,混叠部分在采样后经后置滤波消除,滤波器的截止频率为 f m ′ ′ f_m^{''} fm′′,要滤除混叠部分, f m ′ ′ f_m^{''} fm′′ 必须小于 ( f s − f m ) \left( f_s - f_m \right) (fs−fm)。值得注意的是,在图 2.11 和图 2.12 中,消除频谱混叠部分的滤波技术将会导致一些信息的丢失。因此,采样速率、截止带宽以及用于特定带宽信号的滤波器类型的选取都是密切相关的。
可实现滤波器在通频带和所需的带外衰减之间,需要有一个非零宽度的频带过渡,这就是所谓的过渡带宽(transition bandwidth)。为使采样速率最小化,通常希望抗混叠滤波器的过渡带宽要小。过渡带宽窄的滤波器,其复杂性和价格都会急剧上升,因此,在减小滤波器的过渡带宽和提高采样速率两者之间需要权衡,提高采样速率意味着要提高存储和转发速率。许多系统将滤波器的过渡带宽定为信号带宽的 10 % ∼ 20 % 10 \%\sim20\% 10%∼20%。如果将抗混叠滤波器的过渡带宽设为 20 % 20\% 20%, 则工程上的奈奎斯特采样速率为:
f m ⩾ 2.2 f m f_m\geqslant2.2f_m fm⩾2.2fm 图 2.13 阐述了时域中的混叠。实线正弦波信号上的采样时刻是经过选择的,以使原正弦信号欠采样。值得注意的是,由于结果的不定性,根据欠采样点可能会画出一条完全不同的正弦曲线(如虚线所示) 。
过采样是将模拟信号转换成数字信号,或者反过来将数字信号转换成模拟信号最经济的解决办法。这是因为完成同样任务, 用高性能的模拟信号处理设备比用高性能的数字信号处理设备要昂贵得多。以将模拟信号转换成数字信号为例,如果不利用过采样的话,该过程由以下 3 个有序步骤组成:
当采用过采样时,该过程由以下 5 个有序的简单步骤组成:
下面两小节论述过采样的优点。
用来限定输入信号带宽的模拟滤波器,其通频带等于输入信号的带宽,而后过渡到阻带。过渡带宽的存在导致输出信号的带宽增加 f t f_t ft。 滤波输出波形的奈奎斯特频率 f s f_s fs 的标称值等于 2 f m 2f_m 2fm(被采样信号最高频率的两倍),现在必须增加到 2 f m + f t 2f_m+f_t 2fm+ft,滤波器的过渡带宽在采样过程中表现为一段额外的开销。这段增加的频谱不是有用的信号带宽,但它为采样过程中可能导致的混叠预留了一段频谱,可以起到保护信号带宽的作用。混叠项的出现是由于实际信号不可能是严格带限过程。典型的过渡带宽是在奈奎斯特准则所决定的采样速率的基础上增加 10 % 10 \% 10% 到 20 % 20 \% 20%。CD 数字音频系统和数字音带(DAT)系统中都可以找到系统开销的例子。CD 数字音频系统的双边带带宽为 40 kHz 40\,\text{kHz} 40kHz,采样速率为 44.1 kHz 44.1\,\text{kHz} 44.1kHz;数字音带(DAT)系统的双边带带宽为 40 kHz 40\,\text{kHz} 40kHz,采样速率为 48 kHz 48\,\text{kHz} 48kHz。
我们的初衷是要设计过渡带宽小的模拟滤波器,以使采样速率尽可能低。但是模拟滤波器具有两个不受欢迎的性质。首先,过渡带宽窄的滤波器会导致失真(相位对频率的非线性);其次,过渡带宽窄的滤波器代价很高,因为过渡带宽窄意味着高阶滤波器需要大盘高质量元件。我们希望采样器工作在尽可能低的速率上,以减小数据存储的代价,而这正是困难所在。为此必须设计一种过渡带宽窄的复杂的模拟滤波器,但这种滤波器不仅昂贵,还会使设计时原本要保护( 避免混叠)的信号产生失真。
过采样是一种出色的解决方案,它使本来不可能解决的问题迎刃而解。用低成本、低复杂性的模拟预滤波器限制输入信号的带宽。选择较宽的过渡带宽可以使得这种模拟滤波器得到简化。由于过渡带宽增大,频谱变宽,所需的采样速率必须相应增加。开始时一般将采样速率定为原来采样速率的 4 4 4 倍, 在此基础上设计模拟滤波器,使其过渡带宽与采样速率的增加相适应。例如,对采样速率为 44.1 kHz 44.1\,\text{kHz} 44.1kHz 的 CD 信号进行滤波,需要使用过渡带宽为 44.1 kHz 44.1\,\text{kHz} 44.1kHz 的复杂的 10 阶椭圆滤波器(意味着滤波器中含有 10 个储能元件,如电容和电感)。而如果采用过采样,采样速率变为 176.4 kHz 176.4\,\text{kHz} 176.4kHz 对其滤波只需要过渡带宽为 136.4 kHz 136.4\,\text{kHz} 136.4kHz 的简单的 4 阶椭圆滤波器(仅有 4 个储能元件)。
既然现在得到的是采样速率比所期望的要高的采样数据, 那么将其通过高性能低成本的数字滤波器就可以实现抑制混叠的滤波过程。由此数字滤波器可以实现窄过渡带宽,不但没有模拟滤波器的失真现象,而且成本较低。经数字滤波后,信号的过渡带宽减小,下一步就是降低该信号的(再)采样速率。优秀的数字信号处理技术可以在同一个结构内实现滤波和再采样。
现在从系统角度考虑如何进一步提高数据采集过程的质措。模拟预滤波器会导致幅度和相位的失真,我们有关于该失真的确切知识,并且可以对数字滤波器进行设计,使其不仅可以完成模拟前置滤波器抑制混叠的任务,还可以补偿幅度和相位失真,滤波器的复合响应可以由设计者控制。由此,以较小的代价就可以得到高质量(失真小)的采集信号。计算机产业的发展使数字信号处理硬件的价格逐年显著降低,而模拟信号处理硬件则不然。
数字信号到模拟信号的转换(DAC)过程中也利用了过采样。如果数-模转换器 DAC 之后的模拟滤波器的过渡带宽过窄,输出的模拟信号就会受到失真的影响。但如果事先将数字信号过采样后再送至 DAC 的话,就不会出现这个问题。
现在来看图 2.14 中模拟源信息的 4 种形式。图 2.14a 是原始模拟波形,图 2.14b 是原始波形的采样,这里采用的是自然采样或称为 PAM。图 2.14b 中的采样数据与数字系统不能兼容,因为每个自然采样的幅度仍然有无穷多种可能的取值,而数字系统只能处理数量有限的数据。即使采用平顶采样,仍然有无限多种可能的脉冲取值,因为采样数据反映了连续模拟波形所有可能的取值。图 2.14c 给出了由离散脉冲所代表的原始波形,这里的脉冲是平顶的,且脉冲的幅度被限制在一个有限集上。每个脉冲的幅度取值于一组预定的电平集合,这些预定的电平可以由固定字符表中的码元来表示。图 2.14c 中的脉冲称为量化样值(quantized sample),选择这种格式,很明显是为了与数字系统相兼容。图 2.14d 中的格式可以认为是采样保持电路的输出。当样值量化为一个有限集时,就可以与数字系统相兼容了。量化后仍然可以恢复出模拟波形,只不过没有原始的波形精确,但通过增加量化级数(这需要增加系统带宽)可以改善模拟波形恢复的保真度。量化引起的信号失真将在后续讨论。
模拟信号在采样、量化、传输过程中势必会受到一些干扰源的影响,这些干扰源与采样、量化效应和信道传输效应密切相关。下面讨论这些效应。
量化时的固有失真由舍入或截断误差引起。将 PAM 信号编码为量化 PAM 信号过程中会丢失一些原始模拟信息。将模拟波形近似为采样量化值而引起的失真称为量化噪声(quantization noise),量化噪声与量化过程中采用的电平数目成反比。
量化器(或模-数转换器)用 L L L 个电平将取值连续的输入信号近似为一组取值有限的输出值。保证较小输入输出误差的输入信号范围称为转换器的动态范围。如果输入超出这个范围,则输出与输入的误差变大,这时称转换器处于饱和状态。饱和误差增大时比量化误差更令人难以接受。通常可以用自动增益控制(AGC)来避免饱和现象,AGC 可以有效地增大转换器的动态范围。
采样定理说明,精确恢复原始信号的基础是对信号进行等间隔采样。如果在采样时刻处有一微小抖动,就不再是等间隔采样了。虽然在采样时刻已知的情况下仍然有可能精确恢复原信号,但问题是抖动通常是随机过程,因此不可能准确得知采样时刻。抖动在效果上相当于对基带信号进行频率调制(FM)。如果抖动是随机的,则相当于引入了一个低电平的宽带频谱,其性质与量化噪声很接近。如果抖动中有周期分量,就像从录音带中提取数据时可能出现的那样,则周期性调频将在数据中引入低电平谱线。有效地隔离电源以及稳定参考时钟有助于控制定时抖动失真。
热噪声来自于其他用户干扰和电路切换时的瞬时干扰,在检测数字采样脉冲时,热噪声会引起误差。信道引入的误差会急剧降低恢复信号的质量,由信道引入的误差而造成的输出信号质量迅速降低称为门限效应(threshold effect)。在信道噪声很小的情况下,检测不会有什么问题,较小的噪声不会干扰恢复信号, 此时恢复过程中惟一的噪声就是量化噪声。反之,如果信道噪声大到足以影响对波形的检测的话,则相应的检测误差就会造成恢复误差。信道噪声电平的微小变化都可能会造成很大的误差。
信道总是带限的,带限信道对通过的脉冲波形进行拓展。当信道带宽远大于脉冲带宽时,脉冲的拓展很小;当信道带宽接近于信号带宽时,拓展将会超过一个码元周期,造成信号脉冲的重叠,这种重叠称为码间串扰(ISI)。与其他干扰源一样,码间串扰会引起系统性能降低(高误码率)。码间串扰是一种隐患很大的干扰,用提高信号功率的方法来克服码间串扰并不总能够改善误差性能 。
图 2.15 对峰-峰值电压为 V pp = V p − ( − V p ) = 2 V p V_{\text{pp}}=V_p-\left( -V_p \right) =2V_p Vpp=Vp−(−Vp)=2Vp 伏的模拟信号进行 L L L 电平线性量化,量化值如图所示。相邻量化电平之间的跨距为 q q q 伏,称为量化间隔(quantile interval)。当量化电平均匀分布于整个动态范围时,就称该量化器为均匀量化器(uniform quantizer)或线性量化器(linear quantizer)。模拟波形的每个样值被近似为一个量化电平,这种近似会造成绝对值不超过 q 2 \dfrac q2 2q 伏的误差,因而由量化引起的信号质量降低仅限于半个量化间隔, 即 ± q 2 \pm\dfrac q2 ±2q伏。
均匀量化器的优点是其量化方差(均值为 0 时的均方误差)容易计算。假设量化误差 e e e 均匀分布于宽度为 q q q 的量化间隔上(比如输入模拟信号等概取值时),则量化方差为:
σ 2 = ∫ − q 2 + q 2 e 2 p ( e ) d e = ∫ − p 2 + p 2 e 2 1 q d e = q 2 12 \sigma ^2=\int_{-\frac{q}{2}}^{+\frac{q}{2}}{e^2p\left( e \right) \text{d}e}=\int_{-\frac{p}{2}}^{+\frac{p}{2}}{e^2\frac{1}{q}\text{d}e}=\frac{q^2}{12} σ2=∫−2q+2qe2p(e)de=∫−2p+2pe2q1de=12q2其中, p ( e ) = 1 q p\left( e \right) =\dfrac{1}{q} p(e)=q1 是均匀量化误差的概率密度函数。方差 σ 2 \sigma ^2 σ2 与平均量化噪声功率有关,模拟信号的峰值功率(单位电阻 1)为
V p 2 = ( V pp 2 ) 2 = ( L q 2 ) 2 = L 2 q 2 4 V_{p}^{2}=\left( \frac{V_{\text{pp}}}{2} \right) ^2=\left( \frac{Lq}{2} \right) ^2=\frac{L^2q^2}{4} Vp2=(2Vpp)2=(2Lq)2=4L2q2其中, L L L 是量化级数。由上两式可得,在码间串扰或信道噪声忽略不计时,峰值信号功率与平均量化噪声功率的比值 ( S N ) q \left( \dfrac{S}{N}\right) _q (NS)q 为
( S N ) q = L 2 q 2 / 4 q 2 / 12 = 3 L 2 \left( \frac{S}{N} \right) _q=\frac{L^2q^2/4}{q^2/12}=3L^2 (NS)q=q2/12L2q2/4=3L2由上式可见,信噪比 ( S N ) q \left( \dfrac{S}{N}\right) _q (NS)q 的改善量是量化级数平方的函数。极限情况( L → ∞ L\to\infty L→∞)下,信号趋于 PAM 格式(没有量化),信号功率与量化噪声功率的比值趋于无穷,换句话说,当量化级数无穷大时,将没有量化噪声。
脉冲编码调制(PCM)指的是通过将每个 PAM 信号的量化值编码为一个码字而获得的基带信号。源信息经采样和量化后,每个采样量化值被编码为 l l l 比特( l = log 2 L l=\log_2L l=log2L)的代码。对基带传输来说,紧接着代码将被转换成脉冲波形,二进制PCM 码的基本特征如图 2.16。假设模拟信号 x ( t ) x\left( t \right) x(t) 的动态范围为 − 4 V -4\text{ V} −4 V 到 + 4 V +4\text{ V} +4 V。量化电平间的步长设为 1 V 1 \text{ V} 1 V,于是共有 8 个量化电平: − 3.5 V , − 2.5 V , ⋯ , + 3.5 V -3.5\text{ V},-2.5\text{ V},\cdots,+3.5\text{ V} −3.5 V,−2.5 V,⋯,+3.5 V。设 − 3.5 V -3.5\text{ V} −3.5 V 对应于代码 0
,-2.5 V 对应于代码 1
,依此类推,直到 + 3.5 V +3.5\text{ V} +3.5 V 对应于代码 7
。每个代码在二进制中都有其表示方法, 如代码 0
为 000
,代码 7
为 111
。为何这样选择电平而不是用一组连续的整数 1,2,3…呢? 因为量化电平的选取要受到两个限制:
图 2.16 的纵坐标标有量化电平和代码。模拟信号的每个样值被映射为最接近的那个量化电平。模拟波形 x ( t ) x\left( t \right) x(t)下面的 4 组数据依次为:自然采样值、采样量化值、代码和PCM 序列。
图 2.16 中每个样值被映射为 8 个代码之一, 或是 1 个 3 比特的 PCM 序列。假设模拟信号是一段以奈奎斯特速率采样的乐曲,并且在数字格式下很难听,怎样才能改善音质呢?回忆在量化过程中我们用近似值来代替真实信号的情况, 这就带来了量化噪声, 而增加量化级数可以减小量化噪声。如果量化级数增加到 16 的话,结果会如何呢? 现在,每个模拟样值由 1 个4 比特PCM 序列表示。这会带来什么后果呢?在实时通信系统中,消息是不允许有延时的。因此,不管一个样值由几个比特表示,其传输时间都是一样的。一个样值比特数越多的话,每个比特位必须传得越快,换句话说,必须采用更“小”的比特。数据传输速率增加,代价是传输带宽增大,以增大传输带宽为代价就可以获得更高的保真度。
PCM 这个词在图 2.1 中出现了两次。首先,它涉及到格式化过程,因为模-数转换的过程包括采样、量化,并通过将 PAM 信号量化后转换成 PCM 信号而最终生成了二进制的数字,在这里,PCM 信号仅是一串二进制数字,即还未讨论过的基带载波。图 2.1 中第二处 PCM 出现在标题为“基带信号处理”的方框中,在这里列举了各种可以“携带” PCM 数字信息的 PCM 波形(线路码)。因此,PCM 和 PCM 波形之间的区别,就是前者表示一个比特序列,而后者则是传输那个序列的特定波形。
语音通信是数字通信中一个非常重要和特殊的领域。人类的语音特征表现为如图 2.17 所示的一组统计数据,横坐标代表语音信号的幅度,归一化为将其通过典型通信信道后的均方根(rms)值,纵坐标代表取值超过相应横坐标值的概率。在大多数语音信道中, 50 % 50 \% 50% 的时间音量很低,也就是说,检测到的语音能量的电压不到均方根值的 1 4 \dfrac14 41 。幅度大的值相对较少,仅在 15 % 15\% 15% 的时间上电压超过均方根值。由量化方差 σ 2 = q 2 12 \sigma ^2=\dfrac{q^2}{12} σ2=12q2 可见,量化噪声取决于步长(量化间隔的长度),如果各量化间隔长度相等,就称该量化为均匀量化。这样的系统对语音信号来说有些浪费,许多量化电平用得很少。均匀量化系统中, 量化噪声对所有信号都相等,因此,低电平信号的信噪比要比高电平信号的信噪比差。非均匀量化对弱信号可以提供更精细的量化,而对强信号则采取较为粗糙的量化,因此可以通过非均匀量化使量化噪声与信号大小成正比。非均匀量化是以增大强信号的量化噪声为代价的,减小弱信号的量化噪声从而减小总体量化噪声。图 2.18 分别在均匀量化和非均匀量化下将强信号和弱信号的最化进行比较,阶梯状波形是模拟波形的近似(引入了量化失真),很明显,非均匀量化改善了弱信号的信噪比。非均匀量化可以使输入范围内所有信号的信噪比保持常数。对于语音信号而言,典型的输入信号动态范围为 40 分贝,其中,分贝是功率 P 1 P_1 P1 与功率 P 2 P_2 P2 的比值:
dB ( 数值 ) = 10 log 10 P 2 P 1 \text{dB}\left( \text{数值} \right) =10\log _{10}\frac{P_2}{P_1} dB(数值)=10log10P1P2均匀量化中弱信号的信噪比要比强信号低 40 dB 40\text{ dB} 40 dB。标准电话技术处理大动态范围输入信号的策略,是用对数压缩量化器取代均匀量化器,这样一来,输出信噪比将与输入信号的分布相互独立。
非均匀量化的方法之一是采用特性如图 2.19a 所示的非均匀量化器,更常用的方法是首先对原始信号进行如图 2.19b 所示的对数压缩,然后采用均匀量化器。对于幅值较小的信号,其压缩特性要比幅值较大的信号具有更陡峭的斜率。于是,给定信号在幅度小的区域内量化电平数增加,而在幅度大的区域内量化电平数减少。压缩有效地改变了输入信号幅度的分布,因而在压缩器输出端就不再是幅度小的信号占优势了。信号经压缩后作为图 2.19c 所示的均匀(线性)量化器的输入,在接收端进行称为扩展(expansion)的反压缩,确保整个传输过程中信号不失真。压缩和扩展这一对处理过程称为压扩(companding)。
早期的 PCM 系统采用平滑对数压缩技术,现在大多数 PCM 系统则采用分段线性近似来实现对数压缩。北美地区采用 μ \mu μ 律曲线:
y = y max ln [ 1 + μ ( ∣ x ∣ / x max ) ] ln ( 1 + μ ) s g n x y=y_{\max}\frac{\ln\left[ 1+\mu \left( \left| x \right|/x_{\max} \right) \right]}{\ln\left( 1+\mu \right)}\mathrm{sgn}\ x y=ymaxln(1+μ)ln[1+μ(∣x∣/xmax)]sgn x其中 s g n x = { + 1 , x ⩾ 0 − 1 , x < 0 \mathrm{sgn}\ x=\displaystyle\begin{cases}\begin{aligned}&+1,&x\geqslant0\\&-1,&x<0\end{aligned}\end{cases} sgn x={+1,−1,x⩾0x<0, μ \mu μ是一正常数, x x x 和 y y y 分别代表输入和输出电压, x max x_{\max} xmax 和 y max y_{\max} ymax 分别是输入和输出电压的最大值。不同值的 μ \mu μ 压缩特性曲线如图 2.20a 所示, 北美地区常取 μ \mu μ 为 255。 μ = 0 \mu=0 μ=0 时为线性放大, 此时即相当于均匀量化。
欧洲则主要采用 A A A 律曲线:
y = { y max A ( ∣ x ∣ / x max ) 1 + ln A sgn x , 0 < ∣ x ∣ x max ⩽ 1 A y max 1 + ln [ A ( ∣ x ∣ / x max ) ] 1 + ln A sgn x , 1 A < ∣ x ∣ x max < 1 y=\begin{cases}\begin{aligned} &y_{\max}\frac{A\left( \left| x \right|/x_{\max} \right)}{1+\ln A}\text{sgn}\ x,&0<\frac{\left| x \right|}{x_{\max}}\leqslant \frac{1}{A}\\ &y_{\max}\frac{1+\ln \left[ A\left( \left| x \right|/x_{\max} \right) \right]}{1+\ln A}\text{sgn}\ x,&\frac{1}{A}<\frac{\left| x \right|}{x_{\max}}<1\\ \end{aligned}\end{cases} y=⎩⎪⎪⎨⎪⎪⎧ymax1+lnAA(∣x∣/xmax)sgn x,ymax1+lnA1+ln[A(∣x∣/xmax)]sgn x,0<xmax∣x∣⩽A1A1<xmax∣x∣<1其中, A A A 是一正常数, x x x 和 y y y 分别与式 μ \mu μ 律曲线中的定义相同。图 2.20b 给出了不同 A A A 值的几条 A A A 律压缩特性曲线,通常取 A A A 值为87.6。
第 6 节讲述了如何通过脉冲编码调制将模拟波形转换成二进制数字信息。得到的这些数字没有任何物理意义,它们不过是用来表示信息的一些抽象的数值。因此,我们需要具有明确物理意义的波形来表示或者说“携带”这些数字。
通常用电脉冲来表示二进制数字,以便于在基带信道中传输,图 2.21 给出了这种表示方法。码字时隙见图 2.21a ,每个采样量化值用 4 比特的码字来表示。在图 2.21b 中,一个脉冲表示该时刻上是一个二进制数 1
,没有脉冲表示该时刻上是二进制数 0
。因此,如图 2.21b 所示的电脉冲序列可以用来传输 PCM 比特流中的信息,亦即可以用来传输消息量化样值中的信息。
接收端在每个比特时隙必须对有无脉冲进行判决,第 9 节中将会讲到,能否正确检测脉冲的到来,实际上取决于能否接收到脉冲能量(脉冲下的面积),因而要尽可能增加图 2.21b 中脉冲的宽度 T ′ T^{'} T′,如果将其增加到最大值(等于比特时隙 T T T),则所得波形如图 2.21c 所示。我们可以用两个电平间相互转换的序列,而不是有无脉冲的一个序列来表示这个波形。高电平表示二进制 1
,低电平表示二进制 0
。
对二进制码元进行脉冲调制所得的二进制波形称为脉冲编码调制(PCM)波形,图 2.22 举例说明了 PCM 波形的几种类型。在电话应用中,这些波形常称为线路码。对非二进制码元进行脉冲调制所得的波形称为 M M M 进制脉冲调制波形,它也有几种不同的类型, 8.5 小节将以脉冲幅度调制(PAM)为重点,讨论 M M M 进制脉冲调制。图 2.1 中标号为基带信号的方框列出了 PCM 波形和 M M M 进制脉冲波形的基本分类,PCM 波形可分为以下 4 类:
NRZ 波形是最常用的 PCM 波形,它可分为以下几个子类:NRZ-L(L 为电平)、NRZ-M(M 为传号)和 NRZ-S(S 为空号)。NRZ-L 波形广泛应用于数字逻辑电路中,用一个电平代表二进制 1
,而另一个电平代表二进制 0
。数据由 0
变为 1
或是由 1
变为 0
都将引起电平的改变。在 NRZ-M 波形中,电平变化代表 1
(或称为传号),而电平不变化代表 0
(或称为空号),这也常称为差分编码(differential encoding),NRZ-M 波形主要应用于磁带记录中。NRZ-S 波形与 NRZ-M 波形正好相反,电平不变化代表 1
,而电平变化代表 0
。
波形 | 规则 |
---|---|
NRZ-L | 用一个电平代表二进制 1 ,而另一个电平代表二进制 0 |
NRZ-M | 电平变化代表 1 ,而电平不变化代表 0 |
NRZ-S | 电平不变化代表 1 ,而电平变化代表 0 |
RZ 波形包括单极性 RZ 波形、双极性 RZ 波形和 RZ-AMI 波形,它们主要应用于基带数据传输和磁带记录中。单极性 RZ 波形中,半个比特宽度的脉冲代表 1
,而没有脉冲代表 0
。双极性 RZ 波形中,两个极性相反,宽度均为半个比特的脉冲分别代表 1
和 0
,这样每个比特时隙中都有脉冲。NRZ-AMI 波形用于电话系统中,用幅度相等正负交替的脉冲代表 1
,而没有脉冲代表 0
。
波形 | 规则 |
---|---|
单极性 RZ 波形 | 半个比特宽度的脉冲代表 1 ,而没有脉冲代表 0 |
双极性 RZ 波形 | 两个极性相反,宽度均为半个比特的脉冲分别代表 1 和 0 |
NRZ-AMI 波形 | 用幅度相等正负交替的脉冲代表 1 ,而没有脉冲代表 0 |
相位编码包括 bi- ϕ \phi ϕ-L(bi-phase-level)码(或称为曼彻斯特码)、bi- ϕ \phi ϕM(bi-phase-mark ) 码、bi- ϕ \phi ϕ-S(bi-phase-space)码和延迟调制(Delay Modulation, DM)码(或称为米勒码)。相位编码主要用于磁带记录系统、光通信和卫星遥测系统中。在 bi- ϕ \phi ϕ-L 码中,前半个比特宽度有脉冲且后半个比特宽度无脉冲代表 1
,相反,前半个比特宽度无脉冲而后半个比特宽度有脉冲代表 0
。bi- ϕ \phi ϕ-M 码中,每个码元持续时间开始时电平都发生跃变,如果在半个码元持续时间后电平再次跃变则代表 1
,而在整个码元待续时间内电平不发生跃变则代表 0
。在 bi- ϕ \phi ϕ-S 码中,每个码元持续时间开始时电平也发生跃变,如果在整个码元持续时间内电平不发生跃变则代表 1
,而在半个码元持续时间后电平再次跃变则代表 0
。在延迟调制码中,1
用码元持续时间中心点出现跃变来表示,0
则分两种情况处理:对于单个的 0
,在码元持续时间内不出现电平跃变,且与相邻码元的边界处也不出现跃变;对于连续 0
情况,在两个 0
码的边界处出现电平跃变。
波形 |
|
---|---|
bi- ϕ \phi ϕ-L | 前半个比特宽度有脉冲且后半个比特宽度无脉冲代表 1 ,相反,前半个比特宽度无脉冲而后半个比特宽度有脉冲代表 0 |
bi- ϕ \phi ϕM | 每个码元持续时间开始时电平都发生跃变,如果在半个码元持续时间后电平再次跃变则代表 1 ,而在整个码元待续时间内电平不发生跃变则代表 0 |
bi- ϕ \phi ϕ-S | 每个码元持续时间开始时电平也发生跃变,如果在整个码元持续时间内电平不发生跃变则代表 1 ,而在半个码元持续时间后电平再次跃变则代表 0 |
延迟调制码 | 1 用码元持续时间中心点出现跃变来表示,0 则分两种情况处理:对于单个的 0 ,在码元持续时间内不出现电平跃变,且与相邻码元的边界处也不出现跃变;对于连续 0 情况,在两个 0 码的边界处出现电平跃变 |
######### |
许多二进制波形用 3 个电平对二进制数据进行编码,双极性 RZ 波形和 RZ-AMI 波形就是如此,此外还有双相码和双二进制码。双相不归零码中,0-1 或1-0 数据转换用脉冲极性的改变表示,如果数据保待不变则在整个码元持续时间内发送零电平。双相归零码中,1-0 或 0-1 转换时生成半个码元持续时间的极性改变,如果数据保持不变则发送零电平。3 电平双二进制码的编码规则将在第 9 节中讨论。
有人也许会问,为什么会有这么多种 PCM 波形,有必要用这么多种波形来表示数据吗?选用大乱波形的原因就在于各个波形性能上的差异性。在特定的应用中要选择一个 PCM 波形,必须考虑以下几种因素:
比较和选择各种可用 PCM 波形最常用的准则包括频谱特性、位同步性能、检错性能、抗干扰性能、抗噪声性能以及实现的成本与复杂性。图 2.23 给出了一些最常见的 PCM 波形的频谱特性,其中,纵坐标代表功率谱密度,单位为 W/Hz \text{W/Hz} W/Hz,横坐标是标准化带宽 W T WT WT, W W W 为带宽, T T T 为脉冲周期, W T WT WT 常称为信号的时间带宽积。由于脉冲或码元速率 R s R_s Rs 是 T T T 的倒数,从而标准化带宽也可以写成 W / R s W/R_s W/Rs,因此,标准化带宽的单位为脉冲/秒或码元/秒。带宽的这个相对衡量标准很有价值,因为它描述了各个波形的传输带宽是如何有效利用的。每秒传输 1 个码元而所需带宽不到 1 Hz 的任何波形,都可以认为它的带宽利用率相对较高,延迟调制和双二进制波形(见第 9 节)就是如此;相对而言,每秒传输 1 个码元而所需带宽超过 1 Hz 的波形就可以认为它的带宽利用率相对较低,双相(曼彻斯特)码就是如此。由图 2.23 可见,波形的频谱反映了信号能量的分布,例如,NRZ 和双二进制波形在直流和低频部分有大量频谱分量, 而双相码没有直流能量。
由《Part 1——信号和频谱》和本文可知,利用二进制分割( M = 2 k M = 2^k M=2k),使一组比特和码元相关联,便于信号的处理和传输。现在以类似的应用为例来说明这一点,这里也用到 M = 2 k M = 2^k M=2k。将模拟信息经采样、量化及编码转换成比特流的过程中,每个模拟样值被转换成一个由一组比特组成的 PCM 码字。PCM 码字的长度取决于对样值进行量化时的量化电平数,也相当于 PCM 码字可以代表的样值的数目。或者说,量化电平数取决于用来确定电平所需的比特数。样值量化电平数与用来表示所有量化电平所需的比特数之间的关系为 M = 2 k M = 2^k M=2k,同样,消息码元组的长度与用来表示所有码元所需的比特数之间的关系也是如此。为了加以区分,将 PCM 情形的符号改变一下,为 L = 2 l L=2^l L=2l,而不是 M = 2 k M = 2^k M=2k,这里, L L L 为一个 PCM 码字的量化电平数, l l l 为用来表示所有量化电平所需的比特数。
应该为每个模拟样值分配几个比特位呢?对数字电话信道而言,每个语音样值用 8 个比特进行 PCM 编码,这样共可以表示 2 8 2^8 28 或 256 256 256 个电平。电平数或每个样值的比特数取决于允许的量化失真程度,有必要给出一个通式来描述每个模拟样值所需的比特数(PCM 码字的长度)与允许的量化失真这两者之间的关系。量化失真引起的误差 ∣ e ∣ \left| e \right| ∣e∣ 与模拟电压峰-峰值 V pp V_{\text{pp}} Vpp 之间的关系为
∣ e ∣ ⩽ p V pp \left| e \right|\leqslant pV_{\text{pp}} ∣e∣⩽pVpp由于量化误差不超过 q 2 \dfrac q2 2q, q q q 为量化间隔, 所以有
∣ e ∣ max = q 2 = V pp 2 ( L − 1 ) ≈ V pp 2 L \left| e \right|_{\max}=\frac{q}{2}=\frac{V_{\text{pp}}}{2\left( L-1 \right)}\approx \frac{V_{\text{pp}}}{2L} ∣e∣max=2q=2(L−1)Vpp≈2LVpp其中, L L L 为量化电平数。一般情况下量化电平数足够大,因此 L − 1 L-1 L−1 可用 L L L 代替。由上两式可得
V pp 2 L ⩽ p V pp \frac{V_{\text{pp}}}{2L}\leqslant pV_{\text{pp}} 2LVpp⩽pVpp 2 l = L ⩾ 1 2 p 电平 2^l=L\geqslant \frac{1}{2p}\,\,\,\text{电平} 2l=L⩾2p1电平且
l ⩾ log 2 1 2 p 比特 l\geqslant \log _2\frac{1}{2p}\,\,\,\text{比特} l⩾log22p1比特注意,不要将上式中表示一个PCM 码字所需的比特数与表示共有 M M M 个电平的码元所需的 k k k 个数据位这两者相混淆。
将信息调制成一个脉冲序列共有三种基本的方法: 改变脉冲的幅度、位置或周期,相应的调制方法分别称为脉冲幅度调制(PAM)、脉冲位置调制(PPM)和脉冲周期调制(PDM),PDM 有时也叫做脉宽调制。当未经量化的原信息样值被调制成脉冲序列时, 就称该脉冲调制为模拟脉冲调制。当原信息样值先经量化,生成 M M M 进制码组中的码元,再被调制成脉冲序列时,该脉冲调制是数字式的,称为 M M M 进制脉冲调制。在 M M M 进制 PAM 波形中, M M M 种可能的码元各分配 1 个幅度电平。早先提到的二进制 PCM 波形共有 2 种幅度值( 如 NRZ、RZ),这样的 PCM 波形仅需 2 个电平( M = 2 M=2 M=2),而 M M M 进制 PAM 需要 M M M 个电平。
在 M M M 进制 PPM 波形中,调制过程由延迟或提前一段脉冲时间来实现,这段时间根据原信息码元的不同而各不相同。在 M M M 进制 PDM 波形中,调制过程由改变脉冲的宽度来实现,各脉冲的宽度相应于码元的不同而各不相同。对 PPM 和 PDM 而言,脉冲幅度均保持不变。在频带调制中也可以找到与基带脉冲调制相似的情况,PAM 与幅度调制相类似,而 PPM 和 PDM 则分别与相位调制和频率调制相类似。本节仅讨论 M M M 进制PAM 波形,并将其与 PCM 波形进行比较。
二进制数字波形(如 PCM 波形)所需的传输带宽很大,设法减小传输带宽的解决办法之一是使用多电平信号。设某一比特流的数据速率为每秒 R R R 比特,首先对数据按每 k k k 个比特为一组进行分组, 然后用共有 M = 2 k M=2^k M=2k 个电平的脉冲来传输,而不是每比特都传输一个脉冲波形。在多电平信号或 M M M 进制 PAM 中,每个脉冲可表示 1 个 k k k 比特的码元,码元速率为每秒 R / k R/k R/k 个码元(比特速率的 k k k 分之一) 。由此,数据速率一定时, M > 2 M>2 M>2 的多电平信号每秒传输的码元数减少;换句话说, M M M 进制 PAM 与二进制 PCM 相比所需的信道传输带宽减小。下面将讨论使用 M M M 进制 PAM 的代价。
脉冲接收器必须要能够区分取值不同的各个脉冲,接收器能否像区分图 2.24b 中只有 2 种可能取值的二进制脉冲那样,很轻松地就能区分出图 2.24a 中共有 8 种可能取值的八进制脉冲?传输 8 个电平的脉冲与 2 个电平的脉冲相比,要达到相同的检测效果就需要更大的能量(信号检测的可靠度由接收端的 E b / N 0 E_b/N_0 Eb/N0 值决定)。如果二进制和八进制脉冲的平均功率相同,则二进制脉冲的检测将更容易一些,因为二进制脉冲每个电平的能量比八进制脉冲的要大,这样更利于检测器的判决。如果系统设计者使用易于检测的二进制 PCM 波形而不是八进制 PAM 波形作为传输波形,将会付出代价,数据速率一定时所需的传输带宽是使用八进制 PAM 波形时的 3 倍,因为 1 个八进制脉冲相当于 3 个二进制脉冲(每个二进制脉冲的宽度是八进制脉冲的 1/3)。有人也许会问,为什么不用与八进制脉冲脉宽相同的二进制脉冲而允许信息的延时呢?在有些场合这是可行的,但实时通信系统却不允许有延时,必须保证准时接收到信息。
1963 年,Adam Lender 指出,在带宽为 W W W 赫兹且无码间串扰时,理论上每秒可以传输 2 W 2W 2W 个码元,而且不需要无限陡峭滤波器。他采用了一项称为双二进制信号的技术,也可以称为相关编码或部分响应信号。双二进制信号的基本思想是在数据流中人为地引入一些可控制的码间串扰,而不是试图彻底消除码间串扰。Lender 指出,通过在脉冲间引入相关的干扰,改变检测的方法,实际上就可以在接收端消除干扰,从而获得单位赫兹的理想码元速率, 即 2 码元/s/Hz,而这在以前被认为是不可能实现的。
为了理解双二进制信号是如何引入可控制的码间串扰的,先看一个实例。可以认为双二进制编码的过程如图 2.25 所示,设二进制码元序列 { x k } \left\{ x_k \right\} {xk} 的传输速率为每秒 R R R 个码元,将其通过频谱特性为理想矩形且带宽为 W = R 2 = 1 2 T Hz W = \dfrac R2 = \dfrac1{2T}\text{ Hz} W=2R=2T1 Hz 的系统。大家也许会问,图 2.25 中的矩形频谱与不可实现的奈奎斯特特性有何区别?这两者都有理想的频谱特性,我们不可能实现理想的矩形滤波器,而是用一个容易得到的滤波器来近似,这里的矩形滤波器只是等效模型的一部分。在通过理想滤波器之前,脉冲首先通过如图所示的简单数字滤波器。数字滤波器将原脉冲延时 1 位后加到原脉冲上,即对每个到来的脉冲,滤波器又在此基础上加上了前一个脉冲的值。换句话说,对进入数字滤波器的每个脉冲, 滤波器输出端得到了两个脉冲的和。滤波器输出端的脉冲序列 { y k } \left\{ y_k \right\} {yk} 为
y k = x k + x k − 1 y_k=x_k+x_{k-1} yk=xk+xk−1因此, { y k } \left\{ y_k \right\} {yk} 的幅度不是独立的,每 1 位 y k y_k yk 均含有前 1 位数字的信息,每 1 位 y k y_k yk 中所引人的码间串扰仅来自于原序列中对应的前一位数字 x k − 1 x_{k-1} xk−1。脉冲序列 { y k } \left\{ y_k \right\} {yk} 之间的关系可视为由双二进制编码所引入的码间串扰。可控制的码间串扰是这项新技术的本质,因为在检测器端,这种码间串扰可以很容易地消除,就像当初将其引入一样。序列 { y k } \left\{ y_k \right\} {yk} 后面紧跟的是无码间串扰的理想奈奎斯特滤波器。在图 2.25 中接收端的采样器处,我们希望能够不受噪声影响地恢复出序列 { y k } \left\{ y_k \right\} {yk}。由于所有系统都要受噪声的影响,因而恢复的序列被视为原序列 { y k } \left\{ y_k \right\} {yk} 的估计值,记为 { y ^ k } \left\{ \hat{y}_k \right\} {y^k},用双二进制解码器消除码间串扰得到的原序列 { x k } \left\{ x_k \right\} {xk} 的估计值记为 { x ^ k } \left\{ \hat{x}_k \right\} {x^k}。
如果二进制数字 x k x_k xk 取值为 ± 1 \pm 1 ±1,由 y k = x k + x k − 1 y_k=x_k+x_{k-1} yk=xk+xk−1 可得, y k y_k yk 共有 3 种可能的取值: + 2 +2 +2, 0 0 0 或 − 2 -2 −2。双二进制编码输出有 3 个电平。对 M M M 进制传输而言,部分响应信号有 2 M − 1 2M-1 2M−1 种电平。解码与编码过程正好相反,也就是说每 1 位 y k y_k yk 减去 x k − 1 x_{k-1} xk−1。
解码判决规则如下:
1
);0
);判决规则仅是对每个 x ^ k − 1 \hat{x}_{k-1} x^k−1 减去 y ^ k \hat{y}_k y^k。这种检测方法的缺点是一旦出现一个错误,错误将会不断传播,引发更多的错误,因为当前预测值取决于前一步的预测值,避免错误传播的一种方法为预编码。
预编码是先将二进制序列 { x k } \left\{ x_k \right\} {xk} 经过差分编码变为新的二进制序列 { w k } \left\{ w_k \right\} {wk},如下所示:
w k = x k ⊕ w k − 1 w_k=x_k\oplus w_{k-1} wk=xk⊕wk−1其中,符号 ⊕ \oplus ⊕ 表示二进制数字的模 2 和运算(与逻辑异或运算等价)。然后将二进制序列 { w k } \left\{ w_k \right\} {wk} 转换为双极性脉冲序列,编码规则普通双二进制信号相同。但是,经预编码后,解码过程与通常的双二进制检测过程大不相同,预编码的模型如图 2.26 所示, 二进制数字的模 2 相加产生预编码序列 { w k } \left\{ w_k \right\} {wk},而双极性脉冲经数字滤波器后生成序列 { y k } \left\{ y_k \right\} {yk}。
0
);1
)。差分预编码使我们不需要用到可能出错的前一个判决,仅根据接收到的单个样值就能够进行判决,从而解码得到序列 { y ^ k } \left\{ \hat{y}_k \right\} {y^k}。它主要的优点是一旦数据中某 1 位因噪声而出现错误,将不会影响其他数据的判决。有一点要注意的是,差分预编码二进制序列 { w k } \left\{ {w}_k \right\} {wk} 的第 1 位可任意选择,如果 { w k } \left\{ {w}_k \right\} {wk} 中的起始位由二进制 1
变为二进制 0
,解码所得序列不变。
在 9.1 小节中,将双二进制码转移函数描述为后面跟随着理想矩形滤波器的带 1 位延时的数字滤波器,现在给出其等效模型。1 位延时的傅里叶变换为 e − j 2 π f T e^{-j2\pi fT} e−j2πfT,因此图 2.25 中数字滤波器的频域转移函数为
H 1 ( f ) = 1 + e − j 2 π f T H_1\left( f \right) =1+e^{-j2\pi fT} H1(f)=1+e−j2πfT理想矩形滤波器的转移函数为
H 2 ( f ) = { T , ∣ f ∣ < 1 2 T 0 , o t h e r w i s e H_2\left( f \right) = \begin{cases}\begin{aligned} &T,&\left| f\right|<\frac{1}{2T}\\ &0,&\mathrm{otherwise} \end{aligned}\end{cases} H2(f)=⎩⎨⎧T,0,∣f∣<2T1otherwise与理想矩形滤波器级联的数字滤波器总的等效转移函数为
H e ( f ) = H 1 ( f ) H 2 ( f ) = ( 1 + e − j 2 π f T ) T = T ( e j π f T + e − j π f T ) e − j π f T H_e\left( f \right) =H_1\left( f \right) H_2\left( f \right) =\left( 1+e^{-j2\pi fT} \right) T=T\left( e^{j\pi fT}+e^{-j\pi fT} \right) e^{-j\pi fT} He(f)=H1(f)H2(f)=(1+e−j2πfT)T=T(ejπfT+e−jπfT)e−jπfT因此有
∣ H e ( f ) ∣ = { 2 T cos π f T , ∣ f ∣ < 1 2 T 0 , o t h e r w i s e \left| H_e\left( f \right) \right|=\begin{cases}\begin{aligned} &2T\cos \pi fT,&\left| f \right|<\frac{1}{2T}\\ &0,&\mathrm{otherwise}\\ \end{aligned}\end{cases} ∣He(f)∣=⎩⎨⎧2TcosπfT,0,∣f∣<2T1otherwise级联的 2 个滤波器的复合转移函数 H e ( f ) H_e\left( f \right) He(f) 具有如图 2.27a 所示的滚降特性,其转移函数可以用可实现的模拟滤波器来近似。等效转移函数 H e ( f ) H_e\left( f \right) He(f) 称为余弦滤波器,注意,不要将余弦滤波器与升余弦滤波器混淆。对 H e ( f ) H_e\left( f \right) He(f) 进行傅里叶反变换可得冲激响应函数 h e ( t ) h_e\left( t \right) he(t) 为
h e ( t ) = sinc ( t T ) + sinc ( t − T T ) h_e\left( t \right) =\text{sinc}\left( \frac{t}{T} \right) +\text{sinc}\left( \frac{t-T}{T} \right) he(t)=sinc(Tt)+sinc(Tt−T)如图 2.27b 所示。对图 2.25 输入端的每个冲激 δ ( t ) \delta\left(t\right) δ(t),其输出为 h e ( t ) h_e\left( t \right) he(t)。在 T T T 秒的间隔内仅有 2 个非 0 样值,引入相邻比特间的可控制码间串扰,用 9.2 小节讨论的解码过程可消除该码间串扰。虽然余弦滤波器是非因果的,从而是不可实现的,但它却可以很容易地近似。要实现 9.3 小节讨论的预编码双二进制技术,可以先将二进制序列 { x k } \left\{ x_k \right\} {xk} 差分编码为序列 { w k } \left\{ w_k \right\} {wk},然后将脉冲序列 { w k } \left\{ w_k \right\} {wk} 通过上述 ∣ H e ( f ) ∣ \left| H_e\left( f \right) \right| ∣He(f)∣ 所示的等效余弦滤波器进行滤波。
双二进制信号引入了脉冲幅度间的相关性,然而奈奎斯特准则假定传输的脉冲幅度是相互独立的。前面已经说明了双二进制信号可以利用引入的相关性来获得无码间串扰的传输,且系统带宽较之其他方法更小。那么,不用付出什么代价就可以获得性能上的改善吗?在工程设计中这是不可能的,几乎处处都要考虑利弊的权衡。双二进制码需要 3 个电平,而二进制码仅需 2 个,回忆一下 8.5 小节讨论的内容,在 8 电平 PAM 信号判决与 2 电平 PCM 信号判决两种情况下,我们分别对其性能和所需的信号能量进行了比较。信号能量一定时,完成可靠判决的难度与每个波形中所含有的电平数成反比。因此,虽然双二进制信号满足无码间串扰的要求时所需带宽最小,但要达到相同的抗噪声性能,双二进制信号需要比二进制信号更大的功率。对给定的差错概率( P B P_B PB),双二进制信号与二进制信号相比,其信噪比需要多 2.5 dB 2.5\text{ dB} 2.5 dB 左右,但带宽仅为二进制信号的 1 1 + r \dfrac{1}{1+r} 1+r1, r r r 为滤波器的频率滚降因子。
双二进制信号可以拓展为超过 3 个电平的信号,该信号带宽利用率更高,可以称为多二进制信号(polybinary)。下面看一个将 2 电平的二进制消息转换为从 0 到 ( j − 1 ) \left( j-1 \right) (j−1) 共 j j j 个电平的信号的例子。从二进制到多进制的转换有两个步骤,首先,由 0 和 1 组成的原序列 { x k } \left\{ x_k \right\} {xk} 被转换为如下所示的另一个二进制序列 { y k } \left\{ y_k \right\} {yk}。序列 { y k } \left\{ y_k \right\} {yk} 的当前位由该位前 ( j − 2 ) \left( j-2 \right) (j−2) 个值与当前的 x k x_k xk 值模 2 相加得到,即
y k = x k ⊕ y k − 1 ⊕ y k − 2 ⊕ y k − 3 y_k=x_k\oplus y_{k-1}\oplus y_{k-2}\oplus y_{k-3} yk=xk⊕yk−1⊕yk−2⊕yk−3其中, x k x_k xk 表示输入的二进制位, y k y_k yk 表示第 k k k 个编码位。在上式中, y k y_k yk 前有 ( j − 2 ) = 3 (j- 2) = 3 (j−2)=3 比特,所以共有 j = 5 j=5 j=5 个信号电平。然后将二进制序列 { y k } \left\{ y_k \right\} {yk} 的当前位与前 ( j − 2 ) (j- 2) (j−2) 位代数相加,就得到了多二进制脉冲序列 { z k } \left\{ z_k \right\} {zk},因此 z k z_k zk 模 2 取余即为 x k x_k xk,二进制 0 和 1 分别映射为序列 { z k } \left\{ z_k \right\} {zk} 的偶值脉冲和奇值脉冲。尽管位与位之间有很强的相关性,但序列 { z k } \left\{ z_k \right\} {zk} 中的每1 位仍可以独立检测。这种信号的主要优点是可以将原序列 { x k } \left\{ x_k \right\} {xk} 的频谱密度重新分布到低频部分,从而提高系统带宽的利用率。
本文首先讨论了在所有数字通信系统中都很重要的步骤,即将源信息(包括文本信息和模拟信息)转换为与数字系统兼容的格式;还讨论了采样、量化(非均匀量化和均匀量化)和脉冲编码调制(PCM);接着讨论了在信道中传输的基带信号脉冲波形的选择;最后介绍了双二进制码的概念,双二进制码通过引入可控制的码间串扰来提高带宽利用率,但要以增大信号的发射功率为代价。