【知识要点】
1.数据通信基本概念:模拟信号、数字信号;基带、频带、宽带;单工、双工;比特、码元;波特率、数据速率;数据通信系统模型。
2.数据通信基本理论:傅里叶分析、奈奎斯特定理、香农公式。
3.常见传输介质及其特性。
4.数据编码技术:曼彻斯特编码、差分曼彻斯特编码、4B/5B编码;幅移键控ASK、频移键控FSK、相移键控PSK、正交调幅QAM;脉冲编码调制PCM;调幅、调频、调相。
5.同步控制技术:位同步、字符同步、帧同步。
6.数据交换技术:电路交换、报文交换、分组交换(数据报交换、虚电路交换)。
7.信道复用技术:频分复用、时分复用、统计时分复用、波分复用、码分复用。
8.差错产生的原因及其控制与校验(奇偶校验、循环冗余校验、海明码)。
9.常见数字传输系统:T1载波、E1载波、同步光纤网SONET。
【学习内容】
3.1 数据通信基本概念
数据通信是计算机技术与通信技术结合的产物,主要研究计算机或数字终端之间的数据传输、交换、存储、处理的理论、方法和技术。
3.1.1 数据与信号
数据是信息的具体表现形式,可以是字母、数字、声音、图像、视频等。数据分为模拟数据和数字数据。模拟数据是指在某一区间范围内连续变化的数值,比如声音数据;数字数据则是离散的、只有有限个值,比如字符。
数据通过信号进行传输,信号是数据的电气或电磁波的表现形式。信号分为模拟信号和数字信号。模拟信号随时间变化表现出一种平稳变化的连续波;数字信号则随时间变化表现出一种离散变化的脉冲波。
用数字信号形式表示数字数据或模拟数据称为编码;用模拟信号形式表示数字数据或模拟数据称为调制。
二进制数据的最小单位是比特,而码元是表示数据的基本信号波形。一个码元就是一个完整、独立、固定时长的信号波。码元的状态个数称为码元编码级数。1个码元可以携带n比特的信息量。设码元级数为M,则每个码元可以携带n=log2M比特信息量。
观察和分析电信号的基本方法有时域分析和频域分析。时域分析以时间为自变量,用示波器观察、测量电信号随时间变化的情况;频域分析以频率为自变量,通过傅里叶分析,用频谱仪观察、测量信号的频谱组成、振幅与相位,分析电信号通过信道后频率分量的变化。
模拟信号可分为简单模拟信号和复合模拟信号。简单模拟信号不能再分解。正弦波就是最基本的简单模拟信号,可以用表达式f(t)=Asin(2πt/T+φ)描述。其中,A是振幅,反映了信号的强弱;T是信号周期;φ是相位,反映了波形相对于时间轴原点的位置。振幅A、周期T和相位φ被称为模拟信号的三要素。复合模拟信号是有限或者无限简单模拟信号的叠加。不管多么复杂的模拟信号都可以通过傅里叶分析,分解成一系列简单正弦波的组合形式。
通过傅里叶分析,任何一个数字信号都可以分解为无穷多个简单的正弦波或余弦波,即谐波。每个谐波都有不同的振幅、频率和相位。在信道上发送数字信号,其实发送的就是简单的正弦波或余弦波。
不管是模拟信号还是数字信号,都可以分解为多个谐波。每个谐波都是原信号的分量,频谱是信号所有分量的频率集合。带宽是信号频谱的宽度,即信号频谱中最高频率fmax与最低频率fmin的差值。通常,原始信号中只有部分频率分量能够通过信道传输。
3.1.2 信道
信道是信号传输的通道。一条通信电路往往包含一条发送信道和一条接收信道。
使用模拟信号传输数据的信道称为模拟信道;使用数字信号传输数据的信道称为数字信道。通常,数字信道有更高的传输质量。
信道带宽是指能够通过信道的上限频率和下限频率的差值。实际上,信道带宽就是信道通过载波频率的能力。
信道传输数据的能力受限于信道带宽、信号衰减、变形和失真等因素。奈奎斯特定理和香农公式分别给出了理想状态和非理想状态下信道的极限传输能力,称为信道的最大容量,用信道的最大数据传输速率表示。
3.1.3 数据传输方式
由信源发出的未经过调制的原始电信号所固有的频带称为基本频带,简称基带。其频谱包括直流、低频和高频等多种成分,具有低通形式。这种原始电信号称为基带信号。在信道中直接传输这种基带信号称为基带传输。例如计算机和显示器、打印机等外设间的通信使用的就是基带传输,大多数的局域网也使用基带传输。
宽带信号是将基带信号进行调制后形成的频分复用模拟信号。宽带传输中,各路基带信号经过调制,频谱被搬移到不同的频段,从而形成多个子信道,每个子信道可以同时传输不同的信号。
频带传输是指将基带信号调制成适合在模拟信道中传输且具有较高频率范围的模拟信号,再将这种频带信号在模拟信道中传输。频带传输适合远距离的数据传输。
3.1.4 数据通信方式
从通信双方交换信息的方式可将数据通信分为单工通信、半双工通信和全双工通信。
单工通信是指数据信号只能在一个方向上传输;半双工通信允许数据在两个方向上传输,但在同一时刻只允许数据在一个方向上传输;全双工通信允许数据同时在两个方向上传输。
3.1.5 数据通信性能指标
当一个分组或报文从一个端点出发,通过一系列的链路和中间结点,到达另一个端点所经历的时间称为端到端的时延。在分组交换网络中,端到端的时延由发送时延、传播时延、结点处理时延和排队时延组成。
发送时延是指结点将一个分组的所有比特送入传输链路所需要的时间。设分组的长度为L比特,链路的传输速率为Rbps,则发送时延=L/R。
传播时延是一个比特从链路的一端开始传播到另一端所需要的时间。设链路长度为dm,链路传播速率为vm/s,则传播时延=d/v。
分组在经过中间交换结点时,结点对分组进行差错检测、路由选择等处理所花费的时间称为结点处理时延。这部分时间是不确定的。
当输出链路忙时,分组必须在缓冲区排队等待发送。分组在缓冲队列中排队等待所经历的时间称为排队时延。
在TCP协议中,从源主机发出一个报文段开始,到源主机接收到该报文段的确认所经历的时间称为该报文段的往返时延。
某一链路所能容纳的比特数称为时延带宽积,也称为比特长度。时延带宽积=带宽×传播时延。
单位时间内发送信号的数目称为码元速率或波特率;单位时间内在信道上传输的比特数目称为数据传输速率或比特率。比特率=波特率×log2码元编码状态数。
传输过程中码元被传错的概率称为误码率;比特被传错的概率称为误比特率。
3.2 数据通信基本理论
3.2.1 傅里叶分析
数学家傅里叶证明:任何周期为T的函数f(t)都可以展开成多个、甚至无限个正弦函数和余弦函数。公式如下:
f(t)=a0/2+a1sin(2πft)+b1cos(2πft)+ a2sin(4πft)+b2cos(4πft)+…+ ansin(2nπft)+bncos(2nπft)
根据傅里叶级数理论,对于任何一个持续时间有限的数据信号,可以延长它的时间域,看作是以某周期不断重复的信号,从而可对该信号进行傅里叶分析。
3.2.2 奈奎斯特定理
奈奎斯特推导出有限带宽理想信道的最大容量,即奈奎斯特定理,公式为
C=2Wlog2M
C是信道的最大数据传输速率,W是信道带宽,M是信号编码状态数。
【例】一个信道的带宽为3kHz,信号编码状态数为4,则最大数据传输速率为C=2×3000×log24(bps)=12Kbps。
3.2.3 香农公式
香农推导出有高斯白噪声干扰情况下有限带宽信道的最大容量,即香农公式
C=Wlog2(1+S/N)
S/N是信噪比,通常用分贝值表示,即10 log10(S/N)分贝。
【例】有一个信道带宽W=3.1kHz,信噪比S/N=2000,则该信道最大数据传输速率C=3100×log2(1+2000)=34Kbps。
3.3 传输介质
传输介质是信道的物理载体。按照传输介质的形态,可分为有线传输介质和无线传输介质。有线传输介质又可以分为同轴电缆、双绞线、光纤等。
3.3.1 同轴电缆
同轴电缆由铜芯、绝缘层、金属屏蔽层和塑料外套组成。过去同轴电缆使用比较多,现在同轴电缆在室内已被双绞线取代,室外以被光纤取代。
3.3.2 双绞线
把两根相互绝缘的铜导线按照规则扭绞在一起就形成了双绞线。线对扭绞可以减少相互间的辐射电磁干扰和线对之间的串扰。
计算机网络使用的双绞线电缆通常是4对8芯双绞线。双绞线有屏蔽和非屏蔽之分。根据双绞线两端线序排列规则,可将双绞线分为直通线、交叉线和全反线。
3.3.3 光纤
光纤是一种光传输介质。光纤的传输原理是光的全反射。利用光的全反射,光脉冲信号会沿着光纤一直传播下去。
光纤通常由纤芯、包层和护套层组成。光纤通信中的光源有两种:发光二极管和注入型激光二极管。
按照光波在光纤中传播的光束数量,可将光纤分为单模光纤和多模光纤。一条光缆通常由多根光纤组成。
3.3.4 无线传输介质
不同频谱的电磁波通过自由空间传播,可实现多种无线通信。常见的无线传输介质有无线电波、微波、红外线、激光等。
无线电波的频谱范围为104~108Hz。无线电波传输距离远,穿透能力强,可以轻易地跨过障碍物,广泛应用于通信领域。
微波是指频率在300MHz~300GHz的电磁波。微波频率极高,波长短,在空中传播的特性与光波相近,遇到障碍物易被反射或阻挡,适用于视距通信,超过视距需要中继转发。
卫星通信是在微波地面站之间利用地球同步卫星作为中继器的一种微波接力通信。卫星通信的传播时延在270ms左右。
红外线的频率范围在1012~1014Hz,主要用于室内短距离的数据传输。
3.4 数据编码技术
在数据通信中,将数据转换为数字信号在信道上传输的过程称为编码;将数据转换为模拟信号在信道上传输的过程称为调制。
3.4.1 数字数据-数字信号编码
数字数据-数字信号编码就是用数字信号,例如脉冲电压或电平跳变来表示二进制码0和1。常见的数字数据-数字信号编码有极性编码、归零编码、双相编码等。
极性编码就是用脉冲电压的正负极性表示数据。常见的极性编码有单极性码、极性码和双极性码。单极性码只使用脉冲电压的正极或负极表示数据,通常用恒定的正电压表示1,无电压或线路空闲表示0;极性码使用脉冲电压的两极表示数据,通常 正电平表示1,负电平表示0;双极性码则使用脉冲电压的两级和零电平表示数据,例如交替反转编码AMI用零电平表示0,交替地使用正、负电平表示1.
根据编码信号的脉冲电压是否回归到0,数字数据-数字信号编码可分为非归零电平编码NRZ-L、非归零反相编码NRZ-I和归零码。在NRZ-L编码中,信号电压或正或负,正电压表示1,负电压表示0;在NRZ-I编码中,用信号电平的一次反转表示1,没有电平变化表示0;归零码用正电平表示1,负电平表示0,任何比特的后半周期电平都归0。
在双向编码中,每个码元周期的中间电平都会反转,并用电平的方向表示0和1。常见的双相编码有曼彻斯特码和差分曼彻斯特码。在曼彻斯特编码中,每一码元周期中间脉冲电平都会反转,中间电平的反转既做同步时钟信号又做数据信号;差分曼彻斯特编码对曼彻斯特编码进行了改进,将每一码元周期中间的电平反转仅做同步时钟信号,用每一码元周期开始有无电平反转表示0或1,有跳变为0,无跳变为1。
为了提高线路传输率和抗干扰性,又发展出多种应用性编码。例如4B/5B编码、8B/10B编码等。4B/5B编码将待发送的数据流每4位作为一组,按照4B/5B编码规则将其转换成相应的5位NRZ-I脉冲编码。8B/10B编码与4B/5B编码类似。
3.4.2 数字数据-模拟信号调制
将数字数据变换为适合在模拟信道上传输的模拟信号的过程称为数字数据-模拟信号调制。数字数据-模拟信号调制是通过改变载波的振幅、频率或相位实现对数字数据的编码。相应的调制有三种基本形式:幅移键控ASK、频移键控FSK和相移键控PSK。
幅移键控通过改变载波的振幅表示数据,通常用恒定的载波振幅表示1,无载波表示0。
频移键控使用载波频率附近的两个频率表示0和1,载波频率处于中间值。
相移键控使用两个或多个恒定的载波相位表示数据。
在以上三种基本调制形式基础上还发展了差分相移键控DPSK、正交调幅QAM。
3.4.3 模拟数据-数字信号编码
模拟数据-数字信号编码最常用的技术就是脉冲编码调制PCM。脉冲编码调制的理论基础是采样定理:采样频率必须至少是信号中最大频率或带宽的两倍,否则就不能从信号采样中恢复原始信号。
脉冲编码过程包括采样、量化和编码。采样是指每隔一个固定的时间间隔取出模拟信号波幅的瞬时值,然后将瞬时值扩展为一个可测量的脉冲信号;量化是将采样取得的脉冲信号根据振幅大小,按照量化分级取值,把脉冲序列转换成数字序列;编码是用一定位数的二进制码表示采样序列量化后的振幅,从而得到对应的数字序列。
3.4.4 模拟数据-模拟信号调制
模拟数据-模拟信号调制的技术主要有调幅AM、调频FM和调相PM。
3.5 同步控制技术
在通信期间不要求通信双方一直保持相同的时钟,发送端可以在任意时刻发送数据,而接收端必须时刻做好接收数据的准备,这种通信方式称为异步传输。异步传输以字符为单位传输数据,一次传输一个字符,字符之间可以有任意的时间间隔。异步传输采用位形式的字符同步方法,也称为起止同步控制。
同步传输的通信双方必须先建立同步时钟,然后收发双方开始发送和接收连续的同步比特流。同步传输以数据块为单位传输数据。为使接收端正确识别一个数据块的开始和结束,需要在每个数据块的前面和后面分别加上标识信息,构成一个数据帧。
3.6 数据交换技术
当两个终端之间没有直接线路时,必须经过中间结点的转发才能实现通信。这种通信方式称为交换,中间结点称为交换结点。实现数据交换的主要技术有电路交换、报文交换和分组交换。
3.6.1 电路交换
电路交换是指两个用户终端在开始通信之前,先建立一条物理电路连接,在通信期间双方自始至终使用该电路连接进行数据传输,独占电路连接的资源,直到通信一方释放该电路连接。电路交换主要应用于公用电话网、公用电报网和公用数据网等通信网络中。
3.6.2 报文交换
在报文交换中,源结点把要发送的数据组织成报文的格式,报文中包含源结点地址和目的结点地址,然后以报文为单位逐站向前传递。报文经过多次存储转发,最终到达目的站点。
3.6.3 分组交换
分组交换是将用户报文分割成较小的、有固定格式的数据块,即分组,然后以分组为单位按照存储转发的方式进行传输。每个分组的头部都包含分组编号。
按照分组在网络结点之间的路由方式,分组交换可进一步分为数据报交换和虚电路交换。在数据报交换中,不同分组可能沿着不同的路径到达目的结点;而在虚电路交换中,所有分组沿着同一个路径到达目的结点。
3.7 信道复用技术
在一条信道上同时传输多路用户信号的技术称为信道复用技术。多路信号通过复用器和分用器共享信道。常见的多路复用技术有频分复用FDM、时分复用TDM、波分复用WDM、码分复用CDM、空分复用SDM和统计时分复用STDM。
3.7.1 频分复用
频分复用将信道可用带宽划分成若干个子频带,即子信道,每一个子信道传输一路信号。为保证各路信号互不干扰,需要在各子信道之间设置隔离频带。传统意义上的频分复用有无线广播和有线电视系统;目前使用比较多的频分复用技术是正交频分复用OFDM,例如ADSL、数字视频广播、高清电视等。
3.7.2 时分复用
时分复用又称为同步时分复用,是将使用信道的时间划分成固定长度的时间帧,每个时间帧又被细分为固定数量的时隙,然后给每一路信号分配一个固定序号的时隙,每一路信号只能在自己的时隙内占用信道传输数据。
3.7.3 统计时分复用
统计时分复用是对同步时分复用技术的改进。统计时分复用通过按需动态分配时隙解决时隙浪费的问题。统计时分复用又称为异步时分复用。
3.7.4 波分复用
波分复用的本质是光的频分复用,是指在光纤中同时传输多个频率相近的光载波信号。
3.7.5 码分复用
码分复用CDM常称为码分多址访问CDMA。码分复用是指利用一组正交随机地址码区分各路信号,允许各路信号经过地址码调制后在同一时间使用整个信道带宽进行数据传输。CDMA的工作原理是扩频技术。
3.8 差错控制技术
信号在物理信道上传输,由于线路本身的电气特性所造成的随机噪声、信号幅度的衰减、频率和相位的畸变,以及电信号在线路上产生反射造成的回音效应、相邻线路间的串扰等都会引起信号的失真。必须采取一些手段对信号进行差错控制。
3.8.1 差错控制方法
差错控制是指通过某种手段发现并纠正传输过程中发生的比特差错。在计算机网络中有两类基本的差错控制方法:反馈纠错,也称自动请求重发ARQ;自动纠错FEC,也称前向纠错。
自动请求重发使用的差错控制编码比较简单,接收方只要检测出有比特差错,就向发送方反馈,由发送方重发出错的报文,直到接收方正确接收为止。
在前向纠错中,接收方不但能发现比特差错,而且还能确定发生比特差错的位置,从而加以纠正。
衡量差错控制编码性能的重要参数是编码效率,计算公式为
R = k / n= k / (k + r)
式中k为信息码位数,r为编码时外加的冗余校验位数。
差错控制编码可分为检错码和纠错码。能自动发现差错的编码称为检错码,例如奇偶校验码、循环冗余校验码;不仅能发现差错甚至能够纠正差错的编码称为纠错码,例如海明码。
3.8.2 奇偶校验
奇偶校验的原理是通过在信息码的左边或右边附加上冗余校验比特,使得所传输的码字中1的个数为奇数或偶数。在实际使用时又分为水平奇偶校验、垂直奇偶校验和水平垂直奇偶校验。
水平校验是直接对每一个信息端添加一个奇偶校验位;垂直校验是将要发送的整个信息块分割成定长的若干信息段,然后对各信息段的相同位构成的每一列添加一个奇偶校验位;水平垂直奇偶校验是先对一组信息段进行垂直奇偶校验,然后再对所得结果进行水平奇偶校验。
3.8.3 循环冗余校验
任何一个由二进制数组成的代码,都可以唯一地与一个只含有0和1两个系数的多项式建立一一对应的关系。在使用循环冗余编码时,发送方和接收方事先约定一个生产多项式G(x)。假设一个数据帧有m位,对应的多项式是M(x),为了计算机校验和,该帧的长度必须大于生成多项式的长度。循环冗余编码的思想就是在帧的尾部添加一个校验和,使得添加之后的帧对应的多项式能够被G(x)除尽。当接收方收到带有校验和的帧后,就用G(x)去除它,如果余数不为0,则表明传输过程中有误。
【例】采用CRC进行差错校验,生成多项式G(x)=x4+x+1,信息码字为10110,则CRC的校验码的计算过程如下:
第1步:在信息码字后加0,0的个数与生成多项式的次数一致,本例中为4。这样,信息码字就变成了101100000。
第2步:将信息码字与生成多项式G(x)对应的二进制位序列10011按位异或运算,得到余数1111,即校验码。
3.8.4 海明码
海明码的编码思想:在k比特信息中附加r比特冗余信息构成n=k+r比特码字,其中每个校验比特和某几个特定的信息比特构成奇偶校验关系。接收端对这r个奇偶关系进行校验。如果没有错误的话,这r个校正因子都为0,否则,校正因子不全为0,根据校正因子的不同取值,可以知道错误发生在哪一个位置。
校验比特数必须满足条件2r≥k+r+1。
海明码的编码规则:设k位数据信息码为DkDk-1...D1,r位校验比特为PrPr-1...P1,则Pr在海明码中的第2i-1位置,数据信息位按照从低到高的顺序排列。
【例】使用海明码进行纠错,7位码长(x7x6x5x4x3x2x1),其中4位数据监督关系式为:
c0 = x1 + x3 + x5 + x7
c1 = x2+ x3 + x6 + x7
c2 = x4 + x5 + x6 + x7
如果接收到的码字为1000101,那么纠错后的码字求解如下:
由监督关系式可知,c0校验x1、x3、x5、x7,结果为1;c1校验x2、x3、x6、x7,结果为0;c2校验x4、x5、x6、x7,结果为1。C2 c1 c0= (101)2=5,由此可知第5位发生了错误,需要将第5位的0变为1,纠错后的码字为1010101。
3.8.5 自动请求重发
自动请求重发协议ARQ是依赖接收端的反馈机制和发送方的重发机制纠正数据传输错误的。根据反馈和重发方式的不同,ARQ协议分为3种形式:停等ARQ协议、回退N帧ARQ协议和选择性重传ARQ协议。
3.9 常见数字传输系统
数字传输系统中,为了有效地利用电话局之间的中继线路,通常总是将许多话路的脉码调制信号用时分复用的方法组装成帧,然后再送往线路上一帧接一帧地传输。为了方便起见,模拟电话信号的采样频率一般定为8kHz,经过模数转换,每个脉冲信号编码为8位二进制码。一个标准话路的模拟电话信号转换为脉冲调制信号的速率是64Kbps。
3.9.1 T1载波标准
T1是美国、加拿大、日本和新加坡使用的载波标准。T1载波是专用电话线路时分多路数字传输系统,24路采样声音信号复用一个信道。
T1的时分复用帧结构:24路采样声音信号,每路采样用7位编码,再加上1位控制信号,共8位,24路后再增加1位帧同步位,因此每一帧包含193位,每一帧传输时间为125μs。T1载波支持的传输速率为193b/125μs=1.544Mbps;每个通道支持的数据传输速率为64*(7/8)Kbps=56Kbps。T1采用4根无屏蔽双绞线,以成对的方式进行全双工通信。
3.9.2 E1载波标准
E1载波是欧洲使用的标准载波。E1载波使用30路采样声音信号复用一个信道。
E1是时分复用帧结构:每一帧开始处有8位做同步用,中间有8位用作信令,再组织30路8位数据,共计256位,每一帧传输时间为125μs。即一时分复用帧有32个时隙,其中30个时隙用于发送用户数据,2个时隙用于开销。E1载波支持的传输速率为256b/125μs=2.048Mbps;每个通道支持的传输速率为64Kbps。
当需要更高的数据传输速率时,可以采用时分复用多路T1或E1信号的方法,形成高次群。
3.9.3 同步数字体系
为了解决脉码调制数字传输系统的速率标准不统一和时钟不同步的问题,以及适应光纤网络互连的需求,人们指定了同步光纤网SONET标准。SONET为光纤传输系统定义了同步传输的线路速率等级结构,其传输速率以51.84Mbps为基础,此速率对电信号称为第1级同步传送信号,即STS-1;对光信号则称为第1级同步光载波,即OC-1。
ITU-T以美国标准为基础,制订出了国际标准同步数字系列,即SDH。SDH的基本速率为153.52Mbps,称为第1级同步传输模块,即STM-1,相当于SONET体系中的OC-3速率。