信源编码:为了提高通信有效性而对信源符号进行的变换,换言之,为了减少或消除信源冗余度而进行的信源符号变换。具体说,就是针对信源输出符号序列的统计特性来寻找某种方法,把信源输出符号序列变换为最短的码字序列,使后者的各码元所载荷的平均信息量最大,同时又能保证无失真地恢复原来的符号序列。其作用有二:一是数据压缩;二是模数转换。
最原始的莫尔斯电码,还有ASCII码和电报码都是信源编码。现代通信应用中常见的信源编码方式有:Huffman编码、算术编码、L-Z编码,这三种都是无损编码。当然还有有损编码,略过。
以简单的数据压缩为例即可说明信源编码的应用。若有一离散、无失真、无记忆信源,它含有五种符号U0~U4及其对应概率Pi,对它进行两种编码:等长码和最佳哈夫曼码(见下表)。
其中,等长码的平均码长=3,即三位码。若采用哈夫曼编码,平均码长不足两位码:
为了对抗信道中的噪音和衰减,通过增加冗余来提高抗干扰能力和纠错能力,是提高信道可靠性的理论和方法。分为两类:信道编码定理、构造性的编码方法
通常纠错码分为两大类,即分组码和卷积码。主要包括:线性分组码、卷积码、级联码、Turbo码和LDPC码。其中分组码又分为:汉明码,格雷码,循环码(BCH码,RS码,CRC循环冗余校验码)。
1948年,香农提出一位纠错码(码字长=7,信息码元数=4)。
1949年,出现三位纠错的格雷码(码字长=23,信息码元数=12)。
1950年,美国数学家R.W.汉明提出著名的汉明码,对纠错编码产生了重要的影响。
1955年,出现卷积码,至今仍有很广泛的应用。
1957年,出现了循环码,便于应用代数理论进行设计,构造简单,也容易实现。
1959年,出现了能纠正突发错误的哈格伯尔格码和费尔码。
1959年美国的R.C.博斯和D.K.雷·乔达利与法国的A.奥昆冈几乎同时独立地发表一种著名的循环码,后来称为BCH码(即Bose-Chaudhuri-Hocquenghem码)。
1965年,提出序贯译码序贯译码已用于空间通信。
1967年,A.J.维特比提出最大似然卷积译码,称为维特比译码。
1978年,出现矢量编码法,是一种高效率的编码技术。
1980年,用数论方法实现里德-所罗门码(Reed-Solomon码),简称RS码。它实际上是多进制的BCH码。这种纠错编码技术能使编码器集成电路的元件数减少一个数量级。
广义的信源编码包括模数转换(即把模拟量变换成二进制的数字量)和数据压缩(即对这些数字量进行编码来降低数码率)两个方面。信源编码的主要任务是压缩数据。
1951年,香农证明:当信源输出有冗余的消息时可通过编码改变信源的输出,使信息传输速率接近信道容量。
1948年,香农提出能使信源与信道匹配的香农编码。
1949年,美国麻省理工学院的R.M.费诺提出费诺编码。
1951年,美国电信工程师D.A.霍夫曼提出更有效的霍夫曼编码。
此后又出现了传真编码、图像编码和话音编码,对数据压缩进行了深入的研究。
这种方法是根据编码对象的出现概率(概率分布),分别给予不同长短的代码,出现概率越大,所给代码长度越短。这里所谓匹配就是指代码长度与概率分布相匹配。莫尔斯码是一种匹配编码。匹配编码还常采用去相关性的方法进一步压缩数据。
这种方法是先对信号进行变换,从一种信号空间变换成另一种信号空间,然后针对变换后的信号进行编码。变换编码在话音和图像编码中有广泛的应用。目前常用的变换编码有预测编码和函数编码两类。预测编码是根据信号的一些已知情况来预测信号即将发生的变化。它不传送信号的采样值,而传送信号的采样值与预测值之差。预测编码用在数字电话和数字电视中。函数变换最常用的是快速傅里叶变换(FFT)、余弦变换、沃尔什变换、哈尔变换和阿达马变换等。通过变换可得到信号的频谱特性,因而可根据频谱特点来压缩数码。
这种方法是将可能传输的消息分类按地址存储在接收端的电子计算机数据库中,发送端只发送数据库的地址,即可查出消息的内容,从而大大压缩发送的数据。
这种方法主要用于有标准形状的文字、符号和数据的编码。但话音也可以进行识别编码。识别编码的作用不仅限于压缩数据,它在模式识别中也有广泛的应用。常用的识别方法有关联识别和逻辑识别等方法。识别编码可大大压缩数据。例如,用话音识别的方法传输话音,平均数码率小于100比特/秒。而用Δ调制话音的方法传输话音,数码率达38400比特/秒。两者相差约400倍。但识别编码在恢复时是根据一个代码恢复一个标准声音,只能用于不必知道发话人是谁的特殊电话和问答装置。识别编码用于文字传输时,恢复出来的都是印刷体符号,只能用于普通电报。