多声道LPCM:无损音轨原始存在格式,概念上等效于wave文件,并不需要运算解码,可直接输入功放进行DA转换,光纤和同轴接口只能传输2声道LPCM,多声道LPCM需要HDMI接口传输。
PCM:非线性脉冲编码调制
LPCM:线性脉冲编码调制
它们是一种将模拟语音信号转换为数字信号的编码方式,为无损非压缩编码.
转换流程:抽样 --> 量化 --> 编码
-------------------------------------------------------------
抽样过程是将连续时间模拟信号变为离散时间,连续幅度的抽样信号
量化过程是将抽样信号变为离散时间,离散幅度的数字信号
量化过程又被分为线性量化和非线性量化
线性量化在整个量化范围内,量化间隔均相等
非线性量化采用不等的量化间隔
编码过程是将量化后的信号编码成为一个二进制码组输出
--------------------------------------------------------------
主要区别:
因为它们量化间隔不同,所以最后的二进制编码位数不同.
其它区别:
PCM中有时会使用相应的技术降低数字信号源的数据率,便于存储和数据传输方便
LPCM中通常使用了更多的杜比环绕立体声重放技术,更逼真地再现原声场。
LPCM(PCM)(线性脉冲编码调制) 普通CD规格为16bit/44.1kHz,DVD的规格则有多种,量化精度可分为16bit、20bit、24bit,采样频率分为48kHz、96kHz。此外,LPCM信号中可录入杜比环绕声信息,供现有的杜比定向逻辑环绕声系统使用。
VOB文件有视频、声音、字幕数据流组成。视频数据流是MPEG2格式,音频数据流是AC-3或者者LPCM、MPEG2、MP2、DTS等等,AC3基本上是事实的标准,MPEG2多声道只在极少数2区碟上可以看到(比如In the line of fire,2区).PCM主要用于音乐DVD,而MP2只在廉价DVD上才有.PCM是高质量无压缩数字音频,因此需要太多的空间,并不适合用于DVD电影光碟。AC3的数据率介于192~448KBPS之间,192KBPS用于双声道,384~448KBPS用于5.1声道。
音频数字化主要有压缩与非压缩两种方式。较早出现的数字音频播放机,如CD唱机和DAT录音机,均采用线性PCM编码来存储音乐信号,为非压缩方式。在高质量要求的音频工作站和数字录像机(如DVCPRO)上,现在也采用非压缩的格式。
我们目前常见的MPEG、Dolby Digital、DTS等则为压缩方式。压缩分为有损压缩和无损压缩。有损压缩的目的是提高压缩率,降低占用系统资源。可以根据实际需要选用不同的采样速率、样本分辨力(精度)和数据率。
如今杜比数字作为由FCC为美国选定的ATSC数字电视标准的一部分,为高清晰度电视(HDTV)和标准清晰度电视(SDTV)广播的标准。MPEG为欧洲数字视频广播(DVB)、数字音频广播(DAB)和日本广播电视业的音频标准。DVD则支持3种主要标准:Dolby digital(杜比数字)、MPEG-2和线性PCM(LPCM)。其他格式,如DTS(Digital Theatre Sound)、SDDS(Sony Dynamic Digital Sound)等为任选格式。
声音重放技术的发展路程,是沿着单声(Monophonic)、双声道立体声(Stereophonic)到4通道立体声,再到环绕立体声(Stereo surround),现在一般为5.1模式。其根本目的,就是更逼真地再现原声场。我国电视目前大量采用的单声道已远远跟不上人们生活的需要。如何以量低的数据率,最有效地传送多声道、高质量的声音,是数字化的发展方向。所谓5?1模式,即录制、解码和放声中采用5个声道:左(L)、中(C)、右(R)、左环绕(LS)、右环绕RS),再加上一个低频效果通道(LFE),就可以达到真正的立体环绕声效果——宽阔的场景深度感和总体真实感。5.1模式为ATSC和DVB的标准声道。
声音之所以能够数字化,是因为人耳所能听到的声音频率不是无限宽的,主要在20kHz以下。按照抽样定理,只有抽样频率大于40kHz,才能无失真地重建原始声音。如CD采用44.1kHz的抽样频率,其他则主要采用48kHz或96kHz。
PCM(脉冲编码调制)是一种将模拟语音信号变换为数字信号的编码方式。主要经过3个过程:抽样、量化和编码。抽样过程将连续时间模拟信号变为离散时间、连续幅度的抽样信号,量化过程将抽样信号变为离散时间、离散幅度的数字信号,编码过程将量化后的信号编码成为一个二进制码组输出。
量化分为线性量化和非线性量化。线性量化在整个量化范围内,量化间隔均相等。非线性量化采用不等的量化间隔。量化间隔数由编码的二进制位数决定。例如,CD采用16bit线性量化,则量化间隔数L=65536。位数(n)越多,精度越高,信噪比SNR=6.02n+1.76(dB)也越高。但编码的二进制位数不是无限制的,需要根据所需的数据率确定。比如:CD可以达到的数据率为2×44.1×16=1411?2Kbit/s。
常用的编码码组有3种:自然二进制码组(NBC)、折叠二进制码组(FBC)、格雷二进制码组(RBC)。国际PCM标准主要使用FBC。
PCM虽然为无损压缩,但由典型的音频信号表示的信号特性没有达到最佳,也没有很好的适应人耳听觉系统的特定要求。PCM的数据量过高,从而造成存储和传输方面的障碍,因此必须使用相应的技术降低数字信号源的数据率,又尽可能不对节目造成损伤,这就是压缩技术。
人耳的听觉心理有两个特性:频率掩蔽和时间掩蔽特性。人耳在安静的环境中有一个静听阈(门限),即对应于人耳能听到的频率范围能被感觉到的最低声音强度。频率掩蔽,即当一个单音单元出现时,产生一个新的听阈曲线(同听阈),在此频率附近的频段内,门限均有不同程度的提高,以中心频率为最高。时间掩蔽,即当一个强信号出现时,其前后一段时间内,业已存在的弱音可以被掩蔽不被听见。在听阈以下的音频信号不需要编码。
Mux 是 Multiplex 的缩写,意为“多路传输”,其实就是“混流”、“封装”的意思,与“合成”的意思相似就是指把视频素材和音频素材封装到一个单独的文件中。
通过 muxing(混流),可以将视频流、音频流甚至是字幕流捆绑到一个单独的文件中,作为一个信号进行传输,等传输完毕,就可以通过 demuxing(分离) 将里面的视频、音频或字幕分解出来各自进行解码和播放。
在 muxing 与 demuxing 的整个过程,都不对原来的视频、音频或字幕重新编码。混流(封装、打包)后的文件,可以通过分离(分解、解包)操作,获得与原始素材一模一样的独立的视频、音频和字幕文件。