音视频文件格式详解

第一部分:基本概念讲解
媒体: 是表示,传输,存储信息的载体,常人们见到的文字、声音、图像、图形等都是表示信息的媒体。
    多媒体是: 是声音、动画、文字、图像和录像等各种媒体的组合,以图文并茂,生动活泼的动态形式表现出来,给人以很强的视觉冲击力,留下深刻印象
    多媒体技术:是将文字、声音、图形、静态图像、动态图像与计算集成在一起的技术。它要解决的问题是计算机进一步帮助人类按最自然的和最习惯的方式接受和处理信息。
流媒体 流媒体是指采用流式传输的方式在 Internet 播放的连续时基媒体格式 ,实际指的是一种新的媒体传送方式,而不是一种新的媒体格式(在网络上传输音 / 视频等多媒体信息现在主要有下载和流式传输两种方式) 流式传输分两种方法:实时流式传输方式(Realtime streaming)和顺序流式传输方式(progressive streaming)
多媒体文件 是既包括视频又包括音频,甚至还带有脚本的一个集合,也可以叫容器;
媒体编码: 是文件当中的视频和音频所采用的压缩算法。也就是说一个 avi 的文件,当中的视频编码有可能是 A ,也可能是 B ,而其音频编码有可能是 1 ,也有可能是 2    转码 :指将一段多媒体包括音频、视频或者其他的内容从一种编码格式转换成为另外一种编码格式
视频: 连续的图象变化每秒超过 24 帧( Frame )画面以上时,根据视觉暂留原理,人眼无法辨别单幅的静态画面,看上去是平滑连续的视觉效果,这样连续的画面叫做视频
音频 : 人类能听到的声音都成为音频,但是一般我们所说到的音频时存储在计算机里的声音
第二部分:视频文件格式
基本视频概念讲解:
码率:码率就是数据传输时单位时间传送的数据位数,一般我们用的单位是kbps即千位每秒。 通俗一点的理解就是取样率,
单位时间内取样率越大,精度就越高,处理出来的文件就越接近原始文件,但是文件体积与取样率是成正比的,所以几乎所
有的编码格式重视的都是如何用最低的码率达到最少的失真。但是因为编码算法不一样,所以也不能用码率来统一衡量音质
或者画质 
 
帧:帧就是一段数据的组合,它是数据传输的基本单位。就是影像动画中最小单位的单幅影像画面,相当于电影胶片上的每
一格镜头。 一帧就是一副静止的画面,连续的帧就形成动画,如电视图像等。
帧率:帧率即每秒显示帧数,帧率表示图形处理器处理场时每秒钟能够更新的次数。高的帧率可以得到更流畅、更逼真的动画。
一般来说30fps就是可以接受的,但是将性能提升至60fps则可以明显提升交互感和逼真感,但是一般来说超过75fps一般就不
容易察觉到有明显的流畅度提升了。如果帧率超过屏幕刷新率只会浪费图形处理的能力,因为监视器不能以这么快的速度更新
,这样超过新率的帧率就浪费掉了。
 
关键帧:相当于二维动画中的原画,指角色或者物体运动或变化中的关键动作所处的那一帧,它包含了图像的所有信息,后来
帧仅包含了改变了的信息。如果你没有足够的关键帧,你的影片品质可能比较差,因为所有的帧从别的帧处产生。对于一般的
用途,一个比较好的原则是每5秒设一个关键键。但如果时那种实时传输的流文件,那么要考虑传输网络的可靠度,所以要1
2秒增加一个关键帧。
目前我们经常见的视频格式无非就是两大类:
1、影像格式(Video
2、流媒体格式(Stream Video

在影像格式中还可以根据出处划分为三大种:
1AVI格式:这是由微软(Microsoft)提出,具有悠久历史的一种视频格式
2MOV格式:这是由苹果(Apple)公司提出的一种视频格式
3MPEG/MPG/DAT:这是由国际标准化组织ISO(International Standards Organization)IEC(International Electronic Committee)联合开发的一种编码视频格式。MPEG是运动图像压缩算法的国际标准,现已被几乎所有的计算机平台共同支持。

在流媒体格式中同样还可以划分为三种:
1RM格式:这是由Real Networks公司开发的一种新型流式视频文件格式。
2MOV/QT格式:MOV也可以作为一种流文件格式。QuickTime能够通过Internet提供实时的数字化信息流、工作流与文件回放功能,为了适应这一网络多媒体应用,QuickTime为多种流行的浏览器软件提供了相应的QuickTime Viewer插件(Plugin),能够在浏览器中实现多媒体数据的实时回放。
3ASF格式:这是由微软公司开发的流媒体格式,是一个在Internet上实时传播多媒体的技术标准。
4. FLV


具体视频文件格式详解:
*. MPEG/.MPG/.DAT
MPEG也是Motion Picture Experts Group 的缩写。这类格式包括了 MPEG-1, MPEG-2 MPEG-4在内的多种视频格式。MPEG-1相信是大家接触得最多的了,因为目前其正在被广泛地应用在 VCD 的制作和一些视频片段下载的网络应用上面,大部分的 VCD 都是用 MPEG1 格式压缩的 ( 刻录软件自动将MPEG1转为 .DAT格式 ) ,使用 MPEG-1 的压缩算法,可以把一部 120 分钟长的电影压缩到 1.2 GB 左右大小。MPEG-2 则是应用在 DVD 的制作,同时在一些 HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当多的应用。使用 MPEG-2 的压缩算法压缩一部 120 分钟长的电影可以压缩到 5-8 GB 的大小(MPEG2的图像质量MPEG-1 与其无法比拟的)。

*.AVI
 它的英文全称为Audio Video Interleaved,即音频视频交错格式。是将语音和影像同步组合在一起的文件格式。它对视频文件采用了一种有损压缩方式,但压缩比较高,因此尽管面面质量不是太好,但其应用范围仍然非常广泛。AVI支持256色和RLE压缩。AVI信息主要应用在多媒体光盘上,用来保存电视、电影等各种影像信息。它于1992年被Microsoft公司推出,随Windows3.1一起被人们所认识和熟知。所谓音频视频交错,就是可以将视频和音频交织在一起进行同步播放。这种视频格式的优点是图像质量好,可以跨多个平台使用,其缺点是体积过于庞大,而且更加糟糕的是压缩标准不统一,最普遍的现象就是高版本Windows媒体播放器播放不了采用早期编码编辑的AVI格式视频,而低版本Windows媒体播放器又播放不了采用最新编码编辑的AVI格式视频,所以我们在进行一些AVI格式的视频播放时常会出现由于视频编码问题而造成的视频不能播放或即使能够播放,但存在不能调节播放进度和播放时只有声音没有图像等一些莫名其妙的问题,如果用户在进行AVI格式的视频播放时遇到了这些问题,可以通过下载相应的解码器来解决。是目前视频文件的主流。 这种格式的文件随处可见,比如一些游戏、教育软件的片头,多媒体光盘中,都会有不少的 AVI 。现在,在WINDOWS 9598里都能直接播放AVI,同一种格式的avi文件有可能采用不同的编码方式,最常见的有 Intel IndeoRVideo R3.2(像游戏过场动画等,是目前使用最广泛的一种avi编码技术)、Microsoft video 等。

*.RA/RM/RAM
 *.RM Real Networks公司所制定的音频/视频压缩规范Real Media中的一种,Real Player能做的就是利用Internet资源对这些符合Real Media技术规范的音频/视频进行实况转播。在Real Media规范中主要包括三类文件:RealAudioReal VideoReal Flash Real Networks公司与Macromedia公司合作推出的新一代高压缩比动画格式)。REAL VIDEO RARAM)格式由一开始就是定位就是在视频流应用方面的,也可以说是视频流技术的始创者。它可以在用 56K MODEM 拨号上网的条件实现不间断的视频播放,RealVideo的定位来看,就是牺牲画面质量来换取可连续观看性。其实RealVideo也可以实现不错的画面质量,由于RealVideo可以拥有非常高的压缩效率,很多人把VCD编码成RealVideo格式的,这样一来,一张光盘上可以存放好几部电影。REAL VIDEO存在颜色还原不准确的问题,RealVideo就不太适合专业的场合,但RealVideo出色的压缩效率和支持流式播放的特征,使得RealVideo在网络和娱乐场合占有不错的市场份额。
*.MOV
MOV
格式,美国 Apple 公司开发的一种视频格式,默认的播放器是苹果的 QuickTimePlayer 。具有较高的压缩比率和较完美的视频清晰度等特点,但是其最大的特点还是跨平台性,即不仅能支持 MacOS ,同样也能支持 Windows 系列 , 在所有视频格式当中,也许 MOV 格式是最不知名的。也许你会听说过 QuickTime MOV 格式的文件正是由它来播放的。在 PC 几乎一统天下的今天,从 Apple 移植过来的 MOV 格式自然是受到排挤的。它具有跨平台、存储空间要求小的技术特点,而采用了有损压缩方式的 MOV 格式文件,画面效果较 AVI 格式要稍微好一些。到目前为止,它共有 4 个版本,其中以 4.0 版本的压缩率最好。这种编码支持 16 位图像深度的帧内压缩和帧间压缩,帧率每秒 10 帧以上。现在这种格式有些非编软件也可以对它时行处理,其中包括 ADOBE 公司的专业级多媒体视频处理软件 AFTEREFFECT PREMIERE

*.ASF
 ASF (Advanced Streaming format高级流格式)ASF MICROSOFT 为了和现在的 Real player 竞争而发展出来的一种可以直接在网上观看视频节目的文件压缩格式。ASF使用了 MPEG4 的压缩算法,压缩率和图像的质量都很不错。因为 ASF 是以一个可以在网上即时观赏的视频格式存在的,所以它的图像质量比 VCD 差一点点并不出奇,但比同是视频格式的 RAM 格式要好。 ASF支持任意的压缩/解压缩编码方式,并可以使用任何一种底层网络传输协议,具有很大的灵活性。ASF流文件的数据速率可以在28.8Kbps3Mbps之间变化。用户可以根据自己应用环境和网络条件选择一个合适的速率,实现VOD点播和直播。

*.WMV
 WMV是微软推出的一种流媒体格式,它是ASF的升级延伸,在同等视频质量下,WMV格式的体积非常小,因此很适合在网上播放和传输。微软希望用其取代QuickTime之类的技术标准以及WAVAVI之类的文件扩展名。WMV的主要优点在于:可扩充的媒体类型、本地或网络回放、可伸缩的媒体类型、流的优先级化、多语言支持、扩展性等。

*. NAVI
 如果你发现原来的播放软件突然打不开此类格式的AVI文件,那你就要考虑是不是碰到了n AVIn AVI New AVI 的缩写,是一个名为 Shadow Realm 的地下组织发展起来的一种新视频格式。它是由Microsoft ASF 压缩算法的修改而来的(并不是想象中的 AVI),视频格式追求的无非是压缩率和图像质量,所以 NAVI 为了追求这个目标,改善了原始的 ASF 格式的一些不足,让 NAVI 可以拥有更高的帧率。可以这样说,NAVI 是一种去掉视频流特性的改良型 ASF 格式。
*.FLV
FLV FLASH VIDEO 的简称, 是由 Macromedia 公司开发的属于自己的流式视频格式。 FLV 也就是随着 Flash MX 的推出发展而来的视频格式,是在 sorenson 公司的压缩算法的基础上开发出来的。 FLV 格式不仅可以轻松的导入 Flash 中,速度极快,并且能其到保护版权的作用,并且可以不通过本地的微软或者 REAL 播放器播放视频。 Flash MX 2004 对其提供了完美的支持,它的出现有效地解决了视频文件导入 Flash 后,使导出的 SWF 文件体积庞大,不能在网络上很好的使用等缺点。由于它形成的文件极小、加载速度极快,使得网络观看视频文件成为可能,它的出现有效地解决了视频文件导入 Flash 后,使导出的 SWF 文件体积庞大,不能在网络上很好的使用等缺点。

视频压缩基本概念:
一、有损和无损压缩 在视频压缩中有损( Lossy )和无损( Lossless )的概念与静态图像中基本类似。无损压缩也即压缩前和解压缩后的数据完全一致。多数的无损压缩都采用 RLE 行程编码算法。有损压缩意味着解压缩后的数据与压缩前的数据不一致。在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息,而且丢失的信息不可恢复。几乎所有高压缩的算法都采用有损压缩,这样才能达到低数据率的目标。丢失的数据率与压缩比有关,压缩比越小,丢失的数据越多,解压缩后的效果一般越差。此外,某些有损压缩算法采用多次重复压缩的方式,这样还会引起额外的数据丢失。
二、帧内和帧间压缩 帧内( Intraframe )压缩也称为空间压缩( Spatial compression )。当压缩一帧图像时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息,这实际上与静态图像压缩类似。帧内一般采用有损压缩算法,由于帧内压缩时各个帧之间没有相互关系,所以压缩后的视频数据仍可以以帧为单位进行编辑。帧内压缩一般达不到很高的压缩。
   
采用帧间( Interframe )压缩是基于许多视频或动画的连续前后两帧具有很大的相关性,或者说前后两帧信息变化很小的特点。也即连续的视频其相邻帧之间具有冗余信息,根据这一特性,压缩相邻帧之间的冗余量就可以进一步提高压缩量,减小压缩比。帧间压缩也称为时间压缩( Temporal compression ),它通过比较时间轴上不同帧之间的数据进行压缩。帧间压缩一般是无损的。帧差值( Frame differencing )算法是一种典型的时间压缩法,它通过比较本帧与相邻帧之间的差异,仅记录本帧与其相邻帧的差值,这样可以大大减少数据量。
三、对称和不对称编码 对称性( symmetric )是压缩编码的一个关键特征。对称意味着压缩和解压缩占用相同的计算处理能力和时间,对称算法适合于实时压缩和传送视频,如视频会议应用就以采用对称的压缩编码算法为好。而在电子出版和其它多媒体应用中,一般是把视频预先压缩处理好,尔后再播放,因此可以采用不对称( asymmetric )编码。不对称或非对称意味着压缩时需要花费大量的处理能力和时间,而解压缩时则能较好地实时回放,也即以不同的速度进行压缩和解压缩。一般地说,压缩一段视频的时间比回放(解压缩)该视频的时间要多得多。例如,压缩一段三分钟的视频片断可能需要 10 多分钟的时间,而该片断实时回放时间只有三分钟。
第三部分:音频文件格式   
.WMA
   WMA 的全称是 Windows Media Audio ,是微软力推的一种音频格式。 WMA 格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到 1:18 ,生成的文件大小只有相应 MP3 文件的一半。此外, WMA 还可以通过 DRM Digital Rights Management )方案加入防止拷贝,或者加入限制播放时间和播放次数,甚至是播放机器的限制,可有力地防止盗版。
优点
WMA 7
之后的 WMA 支持证书加密,未经许可(即未获得许可证书),即使是非法拷贝到本地,也是无法收听的。同时,微软公司开始时宣称的:同文件比 MP3 体积小一倍而音质不变,也得到了兑现。事实上,这个说法,仅仅适用于低比特率的情况,另外,微软公司在 WMA 9 大幅改进了其引擎,实际上几乎可以在同文件同音质下比相同的 MP3 体积少 1/3 左右。
缺点
在高比率的渲染能力低下,同音源的一个 320KBPS MP3 与比较 192KBPS WMA 相比,音质和渲染力很容易分别出是前者较优。

   .VQF
   VQF TwinVQ Transform domain Weighted Interleave Vector Quantization ),是由 NTT Nippon Telegraph and Telephone )与 Yamaha 共同开发的一种音频压缩技术。 VQF 的音频压缩率比标准的 MPEG 音频压缩率高出近一倍,可以达到 18:1 左右甚至更高。也就是说把一首 4 分钟的歌曲( WAV 文件)压成 MP3 ,大约需要 4MB 左右的硬盘空间,而同一首歌曲,如果使用 VQF 音频压缩技术的话,那只需要 2MB 左右的硬盘空间。因此,在音频压缩率方面, MP3 RA 都不是 VQF 的对手。
但是 VQF 不支持 " " ,这可能也是为什么现在它完全被 WMA 压下去的一个主要原因 .

   .MP3
MP3 的全称是 Moving Picture Experts Group Audio Layer III 。简单的说, MP3 就是一种音频压缩技术,由于这种压缩方式的全称叫 MPEG Audio Layer3 ,所以人们把它简称为 MP3 MP3 是利用 MPEG Audio Layer 3 的技术,将音乐以 1:10 甚至 1:12 的压缩率,压缩成容量较小的 file ,换句话说,能够在音质丢失很小的情况下把文件压缩到更小的程度。而且还非常好的保持了原来的音质。正是因为 MP3 体积小,音质高的特点使得 MP3 格式几乎成为网上音乐的代名词。每分钟音乐的 MP3 格式只有 1MB 左右大小,这样每首歌的大小只有 3-4 兆字节。使用 MP3 播放器对 MP3 文件进行实时的解压缩 ( 解码 ) ,这样,高品质的 MP3 音乐就播放出来了。   
MP3 最受争议的就是音质问题 ( 尤其是随着 WMA 的普及 ) ,其高频损失很大,很多 MP3 编码器粗糙的编码算法不但导致高频丢失,还丢失了许多细节,类似吉他擦弦的感觉在 MP3 中是找不到的 . 在对 MP3 快要失望时,偶发现了 Lame, 它支持根据人耳遮蔽效应原理来分析波形,配合 VBR 技术,可以让音质达到令人吃惊的地步 ; 其独创的心理音响模型技术保证了 CD 音频还原的真实性,配合 VBR( 动态比特率 ) ABR( 平均比特率 ) 参数,编码出来的 MP3 音色纯厚、空间宽广、低音清晰、细节表现良好 , 音质几乎可以媲美 CD 音频,但文件体积却非常小 . 很多网友在使用 LAME 后的反映就是:立刻删除硬盘上所有的 MP3 和其他编码器,全部用 Lame 重新来过。 Lame 提供 EXE DLL ,其中 DLL 是作为标准的动态运行库供其他程序调用 .EXE Command Line 程序,象 DOS 程序一样工作,两者彼此独立,互不关联。但大家很快能发现两者编码的质量是不一样的 , 那是由于 dll 可控性差,与具备丰富调节参数的 EXE 版相比,其压缩出来的 MP3 效果稍逊一筹。但 EXE 是一个命令行工具,操作很麻烦,幸亏有了 WinLAMEr lameGUIxp 这些 Shell 。只要学会使用这些 Shell( 是傻瓜型的 , 一看即会 ) ,就可以用 LAME 压缩出最最精彩的 MP3 了。再说说 APS, LAME 出现以前, APS 就是最好的 MP3 编码器,它使用的 Fraunhofer IIS 编码算法,这比 LAME 使用的编码算法要先进,在 192k Bitrate(CBR) 下,甚至比 LAME 编码的曲子要优秀,细节明显要丰富一些,但 APS 本身不支持 VBR ,当 Bitrate 往上提高时,音质就要比 LAME 编码的要差了,大部分朋友的 MP3 的一般都是 128-192K Bitrate 的,因此 APS 仍旧有推荐的价值。特别是有很多 MP3 随身听不支持 VBR 256K Bitrate 以上的 MP3 LAME 就不一定合适这些朋友了, APS 就成了不错的选择,由它编码的曲子,绝对不会辱没你昂贵的 PLAYER.

   .MP3PRO
   MP3PRO 完全是基于传统 MP3 编码技术的一种改良,本身最大的技术亮点就在于 SBR(Spectral Band Replication 频段复制 ), 这是一种新的音频编码增强算法 . 它提供了改善低位率情况下音频和语音编码的性能的可能 . 这种方法可在指定的位率下增加音频的带宽或改善编码效率 ,SBR 最大的优势就是在低数据速率下实现非常高效的编码 . 如果在高数据速率的情况下, SBR 将如同虚设 . 当制作 MP3PRO 文件时,编码器将音频分为两部分。一部分是将音频数据中的低频段部分分离出来,通过传统的 MP3 技术而编码得出的正常的 MP3 音频流,此举可令到 MP3 编码器可以专注于低频段信号从而获得更好的压缩质量,而且原来的 MP3 播放器也可播放 MP3PRO 文件。另一部分则是将分离出来的高频段信号进行编码并嵌入到 MP3 流中,传统的 MP3 播放器会将其忽略掉,而新的 MP3PRO 播放器则可从中还原出高频信号,并将两者进行组合,得到高质量的全带宽的声音 . 官方宣称通过这样的技术,使得 MP3PRO 能在 64kbps 的编码率便可提供与 128kbps mp3 相同的质量。低比特率下 MP3PRO 的性能很明显地比 MP3 要高 , 但是它与 WMA 谁胜谁负就很难说了 , 根据一些发烧友的评测 , MP3PRO 似乎略胜一些 . 高比特率下很少有人用到 MP3PRO.
.OGG
   OGG 格式的全称应该是 OGG Vobis 。它是一种新的音频压缩格式,类似于 MP3 等现有的音乐格式。但有一点不同的是,它是完全免费、开放和没有专利限制的。 OGG Vobis 有一个很出众的特点,就是支持多声道,随着它的流行,以后用随身听来听 DTS 编码的多声道作品将不会是梦想。 OGG Vobis 在压缩技术上比 MP3 好,而且它的多声道,免费,开源这些特点,使它很有可能成为一个流行的趋势,这也正是一些 MP3 播放器对其支持的原因
在高音质要求下 , 有损音频编码世界中是三足项立,分别为 MP3 MPC OGG 。 
Ogg Vorbis 中的主要算法还是利用MDCT(修饰离散余弦变换Modified Discrete Cosine Transform )而不是用现在比较时兴的小波(wavelet)技术。Ogg的多通道编码技术,统称为立体声通道耦合Stereo Channel Coupling。而该技术实际又是由两种不同的技术组成的:channel interleaving  square polar mapping,而这也是Ogg能成为免费制式的一个必要条件,以往的联合立体声Joint Stereo”的编码模式是有专利限制的。 据官方声称,与其他会造成立体空间感减弱的编码模型相比,这两种技术都可以在保持编码器的灵活性的同时而不损害本来的立体声空间影像 �D�D 相信配合 iRiver 3d 音效会有更好的表现力,而且实现的复杂程度比联合立体声方式要低。
   OGG Vorbis 这种编码也远比 90 年代开发成功的 MP3 先进,它可以在相对较低的数据速率下实现比 MP3 更好的音质! �D�D 我认为 Ogg 很象 MD atrac 格式,特别象新的 lp2 编码,它能在低别特率下有着很要的音质。此外,在编码上, Ogg Vorbis 是使用了 VBR (可变比特率)和 ABR (平均比特率)方式进行编码,所以理论上, Ogg Vorbis 带来的音乐可以比采用 CBR 文件有更好的声音表现,当然前提是两者使用同样比特率 (Bit Rate) 的压缩模式 �D�D 这里可以知道。 Ogg Vorbis 的比特率缩放功能可以在不用重新编码的情况下调节文件的相关压缩率,与此同时, Ogg 文件的单位编辑能力和超越左右声道的音频流技术可以带来更为奇妙的音乐享受。 Vorbis 还具有比特率缩放功能,可以不用重新编码便可调节文件的比特率。
   Vorbis 文件可以被分成小块并以样本粒度( granularity ,专业术语,指数据可以被分割的最小尺寸)进行编辑; Vorbis 支持多通道(大于 2 )音频流并使用了独创性的处理技术;这意味着什么?这意味着 Ogg Vorbis SACD DTSCD DVD AUDIO 抓轨软件(目前这种软件还没有)的支持下,可以对所有的声道进行编码,而不是 MP3 只能编码 2 个声道。多声道音乐的兴起,给音乐欣赏带来了革命性的变化,尤其在欣赏交响时,会带来更多临场感。这场革命性的变化是 MP3 无法适应的。在以后的播放技术不断提高以后,而且人们对音质要求不断提高, Ogg 的优势将更加明显。
   . MPC
   MusePaCk 是由德国人 Andree Buschmann 开发的一种完全免费的高品质音频格式。在其问世之前, Lame MP3 是公认音质最好的有损压缩方案,追求音质的人对它趋之若鹜。但现在这个桂冠无疑该让给 MPC 了,在中高码率下, MPC 可以做到比 MP3 更好音质。在高码率下, MPC 的高频要比 MP3 细腻不少,可以在节省大量空间的前提下获得最佳音质的音乐欣赏,是目前最适合用于音乐欣赏的有损编码。
MPC 的编码方案是在 MP2 的基础上改进而来。它同样采用子带编码技术,但相比 MP2 ,它所采用的心理声学模型要优秀得多,并加入了像 ANS Adaptive Noise Shaping )、 CVD(ClearVoiceDetection) 等技术,甚至改变了压缩时所用的 Huffman (哈夫曼)编码,以得到更大的压缩率。另外, MPC 采用的是可变码率进行编码。毫无疑问,可变码率的编码效率要高于固定码率,因为前者可以合理地分配数据量,在信号复杂(微弱)时提高(降低)比特率,在得到满意的效果又能确保不错的压缩率。为了保证高音质, MPC 的瞬间最大码率甚至高达 1.32Mbps ,这已经快接近 CD 1.41Mbps
较高比特率下 (250kbps 左右 ),MPC 表现非常的出众 , 甚至超过了 MP3 ,很难分辨它和原始信号有多少区别,无论从频率保留还是细节保留,以及信号强度失真来说, MPC 太优秀了 . MPC 并非万能的,它无法编码 48khz 采样率的曲子,所幸的是,这样的曲子来源很少 . 可惜这种格式并没有像 MP3 WMA 那样流行 .

   .ATRAC
   ATRAC Adaptive TRansform Acoustic Coding 自适应声学转换编码技术):是 Sony 的原创音乐压缩技术,主要用于 MD Walkman 的录音及播放方面。是一项基于听觉心理学领域的研究和不损伤可闻声质量的数码音频译码压缩技术,对音乐资讯有效的进行压缩,压缩的比率为原来的五分之一,因为 MD 使用了 ATRAC 压缩技术,这样的压缩大大节省了许多空间,所以  CD 的碟片要 120mm 大小,而 MD 只需 64mm 就可以录下 74 分钟的音乐。
ATRAC 压缩技术主要是利用了人耳的蔽遮效应,在心理声学原理上,在进行音频录入的同时,有许多外部的频段同时也会被录入,当人耳同时听到两个不同频率、不同音量的声音时,音量较小的低频及音量较小的高频连同不为人耳所察觉的频段信号都会被自动减弱或忽略不予记录,因此又可以称为适应性变换声码技术,由于近年�肀嗦胙顾跫际酰� ATRAC 的版本)越�碓匠墒欤�所以经过编码解码过程后的声音仍直逼 CD ,大家就不必担心音质差啦。
ATRAC 16 比特 44.1KHz 的数字信号以频率响应轴分成 52 个区段(在低频时分割较细而在高频时分割较粗),根据声音心理学的原理,将声音信号中人耳听不到和对人的听力影响不大的信息给剔除出去而达到缩小声音文件的目的。利用这种原理, ATRAC 可以将录音的资料量压缩为原来的五分之一(即压缩比为 1 5 )。
.

   . APE  
     APE 的本质,其实它是一种无损压缩音频格式。庞大的 WAV 音频文件可以通过 Monkey''s Audio 这个软件进行 瘦身 压缩为 APE 。很时候它被用做网络音频文件传输,因为被压缩后的 APE 文件容量要比 WAV 源文件小一半多,可以节约传输所用的时间。更重要的是,通过 Monkey''s Audio 解压缩还原以后得到的 WAV 文件可以做到与压缩前的源文件完全一致。所以 APE 被誉为 无损音频压缩格式 Monkey''s Audio 被誉为 无损音频压缩软件 。与采用 WinZip 或者 WinRAR 这类专业数据压缩软件来压缩音频文件不同,压缩之后的 APE 音频文件是可以直接被播放的。   Monkey''s Audio 会向Winamp中安装一个“in_APE.dll”插件,从而使Winamp也具备播放APE文件的能力。 
和上面介绍的几款编码不同的是,这个编码提供了最好的音质保证 ( 无损压缩 ) !还提供了 Winamp 的插件支持 , 可以直接用 Winamp 来播放 . 所谓无损就是指压缩后的格式和源文件在音质上并无差异,而 Mp3 WMA 等的编码方案是基于有损的,在损失部分音质的前提下节约存贮空间,所以说音质再好的 Mp3 WMA 也只能是无限接近源文件的音质。 APE 非常适合来编码讲究细节的独奏曲目和大动态的交响曲。向各位音乐迷们 ( 不是歌迷 ) 作最强烈的推荐!它的压缩比约为 2:1.

   . WAV
   WAV 是录音时用的标准的 windows 文件格式,文件的扩展名为 .wav WAVE 文件作为最经典的 Windows 多媒体音频格式,应用非常广泛。声道有单声道和立体声之分,采样频率一般有 11kHz 22kHz 44kHz 三种。
WAVE 文件所占容量 = (采样频率 × 采样位数 × 声道) × 时间 /8 1 字节 =8bit )。
   WAV 文件与 MIDIMP3 这类多媒体声音文件比较起来,所占的硬盘空间要大得多,但 WAV 文件的回放效果是最好的, WAV 文件直接反映了一个声音在每个时刻的大小值, 1 分钟 44khz 采样率的 WAV 文件就会占用 10M 硬盘空间!
它通常作为制作高质量音乐的中间体
   .RM
   Real Networks 公司所制定的音频视频压缩规范称为Real Media,用户可以使用RealPlayerRealOne Player对符合RealMedia技术规范的网络音频/视频资源进行实况转播并且RealMedia可以根据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放。这种格式的另一个特点是用户使用RealPlayerRealOne Player播放器可以在不下载音频/视频内容的条件下实现在线播放。另外,RM作为目前主流网络视频格式,它还可以通过其Real Server服务器将其它格式的视频转换成RM视频并由Real Server服务器负责对外发布和播放。 RM ASF 格式可以说各有千秋,通常 RM 视频更柔和一些,而 ASF 视频则相对清晰一些。
  RM
格式一开始就定位在视频流应用方面,也可以说是视频流技术的始创者。它可以在用 56 K Modem 拨号上网的条件下实现不间断的视频播放,当然,其图像质量和 MPEG2 DIVX 等相比有一定差距,毕竟要实现在网上传输不间断的视频是需要很大带宽的。
RM 已经是昨日黄花,没有任何新意,低 Bitrate 比不过 WMA ,高 Bitrate 比不过 MP3 ,虽然新的 RM 导入了 ATRAC3 算法,但颓势已定,很难东山再起了。 

你可能感兴趣的:(视频,文件,格式,详解,休闲)