视频文件格式扩展名/专用名词详解

AAC

AAC全称高级音频编码(Advanced Audio Coding),将是 AC3 音频编码的替代者。在AC3基础上,AAC从多方面对其进行了改进。(不过)当前的播放器和硬件对于这种即将到来的音频格式支持仍旧十分有限。

Authentication 认证

在一部电影能够播放以前,播放器和碟片之间必须建立一种它们能在其中彼此传递真实的电影信息的安全通讯方式。在建立这种方式前, 另一方面它们还需要保证有合法的“观众”-- 这可以经由若干关键的密匙交换、 验证等等方法来完成。

AC3

AC3(全称Audio Coding3音频编码3)是杜比数码的同义词,杜比数码是一种高级音频压缩技术,它最多可以对6个比特率最高为448kbps的单独声道进行编码。要了解更多信息请参阅 杜比网站 Dolby website 。

ASF

全称高级流媒体格式(Advanced Streaming Format),微软与Real Media的流媒体对应的一般格式。

AVI

音频视频互相交错,在Windows操作系统下的个人电脑中使用最广泛的视频格式。它阐明了视频和音频是如何在没有明确指定编码/解码器的情况下彼此互相依附的。

BUP 文件

BUP文件是 IFO 文件的一个备份。这些文件一般出现在DVD碟片上。

Cell (ID)

一个cell是一张DVD上最小的视频单位.通常用来存放一个chapter,也可以用来存放一个章节(chapter),也可以用来存放一更小的单位,譬如多视角或者分支剧情信息。

Codec 编码解码器
编码/解码器是一个软件,通常用于把音频或视频编码成一种特定格式,也可以把用这种特定格式编码的媒体再次解码。流行的编码/解码器有:MPEG1,MPEG2,MPEG-4,Indeo等。AVI,ASF等只是一种格式而不是编码/解码器 -它们可以用不同的codec编码。

DAR

DAR表示显示长宽比,它代表着屏幕的尺寸。大多数电脑屏幕长宽比为4:3,这意味着(荧屏)水平尺寸是垂直尺寸的4/3。对于电视屏幕,传统的4:3显像方式不少,但是现在16:9的显像方式越来越多,众所周知,16:9的显像方式在同一对角线长度的情况下要比4:3的显像方式呈现出更宽的视野。16:9的荧屏更加适合用于表现好莱坞电影,这些电影(图象的长宽比)通常为1:2.35或者1:1.85(意思是图象横向尺寸是纵向尺寸的1.85倍)。

Deinterlace

把 交错 的视频流恢复为 progressive 的过程叫做deinterlacing。

Demultiplexing 反多路复用
与 多路复用 相反,在反多路复用过程中,一个合并过的音频/视频流将被分割成若干个构成它的流(一个视频流,至少一个音频流和一个导航流)。每一个VOB编码器将VOB文件在编码(快速Mpeg编码,mpeg编码到avi,dvd编码到mpg,二次Mpeg2编码)之前反多路复用,同时DVD播放器也做同样的事情(音频和视频将被在个人电脑的不同流程中被处理,或者被不同的解码器解码) 。

Descrambling
DVD通常被CSS(算法)加密过-试想你为每个字母编号,比如用1来表示a。一个句子就会变成一组数字,这就是我们所说的编码,当然了,CSS比这个要好(复杂)的多,但是它也不难破解。解密意味着逆序进行加密的过程,把我们得到的数字重新变成一个句子,或者说把我们的电影重新回放。你可以在你的DVD驱动器被授权之后试着把一部电影拷贝到你的硬盘里然后播放,你会得到一幅混乱(无法观看)的图象因为它(数据)仍旧被加密。一般的CSS解密者们会用一堆所知的解密匙(例如DeCSS或者DODSrip-它们包含着大量的密匙但自然不是全部)或者试着去用算法攻击(破解)密匙(VobDec-它为什么能对大多数光盘起作用的原因是因为它并不依赖于碟片)。

Digital Video 数字视频
数字视频一般被压缩,因为存储一部未经压缩的电影会占用很可观的字节数-上千G字节(用数字來衡量就是十的十二次方字节)。因为一般的无损压缩对于视频(存储)来说是无能为力的,所以视频编/解码器不得不去掉不重要的信息-一些人眼看不到或者不大可能看到的东东。 因为运用关键祯的现代压缩算法仍然不够,所以采用 关键帧(keyframes), I帧和P帧(I and P frames) 来节约空间。

DivX
老天,不要让Circuit City '98所介绍的现在已经过时了的 DIVX (DIgital Video eXpress 数字视频体验) 系统给弄糊涂了。现在有两种不同口味的 DivX : DivX ;) 是已被破解的微软MPEG4编码/译码器(视窗媒体视频V3)的名称。这些codec是微软为他的视窗媒体架构所开发的,它最初可以用来译码AVI以及ASF格式,但是所有非测试版本都被加上了AVI锁,从而使得不能使用他们来进行AVI编码且目前只有极少数工具支持ASF格式。DivX的创作者们所作的是去除AVI锁从而是它们可以重新用于AVI编码,将名字更换为DivX的原因是为了避免与众多codec混淆,这样在同一台电脑上同时使用破解过以及未破解过的 视窗媒体编码器(Windows Media Encoder) 就成为可能了。最新版的DivX还包括了一个已被破解了的视窗音频媒体编码/译码器,称作DivX音频。由于它的破解目前来说不甚完美,所以用它来进行高码率编码会受到限制。这个codec也被称作DivX3。

另一个DivX就是DivXNetworks所开发的崭新的MPEG-4视频编码/译码器。它提供更高级的编码控制以及二次编码。更好的是他还可以播放旧版DivX ;-)(DivX3)电影。这个codec一般被称作DivX4。

DIVX
DIVX基本上去掉了DVD的所有额外功能:附赠的东西、制作组、预告片、多语种、Circuit City跟一大堆好莱坞贪婪律师们充满屏幕的电影介绍从而可以完全控制控制电影分配到最终用户而且在家里播放电影时也可以获得控制权。DIVX是按次付费的,而且能播放DIVX的DVD播放器必须与你的电话线连接在一起,当你播放DIVX的时候播放器就会通过电话接通DIVX中央机进行登记并用你的信用卡付费。下面是看一部电影的开销 : 4.50美元用于48小时的电影观赏时段;2.50美元用于外的观赏时段。DIVX服务在一年内因为得不到授权(华纳,索尼,新干线以及所有其他小一些的制片公司直接拒绝为此格式提供授权--真是太感谢他们了!!)以及主要来自因特网上DVD站点的恶评而被终止了。稍后报纸以及电视新闻对此作出了严肃报道。

因为DIVX使用三重DES加密所以它不怕密匙攻击,非常安全。除非你可以破解它,否则无法rip这些碟片。换句话来说你的DIVX光盘永远成不了主流。

DRC

动态范围压缩(Dynamic Range Compression)。AC3音轨含有与大多数音频设备所能够处理的动态范围相比更大的动态范围,因此大多数DVD播放器以及DVD播放软件会按照实际动态范围在某种程度上压缩这些范围。用非专业术语来说就是,音量在某一时期会被增大。比如杂音不会变得比较大而只是稍微大些,然而一般的对话音量将会增加不少。因为你的播放器也会这么干,这就是增大音量的方法。

Field 场

交错的视频流 (Interlaced video streams) 包含的是场而不是帧 (frames)。

FourCC

FourCC代表四字符代码(four character code),是一种独立标示视频数据流格式的四字符代码。视频播放软件通过查询FourCC代码并且寻找与FourCC代码相关联的视频解码器来播放特定的视频流。比如: DIV3 = DivX Low-Motion, DIV4 = DivX Fast-Motion, DIVX = DivX4.

Formats used for DVD conversion DVD转换时使用的格式
VCD: Video CD,在很多DVD播放器上都可以播放,几乎每个操作系统下都有相应的播放软件。播放这种盘不需要很快的电脑,但是图像质量和VHS差不多。它的视频是1150kbit/s的MPEG1,音频是224kbit/s的MPEG1 audio layer 2。
SVCD: Super Video CD,在亚洲国家多用。视频部分使用MPEG2,达到了LD的图像质量,同时提供高质量的环绕立体声。另外它也可以借助硬件解码器的优势,很多系统上也有播放软件。但是,只有少数亚洲制造的低端DVD播放机可以播放SVCD,在欧洲和美国没有这种播放机出售,你只能在你的电脑上看。视频使用最高2600kbit/s的MPEG2,音频使用224kbit/s的MPEG1 audio layer 2。虽然也可以用MPEG2多声道音频,但它只能在Linux上编码,而且由于对这种格式的支持很少,很难说大部分的播放器能不能播放这种5.1声道的MPEG2音轨。同时这种盘可以提供菜单。
miniDVD: 可以说是在CD上存放的DVD,码率最高10mbit/s (包括视频和音频)。视频部分采用MPEG2,VBR,音频部分可以是MPEG1 audio layer 2、raw uncompressed PCM或者AC3。如果你愿意接受播放时间的限制的话,视频质量可以和DVD一样。你也可以建立DVD一样的菜单。缺点是miniDVD只能在PC上播放,在Affrey LD 2060上需要你升级播放机来得到播放miniDVD的能力。
DivX/MPEG4: 根据你选择的分辨率和码率的不同,视频质量可以从低于VHS到接近DVD。可以选择很多种音频格式。你可以制作非常像DVD的DivX CD:多语言、字幕、菜单,虽然工作量很大。另外虽然目前还没有播放机可以放DivX,但是基本所有的操作系统都可以播放,包括Mac、Linux、BeOS,当然还有Windows。不过也有很多奇怪的毛病,在慢的机器上工作正常,而在快的机器上跳祯等等。不过如果他在你的机器上工作,那么它当然是你的不二之选。
Frame 帧
电影的基本组成单位。一帧代表一幅图象。电影通常1秒钟播放24帧,所以它1秒钟有24幅不同图象。设想有24幅鸟的图象,在第一幅里鸟在图的左侧,然后它逐渐向右移动。在第24帧鸟已经在图象的最右侧了。设想这24幅图象以足够快的速度按顺序播放,那么人眼看来就好象这鸟从屏幕的左侧飞到了右侧。

I and P Frames I帧和P帧

当前 帧(Frame) 仅仅描述它与前一帧的区别(虽然描述的不甚准确但相信理解含义并非难事)。比如说我们有一幅一只小鸟飞过一片有云彩天空的图象,这是个关键帧(keyframe)。然后我们可以使用I帧来这样描述:将小鸟向左和下方各移动一英寸。

iDCT & Wavelet iDCT和小波
MPEG文件中的视频信息是存储于频域而非空间域(即我们看到的图象)中的。信息通过这种方式得到压缩从而减少了信道中传播的信息量。MPEG通过离散余弦变换DCT(Discrete Cosine Transform)把空间域的信息变换到频域的信息。从MPEG流中提取出空间域的信息时,我们需要使用反离散余弦变换(IDCT)来抵消编码时做的离散余弦变换。
 

DCT和IDCT其实就是一种离散傅立叶变换(DFT),只不过我们通过DFT得到的是复数,而DCT/IDCT变换的结果是整数。我们可以在DSP,通信系统等领域的大学课本中查到更详尽的相关信息。
小波是一种基空间。小波基可以有无穷种(比如Daubechies, Haar, Mexican Hat, "Spline", Zebra等等),但小波基的主要特性是它是局部化的。傅立叶函数跨越了整个空间(从负无穷到正无穷),而小波实际上是不同位置、不同尺度上的脉冲波。

压缩以后的数据分成了两部分。一般来说90%以上的数据通过低通滤波器,而高通滤波器会滤出数值非常小的细节数据(当然,如果信息源噪音很大的话这个自然不成立)。对于图像来说,使用这种方法的最大价值在于基的局部化,因此我们可以用小波来很好的模拟像边缘这些非连续的部分。使用小波以后就不会再出现那些奇怪的JPEG光环了。

IFO 文件

信息文件 (InFOrmation file) 通常存在与DVD中。这些文件包含了为DVD播放器导航的信息。如果想了解更多信息请关注 DVD structure article。

Interlaced 隔行扫描

Interlaced (隔行扫描)是一种视频存储模式一个交错的视频流不包含帧而是一些场,每个场包含了一帧里的一半数量的行(全部是odd或全部是even)。关于视频存储模式和隔行(interlacing)的更多信息可以参考 video basics.

Interleaving 交错
想象一下在一个特定点把音频和视频结合在一起,就是我们所说的交错。播放器会识别交错点,确保音频和视频在整部电影中按照粘合的点的规律来播放。

更详细地解释:假设我们有10秒钟的视频和10秒钟的音频片断。每一秒钟的视频用V表示 ,音频用A表示,那么如果你的交错设置为10秒,磁盘上的文件将是VVVVVVVVVVAAAAAAAAAA的形式。如果交错设置为1秒这里将是:VAVAVAVAVAVAVAVAVA。

Inverse Telecine
Telecine 的反向工程。此过程将29.97fps的片源还原为本来的24fps。

Keyframe 关键帧
一个完整的帧 (frame),但是此帧被尽可能的压缩了。

m1v/m2v

这两个术语分别被作为MPEG-1和MPEG-2视频数据的扩展(仅仅是视频,不包含任何音频)。

MPEG

MPEG意思是动态影像专家组 (Motion Picture Expert Group),通常它是视频格式的来源。这个专家组解释数字视频的标准(或规范),包括MPEG1标准(VCD)、MPEG2标准(用于DVD以及SVCD)、MPEG4标准以及若干音频标准包括MP3和AAC。使用MPEG-1或者MPEG-2标准的视频通常以.mpg或者.mpeg作为扩展名。

MPEG4
MPEG4是MPEG专家组 (MPEG Group) 所确定的一系列标准(或者规范),它将成为数字视频的下一标准(主要用于视频电话、因特网上的流媒体以及更多方面)。MPEG4允许运用多种编码方式,比如一个关键帧可以使用 ICT 或者 小波 以得到不同的输出质量。

MPG

MPG可以看作 MPEG 的缩写,也可以作为MPEG-1以及MPEG-2视频数据的扩展名。

MM4

Multiple MPEG 4: 不同比特率编码文件的组合.比如你能把2000kbit/s和910kbit/s编码的文件组合起来,采用比特率较低的文件,取代文件中由于和2000kbit/s的部分作用太多而导致严重失真的画面.这里也可以是两种DIVX编码的组合:你可以把低MOTION和高MOTION的文件合并起来(这里也可以使用不同的比特率)。

Multipass encoding 多通路编码

在你阅读之前:目前真正的多通路编码只存在WM8和MPEG-2(SCVD和miniDVD)中。M4C并不是真正的多通路编码(阅读M4C指南去寻找它究竟是什么和如何工作的)。一个支持多通路的编码将在第一个通路中分析将要被编码的视频流并把它遇到的任何东西都记录下来。假设我们有一个以对话场景开始的小片断,这其中有很少的剪切而且摄像机保持静止。然后它变成一场空手道打斗,这其中有大量的快速剪切和动作(人们在天空中飞行、踢、拳打等等)。在正常的CBR编码中每秒会获得大约相同的比特率(很难说保持100%的CBR但那是枝节了)但是在多通路VBR模式中编码将根据视频流的信息来使用相应的比特率,这就是说对话部分获得足够的比特率而打斗部分获得更高的比特率。通路越多比特率的分配就越细致。在单通路VBR中编码必须只根据它前面所编码东西的知识来决定使用多少的比特率。

Multiplexing 复用
通常视频和音频是分别编码的。然后你必须将他们合起来这样才能变成可以播放的电影(你当然能在两个播放器中分别播放音频和视频,但是同步将会变得相当困难)。在复用中音频和视频轨道合成为一个音频/视频流。音频和视频流似乎交织在一起,并在其中加入导航信息,使播放器能在快进/速退的采样中保持AV同步。

Normalizing 标准化

标准化包括找到一个音轨的容量峰值,然后增加音轨其余部分至同样等级。这通常在WAV等级完成,那就是说所有的变量都是整数因此不如DRC精确。所以在标准化中DRC更受喜爱。

OGM

OGM表示OGg媒体,是Tobias Waldvogel为Ogg container所做的增补,OGM可以看作是另一种 AVI container,它可以含有Ogg Vorbis、MP3、AC3音频、各种各样的视频格式、段落信息以及字幕。

PGC

PGC表示ProGram Chain。它是一个在DVD编写中经常使用的术语,基本上是一个同时回放东西。举例说电影主要部分有它自己的PGC,DVD上的每一个预告片通常有自己的PGC。当你播放碟片时出现的工作室标志有自己的PGC等等。SmartRipper的电影模式和DVD Decrypter的IFO模式将向你展示一张DVD上所有的PFC。要想进一步获得关于PGC的信息参阅 MPUCoder's DVD information site 网站。

Progressive 逐行扫描

与隔行扫描 (interlaced) 相对。一个只包括全帧 (frames) 的视频流被认为是逐行扫描的.逐行/隔行扫描的知识详见 video basics 。

Quantizer 量化因子

要想真正理解这个术语你必须学习信号处理的课程。在一般人的术语中它表示压缩因子。这个值越大一幅图象就压缩的越多(因此高量化因子意味着低图象质量和占空间小而低量化因子意味着高的图象质量和占用空间大)。
rff/tff 标记

RFF表示repeat first frame(重复第一帧),这是一项用来把源头以每秒24帧记录的电影转化称为需要的每秒29.97帧的技术。采用rff标记编码的电影-标记告诉播放器重复一场。Tff表示首先是顶上的场而且被用来实现telecine从而将24fps的电影制作为29.97fps的。你可以在 Robshot关于同步的文章 中得到更多关于胶片转换为视频方面的信息。

Ripping
关于这方面有很多的混乱。基本上ripping表示把DVD电影拷贝到你的硬盘上。这包括DVD驱动器的认证 (authentication) 过程(试图从DVD上拷贝下一个文件时,你将会看到一条消息:如果你的驱动器还没有被认证那么该操作是不受支持的)和真正的CSS解码 (Descrambling) 过程。CSS(Contentated Scrambling System数据干扰系统)是一种设计用来防止未授权地拷贝DVD电影的防拷贝方案,虽然许多人争论说它也是设计用来控制哪里的DVD电影可以播放,因为没有CSS许可要想播放DVD电影你实质上必须将其加密crack掉-我非常同意这一点。ripping这个词也经常用于(甚至在本站点)描述解码DVD的整个过程,然后把音频和视频转化称为另一种-更少的-格式。

SBC

Smart Bitrate Control智能比特率控制。一种新的称为Nandub的DivX编码器能在压缩过程中动态修改很多内部参数,给你更好的质量和更多的编码控制。更多信息可以参见 DivX指南部分中的SBC指南。

Streamlist 流目录
流目录是一个包括路径名和你的VOB文件名的ASCII测试文件,一行一个文件。这里有一个小例子:
e:/video_ts/vts_01_1.vob
e:/video_ts/vts_01_2.vob
e:/video_ts/vts_01_3.vob
e:/video_ts/vts_01_4.vob
e:/video_ts/vts_01_5.vob

把该文件保存为streamlist.txt或者streamlist.lst。确保你存成为未格式化的ASCII文本,我建议你用记事本来编辑你的流目录,因为记事本不会存成为另一种格式。MPeg2avi要求流目录的扩展名是lst,然而在其他程序使用流目录的时候你可以自由选择任意的扩展名。但是GUI在选择输入文件名/扩展名是有所限制,所以如果流目录没有在文件选择对话框中出现的话,那么你必须重命名你的流目录。

Telecine
把24fps的片源转换成29.97fps或29.97x2交错场/秒。这篇文章 具体解释了这是如何工作的。

VBR

变码率。将音频和视频均以VBR模式编码是可能的,在整个文件中码率将不会固定不变(就像在CBR中固定不变一样),视频/音频中较复杂的部分将会使用更高的码率以获得更佳的视/听觉感受,而其它部分则获得较少的码率。

VKI

可变关键帧间隔。其基本意思即在需要关键帧的地方不再象通常的DivX编码解码器那样按照固定的间隔插入。有两种实现VKI的方法:第一种方法是编码器解开压缩的帧,将其与原始的比较,如果品质差别高于一个设定的极限值就重新编码。这种编码方法只适用于一种特定程序:M4C。有一种基于命令行的版本和一种可供AviUtl使用的插件(后者在AviUtl向导中有详细介绍)。如果有把极限值设定的过高那么你最后将得到许多关键帧还有第二种方法,其主要是在场景变换的时候插入关键帧。为了达到这个目的编码程序或者编码解码器会侦测到哪个位置有一个所谓的“cut”(就象电影制作者所使用的)存在并且使新场景的第一帧成为关键帧。这可以通过使用mpeg2aviAr(AviRevolution的一部分),m4c或者通过安装DivX VKI编码解码器来实现。如果你使用后者就不用担心编码器。每个可以进行DivX编码的程序都可以使文件在场景变换处有关键帧。当VKI被合理地使用时(只适用于第一种方法),可以帮助你增减关键帧数量,从而再次得到更高品质,这是因为尤其在低比特率时,太多的关键帧将会带来更糟糕的品质。
 

VM2

VKI + MM4 + VBR MP3的缩写

VOB ID

VOB ID用来将DVD中一个PGC内的Cell归为一组。

VOB Files
所有的DVD影片都存储在vob文件中。vob文件通常包含混在一起的杜比数码音频和MPEG2格式的视频。vob文件按以下形式命名:vts_XX_y.vob,这里的XX代表标题Y代表这一标题的某一部分。总共可以有99个标题和10个部分,虽然 vts_XX_0.vob 从来不包括任何视频,通常只是菜单或者导航信息。有两种方法来找出哪个文件包含着电影的主体:

方法一:用DVD播放器播放电影,然后观察单机的指示灯或者软件播放器的状态窗口;
方法二:电影的主体是数字连续的VOB文件中数字最大的那个。比如有vts_05_1.vob;
vts_05_2.vob……vts_05_8.vob(我从来没有看到过包含9部分文件的电影,但那并不意味着不存在)。

VTS

VTS是视频标题集的简称,也就是说是一连串VOB文件和相应的IFO和BUP文件的合集。举例来说,VTS2将会包含VTS_02_0.VOB(包含菜单)、VTS_02_1.VOB、VTS_02_2. VOB等等,以及VTS_02_0.IFO和VTS_02_0.BUP等文件。VTS用来将视频材料以及其附属文件归为一组。举例来说,一个VTS通常来说用于主影片(而有时还会包括预告片和某些影片公司的logo),别的VTS用于花絮。

Windows Media
Microsoft版权所有的个人电脑音频和视频体系.它是基于一系列的编码,这些编码被WindowsMedia Player用来播放任何其所支持的格式文件.最新版本的WindowsMedia Player是7.0版.WindowsMedia 7.0提供了一系列的新的编码,其中包括一个完全兼容ISO的MPEG4编码(名为Windows Video V1),一个名为MS Video V7的改进了的MPEG-4编码(尽管我并没有发现它和DivX基于的MS Windows Video V3相比有任何的改进),这种编码支持Deinterlacing和Inverse Telecine.

XCD

eXtended CD是一种即将到来的(能否译作下一代?感觉不太合适)CD格式,这种格式允许用mode2的第二种形式来刻录你的CD,这基本上就意味着它含有较少的校验码,从而你可以在单张CD上存储更多的数据。XCD允许你在一张普通的700MB CD里存储800MB的数据。正如我所说得那样,由于只有较少的校验码,XCD不是非常可靠所以建议你只把container中具有附加校验的数据(比如说OGM)放到这种CD中。如需了解更多请查阅XCD指南。

XviD

XviD是个文字游戏。把它倒过来读,你就会看到一个熟悉的词。XviD是一种开放源码的MPEG-4编码解码器,通过它你能得到比最好的DivX编码解码器更佳的效果。
  

你可能感兴趣的:(音视频技术)