多媒体技术是计算机处理多种媒体信息的综合性技术。
Delphi具有多媒体信息处理能力,包括在组件上绘制各种图形、图像的显示和处理,以及音频和视频文件的播放等多媒体设计。
本章主要内容
& 多媒体技术
& 图形设计
& 图像处理
& 视频播放组件
在多媒体技术中,媒体(medium)是指信息的表现形式或载体,包括文本、图形、图像、声音、动画和视频等。
多媒体(Multimedia)是多种媒体信息的有机组合。
多媒体技术是计算机处理多种媒体信息的综合性技术,通过计算机对各种不同类型的媒体信息进行数字化采集、获取、压缩/解压缩、编辑、存储等加工处理,使多种媒体信息建立逻辑连接,形成一个可组织、存储、传送、操纵和控制多媒体信息的集成环境和交互系统。
多媒体技术具有多样性、集成性、交互性和数字化特性。
计算机能处理的多媒体信息从时效上可分为以下两大类:
· 静态媒体,包括文本、图形、图像。
· 动态媒体,包括声音、动画、视频。
(1)文本。
文本(text)是计算机中基本的信息表示方式,包含字母、数字以及各种专用符号。
(2)图形。
在计算机中,图形与图像是一对既有联系又有区别的概念。它们都是一幅图,但图的产生、处理、存储方式不同。
图形(graphics)是指通过绘图软件绘制的由直线、圆、圆弧、任意曲线等图元组成的画面,称为矢量图形。每个图元具有大小、位置、形状、颜色、维数等属性,不同的图元之间有明确的界限,多个图元可以组合或分解。
矢量图形由特定的绘图软件绘制,以矢量图形文件形式存储。矢量图形文件中存储的是一组描述各个图元属性的指令集合,通过相应的绘图软件读取这些指令,可将其转换为输出设备上显示的图形。矢量图形的最大优点是对图形中的各个图元进行缩放、移动、旋转而不失真,而且它占用的存储空间小。
计算机辅助设计(CAD)系统中常用矢量图形来描述复杂的机械零件、房屋结构等。
(3)图像。
图像(image或picture)是由扫描仪、数字照相机、摄像机等输入设备捕捉的真实场景画面产生的映像,经A/D转换变成二进制代码,并以专门的图像格式文件存储。输出时,以数字方式控制显示设备实现原来景物的重现。
(4)动画。
动画(animation)是利用人眼的视觉暂留特性得到的,当一系列图形或图像的画面按一定时间间隙在人的视线中经过时,人脑就会产生物体运行的印象。
(5)音频。
音频(audio)包括语音、音乐以及各种动物和自然界(如风、雨、雷等)发出的各种声音。音乐和解说词可使文字和画面更加生动。在计算机中的音频处理技术,主要包括声音的采集、数字化、压缩/解压缩、播放等。
(6)视频。
视频(video)图像来自录像带、摄像机、影碟机等视频信号源,是对自然景物的捕捉,数字化后以视频格式文件存储。视频的处理技术有视频信号导入、数字化、压缩/解压缩、视频和音频编辑、特效处理、输出到磁盘、光盘等,音视频的同步使视频影像具有真实的效果。
在计算机系统中,所有多媒体信息都是按数字化格式存储、处理和传输的,不同类型的多媒体信息存储成不同格式的文件。
文本文件通常存储成.txt、.rtf、.doc等格式。
由于图像、视频、音频信号的数据量非常大,给多媒体信息的存储、处理和传输造成极大的困难。因此,减少存储量就成为多媒体技术中的一个关键问题,最有效的解决方法是数据压缩编码。
本节先介绍用于数据压缩的两个国际标准,再介绍图形图像、音视频信息的文件格式。
20世纪80年代,国际标准化组织(ISO)和国际电信联盟(ITU)联合成立了两个专家组:联合图像专家组(Joint Photographic Experts Group,JPEG)和运动图像专家组(Moving Picture Experts Group,MPEG),分别制定了静态和动态图像压缩的工业标准。
(1)JPEG标准。
JPEG标准适用于连续色调和多级灰度的静态图像。一般对单色和彩色图像的压缩比通常分别为10∶1和15∶1。常用于CD-ROM、彩色图像传真和图文管理。
(2)MPEG标准。
MPEG标准不仅适用于运动图像,也适用于音频信息,它包含了三部分:MPEG视频、MPEG音频、MPEG系统(视频和音频的同步),MPEG视频是MPEG标准的核心。MPEG已指定了MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21等多种标准。
(1)BMP(.bmp)文件格式。
BMP(bitmap位图)格式存储构成图像的每个像素点的亮度和颜色等属性,BMP格式是Windows使用的基本位图格式。
显示器上的每一个光点就是一个像素。在数字化彩色显示器中,一个像素由一个二进制控制。若用一位二进制控制,“1”表示发光,“0”表示不发光,则只能是黑白显示;若用4位控制,可显示16种颜色;若用8位控制,可显示256种颜色。目前普遍使用的真彩色图像,由红、绿、蓝三基色通过不同的强度混合而成,当强度分为256级(值为0~255)时,占24位,就构成了224=16777216种颜色的“真彩色”图像。
BMP格式不进行压缩,放大和缩小时会失真。图像的分辨率和像素的颜色深度决定了图像文件的大小,计算公式如下:
位图文件容量(字节数)=列数×行数×颜色深度÷8
图像的分辨率和像素的颜色深度决定位图图像文件的容量示例见表10-1。
表10-1 位图文件容量
分 辨 率 |
颜色深度(位) |
颜 色 |
位图文件容量(KB) |
640×480 |
1 |
单色,黑白 |
38 |
640×480 |
4 |
16色 |
150 |
640×480 |
8 |
256色 |
300 |
640×480 |
24 |
真彩色 |
900 |
800×600 |
24 |
真彩色 |
1,406 |
1024×768 |
24 |
真彩色 |
2,304 |
由此可见,对于24位真彩色图像,一幅640×480像素的图像文件需要900KB,而一幅1024×768像素的图像文件则需要2.3MB,占用存储空间较大,即使是空白图像也需要这么大的容量,必须采用编码技术来压缩信息。
(2)JPEG(.jpg)文件格式。
JPEG格式是根据JPEG标准压缩的图像格式,具有良好的压缩性能,能够存储256色以上的真彩图像。JPEG格式文件是目前保存照片等图像的常用格式。
(3)WMF(.wmf)文件格式。
WMF是比较特殊的图元文件,属于矢量图形。Windows中许多剪贴画图像是以该格式存储的,广泛应用于桌面出版印刷领域。
(4)GIF(.gif)文件格式。
GIF(Graphics Interchange Format,图形交换格式)是针对Internet应用而设计的图像格式,GIF格式的压缩比高,磁盘空间占用较少,但不能存储超过256色的图像。
GIF格式既可以存储单幅静止图像,也可以同时存储若干幅静止图像进而形成连续的动画。GIF格式具有渐显方式,即在图像传输过程中,先显示图像的大致轮廓,再逐步显示图像的各细节部分,“从朦胧到清楚”。
(1)WAV(.wav)文件格式。
WAV是Microsoft公司采用的波形声音文件存储格式,主要由外部音频(麦克风、录音机)录制后,经声卡转换成数字化信息以扩展名.wav存储,播放时还原成模拟信号由扬声器输出。WAV文件直接记录了真实声音的二进制采样数据,通常文件较大,多用于存储简短的声音片段。
记录每秒钟存储声音容量的公式为:
存储量(字节/秒)=采样频率×量化精度×声道数÷8
例如,用44.1kHz的采样频率,每个采样点用16位的精度存储,则录制1秒钟的立体声(双声道)节目,其WAV格式文件所需的存储量为:
44100×16×2÷8=176400(byte)
(2)MIDI(.mid)文件格式。
MIDI是乐器数字化接口(Musical Instrument Digital Interface)的缩写,是为了把电子乐器与计算机相连而制定的一个规范,是数字音乐的国际标准。
与WAV文件不同的是,MIDI(扩展名为.mid)文件存放的不是采样信息,而是将乐器弹奏的每个音符记录为一连串的数字,然后由声卡上的合成器根据这些数字代表的含义进行合成后由扬声器播放声音。相对于保存真实采样数据的WAV文件,MIDI文件显得更加紧凑,其文件尺寸通常比声音文件小得多。
(3)MPEG(.mp1/.mp2/.mp3)文件格式。
MPEG指的是采用MPEG音频压缩标准进行压缩的文件。MPEG音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为3层(MPEG-1 Audio Player 1/2/3),分别对应MP1、MP2、MP3三种音频文件,压缩比分别为4∶1、6∶1~8∶1、10∶1~12∶1。MP3因其压缩比较高、音质接近CD、制作简单、便于交换等优点,是目前使用最多的音频格式文件。WAV和MIDI格式文件均可以压缩成MPEG格式文件。
(4)RA(.ra)文件格式。
RA(Real Audio)是Real Network公司制定的音频压缩规范,有较高的压缩比,采用流媒体的方式在网上实时播放。
视频文件是由一系列的静态图像按一定的顺序排列组成,每一幅称为帧(frame)。电影、电视通过快速播放每帧画面,再加上人眼视觉效应便产生了连续运动的效果。当帧速率达到12帧/秒(12fps)以上时,可以产生连续的视频显示效果。通常视频图像还配有同步的声音,所以,视频信息需要巨大的存储容量。
视频有两类:模拟视频和数字视频。数字视频文件可以分为两大类:一类是影像文件,如VCD等,影像文件不仅包含大量图像信息,同时还容纳大量音频信息;另一类是流式视频文件,这是随着Internet的发展而诞生的后起之秀,如在线实况转播,就是构架在流式视频技术之上的。以下介绍影像视频文件格式。
(1)AVI(.avi)文件格式。
AVI(Audio-Video Interleaved,音频-视频交错)文件格式将视频与音频信息交错地保存在一个文件中,较好地解决了音频与视频的同步问题,是Video for Windows视频应用程序使用的格式,目前已成为Windows视频标准格式文件。该文件数据量较大,要压缩。AVI格式文件用于保存电影、电视等各种影像信息。
(2)MOV(.mov)文件格式。
MOV文件格式是Apple公司在QuickTime for Windows视频应用程序中使用的视频文件。原在Macintosh系统中运行,现已移植到Windows平台。利用它可以合成视频、音频、动画、静止图像等多种素材。该文件数据量较大,要压缩。
(3)MPG/MPEG(.mpg/.mpeg)文件格式。
MPEG文件是按照MPEG标准压缩的全屏视频的标准文件。MPEG文件需要由特殊的硬件设备产生,而产生后的影片文件,就可以在装有MPEG解压缩功能的计算机上欣赏。新一代显卡已经有MPEG解压缩的能力,可直接观看这类影片,否则需要安装影片播放卡,才能解压缩MPEG文件。
(4)DAT(.dat)文件格式。
DAT(Digital Audio Tape,数字音频磁带)是VCD(Video CD)专用的格式文件,文件结构与MPEG文件格式基本相同。