个人总结,仅供参考,欢迎加好友一起讨论
多媒体技术是指通过计算机对文字、数据、图形、图像、动画、声音等多种媒体信息进行综合处理和管理,使用户可以通过多种感官与计算机进行实时信息交互的技术,又称为计算机多媒体技术。
声音的三个要素是音强,音调和音色。
声音信号是一种模拟信号,在计算机中必须转换成数字信号,即二进制编码来表示。
声音信号的数字化转化过程:
采样
采样频率需大于声音信号最高频率的两倍
量化
量化的二进制位数越多,量化精度越高,声音重构质量越好
编码
多种编码方式进行数据压缩、减少数据量
例题1:
例题1解析与答案:
答案:D
解析:采样频率需大于声音信号最高频率的两倍
声音的数据传输率:
数据传输率(bps) = 采样频率(Hz) × 量化位数(bit) × 声道数
bps= bit/s
单位Hz,注意KHz
声音信号数据量:
声音信号数据量(Byte) = 数据传输率(bps) × 持续时间(s) / 8
除以8是8bit = 1Byte
典型例题:对话音信号数字化采样,采样频率为8KHz,量化精度为8位,单声道输出,则每秒钟与每小时的数据量为?
解:8KHz * 8 * 1 = 64000b = 8000B = 7.8125KB,换算成小时用3600秒 * 7.8125KB = 28800KB
常见音频格式 | |
---|---|
Wave | 波形文件,质量高、数据量大 |
Sound | 支持压缩 |
Audio | UNIX系统 |
Voice | 有文件头块与文件数据块 |
AIFF | 苹果公司音频格式 |
MPEG-1 Audio Layer | 流行、压缩率大 |
RealAudio | 解决带宽不足的产品 |
MIDI | 非波形、文件长度小 |
MP3 | 典型音频文件 |
图像是用像素点来描述的图。
图像 - 颜色分类:
同一色调,饱和度越高,颜色越浓
图像 - 色彩模型:
图像 - 分辨率:
屏幕能够显示的像素越多,显示设备的分辨率越高,图像质量越高
显示屏上显示出的像素数目,显示分辨率
例如:显示器分辨率1024 × 768,将显示屏分为768行,每行显示1024个像素
组成一组图像的像素密度,图像分辨率
例如:用200dpi来扫描一副2 × 2.5英寸的照片,可以得到一幅400 × 500个像素点的图像。
其中,dpi代表每英寸长度内的像素点数
图像 - 像素深度:
像素深度指存储每个像素所用的二进制位数,也用来度量图像色彩分辨率,决定了彩色图像可出现的最多颜色数。
例如:一幅彩色图像的每个像素用R、G、B三个分量表示,若3个分量的像素位数分别为4、4、2,则最大颜色数目为24 × 24 × 22 = 210 = 1024个
图像 - 数据量:
图像的分辨率越高,图像深度越深,数字化后的图像效果越逼真,图像数据量越大。
图像的总像素 = 图像水平方向像素 × 垂直方向像素
图像数据量 = 图像的总像素 × 图像深度 / 8,单位是Byte
例如:一幅640 × 480的256色图像,256也就是2的8次方,所以文件大小:640 × 480 × 8 / 8 = 300B
图像 - 真彩色:
真彩色是指图像中的每个像素值都分成R、G、B三个基色分量,每个基色分量直接决定其基色的强度,这样产生的色彩称为真彩色。
真彩色可以反映原图像的真实色彩。
将彩色视频信号数字化时,利用图像子采样技术通过降低色度信号的采样频率,减少数据量。
图像 - 伪彩色:
伪彩色图像的每个像素值实际上是一个索引值或代码,该代码值作为色彩查找表CLUT(Color Look-Up Table)中某一项的入口地址,根据该地址可查找出包含实际R、G、B的强度值。
图像 - 位图与矢量图:
常见图像格式 | |
---|---|
BMP | Win系统,可选图像深度 |
GIF | 动图,最多支持256色 |
TIFF | 能把任何图像编码成二进制而不丢失属性 |
PCX | 不支持真色彩 |
PNG | GIF替代 |
JPEG | 有损压缩,可选压缩比例 |
WMF | 需函数调用 |
例题2:
例题2解析与答案:
答案:C
解析:略
例题3:
例题3解析与答案:
答案:B
解析:略
例题4:
例题4解析与答案:
答案:D
解析:略
常见视频格式 | |
---|---|
Flic | 数据压缩率高 |
AVI | 视频音频交错同步播放 |
Quick Time | 跨平台,存储空间小 |
MPEG | 标准算法压缩,格式统一,兼容性好 |
Real Video | 流媒体,可低速率传输 |
视频容量 = 每帧图像容量(Byte) × 每秒帧数 × 时间 + 音频容量 × 时间
感觉媒体,直接作用于人的感觉器官,使人产生直接感觉的媒体
声音、图形、图像、动画
表示媒体,为了加工、处理和传输感觉媒体而人为研究、构造出来的一种媒体
各种编码方式,如文本编码、图像编码和声音编码
显示媒体(表现媒体),表现和获取信息的物理设备
输入显示媒体:键盘鼠标麦克风;输出显示媒体:显示器,打印机,音箱
存储媒体,存储数据的物理设备
磁盘、光盘和内存等
传输媒体,传输数据的物理载体
电缆,光缆和交换设备等
数据压缩技术包含空间冗余,时间冗余,视觉冗余,信息殇冗余,结构冗余,知识冗余。
数据压缩技术可以分为两大类:无损压缩法(冗余压缩法或熵编码法)和有损压缩法(熵压缩法)。
哈夫曼编码是无损编码,还有行程编码也是无损的。 运动补偿,变换编码都是有损的编码。有损就是压缩后就无法还原了。所以有损是不可逆的编码方式。
根据信息论的基本原理,数据压缩的理论极限是信息嫡。如果要求编码过程中不丢失信息量,即要求保存信息嫡,这种信息保持编码叫嫡编码,属于无失真编码,它是根据消息出现概率的分布特性而进行的编码技术。
商编码方法主要包含哈夫曼编码、香农-范诺编码以及算术编码等。
例题5:
例题5解析与答案:
答案:C
解析:略
哈夫曼编码属于熵编码,是建立在信源的统计特性之上的无损压缩编码技术
哈夫曼编码按照信源符号出现的频度或概率排序后递归地自底向上建立编码树,即可得到变长信息编码。
另外:词典编码也属于无损压缩编码,其基本思想是利用数据本身包含有重复代码这个特性。
例题6:
例题6解析与答案:
答案:B
解析:略
MPEG - 1视频中的帧间编码主要采用了运动补偿的帧间预测编码,帧内编码主要采用了变换编码。针对音、视频编码技术。
有3种不同类型的视频帧:
DVD的标准,针对音、视频编码技术。
针对音、视频编码技术,是一个数据率很低的多媒体通信标准,可以应用在移动通信和公共电话交换网上,可支持可视电话,可视邮件,电子报纸和其他低速率传输场合下应用。
最适合在公用电话交换网PSTN上实时传输视频数据。
多媒体内容描述接口,采用XML作为内容描述可选语言,包括音视频和3D模型描述标准,及MPEG-7参考软件。
开放的多媒体应用框架标准,是ISO/IEC指定的一个标准,定义多媒体应用的一个开发框架。
标准面向窄带综合业务数字网(N-ISDN),是窄带可视电话系统的通信标准。
面向无QoS保障的包交换网络上的多媒体通信标准。
低速率网络(如PSTN)上多媒体通信及终端的标准。
视频压缩编码技术的标准。