多媒体技术基本概念(★★)
多媒体相关计算问题(★★★)
媒体的种类(显示媒体)(★)
常见多媒体标准数据压缩技术(★★)
多媒体中的媒体有两种含义,一是指存储信息的实体,二是指表达与传递信息的载体。
需要把模拟信号转换为数字信号后才可以把声音信息放入计算机。声音需要经过采样,量化和编码之后才能存入计算机。为了避免失真,采样频率应该定位40KHZ。采样频率应该为声音频率的两倍。
人的耳朵能听到的声音带宽为20-20KHZ,乐器发声的范围是和人耳保持一致的。 说话的频率是在300-3400HZ。 低于这个频率就是次声波,高于这个频率的就是超声波。其中B超就是超声波。
1.MIDI
记录了七个音符的一个序列,所以存储容量更小,当然不能记录人的声音,只能记录音乐曲谱信息。
2.累进编码方式
刚开始显示图像较为模糊,随着下载的时间变得越来越清晰的技术。
WAV格式音乐信息记录的是音乐的波形信息,所以它比较大。
人眼看到的任一彩色光都是亮度,色调和饱和度三个特征的综合效果,其中色调反映了颜色的种类。
位图与矢量图相比,位图占用的存储空间比矢量图来得大,处理侧重于获取和复制,显示速度快。
计算机多媒体技术的基本特征,即数字化、集成性、交互性及围绕计算机而构成并受计算机的控制。
计算机及多媒体技术都是建立在数字化的基础之上的。
直接作用于人的感觉器官,使人产生直接感觉的媒体
声音,图像,图形,动画
为了加工,处理和传输感觉媒体而人为研究,构造出来的一种媒体 各种编码方式,如文本编码,图像编码,声音编码
表现和获取信息的物理设备。
输入显示媒体:键盘鼠标麦克风
输出显示媒体:显示器,打印机,音箱
存储数据的物理设备 磁盘,光盘和内存等
微型计算机系统中,显示器处于表现媒体,硬盘属于存储媒体。
传输数据的物理载体 电缆,光缆和交换设备等
数据压缩技术包含空间冗余,时间冗余,视觉冗余,信息殇冗余,结构冗余,知识冗余。
在大面积都是同种颜色的时候,不用每个像素都记录的情况,来节约空间成本
视频直播中PPT不切换而直播人脸却一直在变化。
某图像在缩小时无法正常显示,只有放大后才会发现不清晰。
通过对不同的信息编码
拍照的时候,很多bit位格子内容是一样的,这样只要记录一个bit的内容就可以了。
常规性的东西把它砍掉,不记录从而来节省空间。
数据压缩技术可以分为两大类:无损压缩法和有损压缩法。
Lossless Compression coding
去掉或者减少数据的冗余,它通常使用的是统计编码技术,包括哈夫曼编码
也称为冗余压缩法或熵编码法
常见的熵编码有:香农(Shannon) 编码、哈夫曼(Huffman) 编码和算术编码(Arithmeticcoding)。在视频编码中,熵编码把一系列用来表示视频序列的元素符号转变为一个用来传输或是存储的压缩码流。
还有行程编码也是无损的编码。
Loss compression coding 它压缩了熵,会减少信息量,不可逆,能达到较高的压缩比。也称为熵压缩法
运动补偿,变换编码都是有损的编码。有损就是压缩后就无法还原了。
所以有损是不可逆的编码方式。
心理声学研究认为:人耳能否听见声音取决于声音的频率、幅度是否高于这种频率的听觉阈值,低频区的频率分辨率髙于高频区。
MPEG音频编码方法使用了心理声学模型。
PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。
在PCM脉冲编码调制的基础上引入了 “自适应”的思想。“自适应”是指根据输入信号幅度大小自动地改变量化阶的大小。 LPC是根据过去已有的几个采样值的模型的线性组合来推断现在的采样值,进而用实际采样值与预测采样值之差(预测误差)及线性预测系数进行编码。
有损&无损,压缩比更高,小波变换,医学图像应用
离散余弦,VCD,MP3,动态图像专家组:制定和发布视频音频和数据的压缩标准
MPEG-1 视频中的帧间编码主要采用了基于运动补偿的帧间预测编码,帧内编码主要采用了变换编码。
MPEG-1标准中,视频图像的帧序列包括帧内图像(I帧)、预测图像(P帧)和插补图像(B帧,或称双向预测图像)3种。帧内图像不参照任何过去的或者将来的其他图像帧,压缩编码直接采用类JPEG的压缩算法,故其可以直接作为索引和访问点;预测图像使用基于运动补偿的单向帧间预测编码;而插补图像则使用双向帧间预测编码。
Huffman,DVD,有线/卫星电视,AAC
MPEG-4 网络应用,无线通信,增强交互性,数码权限管理,多媒体传输集成框架
多媒体内容描述接口,具备描述功能,不是编码标准
MPEG-7标准被称为"多媒体内容描述接口",为各类多媒体信息提供一种标准化的描述,这种描述将与内容本身有关,允许快速和有效地查询用户感兴趣的资料
融合不同协议,制定新标准,标准集成
;MPEG-21是ISO/IEC制定为一个标准,致力于定义多媒体应用的一个开放框架。
基于DCT和可变长编码的算法。离散余弦,有损压缩
数字音视频编解码技术标准工作组(简称AVS工作组)由国家信息产业部科学技术司于2002年6月批准成立。
它是我国的数字音视频压缩编码国家标准。
针对在ISDN上实现电信会议应用。
主要针对低宽带而设计的,可提供比H261更好的图像效果。
是国际电信联盟(ITU)制定的视频信号和音频信号的压缩编码标准。
H.264是视频压缩编码技术的标准。
是由Web3D联盟专为Internet应用设计的三维图形标记语言,是VRML标准的升级版本
H.320标准面向窄带综合业务数字网(N-ISDN),是窄带可视电话系统的通信标准;
H.323是面向无QoS保障的包交换网络上的多媒体通信标准;
H.324是低速率网络(如PSTN)上多媒体通信及终端的标准。
真彩色是指图像中的每个像素值都分成R、G、B三个基色分量,每个基色分量直接决定其基色的强度,这样产生的色彩称为真彩色。
图像的每个像素值实际上是一个索引值或代码,该代码值作为色彩查找表CLUT (Color Look-Up Table)中某一项的入口地址,根据该地址可查找出包含实际R、G、B的强度值。这种用查找映射的方法产生的色彩称为伪彩色。
将每个像素值分为红、绿、蓝分量,每个分量作为单独的索引值进行变换。
矢量图使用直线和曲线来描述图形,这些图形的元素是一些点、线、矩形、多边形、圆和弧线等等,它们都是通过数学公式计算获得的。
颜色是由亮度和色度共同表示的,色度是不包括亮度在内的颜色的性质,它反映的是颜色的色调和饱和度。
在进行数据的采样与压缩时,由于人眼睛能识别的颜色的种类,远小于颜色固有的种类。所以会从这个维度出发,将人类看不出差异的颜色使用同样的颜色保存,这能有限的减少编码数据量。
将彩色视频信号数字化时,利用图像子采样技术通过降低色度信号的采样频率,以减少数据量。