计算机应用基础—多媒体技术(一)_萧风的博客-CSDN博客
二、图像与图形及应用
(一)图像
(一 ) 定义:从现实世界中 通过数字化设备(扫描仪)获取的图
(二 ) 又名:取样图像、 点阵图像、位图图像
(三 ) 图像数字化过程:
1. 扫描 :将画面划分为 M x N 个网格,每个网格称为一个取样点 。
2. 分色 :将彩色图像取样点的颜色分解成三个基色
3. 取样 :测量每个取样点每个分量(基色)的亮度值
4. 量化:对取样点每个分量的亮度值进行 A / D 转换
(四 ) 数字图像获取设备:
1. 例如:扫描仪、数码相机等
2. 基本原理:通过光敏器件(CMOS 或 CCD )将光的强弱转换为电流的强弱,然后通过取样、 量化等步骤,进而得到数字图像
3. 可以通过参数设置,得到彩色图像或黑白图像
(五 ) 图像的主要参数:
1. 图像大小(图像分辨率)
(1) 垂直分辨率:矩阵的行数 水平分辨率:矩阵的列数
(2) 像素总数=垂直分辨率 X 水平分辨率
A. 像素:每个取样点
B. 像素是组成取样图像的基本单位
(3) 若图像超过了屏幕(或窗口)大小,则只能显示图像的一部分,使用滚动条可看到全部 图像。
2. 颜色空间的类型(颜色模型):
(1) 定义:指彩色图像所使用的颜色描述方法
(2) 常用的颜色模型: RGB 、 CMYK 、 HSB 、 YUV 等 (颜色模型可以相互转换)
3. 像素深度:
(1) 黑白 或灰度图像用 1 个 矩阵表示 , 彩色图像用多个(一般为 3 个)矩阵表示.
(2) 定义:像素的所有颜色分量的二进位数之和
(3) 意义:决定了不同颜色(亮度)的最大数目
(4) 若 R 4b、G 4b 、 B 4b ,则最大颜色数目为 4096
(六 ) 图像数据量 = 图像水平分辨率×图像垂直分辨率×像素深度/ 8
(七 ) 数字图像应用:可视电话、卫星遥感、计算机断层摄影( CT )
(八 ) 图像压缩
1. 可行性:图像中数据相关性很强,人眼的视觉有一定的局限性
2. 方法:
(1) 图像压缩方法很多,不同方法适用于不同的应用,一台计算机能使用多种压缩方法。
(2) 优劣评价标准: 适用范围、 压缩倍数的大小、重建图像的质量 (有损压缩时)、 压缩算 法的复杂程度
(九 ) 常用图像文件格式
1. BMP:Windows 使用的标准图像格式,几乎所有 Windows 应用软件都支持
2. TIF:大量用于 扫描仪和桌面出版
3. GIF :压缩比(无损压缩)可调,文件特别小——颜色数较少(不超过 256 色),常用于色彩 数要求不高的场合作为插图、剪贴画等使用,支持透明背景,具有 渐进显示 功能,形成 动画 效果 ,适合网络传输
4. JPEG :适用范围最广(国际标准)、 可支持 有损 压缩 、 主要应用领域之一是数码相机。
5. JP2 :特别采用了小波分析等先进算法 , 比 JPEG 好 , 更适合网上传输
(十 ) 图像处理
1. 目的: 图像分析、提高图像的视感质量、图像复原和重建
2. 通用图像处理软件的基本功能:图像的缩放显示、调整图像的亮度与对比度等、在图片上制 作文字等,并与图像融为一体
3. 数字图像处理软件: PhotoShop 、 Microsoft Photo Editor 、 PhotoImapact
(二)图形
(一 ) 定义:使用计算机合成制作的图
(二 ) 又名:矢量图形
(三 ) 过程:使用计算机描述真实(假象)景物的结构、形状与外貌,在需要显示图像的时候,再根据 其描述和用户的观察位置及光线的设定,生成该景物的图像。
(四 ) 计算机图形学 CG :研究如何使用计算机描述景物并生成其图像的原理、方法与技术
(五 ) 过程模型 / 算法模型:根据景物的生成规律,并使用相应的算法来描述其规律所建立的模型(如描 述树木、花草、烟火、毛发、山脉等)
(六 ) 使用计算机合成图像的主要优点:
1. 能生成实际存在的具体景物的图像和假想或抽象景物的图像
2. 能生成静止图像和各种运动、变化的动态图像
3. 图形文件中只记录生成图的算法和图上的某些特征点,数据量较小
(七 ) 计算机合成图像的应用:
1. 计算机辅助设计、 设计绘制电路图(最直接的应用)
2. 设计制作石油开采地形图
3. 制作天气图等
4. 计算机动画
(八 ) 矢量绘图软件: AutoCAD 、 CorelDraw 、 Illustrator 、 FreeHand 、 Microsoft Visio
三、波形声音的获取与播放
(一 ) 声音信号的数字化:
1. 定义:将模拟声音信号转换成二进制数字编码形式以便于计算机进行处理的过程
2. 过程:
(1) 取样
A. 声音是一种波,它由许多不同频率的谐波组成,谐波的频率范围称为声音的带宽。
(a) 全频带声音:20Hz~20KHz
(b) 言语/语音:人说话的声音,约为 300~3400Hz
B. 语音 的取样频率 8KHz 、音乐的取样频率 40KHz 以上
(2) 量化
A. 本质:AD 转换
B. 量化精度越高,声音的保真度越好,噪音越低
(3) 编码
A. 经过取样和量化后的声音,还必须按照一定的要求进行编码
B. 目的:减少数据量,并按某种格式将数据进行组织
C. IP 电话语音信号需要进行数据压缩
3. 波形声音获取设备:
(1) 麦克风 :将声波转换为电信号
(2) 声卡
A. 功能:波形声音的获取与 数字化 、声音的 重建 与播放、 MIDI (乐器指令数字化接口) 声音的 输入 、 MIDI 声音的 合成 与播放
B. 声卡以数字信号处理器 DSP 为核心 ,它在完成数字声音的编码、解码及声音编辑操 作中起着重要的作用。
C. 声卡能通过话筒输入、线路输入,获取单、双声道声音
D. 随着大规模集成电路技术的发展,不少 PC 机的声卡已经与主板芯片组集成在一起, 不再需要做成独立的插卡。
(3) 数码录音笔
(二 ) 声音重建:
1. 过程:解码、 数模转换 、插值
2. 播放过程中必须借助于安装在声卡上的 数字信号处理器 DSP 转换为波形信号
3. 音箱一般通过 声音卡 与主机相连接
(三 ) 波形声音的码率 = 取样频率 × 量化位数 × 声道数
1. CD 唱片的码率=44.1 kHz × 16 bits × 2 = 176.4 KB/s
2. CD 唱片 1 小时的数据量= 176.4KB/s × 60 × 60 = 635040KB = 635MB
(四 ) 全频带声音的压缩编码
1. MP3 音乐= MPEG-1 audio 层 3
2. 通过专门的软件可以将 WAV 文件转换成 MP3 格式
3. 在移动通信和 IP 电话中,由于信道的带宽较窄,需要采用更有效的语音压缩编码方法。
(五 ) 计算机合成声音
1. 语音合成:
(1) 定义:根据语言学和自然语言理解的知识,使计算机模仿人的发声,自动生成语音的过 程。
(2) 目前水平~ 文语转换 TTS :按照文本(书面语言)进行语音合成的过程
(3) 应用:电话信息查询、语音秘书、残疾人服务( 有声 E-mail 服务、有声文稿校对) 等
2. 音乐合成:
(1) 声卡上的音源:调频合成器、波表合成器
(2) MIDI 文件(*.mid)
A. 定义:使用 MIDI 规范表示的音乐 ( MIDI 文件中记录的是乐谱)
B. 播放:由 PC 机中的声卡合成, 由 Windows 的媒体播放器软件播放 ( 音乐质量受声 卡档次影响 )
C. 优点:文件的 数据量很少 (比 CD 少 3 个数量级,比 MP3 少两个数量级)
D. 缺点:可表示的音乐不够丰富、 无法合成出所有各种不同的声音 (例如语音)