第3章 数据存储

3.1 数据的类型

    现实世界中的数据有不同的形式:数字、文本、音频、图像、视频。

    计算机的存储硬件都有两种状态,开或关,可以对应数学中的二进制,即0或1,所以计算机用二进制来存储数据。

3.2 存储数字

    计算机存储器被划分为许多位数一定的存储单元,一个存储单元能表示一定范围的数字,先将数字转化为二进制,再以一定的方法存储在内存中,这些方法有 表示整数的无符号表示法、符号加绝对值、二进制补码 和 表示实数的浮点表示法。

3.3 存储文本

    文本是语言符号的集合,符号的表示可以转化为与符号一一对应的代码的表示,这种符号与代码之间的映射成为编码,常用的编码有ASCII(美国信息交换标准代码)、Unicode等

3.4 存储音频

    音频的本质是音波,是音频值关于时间的函数,是随时间变化的实体,这表示音频可以被无限等分,我们只能以尽量精确的密度来记录音频。

    第一步,采样,对相同时间段的一段音频,采样点的多少决定了音频(采样率)的采集质量。

    第二步,编码,采样后,将每个采样点的数据转化为位模式称为编码,音频值的精度(分配多少位表示值)叫做每样本位或位深度,每秒的采样数与每样本位的数量的乘积称为位率R。

    当前音频编码的主流标准是MP3(MPEG Layer 3的缩写),它采用每秒44100个样本以及每样本16位,可以计算得到位率为705600b/s。

3.5 存储图像

    在计算机中有两种图像存储技术:光栅图和矢量图。

 3.5.1 光栅图

    光栅图是像素点的集合,整个图像被分成小的像素,每个像素有单独的密度值。

    对同一图像,划分成多少个小像素会影响光栅图的清晰度,即解析度。

    用于表示每个像素的位的数量,即色彩深度,位数与颜色种类的多少成正比。通过红黄蓝(RGB)三原色的组合,可以显示出其他颜色。用24位来编码一个像素(RGB每个占8位)称为真彩色,可以计算得到真彩色能表示2的24次方种颜色。因为真彩色模式的颜色范围超出了许多程序的需要,所以使用索引色,即对常用色(通常使用256个常用色)与索引之间进行再编码,使其一一对应,可以节省编码时间。

    常用的图像编码标准有JPEG(联合图像专家组)使用真彩色模式,但压缩图像来减少位的数量, 还有GIF(图像交换格式)使用索引色模式。

 3.5.2 矢量图

    矢量图是将图像分解成几何图像的组合,通过描述这些几何图形(比如线段有端点坐标、圆有圆心半径等)来保存和绘制图像。

3.6 存储视频

    视频是图像(称为帧)在时间上的表示。连续图像的组合就是一部电影。

    常用的视频压缩技术有MPEG。

你可能感兴趣的:(计算机科学导论)