作为半路出家的程序员,直接用的是高级语言,对于底层的知之甚少,寻找到了技术大神曾经铺好的道路。就是这本《计算机导论》,揭开了计算机神秘的面纱。这一章节的包含了 位和位存储、主存储器、海量存储器、用位模式表示信息、二进制系统、整数存储、小数的存储、数据压缩、通信差错,让我们了解到计算机是如何存储数据及表示数据的。
1.1 位和位存储
计算机的信息大多数是以0和1进行编码,这些数字称为位(bit)。在不同应用中可以表示数字,字母,标点符号,图像,音乐和视频等等
1.1.1 布尔运算
布尔运算:为了纪念数学家乔治·布尔把真/假值运算命名布尔运算。
基本的布尔运算:AND(与),OR(或),XOR(异或),NOT(非)。
AND:只有两边的值都为真时才为真,否则为假。
OR:只要其中一边的值为真就为真,否则为假。
XOR:只有两边的值不同时为真,否则为假。
NOT:取其相反值。
NOR(或非):只有两边都为假时才为真,否则为假。
NAND(与非)
:只有两边都为真时才为假,否则为真。
0代表假值,1代表真值。
1.1.2 门和触发器
门:是一种设备,可以通过布尔输入值,得到布尔输出值。
门的技术实现:齿轮,继电器和光学设备。
触发器:产生1或0输出值得电路,其值基本保持不变,除非其他电路的脉冲使其改变成另一个值
1.1.3 十六进制计数法
流:一个长的位串称为流。
十六进制计数法:它是利用计算机位模式的长度为4倍制定的,这种方式可以使12位串仅需3个符号表示。
1.2 主存储器
主存储器: 计算机包含大量的电路(如触发器),每个电路能够存储单独的一个位。这种位存储器称为计算机的主存储器。
1.2.1 存储器结构
存储单元(cell):主存储器的单位,一个存储单元容量是8位,一个8位的串称为一个字节(byte)。
高位端:存储单元的左端称为高位端。
低位端:存储单元的右端称为低位端。
最高有效位(高位):高位端的最左一位称作最高有效位。
最低有效位(低位):低位端的最右一位称作最低有效位。
地址:每个存储单元都赋予了唯一的”名字“,称作地址。
随机存取器:为了反应任何顺序存取存储单元的能力,计算机的主存储器常称为随机存取器(RAM)。
动态存储器:通过存储快速消散的微小电子的技术的计算机存储器称为动态存储器(DRAM)。
SDRAM:同步动态RAM。
1.2.2 存储器容量的度量
1千字节=1KB=1024存储单元=1024字节=1024B
1兆=1MB=1024千字节=1024KB
1吉=1GB=1024兆=1024MB
1.3 海量存储器
海量存储器包含: 磁盘、CD盘、DVD盘、磁带、闪存驱动器。
海量存储器特点: 稳定、容量大、价格低。
联机:设备或信息已经与计算机连接,不需要人的干预就可以使用。
脱机:必须先有人的干预,设备和信息才可被计算机使用。
海量存储器缺点:数据存取需要花费更长时间。
1.3.1 磁学系统
磁学包含:磁盘,磁带。
道:在盘片上面或者下面的滑道。
柱面:新的一组道。
扇区:每个道划分成若干个小弧区。
区位记录:在大容量磁盘存储器系统里,边缘道包含的扇区要远多于靠近中心的道,这种存储能力常通过一种称作区位记录(zoned-bit recording,ZBR)。
格式化:道和扇区的位置不是磁盘物理结构的固定部分,它们是通过称为磁盘格式化或者初始化的过程磁化形成的。
磁盘:仅由一张塑料盘片组成的低容量系统,也称为软盘。
硬盘系统:由多个刚硬的盘片,并安装在同一个轴上。
硬盘系统的性能评估:
1)寻道时间:读/写磁头从一个道移到另一个道所需要的时间
2)旋转延迟或者等待时间:盘片旋转一周所需要时间的一半,也就是读/写磁头到达所要求道候,等待盘片旋转使读/写磁头位于所要存取的数据(扇区)上所需要的时间
3)存取时间:即寻道时间和等待时间之和
4)传输速率:从磁盘上读出或写入数据的速率
磁带:信息存储在一条细薄的塑料带的磁涂层上,而塑料带则绕在磁带卷轴上作为存储器.
磁带的缺点:不同位置之间移动非常耗时.
1.3.2 光学系统
光盘:直径为12cm(大约5英寸),由涂着光洁保护层的反射材料制成.
数字音频光盘:CD技术最初用于音频录制.
1.3.3 闪存驱动器
闪存系统:用电子信号将二进制位直接送到存储介质中.
闪存驱动器:闪存设备称为闪存驱动器.
1.3.4 文件存储及检索
文件:海量存储系统中的信息一般被分组为较大的单元.
典型的文件:可能有文本、照片、程序、音乐录音或者一组有关公司员工的数据组成。
物理记录:符合存储设备特性的数据块称为物理记录。
逻辑记录:文件通常有自然划分,这是由它所表示的信息决定.例如一个有关文本的文件包含段落或页。这些自然产生的数据块称为逻辑记录。
字段:逻辑记录通常由称为字段的较小的单元组成。例如:一个包含员工信息的逻辑记录大致由姓名、地址、员工标识号等这样的字段组成。
键字段:文件的每一个逻辑记录是由一个特定的字段唯一标识出来的,这样的标识字段称为键字段,键字段中的值称为键。
缓冲区:通常用于一个设备向另一个设备传输的过程中临时存储数据的区域。
1.4 用为模式表示信息
1.4.1 文本的表示
美国信息交换标准码(ANSI):这种代码使用长度为7的位模式来表示大小写英文字母、标点符号、数字0~9以及某些控制字符,如换行、回车与制表符等。
ASCII码:扩展为8位位模式,方法就是在每个7位位模式的最高端添加一个0.,这种技术不仅使所产生的代码的位模式与字节型存储单元相匹配,而且还提供了
附加的128个位模式(通过给附加的位赋予数值1),可以表示原来ASCII码所不包括的符号.
Unicode:它是由硬件及软件的多家主导厂商共同研制开发的.这种代码采用唯一的16位模式来表示每一个符号.Unicode由65536个不同的位模式组成.
ISO:国际标准化组织开发的一种代码标准,使用了32位模式.
文本文件:一个文件由一长串根据ASCII或者Unicode编码的符号组成.
文本编辑器:常称为简单编辑器的实用程序操作简单文本文件
字处理程序:操作教复杂的文件.
1.4.2 数值的表示
二进制记数法:一种数值表示方法,只使用数字0和1,被广泛应用于计算机存储器中数值数据的编码。
二进制补码记数法:系统通常用于存储整数,因为它提供了一种便利地表示负数和正数的方法。
浮点记数法:为了表示
这样带有分数部分的数,使用浮点记数法的方法表示
1.4.3 图像的表示
像素:图像表示为一组点,每一个点称为一个像素。
位图:每个像素的显示被编码,整个图像就表示成这些已编码像素的集合,这个集合被称为位图。
位图缺陷:图像不能轻易调节到任意大小。
1.4.4 声音的表示
最常用的方法是按有规律的时间间隔采样声波的振幅并记录所得到的数值序列,这种技术采用每秒8000次的采样频率。
为了满足音乐录制的高保真。采用每秒44100次的采样频率。
乐器数字化接口(MIDI):一种编码系统,应用于电子键盘的音乐合成器。
1.5 二进制系统
1.5.1 二进制记数法
1.5.2 二进制加法
1.5.3 二进制中的小数
1.6 整数存储
1.6.1 二进制补码发记数法
符号位:最左边的位常称为符号位,符号1的模式表示负值,符号位0的模式表示非负值.
二进制补码系统中,绝对值相同的正负数值之间的模式很接近,从右向左时,知道第一个二进制1,它们是相同的.然后,以这个1为分界线,左面的位模式互为补码.
补码:通过转换所有的二进制0为1,和转换所有的二进制1为0而得到的模式.
1.二进制补码计数法中的加法
2.溢出问题
溢出:计算得出的数值超出了可以表示的数值范围.
1.6.2 余码记数法
图1-24表示的系统称为余8记数法.
1.7 小数的存储
1.7.1 浮点记数法
1.7.2 截断误差
图1-27 的这个现象称为阶段误差或舍入误差
1.8 数据压缩
数据压缩:为了存储和传输数据,在保留原有内容的条件下,缩小所涉及数据的大小是有益的,这一过程的技术称为数据压缩.
1.8.1 通用的数据压缩技术
无损:压缩过程中是不丢失信息的.
有损:压缩过程中会发生信息丢失.
通常有损技术比无损技术提供更大的压缩,在可以忽略小错误的数据压缩中应用广泛,如图像和音频压缩中.
行程长度编码:对于被压缩数据由一长串相同的数据组成的情况,普遍使用称为行程长度编码的压缩技术,这是一种无损方法.
频率相关编码:又称赫夫曼代码
相对编码:也称为差分编码,这技术记录下了连续数据单元之间的区别,而不是整个单元.
字典编码:指的是一组构造块,压缩的信息通过它们建造起来,而信息本身编码成一系列字典的参照符.
自适应字典编码:在这种系统中,编码过程中字典是可以改变的.流行的例子是LZW编码
1.8.2 图像压缩
GIF:一种字典编码系统,将赋予一个像素颜色的数量减少到只有256个.每个颜色都由 红-绿-蓝 组合都用3个字节编码.这256个编码存储在一个称为调色板的表格里.
每个像素都可以用一个字节表示
JPEG:它是由ISO中的联合图像专家组研制开发的标准.JPEG包含集中图像压缩的方法.JPEG极限标准的选择模式(JPEG的有损顺序模式)
TIFF:起初是用于存储图片的一种标准格式.为传真应用中压缩文本文档的图像设计的.
1.8.3 音频和视频压缩
MPEG:音频及视频的编码和压缩最常用的标准是由ISO领导的运动图像专家组研制开发的.
MP3:压缩音频的系统 MPEG layer3的缩写
暂时模糊:指的是在一个巨大声响后,短时间内,人耳觉察不到本可以听见的轻柔的声音.
频率模糊:指的是某一个频率的声音可能掩盖相近频率的轻柔的声音.
1.9 通信差错
1.9.1 奇偶校验位
奇偶校验位: 如果被操作的每个位模式有奇数个1,而找到了有偶数个1的模式,那么一定是出错了.使用这个原则,只要在系统已经可用的模式上添加以为,这个位称为就校验位.
上面描述的奇偶校验系统称为奇校验.
偶校验:每个模式设计成包含偶数个1,因此,如果出现了奇数个1,那么就表明有错误.
校验字节:例如磁盘扇区存储的位串,这种情况下,模式都有一组校验位.
1.9.2 纠错编码
汉明距离: 两个模式之间的汉明距离指的是这两个模式中不相同位的个数.