计算机科学概论各章总结,读《计算机科学概论》-1. 数据存储-总结

(加粗的为原话)

摘要:

我们首先要学习的是在计算机科学中信息如何编码和存储。第一步,我们要讨论计算机数据存储设备的基础知识,然后进一步研究如何进行信息编码并存储到系统内部。我们还将探讨现如今数据存储系统的各个分支,以及如何用数据压缩、纠错等技术来克服其不足。

接下来将从上面提到的几个方面进行论述。

基础

电位可分为高低电平,能够用来表征0和1两个数值。不同的高低电平的输入在经过不用的门结构,如与门,非门,亦或门,或是有上述几个门结合组成的触发器等,能够得到相应的输出。而触发器正是现代计算机中存储二进制位的一种方法。计算机主存储器是以存储单元组织起来的,一个存储单位的典型值为8位。不同的组存储单元都具有属于它们的地址。通过这些地址能够访问这些存储单位中的内容。

数据存储

计算机的主存储器RAM,在断电的情况下,各个电路中由于没有电位信号,因此刚断电发生时,RAM中的内容会发生清空,计算机启动后与运行过程中,其内的电平信号会发生变化。而ROM由于事先已经将程序的内容定了下来,当计算机启动通电后,所存储的内容不随计算机具体的运行而改变。(自己的理解)

数据的存储除了RAM,ROM还有海量存储器,如磁盘,CD,DVD,磁带,闪存等。

磁盘

磁盘里面是薄的、可以旋转的盘片,表面有磁介质的图层用以存储数据。数据在磁盘中的存储方式是以同心圆的方式进行存储的。磁头在磁盘表面走一圈的轨迹称为道,道可以被划分为若干个小弧区称为扇区。磁盘上所有的扇区包含相同数目的二进制位(一般在512个字节到几KB之间)。在最简单的磁盘存储系统里,每个道具有相同的扇区。因此,盘片边缘扇区上存储的位密度要小于靠近盘片中心道上存储的位。在大容量磁盘系统中,可以分为几个区,在每个区中每个道具有相同数目的扇区。道和扇区的位置不是磁盘物理结构的固定部分,它们是通过称为磁盘格式化的过程磁化形成的。

CD

CD上的信息是存储在一条道上,它呈螺旋形由内向外缠绕在CD上。螺旋形道上靠外边缘的环道存放的信息比内部的环道多,因此,如果盘片旋转一整圈,激光束在扫描螺旋形道外边时读到的扇区个数比里边多,为了获取同意的数据传输速率,CD驱动器必须适应数据传输速率的变化。

闪存

闪存系统里,用电子信号将二进制位直接送到存储介质中,电子信号使得二氧化硅的微小晶格截获电子,从而转换微电子电路的性质。

/**********************************************/

question: 使用字处理程序修改文档时,有时添加一段文本都不会很明显地增加海量存储器中文件的大小,而有时一个符号的增加就会使文件增加几百个字节。为什么?

answer: 存储空间是以物理扇区为单元分配的(事实上,在大多数情况下是以扇区组为单元)。如果最后一个物理扇区没有被写满,可以再添加新的文本,而不需要增加此文档的存储空间。如果最后一个物理扇区已经被写满,那么无论要给该文档添加什么内容,都需要分配额外的物理扇区。

/**********************************************/

声音

声音是一种连续信号,在计算机中存储时,是通过一定频率进行采样,而后进行存储。

数据压缩

行程长度编码的压缩技术:将一组相同的数据成分替换成一个代码,指出重复的成分以及其在序列中出现的次数。例如,指出一个为模式中包括253个1,接着是118个0,接着是87个1。

频率相关编码:这个系统中,用于表示数据项目的位模式长度与这个项目使用频率是相反的。如英文中,字母e,t,a,i使用的频率大于z,q,x。因此,可以使用短位模式表示前面的字母,长位模式表示后面的字母,就能够节省空间。

LZW编码:如 xyx xyx xyx xyx可以解析为121343434

GIF:提供一个像素颜色只有256种的调色板,将图像中的每个像素的颜色都用256种颜色中的一种表示,将3个字节表示成一种颜色转化成了一个字节表示一种颜色,这是一种有损的方式。

JPEG基线标准的图像压缩:利用人眼的局限性,相对于颜色的变化,人眼对亮度的变化更加敏感。对于色度和光照编码的图像,将色度在2*2的像素方格中去均值,色度信息减少,而保留亮度信息。后续还有复杂的处理。

MP3:将人耳觉察不到的细节删除,1.暂时模糊,巨大声响后,短时间内,人耳觉察不到本可以听见的轻柔的声音。2. 频率模糊,某一频率的声音能够掩盖相近频率的轻柔的声音。

纠错

奇偶效验位。

posted on 2012-07-08 22:10 钟谢伟 阅读(1181) 评论(0)  编辑 收藏 引用

你可能感兴趣的:(计算机科学概论各章总结)