数据库在磁盘上的存储

1. 磁盘上的数据存储

首先弄清楚磁盘的几个概念
数据库在磁盘上的存储_第1张图片
磁盘面:磁盘一般会由多个磁盘片组成,一般都控制在5片以内,每个磁盘片包含两个面。磁盘片从下向上从0开始,比如最下边的磁盘块是0面和1面,依次往上走。
磁头:通过磁性原理读取磁盘数据的部件,每个磁盘面都对应有个读/写磁头。

数据库在磁盘上的存储_第2张图片
扇区和磁道:磁盘的物理读写是以扇区为基本单位,磁盘面从圆心向外有数万个同心圆环被称为磁道,每圈磁道又被等分为若干个弧段,这些弧段称之为扇区,每条磁道有数千个扇区,每个扇区的容量通常是512~4096字节。
柱面:每个盘面的磁头位于相同的扇区,磁头在给定时间访问到所有盘面上的所有扇区的集合成为柱面。
寻道:把读写磁头移动到磁盘上适当的磁道上的过程为寻道,这个过程所需的时间成为寻道时间。
块/簇:磁盘块/簇,是操作系统中最小的逻辑存储单位,是操作系统和磁盘打交道的最小单位。
   扇区是磁盘中的物理概念,而块/簇则是操作系统中的逻辑概念,由于扇区的容量小数目太多,在寻址时比较困难,所以操作系统将相邻的扇区组合在一起形成一个块,再对块进行整体操作。

为了访问数据,操作系统必须对磁盘进行三步操作:
   寻道——将磁头移动到适当的磁道上,这段时间成为寻道时间;
   旋转——一旦磁头到达正确磁道,就必须等待要访问的扇区转动到读写头下面,这段时间成为旋转延时;
   传输——传输一块数据块,这段时间成为数据传输时间。

2. 操作系统对数据的组织形式


   数据在磁盘上是以文件的形式进行存储,而这些文件并不总是能顺序地存储在磁盘上。操作系统把数据组织成一个个的文件存储在磁盘上,在读取数据时是按照磁盘块进行访问数据,通过FCB——目录或文件夹,找到起始磁盘块,再通过FAT——文件分配表,找到剩余的一系列磁盘块,就这样来还原一个文件的信息。
数据库在磁盘上的存储_第3张图片              数据库在磁盘上的存储_第4张图片
FAT:文件分配表,记录着文件和磁盘块之间的对应关系。每一个存储的磁盘块都对应文件分配表中的一个表项,表项中存储着具体的数据(如24),表示该磁盘块读完后的下一个磁盘块位置,通过FAT表我们可以找到该文件对应的一系列磁盘块。
FCB:目录或文件夹,文件的第一个磁盘块不是保存在文件分配表里的,而是保存在目录或文件夹中,里面有该文件名和对应起始磁盘块的位置。

3. 内存

数据库在磁盘上的存储_第5张图片
操作系统与硬盘进行通信的基本单位是块,那同样,操作系统与内存也要进行通信,基本单位就是 “page”,即所谓的页,和 “块” 一样,也是一种逻辑概念。
内存是如何进行管理的?一块内存可以分为很多个内存页或内存块,一个数据必须先从磁盘块加载到内存中,然后才能被cpu处理。在使用内存时,操作系统会进行内存申请和分配。当程序需要的数据不在内存里,操作系统会进行内存页和磁盘块数据的交换。

4. DBMS数据存储与查询


数据库表记录和磁盘块之间的关系是怎样的呢?
数据库是一系列table的集合,每个table由一行一行的记录构成,每条记录又由多个属性构成。table的每一条记录,实际上对应磁盘上的一系列01串。表当中的数据存储在磁盘上后,我们要查找这些记录,就得知道具体的磁盘块位置,还要给出盘面、磁道(柱面)、扇区等一些基本的信息。为了找到这个磁盘块,就需要有一个映射,该映射就叫做索引。不同的数据库、不同的数据表可以建立多个索引,索引块中存放着指向实际数据块的指针,用来查找表记录对应的磁盘块,再根据具体索引找到对应的表记录。

你可能感兴趣的:(数据库在磁盘上的存储)