机械硬盘主要由磁盘盘片、磁头、主轴与传动轴等组成,数据存放在具有磁性物质的磁盘盘片中。
实际运行时,主轴马达让碟片转动,然后磁头臂让磁头在碟片上面进行读写操作。
读取数据时以磁头转圈的方式进行,在磁片同心圆中切出一个一个的小区块,这些小区块就是磁盘的最小物理存储单位,成为扇区(sector),同一个同心圆的扇区组合成的圆就是磁道(track)。由于磁盘里可能会有多个碟片,因此在所有碟片上面的同一个磁道可以组成 柱面(cylinder)。
外圈的圆比较大,为了合理利用这些空间,磁盘外圈圆会比内圈有更多的扇区。所以,当碟片转一圈时,外圈的扇区数量比较多,因此如果数据写入在外圈,转一圈能够读写的数据量比内圈多。因此数据的读写会由外圈开始向内写,这是默认的方式。
原本硬盘的扇区都是设计成512B的大小,但随着硬盘容量的增大,为了减少数据量的拆解,目前绝大多数的高容量硬盘使用了4K大小的扇区设计。
主要的分区格式有早期的MBR格式和新的GPT格式。
MBR分区格式中柱面是文件系统的最小单位,也就是分区的最小单位。
第一个扇区(旧式磁盘中为512字节)中存放着启动引导程序和分区表:
分区表64字节最多仅能有四组记录区,每个记录区16字节。
如图中有4个主分区。
总结:
扩展分区的目的是使用额外的扇区来记录分区的信息,扩展分区本身并不能被拿来格式化。
扩展分区可以继续划分出逻辑分区(logical partition)。
/dev/sda[1-4] 都是留给主分区或扩展分区用的,所以逻辑分区的设备文件名就从 sda5 开始。
图中分区在Linux下的文件名是:
P1:/dev/sda1
P2:/dev/sda2
L1:/dev/sda5
L2:/dev/sda6
L3:/dev/sda7
L4:/dev/sda8
L5:/dev/sda9
总结:
偏移 | 长度(字节) | 意义 |
---|---|---|
00H | 1 | 分区状态:00–>非活动分区;80–>活动分区;其它数值没有意义 |
01H | 1 | 分区起始磁头号(HEAD),用到全部8位 |
02H | 2 | 分区起始扇区号(SECTOR),占据02H的位0-5;该分区的起始磁柱号(CYLINDER),占据02H的位6-7和03H的全部8位 |
04H | 1 | 文件系统标志位 |
05H | 1 | 分区结束磁头号(HEAD),用到全部8位 |
06H | 2 | 分区结束扇区号(SECTOR),占据06H的位0-5;该分区的结束磁柱号(CYLINDER),占据06H的位6-7和07H的全部8位 |
08H | 4 | 分区起始相对扇区号 |
0CH | 4 | 分区总的扇区数 |
分区表组最后4个字节表示分区中的扇区数量,有4*8=32位,最大值为 20+21+ … +231 = 232-1 个扇区,每个扇区大小为512字节,所以能表示的最大容量为 :
( 2 32 − 1 ) ∗ 512 = 2199023255040 b y t e s = 2048 G B = 2 T B (2^{32}-1) * 512= 2199023255040 \, bytes = 2048 \, GB = 2 \, TB (232−1)∗512=2199023255040bytes=2048GB=2TB注意这里是用1:1024换算的,硬盘制造商使用1:1000换算,所以就会得出2.2TB的结果。
2TB是对单一分区容量的限制,如果第一个分区就占了2TB,那么其第二个分区的扇区物理地址就无法表示了,所以2TB也是对整个硬盘最大容量的限制。
详细说明见Wiki页面:https://zh.wikipedia.org/wiki/Master_boot_record
MBR的弊端:
如今扇区大小不仅有512字节的,还有4K大小的。为了兼容所有的磁盘,使用逻辑区块地址(Logical Block Address,LBA)来处理扇区。GPT将硬盘所有区块以LBA(默认512字节)来规划,第一个LBA称为LBA0。
与MBR仅使用第一个512字节来记录不同,GPT使用了34个LBA来记录分区信息。相比于MBR中只有一个区块记录分区信息,GPT除了前面34个LBA记录以外,整个磁盘的最后34个LBA也拿来做备份。
LBA0(MBR兼容模块)
出于兼容性考虑存储了一份传统MBR,用来防止不支持GPT的硬盘管理工具错误识别并破坏硬盘中的数据,这个MBR也叫做保护MBR。
分为两个部分,第一个是前面446字节,用来存储第一阶段的启动引导程序。而在原本的分区表的记录区内,这个兼容模式仅放入了一个特殊字符来表示此磁盘为GPT格式之意。
在使用 MBR/GPT 混合分区表的硬盘中,这部分存储了GPT分区表的一部分分区(通常是前四个分区),可以使不支持从GPT启动的操作系统从这个MBR启动,启动后只能操作MBR分区表中的分区。
LBA1(GPT表头记录)
记录了分区表本身的位置和大小,也记录了备份用的GPT分区(最后34个LBA区块)放置的位置。同时放置了分区表的校验码(CRC32),操作系统可以根据这个校验码来判断GPT是否正确。若有错误可以通过这个记录区来获取备份的GPT(磁盘最后面的备份区块)来恢复正常。
LBA[2-33](实际记录分区信息处)
从LBA2区块开始,每个LBA都可以记录4组分区记录,所以在默认情况下,总共有4*32=128组分区记录。每组记录用到128字节的空间。
起始字节 | 长度 | 内容 |
---|---|---|
0 | 16字节 | 分区类型GUID |
16 | 16字节 | 分区GUID |
32 | 8字节 | 起始LBA(小端序) |
40 | 8字节 | 末尾LBA |
48 | 8字节 | 属性标签(如:60表示“只读”) |
56 | 72字节 | 分区名(可以包括36个UTF-16(小端序)字符) |
(16+16+8+8+8+72=128)
GPT 在每组记录中分别提供了 8字节 = 64位 来记载开始/结束的扇区号码。因此,理论上对于单一分区槽来说, 它的最大容量限制为 264 * 512bytes = 263 Kbytes = 233TB = 8 ZB 。但是受操作系统限制,一般一个分区最大限制为 18EB。
GPT 分区没有所谓的主、扩展、逻辑分区的概念,每个都可以视为是主分区,每一个分区都可以格式化。
GPT 分区默认可以提供多达128 组纪录,而在Linux 本身的内核设备记录中,针对单一磁盘来说,虽然过去最多只能到达15 个分区,不过由于Linux 内核通过udev 等方式的处理,现在Linux 也已经没有这个限制了。
参考链接:1.https://en.wikipedia.org/wiki/GUID_Partition_Table
2.https://docs.microsoft.com/en-us/troubleshoot/windows-server/backup-and-storage/guid-partitioning-table-disk-faq