Linux GPT分区表16进制实例分析
GPT分区表随着win10的普及,已经在越来越多的新电脑上开始使用了。前段时间的新闻有看到说Intel会在后面的新平台中完全取消CSM支持,这也大概相当于后面新出的Intel平台的主板将只有纯UEFI模式引导,Legacy模式没有了,也就是说必须要使用GPT分区了。
对于普通用户来说,GPT的好处最明显的地方就是支持系统分区大于 2TB,但这似乎并没有什么用(因为MBR并不支持单个分区大于2TB)。另外一个就是,GPT分区必须要用UEFI,而M$从win8开始搞了个SecureBoot,也能从一定程度上增加那么一丢丢安全性吧。然而在服务器领域就不一样了,服务器的SAN存储很容易就能聚合出一个大于 2T的盘,甚至10多T一个LUN都是很常见的事情,尽管Linux下面有LVM可以绕过分区,但是作为未来的主流分区技术,GPT也将会变得很重要,还是有必要来从底层研究一下。
这篇文章我们使用的实验环境是这样的,VMWare虚拟机安装RHEL6.8,除开系统的虚拟硬盘VMDK之外,额外添加两块虚拟硬盘,一块5GB为/dev/sdb,另一块6GB为/dev/sdc。通过解析这两块虚拟硬盘的分区表头的信息,结合GPT的官方手册,用例子来分析GPT分区表到底是怎么构成的。需要说明的是,这篇文章我们的实验只对这两块虚拟硬盘作建立GPT分区表的操作,为避免干扰,先不建立分区。
关于GPT分区表的结构,最权威的是UEFI论坛的Specifications的PDF文档,这个文档可以在http://www.uefi.org/specifications 这里下载到,最新的是UEFI Specification Version 2.7 (Errata A) 这个版本。另外,这篇文章还参考了维基百科Wikipedia的英文版的GUID分区表的页面:https://en.wikipedia.org/wiki/GUID_Partition_Table 。
-----------------------------------------------------------------------------
我们使用Linux自带的hexdump工具来从16进制的层面分析GPT分区表。
从上面的图中可以看到,我们的两块硬盘/dev/sdb和/dev/sdc分别为5GB和6GB,此时是刚添加了一块新的虚拟硬盘的状态,所以没有分区表,也没有分区,我们使用hexdump来读取这两块硬盘,可以看到里面的数据全都是0,这也符合是一块全新的硬盘的状态。
先来解释一下hexdump的这个输出结果。每一行表示16Byte(字节)的数据,所以第一列的值就显示的是当前行是第多少个字节,它是以16进制显示的。中间那个星号(*)表示它代替的行的数据跟上一行是一样的(这将使得输出结果更易读)。那么红框中140000000和180000000的意思就很明显了,通过将16进制转换成10进制,140000000(Hex) = 5368709120(Dec),180000000(Hex) = 6442450944(Dec),5368709120/1024/1024/1024=5,6442450944/1024/1024/1024=6,结果刚好就是5GB和6GB,这也印证了上面说的第一列的数字表示的是当前行是第多少个字节。140000000和180000000是最后一行,也就是硬盘能存储数据的最后的位置,也就表示硬盘的大小了。
-----------------------------------------------------------------------------
然后我们用parted工具,将这sdb和sdc建立一个gpt分区表。
parted /dev/sdb mklabel gpt & parted /dev/sdc mklabel gpt
分完区之后,再次使用hexdump读取硬盘,就有了上面截图的内容,可以发现,多了不少内容。
先来看GPT硬盘整个的硬盘结构示意图,这个图是来自UEFI Specifications文档,LBA0是Protective MBR,然后就是GPT分区表头,再接着就是每个分区的描述,这三部分构成了主GPT分区表。从First useable block到Last useable block是给每个分区用于存储数据的。最后还有一个备份的GPT分区表,是由每个分区的描述和分区表头构成。
根据UEFI Specifications文档,GPT分区表头是有两部分的,第一部分一般位于LBA1,另外还有一份alternate GPT,可以理解为备份的GPT表头,它位于硬盘的最后一个LBA。至于LBA是怎么计算的,这里就不展开讲,一般来说,硬盘每个LBA是512Byte字节,所以LBA0就是从0x00000000 到 0x00000200-1,而LBA1就是从0x00000200开始,用进制转换一下,200(Hex) = 512(Dec),就是512字节。
LBA0的Protective MBR部分这里就不讲了,有兴趣的可以去看官方文档,这篇文章只关心GPT分区表的结构。
GPT的分区表头,是从LBA1开始的,长度一般为92字节,结合UEFI Specifications和Wikipedia维基百科,根据hexdump的输出结果,我们来一行一行地分析一下sdb的GPT分区表主表头。
00000200 45 46 49 20 50 41 52 54 00 00 01 00 5c 00 00 00 |EFI PART....\...|
0-8字节:GPT Signature,它是一串ASCII码字符串“EFI PART”,把这8个16进制数45 46 49 20 50 41 52 54分别转换成10进制,就是69 70 73 32 80 65 82 84,去查一下ASCII码表,它就是字符串“EFI PART”,注意两个单词中间还有个空格。
9-11字节:GPT修订版本,表示是1.0版,即00 00 01 00。
12-15字节:GPT分区表头大小,一般是92字节,也就是16进制数5c,即5c 00 00 00。
00000210 47 f1 8d 83 00 00 00 00 01 00 00 00 00 00 00 00 |G...............|
16-19字节:GPT头部共92字节数据的CRC32校验值,计算该CRC32值时把这4个字节先置为0再计算,计算完成之后,再将计算出来的值填入这4个字节。我们来计算一下。先把hexdump输出结果的92个字节摘出来,再把16-19字节全填成0,就是下面这样:
45 46 49 20 50 41 52 54 00 00 01 00 5c 00 00 00
00 00 00 00 00 00 00 00 01 00 00 00 00 00 00 00
ff ff 9f 00 00 00 00 00 22 00 00 00 00 00 00 00
de ff 9f 00 00 00 00 00 dd 25 f8 96 c6 47 56 4f
aa ed c2 48 bd ee 50 7d 02 00 00 00 00 00 00 00
80 00 00 00 80 00 00 00 86 d2 54 ab
然后把这一串16进制数全选复制填入CRC32在线计算网站:https://www.lammertbies.nl/comm/info/crc-calculation.html 注意要在Input type中选Hex,这个网站的输入框它会自动忽略空格和换行符,点击Calculate所得计算结果如下:
可以看到,这个结果跟hexdump显示的16-19字节数据一致,即47 f1 8d 83。
20-23字节:保留位,必须为0。
24-31字节:当前GPT表头所在的LBA,上面说到主GPT表一般是LBA1,所以结果是01,即01 00 00 00 00 00 00 00。
00000220 ff ff 9f 00 00 00 00 00 22 00 00 00 00 00 00 00 |........".......|
32-39字节:Alternate GPT表头所在的LBA,上面说到这个一般是最后一个LBA,也就是硬盘的最后一个512字节,这个值是怎么算出来的呢?/dev/sdb容量大小是140000000(Hex) = 5368709120(Dec),除于512字节,5368709120/512 = 10485760(Dec),就是这个硬盘的总LBA数,因为是最后一个LBA所以再减1,即10485760-1 = 10485759(Dec) = 9FFFFF(Hex),
ff ff 9f 00 00 00 00 00
40-47字节:第一个可用的LBA,根据UEFI官方文档规定,LBA大小为512字节时,第一个可用的LBA必须要大于或等于34,即34(Dec) = 22(Hex),即22 00 00 00 00 00 00 00。
00000230 de ff 9f 00 00 00 00 00 dd 25 f8 96 c6 47 56 4f |.........%...GVO|
00000240 aa ed c2 48 bd ee 50 7d 02 00 00 00 00 00 00 00 |...H..P}........|
48-55字节:最后一个可用的LBA,跟上面的第一个可用LBA同样的道理,就是最后一个LBA-34,/dev/sdb容量大小是140000000(Hex) = 5368709120(Dec),5368709120/512 = 10485760(Dec),10485760 - 34 = 10485726(Dec) = 9FFFDE,即de ff 9f 00 00 00 00 00。
56-71字节:硬盘的GUID,这个值是唯一的,不可重复。
72-79字节:定义GPT分区入口的LBA,就是LBA1+1=LBA2,即02 00 00 00 00 00 00 00。
00000250 80 00 00 00 80 00 00 00 86 d2 54 ab 00 00 00 00 |..........T.....|
80-83字节:定义的分区入口的数量,80(Hex) = 128(Dec),128个分区。即80 00 00 00。
84-87字节:每个分区入口的大小,一般是80(Hex) = 128(Dec),即80 00 00 00。
88-92字节:分区入口列表的CRC32校验值。
-----------------------------------------------------------------------------
上面就是主GPT分区表头的16进制逐行分析,下面就是备份分区表头部分了,根据上面的分区,备份的分区表头位置是在硬盘的最后一个LBA,即140000000(Hex) = 5368709120(Dec),5368709120/512 - 1 = 10485759(Dec),10485759 * 512 = 5368708608(Dec) = 13FFFFE00(Hex),即截图中最后一部分的备份GPT分区表头的起码位置。
通过比较主表头和备份表头,我们发现有如下几个地方不一样:
1、16-19字节的GPT头部共92字节数据的CRC32校验值,这个CRC32校验值不一样是由于24-31字节(当前GPT表头所在的LBA)和32-39字节(备份GPT表头所在的LBA)的位置正好是跟主表头位置相反引起的。
2、24-31字节(当前GPT表头所在的LBA)和32-39字节(备份GPT表头所在的LBA),这两个值刚好跟主GPT表头的值是相反的,即互为主备。
3、72-79字节GPT分区入口的LBA,备份表头肯定指向的备份的分区入口列表的LBA。
除了上述3个地方不一样之外,其它地方跟主GPT表头完全一致。
-----------------------------------------------------------------------------
然后我们在/dev/sdb上创建两个分区,再看分区表会有什么样的变化。
[root@RHEL68 ~]# parted /dev/sdb mkpart sdb1 1 100M
[root@RHEL68 ~]# parted /dev/sdb mkpart sdb2 100M 300M
跟未分区时候相比,多了两个分区入口,这些分区入口在官方文档中被称为GPT Partition Entry Array。分区表头部分和未分区相比,有两个地方发生了变化,一个是16-19字节的GPT头部共92字节数据的CRC32校验值,这个值发生了变化是因为88-92字节分区入口列表的CRC32校验这个发生了变化,因为多了两个分区,所以分区入口列表的CRC32校验值肯定会发生变化。
第一个分区的入口起始位置是0x400,第二个分区入口起始位置是0x480,所以每个分区入口描述长度是80(Hex) = 128(Dec) Byte。这个128byte其实已经在表头里面有定义过的,上面有说过,就是表头的84-87字节。
每个分区的入口描述根据官方文档是这样定义的,见下图。
下面来分析第一个分区的分区入口描述。
00000400 a2 a0 d0 eb e5 b9 33 44 87 c0 68 b6 b7 26 99 c7 |......3D..h..&..|
0-15字节:分区类型GUID。根据上面提到的维基百科Wikipedia的英文版的GUID分区表的页面:https://en.wikipedia.org/wiki/GUID_Partition_Table ,可以查到这个GUID EBD0A0A2-B9E5-4433-87C0-68B6B72699C7 是指基本数据分区。需要说明的是,各种类型的分区的GUID都是已经有明确定义的,可以参考维基百科页面,里面列了很多常见类型的分区GUID。
00000410 84 b3 41 ef 05 e6 c1 43 8e 61 bb 5b 4f f9 a9 28 |..A....C.a.[O..(|
16-31字节:分区唯一标识符,跟分区表头定义的硬盘GUID一个道理,也必须是唯一值。
00000420 00 08 00 00 00 00 00 00 ff f7 02 00 00 00 00 00 |................|
32-39字节:分区起始LBA,也就是800(Hex) = 2048(Dec),分区真正开始使用是2048*512 = 1048576(Dec) = 100000(Hex)。
40-47字节:分区结束LBA,也就是2F7FF(Hex) = 194559(Dec),分区的最后一个LBA的起始字节数是 194559*512 = 99614208(Dec) = 5EFFE00(Hex),还要加上一个LBA即512字节,即5F00000(Hex),也就是下一个分区的起始字节数。
00000430 00 00 00 00 00 00 00 00 73 00 64 00 62 00 31 00 |........s.d.b.1.|
00000440 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 |................|
48-55字节:属性标识符,保留的。
56-127字节: 分区名称,共72字节。本例中,为0073(Hex),0064(Hex),0062(Hex),0031(Hex),转换到10进制,就是115(Dec), 100(Dec), 98(Dec), 49(Dec),查询一下ASCII码,即sdb1。