JFS 文件系统概述及布局分析

JFS 文件系统概述及布局分析 

　　日志文件系统如何缩短系统重启时间

　　如果发生系统崩溃，JFS 提供了快速文件系统重启。通过使用数据库日志技术，JFS 能在几秒或几分钟之内把文件系统恢复到一致状态，而非日志文件系统却要花上几小时甚至几天才能完成。本白皮书对 JFS 体系结构作了概述，并且描述了可在 developerWorks 网站上找到的 JFS 技术的设计特性、潜在限制以及管理实用程序。

　　日志文件系统 (JFS) 提供了基于日志的字节级文件系统，该文件系统是为面向事务的高性能系统而开发的。它具有可伸缩性和健壮性，与非日志文件系统相比，它的优点是其快速重启能力：JFS 能够在几秒或几分钟内就把文件系统恢复到一致状态。



　　虽然 JFS 主要是为满足服务器（从单处理器系统到高级多处理器和群集系统）的高吞吐量和可靠性需求而设计的，JFS 还可用于想得到高性能和可靠性的客户机配置。



　　体系结构和设计

　　JFS 体系结构可从磁盘布局特性的角度进行说明。



　　逻辑卷 

　　所有文件系统讨论的基础是某种类型的逻辑卷。这可以是一个物理磁盘，或物理磁盘空间的某个子集，例如：一个 FDISK 分区。逻辑卷也称为磁盘分区。 



　　聚集和文件集 

　　文件系统创建实用程序 mkfs，创建了完全包含在分区内的聚集。聚集是包含一种特定格式的磁盘块阵列，其格式包括超级块和分配映射表。超级块将分区标识成 JFS 聚集，而分配映射表描述聚集内每个数据块的分配状态。格式还包括描述它所必需的初始文件集和控制结构。文件集是可安装的实体。 



　　文件、目录、inode 与寻址结构 

　　文件集包含文件和目录。文件和目录由 inode 持续表示；每个 inode 描述文件或目录的属性，并作为查找磁盘上文件或目录数据的起始点。JFS 还使用 inode 来表示其它文件系统对象，如描述文件集中每个 inode 的分配状态和磁盘位置的映射表。 



　　目录将用户特定的名称映射到为文件和目录所分配的 inode 上，并且形成传统的命名层次。文件包含用户数据，用户数据中没有隐含任何限制或格式。也就是说，JFS 将用户数据看成是未解释的字节流。根植于 inode 基于盘区的寻址结构用来将文件数据映射到磁盘。聚集超级块和磁盘分配映射表、文件描述符和 inode 映射表、inode、目录以及寻址结构一起表示了 JFS 控制结构或元数据。



　　日志 

　　在每个聚集中维护 JFS 日志，并且用来记录元数据的操作信息。日志有一种同样由文件系统创建实用程序设置的格式。聚集内多个安装的文件集可以同时使用一个日志。 



　　设计特性

　　JFS 从一开始就设计成完全集成了日志记录，而不是在现有文件系统上添加日志记录。JFS 的许多特性使之区别于其它文件系统。



　　日志处理 

　　JFS 提供了改进的结构化一致性和可恢复性，以及比非日志文件系统（例如：HPFS、ext2 和传统 UNIX 文件系统）快得多的系统重启时间。发生系统故障时非日志文件系统容易崩溃，是由于一个逻辑写文件操作通常占用多个媒体 I/O 来完成，且在任何给定时间，可能没有完全反映在媒体上。这些文件系统依靠重启实用程序（也就是 fsck），fsck 检查文件系统的所有元数据（例如：目录和磁盘寻址结构）以检测和修复结构完整性问题。这是一个耗时并且容易出错的过程，在最糟糕的情况下，它还可能丢失或放错数据。 



　　相反，JFS 使用原来为数据库开发的技术，记录了文件系统元数据上执行的操作（即原子事务）信息。如果发生系统故障，可通过重放日志并对适当的事务应用日志记录，来使文件系统恢复到一致状态。由于重放实用程序只需检查文件系统最近活动所产生的运行记录，而不是检查所有文件系统的元数据，因此，与这种基于日志的方法相关的文件系统恢复时间要快得多。



　　基于日志恢复的其它几个方面也值得注意。首先，JFS 只记录元数据上的操作，因此，重放这些日志只能恢复文件系统中结构关系和资源分配状态的一致性。它没有记录文件数据，也没有将这些数据恢复到一致状态。因此，恢复后某些文件数据可能丢失或失效，对数据一致性有关键性需求的用户应该使用同步 I/O。



　　面对媒体出错，日志记录不是特别有效。特别地，在将日志或元数据写入磁盘的期间发生的 I/O 错误，意味着在系统崩溃后，要将文件系统恢复到一致状态，需要耗时并且有可能强加的全面完整性检查。这暗示着，坏块重定位是任何驻留在 JFS 下的存储管理器或设备的一个关键特性。



　　JFS 日志记录的语义如下：当涉及元数据更改的文件系统操作--例如，unlink()--返回成功执行的返回码时，操作的结果已经提交到文件系统，即使系统崩溃了也可以发现。例如，一旦成功删除了文件，即使系统崩溃然后重启，它仍然是删除的并且不会再重新出现。



　　日志记录风格将同步写入日志磁盘引入每个修改元数据的 inode 或 vfs 操作。（对数据库专家而言，这是一种使用非剥夺缓冲区策略的仅重做的、物理残留映象、提前写的日志记录协议。）在性能方面，与依赖（多个）谨慎的同步元数据写操作以获得一致性的许多非日志文件系统相比，这种方法较好。但是，与其它日志文件系统相比，它在性能上处于劣势。其它日志文件系统，如 Veritas VxFS 和 Transarc Episode，使用不同的日志风格并且缓慢地将日志数据写入磁盘。在执行多个并行操作的服务器环境中，通过将多个同步写操作组合成单一写操作的组提交来减少这种性能损失。JFS 日志记录风格随着时间推移而得到不断改进，现在提供了异步日志记录，异步日志记录提高了文件系统的性能。



　　基于盘区的寻址结构 

　　JFS 使用基于盘区的寻址结构，连同主动的块分配策略，产生紧凑、高效、可伸缩的结构，以将文件中的逻辑偏移量映射成磁盘上的物理地址。盘区是象一个单元那样分配给文件的相连块序列，可用一个由 <逻辑偏移量，长度，物理地址> 组成的三元组来描述。寻址结构是一棵 B+ 树，该树由盘区描述符（上面提到的三元组）填充，根在 inode 中，键为文件中的逻辑偏移量。 



　　可变的块尺寸 

　　按文件系统分，JFS 支持 512、1024、2048 和 4096 字节的块尺寸，以允许用户根据应用环境优化空间利用率。较小的块尺寸减少了文件和目录中内部存储碎片的数量，空间利用率更高。但是，小块可能会增加路径长度，与使用大的块尺寸相比，小块的块分配活动可能更频繁发生。因为服务器系统通常主要考虑的是性能，而不是空间利用率，所以缺省块尺寸为 4096 字节。 



　　动态磁盘 inode 分配 

　　JFS 按需为磁盘 inode 动态地分配空间，同时释放不再需要的空间。这一支持避开了在文件系统创建期间，为磁盘 inode 保留固定数量空间的传统方法，因此用户不再需要估计文件系统包含的文件和目录最大数目。另外，这一支持使磁盘 inode 与固定磁盘位置分离。 



　　目录组织 

　　JFS 提供两种不同的目录组织。第一种组织用于小目录，并且在目录的 inode 内存储目录内容。这就不再需要不同的目录块 I/O，同时也不再需要分配不同的存储器。最多可有 8 个项可直接存储在 inode 中，这些项不包括自己(.)和父(..)目录项，这两个项存储在 inode 中不同的区域内。 



　　第二种组织用于较大的目录，用按名字键控的 B+ 树表示每个目录。与传统无序的目录组织比较，它提供更快的目录查找、插入和删除能力。



　　稀疏和密集文件 

　　按文件系统分，JFS 既支持稀疏文件也支持密集文件。 



　　稀疏文件允许把数据写到一个文件的任意位置，而不要将以前未写的中间文件块实例化。所报告的文件大小是已经写入的最高块位处，但是，在文件中任何给定块的实际分配，只有在该块进行写操作时才发生。例如，假设在一个指定为稀疏文件的文件系统中创建一个新文件。应用程序将数据块写到文件中第 100 块。尽管磁盘空间只分配了 1 块给它，JFS 将报告该文件的大小为 100 块。如果应用程序下一步读取文件的第 50 块，JFS 将返回填充了 0 的一个字节块。假设应用程序然后将一块数据写到该文件的第 50 块，JFS 仍然报告文件的大小为 100 块，而现在已经为它分配了两块磁盘空间。稀疏文件适合需要大的逻辑空间但只使用这个空间的一个（少量）子集的应用程序。



　　对于密集文件，将分配相当于文件大小的磁盘资源。在上例中，第一个写操作（将一块数据写到文件的第 100 块）将导致把 100 个块的磁盘空间分配给该文件。在任何已经隐式写入的块上进行读操作，JFS 将返回填充了 0 的字节块，正如稀疏文件的情况一样。 



2

　　JFS 内部（潜在）限制

　　JFS 是完全 64 位的文件系统。所有 JFS 文件系统结构化字段都是 64 位大小。这允许 JFS 同时支持大文件和大分区。



　　文件系统大小 

　　JFS 支持的最小文件系统是 16M 字节。最大文件系统的大小是文件系统块尺寸和文件系统元数据结构支持的最大块数两者的乘积。JFS 将支持最大文件长度是 512 万亿字节（TB）（块尺寸是 512 字节）到 4 千万亿字节（PB）（块尺寸是 4K 字节） 



　　文件长度 

　　最大文件长度是主机支持的虚拟文件系统最大文件长度。例如：如果主机只支持 32 位，则这就限制了文件长度。 



　　可移动媒体 

　　JFS 不支持把软盘作为基本文件系统设备。 



　　标准管理实用程序

　　JFS 提供创建和维护文件系统的标准管理实用程序。



　　创建文件系统 

　　这个实用程序提供 mkfs 命令的 JFS 特定部分，用来在指定的驱动器上初始化 JFS 文件系统。该实用程序在较低级别上操作，并假设文件系统所存在的任何卷的创建/初始化由更高级别的另一个实用程序处理。 



　　检查/修复文件系统 

　　这个实用程序提供 fsck 命令的 JFS 特定部分。该命令检查文件系统的一致性，修复发现的问题。它也重放日志，把提交的改动应用到文件系统元数据，如果由于日志重放而声明文件系统是干净的，就不会再采取进一步操作。如果文件系统不认为是干净的，这意味着由于某种原因没有完整和正确地重放日志，或者文件系统不能单靠重放日志来恢复到一致状态，那么，就对文件系统执行一遍完整检查。 



　　当执行全部完整性检查时，检查/修复实用程序首要目的是要达到可靠的文件系统状态，以防止将来文件系统崩溃或故障，第二个目的就是面对崩溃时保存数据。这意味着为了达到文件系统的一致性，实用程序可能丢弃数据。具体而言，当实用程序在不做假设的情况下，无法获得所需信息以将结构上不一致的文件或目录恢复到一致状态时，就会废弃数据。当遇到不一致的文件或目录时，就废弃整个文件或目录，而不再试图保存任何部分。任何由删除受损目录所孤立起来的文件或子目录，都放在文件系统根下的 lost+found 目录中。



　　文件系统检查/修复实用程序重点考虑的因素之一是所需虚存数量。通常，这些实用程序所需的虚存数量由文件系统的大小决定，这是由于所需虚存主要用于跟踪文件系统中个别块的分配状态。随着文件系统增大，块的数量增多，用来跟踪这些块所需的虚存数量也随之增加。



　　JFS 检查/修复实用程序的设计区别在于其虚存需求由文件系统中文件和目录的数量（而不是由块的数量）所决定。对 JFS 检查/修复实用程序而言，每个文件或目录的虚存大约为每个文件或目录 32 字节，或者对于包含百万个文件和目录的文件系统而言，不论其文件系统大小，虚存需求都是大约 32 兆字节。如同所有其它的文件系统，JFS 实用程序需要跟踪块分配状态，但避免使用虚存方法，而是使用位于实际文件系统中的一小块保留工作区来实现。



　　日志文件系统如何处理磁盘布局



　　本文描述磁盘日志文件系统(JFS)布局，以及使用磁盘布局结构来实现可扩展性、可靠性和性能的机制。还会了解用来操作这些结构的策略和算法，以及 JFS 是在哪里使用遍布文件系统的 B+ 树来提高文件系统操作性能。



　　JFS 体系结构可通过其磁盘布局特性的上下文进行说明。磁盘布局是 JFS 用来控制文件系统的格式。本文讨论盘区的文件几何构造、目录格式、块分配映射表格式、inode 和布局结构的其它特性。本文还提供了文件布局使用的 B+ 树数据结构的细节和示例。选择 B+ 树是为了提高读写盘区的性能，这是 JFS 执行的最普通操作。



　　分区、聚集、分配组、文件集



　　分区 

　　JFS 文件系统建立在分区上，分区是由 FDISK 导出到 JFS 的抽象。 



　　分区有：

　　固定分区块尺寸，其合法值为 512、1024、2048 或 4096 字节。分区块尺寸定义了分区上支持的最小 I/O 单元。这对应于组成分区的物理设备的基本磁盘扇区大小，最普遍的尺寸是 512 字节。 



　　大小为：PART_NBlocks，是分区磁盘块数。 



　　分区磁盘块的抽象地址空间 [ 0.. PART_NBlocks - 1 ]。

 

　　聚集 

　　为了支持 DCE DFS（分布式计算环境分布式文件系统），JFS 将磁盘空间分配池（称为聚集）的概念, 与可安装的文件系统子树（称为文件集）的概念分开。本文中聚集和文件集的术语与其 DFS 用法一致。每个分区刚好只有一个聚集；每个聚集可能有多个文件集。在第一个发行版中，JFS 仅支持每个聚集一个文件集；但是，所有元数据都已设计成适用于所有情况。 



　　聚集有：



　　在此聚集的开始部分有 32K 保留区域。 



　　固定的聚集块尺寸，其合法值为 512、1024、2048 或 4096 字节，但不小于分区块尺寸。聚集块尺寸定义了聚集上支持的最小空间分配单元。不要把它与分区块尺寸混淆起来，后者定义的是 I/O 的最小单元。 



　　主聚集超级块和辅助聚集超级块。超级块包含聚集方面的信息，例如：聚集的大小、分配组的大小、聚集块的尺寸等等，辅助聚集超级块是主聚集超级块的直接副本。如果主聚集超级块损坏，则使用辅助聚集超级块。这些超级块位于固定位置。这使得 JFS 不依赖任何其它信息，就能够找到它们。超级块结构在 jfs_superblock.h 的 struct jfs_superblock 中定义。 



　　聚集 inode 表，包含描述聚集范围的控制结构的 inode 。聚集 inode 表逻辑上包含一个 inode 数组。聚集无目录结构；在聚集或文件集名字空间中，任何地方都没有聚集 inode 。 



　　辅助聚集 inode 表，包含从聚集 inode 表复制的 inode 。由于对任何文件系统信息的查找而言，聚集 inode 表中的 inode 都是至关重要的，所以它们每一个在辅助聚集 inode 表中都有备份。当然，不会复制 inode 的实际数据，而只是复制可用来查找数据和 inode 本身的寻址结构。 



　　聚集 inode 映射表，描述聚集 inode 表。聚集 inode 分配映射表包含聚集 inode 上及其磁盘位置上的分配状态信息。

 

　　辅助聚集 inode 映射表，描述辅助聚集 inode 表。由于必须复制聚集 inode 表本身，辅助聚集 inode 映射表实际上是与聚集 inode 分配映射表分开的映射结构。 



　　块分配映射表，描述在聚集内分配和释放聚集磁盘块的控制结构。块分配映射表在聚集磁盘块内进行一对一映射。 



　　fsck 工作区，它为 fsck 提供用来跟踪聚集块分配的空间。因为 JFS 支持超大聚集，所以这一区域是必需的；当 fsck 运行时，可能没有足够的内存用来跟踪内存中的这些信息。超级块描述了这一区域。每个聚集块需要一位。 fsck 工作区总是存在于聚集的末端。 



　　内嵌日志为记录聚集中的元数据更改提供了空间。超级块描述了这一区域。内嵌日志总是紧跟 fsck 工作空间后。 



　　初始情况下，在聚集创建时分配了第一个 inode 盘区。按需要动态分配和释放其它 inode 盘区。每个聚集 inode 描述聚集本身的某些方面，如下：



　　保留聚集 inode 0。 

　　聚集 inode 1，即自身 inode ，描述包括聚集 inode 映射表的聚集磁盘块。这是一种循环表示法，因为聚集 inode 1 本身也在自己所描述的文件中。可通过强制规定至少第一个聚集 inode 盘区要在众所周知的位置，即主聚集超级块后面 4K 的位置，来处理以上显而易见的循环表示法问题。因此，JFS 能轻而易举地找到聚集 inode 1，从聚集 inode 1，通过跟随 inode 1 中的 B+ 树，能找到聚集 inode 表的余下 inode 。 



　　要复制聚集 inode 表，JFS 还需要找到聚集 inode 1 的副本，以查找所复制表的其余部分。超级块会包含一个盘区描述符，该描述符描述辅助聚集 inode 表的第一个 inode 盘区的位置。JFS 能够从中找到辅助聚集 inode 1，以及辅助聚集 inode 表的余下部分。

 

　　聚集 inode 2 描述块分配映射表。 



　　聚集 inode 3 描述安装时的内嵌日志。虽然分配了 inode ，但无数据存入磁盘。 



　　聚集 inode 4 描述在聚集格式化期间发现的坏块。在块映射表中这些标记成已分配。该 inode 是数据为坏块的普通文件。 



3

　　保留聚集 inode 5 到 15 以备将来扩展。 



　　从聚集 inode 16 开始，每个文件集有一个 inode ，即文件集分配映射表 inode 。这个 inode 描述了表示文件集的控制结构。当更多文件集添加到聚集中时，为了容纳更多的文件集 inode ，聚集 inode 表本身可能必须增大。 



　　分配组 

　　分配组(AG)把聚集中的空间分成大块，并且允许 JFS 资源分配策略使用众所周知的方法，来实现更好的 JFS I/O 性能。首先，分配策略尝试将相关数据的磁盘块和磁盘 inode 集群起来，使磁盘实现好的局域性。文件通常是顺序地读写，而目录中的文件通常一起访问。其次，为了容纳局域性，分配策略尝试在整个聚集中分配不相关数据。聚集内的分配组用从 0 开始的 AG（分配组）索引。即用 AG 标识。 



　　必须选择分配组大小，以使 AG 足够大以不断提供连续资源分配。为了将聚集扩充或缩小时所需进行的更新数最小化，分配组必须限制最大组数 128。此外，JFS 将对 8192 个聚集块的分配组大小规定其最小值。分配组大小必须总是 1 个 dmap 页（1、2、4、8、 ...dmap 页）描述的块数的 2 的幂次方。分配组大小在聚集超级块中存储。



　　大小不是分配组大小倍数的聚集将包含部分分配组；磁盘块没有完全覆盖聚集的最后一个分配组。除了JFS 将标记在块分配映射表中分配的却不存在的磁盘块之外，该部分分配组将被当作完整的分配组。



　　文件集 

　　文件集是文件和目录的集合，这些文件和目录形成了可独立安装的子树。文件集完全包含在一个聚集中。请注意，一个聚集中可能有多个文件集；在那种情况下，所有文件集共享由聚集控制结构定义的空闲聚集磁盘块公共池。 



　　文件集有：

　　文件集 inode 表，包含描述文件集范围的控制结构的 inode 。文件集 inode 表逻辑上包含一个 inode 数组。 

　　文件集 inode 分配映射表，描述文件集 inode 表。文件集 inode 分配映射表包含文件集 inode 上及其磁盘位置上的分配状态信息。描述文件集分配映射表和其他文件集信息的超级 inode ，驻留前面所描述的聚集 inode 表中。由于复制了聚集 inode 表，因此这个 inode 存在第二个版本，它指向同样的数据。超级 inode 本身是一个文件。当文件集一开始创建时，分配第一个 inode 盘区按需要动态分配和释放其它 inode 盘区。 

　　文件集中 inode 的分配如下所示：



　　保留文件集 inode 0。 

　　文件集 inode 1 包含附加的文件集信息，它们无法放入聚集 inode 表中的文件集分配映射表 inode 。 

　　文件集 inode 2 是文件集的根目录 inode 。注意，JFS 保留了 inode 2 是文件系统的根这一公共 Unix 约定。 

　　文件集 inode 3 是文件集的 ACL 文件。 

　　从文件集 inode 4 开始，文件集 inode 用于一般文件集对象、用户文件、目录和符号链接。 

　　盘区、inode 、B+ 树

　　盘区是当作单元分配给 JFS 对象的连续聚集块序列。盘区完全包含在一个聚集（并且因此也是在一个分区）中；但是，大盘区可能跨多个分配组。



　　每个 JFS 对象可用一个 inode 来表示。inode 包含预期的对象特定信息，例如：时间戳和文件类型。它们还包含记录盘区分配的 B+ 树。注意，所有 JFS 元数据结构（除超级块之外）都以文件表示。通过重用这种数据的 inode 结构，数据格式（即磁盘布局) 自然是可扩展的。



　　盘区、B+ 树、inode 在以下章节中详细描述。



　　盘区 

　　文件是按盘区顺序分配的。盘区是当作一个单元分配的聚集块的连续变长序列。盘区的尺寸范围是 1 到 2(24)-1 个聚集块。盘区可能跨越多个分配组(AG)。为了在插入新盘区、定位特定盘区等操作方面有更优性能，这些盘区是按 B+ 树索引的。 



　　定义一个盘区需要两个值，即其长度和其地址。长度以聚集块尺寸为单位计算。JFS 使用 24 位值来表示盘区的长度，因此盘区的范围大小是 1 到 2(24)-1 个聚集块。



　　对于 512 字节的聚集块尺寸 (所允许的最小值)，最大盘区是512*(2(24)-1)字节，（比 8G 稍小)。对于 4096 字节的聚集块尺寸（所允许的最大值），盘区的最大长度是 4096*(2(24)-1)字节，(比 64G 稍小)。这些限制仅适用于一个的盘区；对整体文件大小没有限制作用。地址指的是盘区中第一个块的地址。地址同样以聚集块为单位：它从聚集的开始处计算块偏移量。



　　结合了用户特定聚集块尺寸的基于盘区的文件系统，允许 JFS 不需要单独支持内部存储碎片。可配置聚集使用小的聚集块尺寸（例如，512 字节），以使大量小尺寸文件的聚集内部存储碎片最小化。



　　通常，JFS 分配尝试通过分配最小数量的盘区策略，而使每个盘区尽可能大。这就允许大的 I/O 传送，结果使得性能提高。然而，对于特殊情况，不一定总有这种结果。例如，一个段的写入时复制会造成连续盘区被分割成更小的连续盘区系列。另一种情况是盘区大小的限制。例如：由于 JFS 必须把整个盘区读入内存，然后进行解压缩，所以压缩文件盘区大小是有限的。由于 JFS 的可用内存数量有限，因此它必须保证有足够的空间用于解压缩盘区。



　　提供了一个碎片整理实用程序，以减少动态分配／释放可变长盘区时出现的外部存储碎片。这种分配和释放可能导致不相连的变长空闲盘区遍及整个聚集。碎片整理实用程序会把多个小的空闲盘区合并成一个较大的盘区。



　　inode 

　　JFS 磁盘 inode 是 512 字节。一个 JFS 磁盘 inode 包含 4 组基本信息。第一组描述 JFS 对象的 POSIX 属性。第二组描述 JFS 对象的其它属性；这些属性包括支持 VFS 必需的信息、操作系统环境特定的信息、以及 B+ 树的头部。第三组不是包含 B+ 树根节点的盘区分配描述符就是包含内嵌数据。第四组包含扩展属性、更多内嵌数据或附加的盘区分配描述符。在 jfs_dinode.h 的 struct dinode 中定义磁盘 inode 结构。 



　　JFS 动态分配 inode 提供的好处如下：



　　inode 磁盘块可放在任何磁盘地址，这使得 inode 号和位置分开。这种分离简化了支持聚集和文件集重组，能够使聚集缩小。可以移动 inode ，移动后号码仍然相同。这允许 JFS 不必需要查找目录结构就可以更新 inode 号。对于支持 DFS 文件集复制而言，这种分离也是必需的。当复制文件集时，仅复制 inode 。既然 JFS 能把新的 inode 放在磁盘的任意位置，新 inode 将有与从它们复制的 inode 相同的号码。这允许 JFS 不需复制目录结构并且更新 inode 号。 

　　不再需要分配实际所需十倍的 inode 。这对于 JFS 中较大的 inode 尺寸（大于 512 字节）而言，尤为重要。 

　　大文件的文件分配可能消耗多个分配组且仍是连续的，而静态分配造成间隔（由于每个分配组中初始分配的 inode ）。 

　　另一方面，动态 inode 分配造成大量问题，包括：



　　对于静态分配，文件系统的几何构造隐含描述了磁盘上 inode 的布局；对于动态分配，必需有单独的映射结构。 

　　对 JFS 完整性而言，这些映射结构是至关重要的。由于复制这些结构的系统开销，JFS 决定接受丢失这些映射表的风险。但是，JFS 将复制 B+ 树结构，该结构允许 JFS 查找映射表。 

　　通过只分配磁盘上 inode 连续大块的 inode 盘区，动态分配了 inode 。根据定义，一个 JFS inode 盘区包含 32 个 inode 。对于 512 字节的 inode 尺寸，因此磁盘上一个 inode 盘区的大小是 16KB。



　　当分配新的 inode 盘区时，并不初始化盘区。然而，要使 fsck 能够检查是否 inode 在使用中，JFS 需要 inode 的一些信息。一旦盘区中的 inode 标记成在使用中，就必须初始化它的文件集号、inode 号、inode 戳以及 inode 分配组块地址。因此，链接字段就足以确定 inode 当前是否正在使用。 



　　注意，动态 inode 分配意味着在 inode 号与 inode 的磁盘地址之间没有直接关系。因此，JFS 必须有查找磁盘上 inode 的方法。inode 分配映射表提供了这一功能。



　　inode 生成号只是每当重用 inode 时值就增加的计数器。



　　存储每个 inode 生成计数器这一静态 inode 分配常用方法在动态 inode 分配中不起作用，因为当 inode 空闲时，其磁盘空间可能确实由不是 inode 的数据所重用，（换句话说，空间可能被收回，以存储普通文件数据）。因此，在 JFS 中，只有一个 inode 生成计数器，它在每一个 inode 分配时增加其值，即在重用 inode 时，相应的计数器增加其值，而不是每个 inode 有一个计数器。 



4

　　B+ 树 

　　这一节描述文件布局使用的 B+ 树数据结构。选择 B+ 树是为了提高读写盘区的性能，这是 JFS 必须进行的最普通操作。B+ 树为读取文件的特定盘区提供快速搜索。它还提供有效方法将盘区添加或插入文件中。较为少见的情形是：当删除文件时，JFS 需要遍历整个 B+ 树。为了保证 JFS 会删除 B+ 树使用的块以及文件数据，对于遍历 B+ 树效率也很高。 



　　盘区分配描述符（xad 结构）描述盘区并且又添加了表示文件所需的两个字段：描述盘区表示的逻辑字节地址的偏移量和标志字段。盘区分配描述符结构在 jfs_xtree.h, struct xad 中定义。 



　　xad 结构为：



　　　　  struct xad {

　　　　　　　　　 unsigned　　flag:8;

　　　　　　　　　 unsigned　　rsvrd:16;

　　　　　　　　　 unsigned　　off1:8;

　　　　　　　　　 uint32　　  off2; 

　　　　　　　　　 unsigned　　len:24; 

　　　　　　　　　 unsigned　　addr1:8;

　　　　　　　　　 uint32　　  addr2;

　　　　　　　　　 } xad_t;



 　　其中：



　　flag 是包含各种标志的 8 位字段。这些标志能够表示写入时复制、是否分配了盘区但没有记录它、压缩信息等等。 

　　rsvrd是保留供将来使用的 16 位字段。它总为零。 

　　off1,off2 是 40 位字段，包含盘区中第一个块的逻辑偏移量。逻辑偏移量是以聚集块尺寸为单位表示；也就是说，要取得一个字节，偏移量必须乘以聚集块尺寸。 

　　len 是 24 位字段，包含盘区的长度。长度以聚集块尺寸为单位表示。 

　　addr1,addr2 是 40 位字段，包含盘区的地址。地址以聚集块尺寸为单位表示。 

　　xad 结构描述了两个抽象范围：



　　磁盘上磁盘块的物理范围。它以聚集块号 xad_address 开始，并且延伸为 xad_length 聚集块。 

　　文件内字节的逻辑范围。它以字节号 xad_offset * AGBS（聚集块尺寸）开始，并且延伸为 xad_length*AGBS 字节。 

　　当然，物理范围和逻辑范围有相同长度的字节。请注意， xad_offset 以聚集块尺寸为单位存储（例如，在 xad_offset 中值 "3" 意味着 3 个聚集块，而不是 3 个字节）。它遵循文件内盘区总是以聚集块尺寸为边界。 



　　JFS 中的所有索引对象（除目录外），有一个类属 B+ 树索引结构。索引的数据将取决于对象。B+ 树以由树描述的数据的 xad 偏移量为键。项按 xad 结构的偏移量排序。xad 结构是 B+ 树节点中的项。



　　磁盘 inode 第二扇区底部包含数据描述符，它描述在 inode 的后半部分内存储的内容。对于足够小的文件，后半部分可能包含内嵌数据。如果文件数据不适合 inode 的内嵌数据空间，它将包含在盘区中，inode 将包含 B+ 树的根节点。头部指出在使用的 xad 个数，可用的 xad 个数。通常，inode 将包含 8 个 xad 结构 B+ 树的根。如果文件有 8 个或更少盘区，那么这 8 个 xad 结构也是 B+ 树的叶节点。它们将描述盘区。否则，inode 中的 8 个 xad 结构将指向 B+ 树的叶节点或内部节点。



　　一旦 inode 中的 8 个 xad 结构均已填充，为了有更多的 xad 结构，就会尝试使用 inode 的最后四分之一。如果 INLINEEA 位在 inode 的 di_mode 字段中设置，那么 inode 的最后四分之一可用。 



　　一旦 inode 中所有可用的 xad 结构都被使用，就必须拆分 B+ 树。JFS 将把 4K 的磁盘空间分配给 B+ 树的叶节点。叶节点逻辑上是带头的 xad 项的数组。头部指向节点中第一个空闲的 xad 项，没有分配紧跟其后的所有 xad 项。8 个 xad 项从 inode 复制到叶节点，初始化头部以指向第 9 个项作为第一个空闲项。然后 JFS 将把 B+ 树的根更新为 inode 的第一个 xad 结构；该 xad 结构将指向最新分配的叶节点。这个新的 xad 结构的偏移量是叶节点中第一个项的偏移量。将更新 inode 中的头部以表示当前 B+ 树只使用 1 个 xad。还需要更新 inode 头部以表示当前 inode 包含 B+ 树的纯根。



　　当把新盘区添加到文件时，将以必需的次序，继续把它们添加到相同的叶节点。这将持续直到节点填满为止。一旦节点填满了，将为 B+ 树的另一个叶节点分配新的 4K 磁盘空间。将把该 inode 的第二个 xad 结构设置成指向新分配的节点。



　　这将持续直到填满 inode 的所有 8 个 xad 结构为止，这时，将再次拆分 B+ 树。这种拆分将创建 B+ 树的内部 inode ，它们是纯粹用来记录树的搜索路径。JFS 将为 B+ 树的内部 inode 分配 4K 磁盘空间。内部节点看起来如同叶节点。从 inode 复制 8 个 xad 项到内部节点，初始化头部以指向第 9 个项作为第一个空闲项。然后，通过使 inode 的第一个 xad 结构指向新分配的内部节点，JFS 更新 B+ 树的根。将更新 inode 中的头部以表示当前 B+ 树只使用 1 个 xad。



　　文件 jfs_xtree.h 在 struct xtpage_t 中描述 B+ 树根的头部。文件 jfs_btree.h 是在 struct btpage_t 中的内部节点或叶节点的头部。 



　　例子 

　　下列例子进一步分析了盘区描述符和 xad 结构的用法： 



　　连续分配的 1041377 字节文件。 

　　相同的 1041377 字节文件，但在磁盘上拆分成三段。 

　　1041377 字节的文件，但里面有一个"洞"（稀疏文件）。 

　　连续分配的 16GB 文件。 

　　在所有这些例子中，聚集块尺寸都是 1KB。



　　连续分配的 1041377 字节尺寸文件： 该文件需要 1017 个 1KB 聚集块，（在最后一个聚集块中，有 31 个字节丢失成为内部存储碎片）。要描述这个连续文件只需要一个 xad 结构： 



flag　　　　这里不讨论

offset　　  0　　　　　　　　　 /*  the beginning of the file */

length　　  1017　　　　　　　　/*  1017 1KB aggregate blocks */

address　　 xxxxx　　　　　　　 /*  aggregate block #　　　　 */



　　相同的 xad 结构能够表示任何长度为 1040385 （1016 * 1024 + 1）到 1041408 （1017 * 1024）的连续文件，因为盘区描述符只表示小于聚集块大小粒度的尺寸。只有 inode 的 di_size 字段记录字节粒度。 



　　在 1041377 字节文件分三段： 假设相同的文件拆分成磁盘上三个不同盘区：一个为 495 个聚集块长，一个为 22，一个为 500。需要三个 xad 结构来表示该文件，每个物理盘区需要一个： 



xad #0 :

flag　　　　这里不讨论

offset　　  0　　　　　　　　　 /*  the beginning of the file */

length　　  495　　　　　　　　 /*  495 1KB aggregate blocks  */

address　　 xxxxx　　　　　　　 /*  aggregate block #　　　　 */



xad #1:

flag　　　　这里不讨论

offset　　  495　　　　　　　　 /*  the beginning of the file */

length　　  22　　　　　　　　  /*  22 1KB aggregate blocks　 */

address　　 yyyyy　　　　　　　 /*  aggregate block #　　　　 */



xad #2:

flag　　　　这里不讨论

offset　　  517　　　　　　　　 /* the beginning of the file  */

length　　  500　　　　　　　　 /* 500 1KB aggregate blocks　 */

address　　 zzzzz　　　　　　　 /* aggregate block #　　　　  */



　　该例中，0 号 xad 描述文件开始的 495 个物理聚集块。 xad_offset 字段包含 0，因为该 xad 描述以逻辑偏移量 0 开始的字节。第二个 xad，1 号 xad，描述文件接下来的 22 个物理聚集块。 xad_offset 字段包含 495，因为该 xad 描述以逻辑偏移量 506880 (495 * 1024) 开始的字节；前面的字节由 xad 0 描述。最后一个 xad 描述文件的最后 500 块。这里， xad_offset 字段是 517。请注意，对于非稀疏文件，给定 xad 的 xad_offset 字段等于所有以前 xad 结构长度和（在本例中，517 = 495 + 22）。如果这一关系总是成立的，那么 xad_offset 字段就是冗余的，可以消除。然而，下一个例子显示，对于稀疏文件， xad_offset 字段不是冗余的。 



　　1041377 字节的稀疏文件： 考虑经由以下 POSIX 风格的操作而创建的文件： 



fd = create ("newfile", blah blah blah);

write (fd, "hi", 2);



lseek (fd, 1041374, 0);

write (fd, " bye" , 3);



　　该文件有以逻辑字节偏移量 0 开始的两字节数据（"hi"），还有以逻辑字节偏移量 1,041,374 开始的三字节数据 ("bye")，并且在这两者之间全为 0（稀疏的）。文件的长度为 1041377 字节。



　　通常，JFS 不分配物理磁盘空间以保存从不写入文件的字节范围。因此，将占用两个 xad 结构来表示该文件：一个为包含 "hi" 数据的盘区，一个为包含 "bye" 数据的盘区：



xad #0 :

flag　　　　这里不讨论

offset　　  0　　　　　　　　　 /* the beginning of the file  */

length　　  1　　　　　　　　　 /* 1 1KB aggregate blocks　　 */

address　　 xxxxx　　　　　　　 /* aggregate block #　　　　  */



xad #1:

flag　　　　这里不讨论

offset　　  1016　　　　　　　　/* the beginning of the file  */

length　　  1　　　　　　　　　 /* 1 1KB aggregate blocks　　 */

address　　 yyyyy　　　　　　　 /* aggregate block　　　　　　*/



　　在该例中，第一个盘区(xad 0)包含字节 "hi"，紧接着是 1022 字节 0。最后一个盘区(xad 1)包含 990 字节 0，紧接着是 3 字节 "bye"。1KB 盘区中剩余的 31 字节不是文件的组成部分。（它们与第一个例子中丢失成为内部存储碎片的 31 个字节相同）。



　　请注意，该例中， xad_offset 字段是必需的；这是知道 xad 1 表示文件内在无法预料的逻辑偏移量字节序列的唯一方法（也即，xad 1 的偏移量不等于 xad 0 的偏移量加长度）。这是表示稀疏文件的方法。 



　　inode 的 di_size 字段包含写入的最后一个字节偏移值加 1。 



　　连续分配的 16GB 的文件： xad 结构中的长度字段仅有 24 位长：因此，它能包含的最大值是 2(24)-1。如果聚集块大小是 1KB（例如），那么一个 xad 能够表示的最大盘区是(2(24)-1)*2(10)=1KB，小于 16G。暗示这也是 xad 结构能够表示的最大盘区。因此，如果文件够大的话，就算它在磁盘上是相连的，也需要多个 xad 结构来表示它。本例中显示了这样一个连续分配的文件：一个 16G 文件，它从聚集块号 12345 开始连续分配，获取 16777216 个 1KB 的聚集块(16G)。 



xad #0 :

flag　　　　这里不讨论

offset　　  0　　　　　　　　　 /* the beginning of the file  */

length　　  16777215　　　　　　/* 1 1KB aggregate blocks　　 */

address　　 12345　　　　　　　 /* aggregate block　　　　　　*/



xad #1:

flag　　　　这里不讨论

offset　　  16777215　　　　　　/* the beginning of the file  */

length　　  1　　　　　　　　　 /* 1 1KB aggregate blocks　　 */

address　　 16789560　　　　　　/* aggregate block #　　　　  */



　　在该例中，不论文件在磁盘上是否相连，要表示它至少需要两个 xad 结构，这是由于单个盘区的长度限制。 



5

　　块分配映射表

　　块分配映射表用来为整个聚集跟踪分配或释放的磁盘块。由于聚集内所有的文件集共享相同的磁盘块池，在分配或释放磁盘块时，聚集内所有的文件集可使用该分配映射表。



　　块分配映射表本身是聚集 inode 2 描述的文件。当初始创建聚集时，分配包括聚集空间的映射表数据块。映射表将随着聚集的扩充或紧缩而相应动态地增大或缩小。



　　块分配映射表跟踪是否每个个别的聚集块被分配还是释放。



　　映射表的每页长度为 4K。映射表包含三种类型的页：bmap 控制页、dmap 控制页和 dmap 页。 



　　每个 dmap 包含表示每个聚集块的一位。第 i 位表示第 i 个逻辑聚集块的分配状态。它由 struct dmap_t 的 jfs_dmap.h 文件定义。每个 dmap 页包括 8K 的聚集块。 



　　因为块分配映射表可能有许多 dmap 页，它们由 dmap 控制页组织。这些页改进了查找空闲块的大盘区的性能。聚集的大小将决定需要多少页和多少层。至多有三层，它允许的聚集块的最大尺寸是 2(43)。如果不是所有层都需要，块映射表 inode 是每个没有使用层的第一页有“洞”的稀疏文件。



　　JFS 使用提交策略确保控制数据可靠更新。可靠更新意味着一旦系统出错时，要维持一致的 JFS 结构和资源分配状态。为了保证块分配映射表是一致状态，JFS 维护 dmap 结构中的两张映射表，工作映射表和持续映射表。工作映射表记录当前分配状态。持续映射表记录提交的分配状态，由磁盘上找到的或 JFS 日志或提交的 JFS 事务内的记录描述的分配状态组成。当释放聚集块时，首先更新永久映射表。当分配聚集块时，首先更新工作映射表。位值为 0 表示空闲资源，值为 1 表示已分配资源。



　　块分配映射表的 dmap 控制页包含与 dmap 结构中树相似的树，除叶层包含 1024 个元素外。dmap 控制页由 struct dmapctl_t 定义。可在 jfs_dmap.h.文件中找到它。 



　　要注意，dmap 结构中的这一字段是一个平面数组，但它表示图中显示的树。树跟踪除最底层之外的每层上连续块的最大号。树的最底层，从树 [85] 到树 [341]，包含下面描述的工作映射表的二进制搭档表示法。树的其它层包含来自下一较低层的四个部分的最大数目相连空闲块。 



　　二进制搭档系统用来完成每个摘要树的叶层。通过首先为位图的每个字获得空闲位的最长二进制搭档字符串而形成 dmap 结构的树。字符以 2 的幂编码，-1 用来表示已分配全部。



　　然后，使用二进制搭档系统完成树的叶。通过取得从指定索引开始、只包括其以 2 的幂显示的搭档的最大数目空闲块，可形成此树。



　　请注意，只有完全空闲的字才与其完全空闲的搭档组合。组合时，最右搭档变成 -1，以指示它由另一项所表示。 



　　块分配映射表的 dmap 控制页包含与 dmap 结构中树相似的树，除叶层包含 1024 个元素外。这些元素是树 [0] 为紧跟下面的 1024 个映射表页的二进制搭档表示法。对于 L0 页，它是接下来的 1024 个 dmap 页，对于 L1 页，它是接下来的 1024 个 L0 页，而对于 L2 页，它是接下来 1024 个 L1 页。



　　在块分配映射表的顶部，有映射表控制结构 structdbmap_t 。该结构包含摘要信息，能加快查找比平均空闲空间多的 AG。可在 jfs_dmap.h 中找到该结构。 



　　块分配映射表没有记日志：它能在恢复期间由 logredo 修复，或者由 fsck 重构。在 fsck 或 logredo 后工作和持续映射表，都必需是相同状态。 



　　扩展聚集以增大文件系统 

　　要扩展聚集，JFS 必须确保有足够的页存储块分配映射表, 索引聚集新扩展的块。通常，从现有的聚集分配空间给新增的页，但是如果该聚集空间已满，那就不可能了。所以我们需要解决这种特殊情况。 



　　要解决该问题，通常 JFS 为块分配映射表分配的空间多于索引聚集地址空间所需的空间。每个映射表都有额外页空间用于存放位图，如果该页指向另一层摘要树，则该映射表就需额外页存放所需的摘要信息。这种额外空间使得 JFS 可以在必要时将聚集分为更小的单位，以扩大聚集至所需的大小。扩展聚集，需采取以下步骤：



　　如果现有聚集的空间足以扩展块分配映射表，使其能索引新聚集的所有块，那么，JFS 不做任何特殊处理，将聚集扩展至整个空间。仅当需要考虑聚集将来的扩展时，块分配映射表才需增加额外页。 

　　如果没有足够空间扩展，那么 JFS 仅给聚集扩展块分配映射表中已有额外页所能寻址的块。 

　　至此，JFS 有一些额外的聚集块未在聚集中使用到。JFS 可以用这些聚集块扩大块分配映射表，以继续将聚集扩展至所需大小。JFS 必须谨记将这些额外页放入块分配映射表中。 

　　这个处理过程完全由 vfs_cntl() 处理，对系统的其它部分隐藏。 



　　另一种表示法：二进制编码搭档表示法 

　　块分配映射表也可以用二进制编码搭档系统表示。除了树的叶结点和 dmap 结构不同外，这种表示法的逻辑和物理结构与前一种一样。 



　　struct dmap 定义块分配映射表的最下层。每个 dmap 页包括 8K 的聚集块。 



/*

 *  dmap summary tree

 *

 * dmaptree_t must be consistent with dmapctl_t.

 */

typedef struct {

　　int32　 nleafs;　　　　　　 /* 4: number of tree leafs　　 */

　　int32　 l2nleafs;　　　　　 /* 4: l2 number of tree leafs　　  */

　　int32　 leafidx;　　　　　　/* 4: index of first tree leaf　　 */

　　int32　 height;　　　　　　 /* 4: height of the tree　　　 */

　　int8　　budmin;　　　　　　 /* 1: min l2 tree leaf value to combine*/

　　int8　　stree[TREESIZE];　　　　/* TREESIZE: tree　　　　  */

　　uint8　 pad[2];　　　　　　 /* 2: pad to word boundary　　 */

} dmaptree_t;　　　　　　　　　 /* - 360 -　　　　　　 */





/*

 *  dmap page per 8K blocks bitmap

 */

typedef struct {

　　int32　　　 nblocks;　　  /* 4: num blks covered by this dmap */

　　int32　　　 nfree;　　　　/* 4: num of free blks in this dmap */

　　int64　　　 start;　　　　/* 8: starting blkno for this dmap  */

　　dmaptree_t  tree;　　　　 /* 360: dmap tree　　　　　　　　　 */

　　uint8　　　 pad[1672];　　/* 1672: pad to 2048 bytes　　　　  */

　　uint32　　  wmap[LPERDMAP];　 /* 1024: bits of the working map　　*/

　　uint32　　  pmap[LPERDMAP];　 /* 1024: bits of the persistent map */

} dmap_t;　　　　　　　　 /* - 4096 -　　　　　　　　　　　　 */



　　二进制编码搭档系统的每一项都有三个字段： type , size 和 bitmap 。 type 字段表示块空闲、已分配、用位图表示或不由该字段表示 (don't care)。如果类型是"don't care"则这些块由左搭档表示， size 字段忽略。如果 type 是位图，则位图字段的 32 位和 32 块一一对应，表示其空闲或已分配。位值 0 表示空闲块，1 表示块已分配。size 是 2 的幂次方，表示该项描述的聚集块的个数。 



　　对于每个全空闲项，如果其相同大小的左搭档也完全空闲，则右搭档设为"don't care"类型，且右搭档的空间合并入左搭档。当分配块时，仅当搭档分配在同一盘区才合并。必须维护"don't care"类型，以便 logredo 修正映射表。 



　　结构 dmap 包含一个摘要树。其它每个映射层都包含一个摘要树。摘要树提高了查找空闲块大盘区的性能。摘要信息足以判断 dmap 页是否有足够的空闲位，这样就无需查看 dmap 页，从而可以避免无效搜索。



　　要注意，dmap 结构中的这一字段是一个平面数组，但它表示图中显示的树。树的每一层都索引最大数目个相邻的块。树的最底层，树[21]至树[84]，映射至工作映射表中的二进制编码搭档表示。树的其它层包含来自下一较低层的四个部分的最大数目相连空闲块。块分配映射表的其它层可能有一个相似的树，除了叶节点层有 1024 个元素。这些元素映射至树[0]的二进制编码搭档表示，树[0]指向后面的 dmap 页。 



　　如果要合并的四个都为"don't care"类型，则合并项大小标记为 -1。这些项的搭档项负责标记正确的状态。



　　inode 分配

　　动态 inode 分配机制中，inode 号不再直接映射至聚集中特定的逻辑磁盘块，所以要支持下列三种操作，需要定义新的数据结构：



　　正向查找: 给定 inode 号，找到磁盘上的 inode 。文件查找是一种典型的正向查找。 

　　反向查找：给定分区磁盘号（更确定，则给定分配组号），查找邻近的空闲 i-结点。分配新 inode 就属于这种情况，JFS 尽量查找物理上邻近所选分配组的 inode （以便，例如, 同一子目录的文件其 inode 都是相邻的）。 

　　空闲 inode 号查找：要分配新的 inode 盘区，先要找到 32 个相邻的、未分配给相应 inode 盘区的 inode 。当所有已分配的 inode 都在使用，或当 JFS 需要给分配组分配 inode 但以前从未分配过 inode 时，或当一个分配组中没有空闲 inode 时，需要分配新的 inode 盘区。 

　　注意动态 inode 分配的一种微妙效应：相邻 inode 号在磁盘上未必相邻：inode N+32 可以和 inode N 相隔任意远。然而，相隔很远的 inode 号在磁盘上可以是紧邻的；所以，inode N+K 和 inode N 紧邻在理论上是可能的（即使 K>1）



　　inode 分配映射表 

　　inode 分配映射表解决正向查找问题。聚集和每个文件集都有一个 inode 分配映射表，该表是一个 IAG（inode 分配组）的数组。IAG 是 inode 分配映射表的数据。对于聚集，inode 分配映射表映射的 inode 也称为聚集 inode 表。对于文件集，inode 分配映射表映射的 inode 也称为文件 inode 表。 



　　每个 IAG 大小为 4K，描述磁盘上 128 个物理 inode 盘区。由于每个 inode 盘区包含 32 个 inode ，所以每个 IAG 描述 4096 个 inode 。IAG 可以位于聚集的任意位置。IAG 的所有 inode 盘区位于一个分配组，由此 IAG 和 AG 绑定在一起直至释放所有的 inode 盘区。任意 AG 可以分配空间给一个 inode 盘区，然后该 IAG 就与那个 AG 绑定。IAG 由 struct iag_t 定义（见 jfs_imap.h)。 



/*

 *  inode allocation group page (per 4096 inodes of an AG)

 */

typedef struct {

　　int64　 agstart;　　/* 8: starting block of ag　　  */

　　int32　 iagnum;　　 /* 4: inode allocation group number　　 */

　　int32　 inofreefwd; /* 4: ag inode free list forward　　*/

　　int32　 inofreeback;　　/* 4: ag inode free list back　　　 */

　　int32　 extfreefwd; /* 4: ag inode extent free list forward */

　　int32　 extfreeback;　　/* 4: ag inode extent free list back　　*/

　　int32　 iagfree;　　/* 4: iag free list　　　　 */



　　/* summary map: 1 bit per inode extent */

　　int32　 inosmap[SMAPSZ];/* 16: sum map of mapwords w/ free inodes;

　　　　　　　　 *  note: this indicates free and backed

　　　　　　　　 *  inodes, if the extent is not backed the

　　　　　　　　 *  value will be 1.  if the extent is

　　　　　　　　 *  backed but all inodes are being used the

　　　　　　　　 *  value will be 1.  if the extent is

　　　　　　　　 *  backed but at least one of the inodes is

　　　　　　　　 *  free the value will be 0.

　　　　　　　　 */

　　int32　 extsmap[SMAPSZ];/* 16: sum map of mapwords w/ free extents */

　　int32　 nfreeinos;  /* 4: number of free inodes　　　　*/

　　int32　 nfreeexts;  /* 4: number of free extents　　　　　　　 */

　　　　　　　　/* (72)　　　　　　　　　　　　　　　　　　*/

　　uint8　 pad[1976];  /* 1976: pad to 2048 bytes　　　　　　　　 */

　　/* allocation bit map: 1 bit per inode (0 - free, 1 - allocated)　 */

　　uint32  wmap[EXTSPERIAG];　 /* 512: working allocation map　　 */

　　uint32  pmap[EXTSPERIAG];　 /* 512: persistent allocation map  */

　　pxd_t　 inoext[EXTSPERIAG]; /* 1024: inode extent addresses　　*/

} iag_t;　　　　　　　　　　/* (4096)　　　　　　　　　　　　  */



　　inode 分配映射表最前面 4k 大小的页是控制页。该页包含 inode 分配映射表的摘要信息。 dinomap_t 结构的定义见 jfs_imap.h。 



　　逻辑上，inode 分配映射表是动态可扩展的 IAG 结构的数组：



　　struct iag inode_allocation_map [ 1.. N ];

 

　　物理上，inode 分配映射表本身是聚集内的一个文件。聚集 inode 分配映射表由聚集 self-node 描述。文件集 inode 分配映射表由文件集 inode 描述。页空间的分配和释放依据 B+ 树索引需要进行。B+ 树的键是 IAG 页的字节偏移量。



　　JFS 使用提交策略确保控制数据可靠更新。可靠更新意味着一旦系统出错时，要维持一致的 JFS 结构和资源分配状态。为确保 inode 分配映射表的一致性，每个 IAG 都同时维护两个映射表，工作映射表和持续映射表。工作映射表记录当前分配状态。持续磁盘记录递交的分配状态，包括磁盘上记录的分配状态或是 JFS 日志中提交的 JFS 事务记录描述的分配状态。



　　映射表中的每一位记录相应 inode 是空闲还是已分配的。位值 0 表示 inode 空闲，1 表示 inode 已分配。IAG 的每一个控制区内都有一个摘要映射表，用以提高查找空闲 inode 的性能。摘要映射表映射到 IAG 的工作位图。摘要映射表使用一位映射工作映射表的相邻 32 位。每一位表示相应的 inode 可用(0)，或相应的 inode 不可用(1)。（如果没有已分配的盘区，那么该 inode 摘要映射位为 1，表明没有可用的 inode ，）



　　IAG 还包含 inode 盘区描述符，该描述符描述相应的 inode 盘区。每个 IAG 有 128 个描述符。IAG 的每个控制区内都有一个摘要映射表，用于改进空闲 inode 盘区查找的性能。摘要映射表用一位映射一个 inode 盘区。0 表示空闲的 inode 盘区，1 表示已分配的 inode 盘区。



　　如果给定 inode 号，用 inode 分配映射表，通过以下步骤，可以找到 inode 的物理位置：



　　1. 找到描述该 inode 的 IAG。需要找到 inode 分配映射表在 B+ 树中的键（字节偏移量）。



　　iag key = ((Inode number / Inodes per iag) * Inodes per iag) +  4096　　 (EQ 1)



　　2. 查找已找到的 IAG 中引用的 inode 。这可用于在 IAG 工作映射表和持续映射表中索引。



　　iag inode index = (Inode number) mod (Inodes per iag)　　　　　　　　　　(EQ 2)



　　3. 查找 IAG 中的 inode 盘区描述符，该描述符描述包含指定 inode 的 inode 盘区。



　　inode extent descriptor  = (iag inode index) / (Inode per inode extent)  (EQ 3)



　　4. 要找的 inode 位于找到的 inode 盘区内、适当的偏移量处。



　　inode offset = ((iag inode index) mod (Inodes per inode extent)  

　　　* sizeof dinode)　　　　　　　　　　　　　　　　　　　　　　　　　　　 (EQ 4)



　　inode 分配映射表本身由聚集 inode 表中文件集的分配映射表 inode 描述。 



　　通过前面介绍的公式，将 inode 号，#9157，转换成一个偏移量：



iag key = ((inum / num_inodes_per_iag ) * (num_inodes_per_iag )) + 4096

　　　　　　　　　　　　　　　　　　= ((9157 / 4096) * 4096 ) + 4096

　　　　　　　　　　　　　　　　　　= 12288

iag inode index = inum mod num_inodes_per_iag

　　　　　　　　　　　　　　　　　　= (9157 mod 4096 )

　　　　　　　　　　　　　　　　　　= 965

inode extent descriptor = iag_inode_index / num_inodes_per_extent

　　　　　　　　　　　　　　　　　　= 965 / 32

　　　　　　　　　　　　　　　　　　= 30

inode offset　　 =  (iag_inode_index mod num_inodes_per_extent)

　　　　　　　　　　　　　　　　　　　　　 * sizeof dinode

　　　　　　　　　　　　　　　　　 = (965 mod 32) * 512

　　　　　　　　　　　　　　　　　 = 5 * 512

　　　　　　　　　　　　　　　　　 = 2560



　　为简化 JFS 维护命令，及便于理解布局策略的动态性，inode 分配映射文件盘区的大小总为 4KB。



　　当新文件集创建时，必须分配一个 IAG 以及第一个 inode 盘区，以处理文件集的元数据文件。（即，保留的 inode 和根目录 inode ）。



　　AG 空闲 inode 列表 

　　AG 空闲 inode 列表解决反向查找问题。为减少扩展和缩减聚集的系统开销，JFS 设定每个聚集允许的最大 AG 数。所以，AG 空闲 inode 列表头的个数是固定的。列表头在 inode 分配映射表的控制页中。表的第 i 项是一个双向列表的头，表的第 i 项是一个双向列表的头，该双向列表是第 i 个 AG 中的所有包含空闲 inode 的 inode 分配映射表项(IAG)的集合。IAG 号作为列表索引。-1 表示列表尾。每个 IAG 控制区都包含指向该列表的正向和反向指针。 



　　AG 列表从表头开始插入。当分配新的 inode 盘区，或当因盘区占满而删除一个 inode 时，会有插入操作。当一个 IAG 所有的 inode 盘区都满时，从列表中删除该 IAG。



　　注意 AG3 中的 IAG 没有任何相应的 inode 盘区可供分配。所以，这些 inode 未在 AG 空闲 inode 列表中表示。 



　　此表没有记日志；但可以在恢复时由 logredo 恢复，或由 fsck 重建。AG 空闲列表结构定义是 struct dinomap_t，见 jfs_imap.h 文件。 



6

　　AG 空闲 inode 盘区列表 

　　AG 空闲 inode 盘区列表有助于解决反向查找问题以及空闲 inode 号查找问题。这使得 JFS 能找到下一个空闲盘区所在的 IAG 号和 AG 号。（实际是给出了空闲 inode 号。）每个文件集的每个 AG 都有一个AG 空闲 inode 盘区列表。为减少扩展和缩减聚集的系统开销，JFS 设定每个聚集允许的最大 AG 数。所以，AG 空闲 inode 盘区列表头的个数是固定的。列表头在 inode 分配映射表的控制页中。表的第 i 项是一个双向列表的头，该双向列表是第 i 个 AG 中所有包含空闲 inode 的 inode 分配映射表项（IAG）的集合。IAG 号作为列表索引。-1 表示列表尾。每个 IAG 控制区都包含指向该列表的正向和反向指针。 



　　当盘区中所有的 inode 都已删除，则释放该 inode 盘区的磁盘块。当 IAG 的一个 inode 盘区被删除时，该 IAG 插至所属的 AG 空闲 inode 盘区列表的表头。当创建新的 IAG，并分配一个 inode 盘区时，该 IAG 号插至 AG 空闲 inode 盘区列表的表头。当 IAG 的所有 inode 盘区分配完时，从列表中删除该 IAG。当释放 IAG 的所有 inode 盘区时，从列表中删除该 IAG 同时加到IAG 空闲列表中。当 AG 需要分配 inode 盘区时, 则使用 AG 空闲列表头上的第一项。



　　此表没有记日志；但可以在恢复时由 logredo 恢复，或由 fsck 重建。 



　　表的结构定义见 jfs_imap.h, struct dinomap_t . 



　　IAG 空闲列表 

　　IAG 空闲列表有助于查找空闲 inode 号。这使得 JFS 不用查看相应分配的 inode 盘区就可找到 IAG。（实际时给出了空闲 inode 号）。聚集和其每个文件集都有自己的链表。该列表的每个项指向一个 IAG 链表。IAG 号作为列表索引。-1 表示列表尾。当删除盘区的所有 inode 时，则释放该 inode 盘区的磁盘块。如果某个 IAG 的所有 inode 都为空闲，则该 IAG 号插入 IAG 空闲列表头。当需要分配新的 inode 盘区，而该 AG 中又没有包含空闲盘区的 IAG，则使用 IAG 空闲列表头的第一项（即从表中删除）。inode 盘区分配描述符一经分配就不再删除。inode 盘区的地址设为 0x0。 



　　对于聚集 IAG 空闲列表头是聚集自用 inode 的一个字段。对于每个文件集 IAG 空闲列表头是文件集分配映射表 inode 的一个字段。该列表没记日志；但可在恢复时由 logredo 修复，或由 fsck 重建。 



　　IAG 空闲列表的结构定义 struct inomap_t 在文件 jfs_dinode.h 中。 



　　下一个空闲 IAG 

　　下一个空闲 IAG 计数器有助于查找空闲 inode 号。使得 JFS 能找到下一个可以分配的 IAG 的 iag号。（实际是让 JFS 找到空闲 inode 号）。聚集和其每个文件集都有自己的计数器。计数器在 inode 分配映射表的控制页中。IAG 一经分配就不再删除。 



　　文件集分配 inode

　　文件集 inode 表中的文件集分配映射表 inode 是特殊类型的 inode 。既然这些节点表示文件集，则可以说是文件集的“父 inode ”。这些节点包含文件集特定信息，而不是一般的 inode 数据。同时也记录文件集 inode 分配映射表在 B+ 树中的位置。结构定义 struct dinode 见文件 jfs_dinode.h 



　　文件

　　文件由包含一个 B+ 树根的 inode 表示，B+树描述包含用户数据的盘区。B+ 树以盘区的偏移量作为索引。



　　符号链接

　　符号链接由一个 inode 表示，该 inode 的 di_mode 字段设置为符号链接模式 (S_IFLNK)。如果 inode 内有空间，则链接文件的整个路径直接存储在 inode 中。否则，将作为 inode 的数据存于盘区中（通过该 inode 的 B+ 树索引）。 



　　目录

　　目录是 JFS 中日志化的元数据文件。目录由目录项组成，目录项表示目录中包含的对象。目录项将名字和 inode 号连接在一起。特定的 inode 描述特定名字的对象。为提高目录项定位的性能，B+ 树采用按名排序。



　　目录 inode 的 di_size 字段仅表示目录 B+ 树的叶子页。如果 inode 中包含目录的叶节点，则 di_size 字段为256。 



　　目录中没有特定项表示自身 (".") 和父目录 ("..")。而在 inode 中表示。自身就是目录自己的 inode 号。父目录是 inode 中的特殊字段， idotdot，struct dtroot_t ，见文件 jfs_dtree.h。 



　　目录 inode 包含 B+ 树的根，处理方法和一般文件类似。只是目录 B+ 树以名为键。目录 B+ 树的叶节点包含目录项，且以目录项的全名作为键值。目录 B+ 树最下层内部节点使用后缀压缩。其它内部节点采用相同的压缩后缀。后缀压缩将名字缩至最短，正好足以区分当前目录项和前一目录项。



　　由于 B+ 树项的大小是可变的，JFS 需要处理这些项的方案。JFS 想要避免在删除一项时引起的项移动，平均一项有2K的数据。



　　B+ 树节点的内容： 



　　固定个数的目录槽，个数取决于节点的大小。这些槽用于存储目录槽数组和目录项或路由项。目录槽的大小总是 32 字节。固定大小的目录槽使得 JFS 在删除目录项不必移动，从而还避免了内部碎片。 

　　一个目录 B+ 树的头，描述 B+ 树 inode 。此部分包含一个标志，标记节点是内部节点或是叶节点, 及是不是 B+ 树的根节点。还包含自身的块地址。 nextindex 字段记录目录槽数组中的最后一项。 stblindex 字段记录目录槽数组的开始位置。 freelist 字段指向该节点中空闲槽列表头。 

　　一个目录槽数组，它是正使用的目录槽索引的有序数组。使用该数组减少了目录项增删时所需的移动次数。数组比项本身小很多，所以移动的只是数组而不是整个项。在数组中，可以用二分法搜索某个目录项。 

　　一个目录 B+ 树槽空闲列表，使得内部碎片最小化。目录 B+ 树的头包含列表表头，每个空闲目录槽指向列表中的下一个空闲槽。如果有一系列相连的空闲槽，则在第一个槽中设立一个计数值，说明该系列的长度。这有利于在新建目录 B+ 树节点时，进行快速初始化。 

　　一个目录项，将名字链接到一个 inode 号。目录项包含在叶节点的目录槽中。如果需要存储整个目录名，目录项可以有附加槽。目录项的 next 字段表明该项是否有后继项。大多数目录项只有单个槽。 

　　一个路由项，用于记录目录 B+ 树的搜索路径。路由项包含在内部节点的目录槽中。路由项将按后缀压缩的路由键映射到盘区，此盘区包含下一层目录 B+ 树的内部节点或叶节点。如果路由项需要记录整个的路由键，则可以有附加槽。路由项的 next 字段表示该项是否有后继项。大多数路由项只有单个槽。 

　　目录 B+ 树中的内部节点或叶节点是 4K 大小的页。由于许多目录都不是很大，所以这种方式对大多数目录来说是很浪费磁盘空间的。所以目录的初始叶节点采用以下分配方案：



　　初始目录项存储在目录嵌入数据区中。 

　　当目录 inode 的嵌入数据区填满时，JFS 分配一个叶节点，大小和聚集块的尺寸一样。 

　　当初始叶节被占满，而大小又不到 4k，则倍增节点大小。首先在当前盘区中扩增；如果没有足够空间，则需分配新的盘区，然后将旧盘区的数据复制到新盘区。目录槽数组仅够存放页未扩时的槽，所以必须创建新的槽数组。从新分配的数组起始处使用槽，并将旧的数组数据复制到新的位置。更新指向该数组的头指针，并将旧数组中的槽添加到空闲列表中。 

　　如果叶节点再次填满，而大小仍不足 4K，重复步骤 3。一旦叶节点达到 4K 则分配新叶节点。初始节点后的每个叶节点，一开始就分配 4K。 

　　当叶子页的所有项都释放，则从 B+ 树中删除该页。仅当目录中所有目录项都已删除，目录又缩回 inode 。 



　　访问控制列表 (ACL)

　　JFS 的每个 inode 都有不同的访问控制列表 (ACL)。ACL 可以表示不同的项，例如许可权、用户标识符、或组标识符。聚集 inode 的 ACL 字段是没有用的。



　　虽然在磁盘上和内存中 ACL 的表示方式没有规定，但从 DFS 外部所看到的“外部”表示是固定的。ACL 大小的唯一限制是其外部表示必须适合 8192 字节大小的 dfs_acl 结构。 



　　任意 JFS 对象都可有一个管理该对象存取的 ACL；这种 ACL 称为常规 ACL。目录对象在创建时可能用到两个关联的可选 ACL；初始目录 ACL和初始文件 ACL。初始 ACL 的作用范围是目录中的所有文件。



　　ACL 体系结构未指定 ACL 的存储方式，但建议 ACL 有字段标识或命名其辅助对象，这样通过简单的等同性检查就可以检测到文件集中的共享关系。因此，JFS 在每个文件集中用一个文件（ACL 文件）存储文件集的 ACL；文件集 inode 1 就是 ACL 文件。文件集中的每个 inode 在 ACL 文件中存放一个索引。



　　ACL 文件需要一个存储 ACL 空闲区域的位图。ACL 文件有一个 4K 大小的位图，标识 8M 的 ACL 项，如有必要可扩增。位图中的一位代表 256 字节连续磁盘空间；位图不描述自身的状态。



　　ACL 文件的数据未日志化。



　　扩展属性(EA)

　　扩展属性是附加到 JFS 对象适用存储和存取的机制。EA 连续存储在扩展属性空间 (EAS) 中，空格存储 EAS 由 JFS 对象 inode 的 EA 描述符定义。EA 描述符只是一个盘区描述符，定义见 jfs_types.h, struct dxd_t 。 



　　EA 可以存放在 inode 内，或存放在单独盘区内。EA 描述符的标志字段指示存储的方式。由于此空间也可用于存放文件 xtree 附加的 xad 项，所以 inode 的 di_mode 字段指明该空间是否可用。如果该字段值为 INLINEEA，则表明空间可用。



　　如果 EA 存于 inode 内，则忽略 EA 描述符的 offset 和 length 字段。EA 描述符的大小表示数据的字节数。



　　如果 EA 存于盘区内，EA 描述符将描述该盘区。JFS 不希望 EA 数据太大，所以 JFS 不支持每个 inode 有多于一个盘区的 EA 数据。



　　EA 项包括 EA 名称和其值。要访问某个 EA，JFS 只是线性搜索 EA 数据。



　　EA 数据未日志化，但它是写同步的（即数据不是旧数据，就是新数据，但绝不可能是部分更新的数据）。JFS 在日志中记录 EA 数据的位置。嵌入 EA 数据是日志化的。



　　流

　　流用于将数据连接到一个文件或目录。这种附加数据和目录数据相似，都可按名引用。在第一版中不支持流，在这里讨论仅为元数据结构的完整性。



　　磁盘 inode 的四部分的第二部分有一个字段描述流描述符。由于附加到一个对象的流数目是可变的，所以流描述符是一个 inode 号，以允许流增加或缩减。流描述符 inode 指向的数据称为流列表。



　　流没有关联的扩展属性，所以从不使用流的 inode 四部分的最后一个部分-扩展属性。实际上该部分用于附加的流项。B+ 树的数据如同目录项。每个流都有自己的 inode ，它们依次记录流数据存放的数据块地址。



　　结束语



　　JFS 小组最重要的目标是创建可靠的，高性能的文件系统。本文讨论了 JFS 磁盘布局结构，以及实现可伸缩性、可靠性和高性能的机制。同时详细探讨了 JFS 如何在整个文件系统中使用 B+ 树提高文件系统操作

你可能感兴趣的:(文件系统)

第六集如何安装CentOS7.0，3分钟学会centos7安装教程 date分享
从光盘引导系统按回车键继续进入引导程序安装界面，选择语言这里选择简体中文版点击继续选择桌面安装下面给系统分区选择磁盘，点击完成选择基本分区，点击加号swap分区,大小填内存的两倍在选择根分区，使用所有可用的磁盘空间选择文件系统ext4点击完成，点击开始安装设置root密码，点击完成设置普通用户和密码，点击完成整个过程持续八分钟左右根据个人配置不同，时间长短不同好，现在点击重启系统进入重启状态点击本
docker igotyback eureka 云原生
Docker容器的文件系统是隔离的，但是可以通过挂载卷（Volumes）或绑定挂载（BindMounts）将宿主机的文件系统目录映射到容器内部。要查看Docker容器的映射路径，可以使用以下方法：查看容器配置：使用dockerinspect命令可以查看容器的详细配置信息，包括挂载的卷。例如：bashdockerinspect在输出的JSON格式中，查找"Mounts"部分，这里会列出所有的挂载信息
光盘文件系统 (iso9660) 格式解析穷人小水滴光盘文件系统 iso9660 deno GNU/Linux javascript
越简单的系统,越可靠,越不容易出问题.光盘文件系统(iso9660)十分简单,只需不到200行代码,即可实现定位读取其中的文件.参考资料:https://wiki.osdev.org/ISO_9660相关文章:《光盘防水嘛?DVD+R刻录光盘泡水实验》https://blog.csdn.net/secext2022/article/details/140583910《光驱的内部结构及日常使用》ht
Python多线程实现大规模数据集高效转移 sand&wich 网络 python 服务器
背景在处理大规模数据集时，通常需要在不同存储设备、不同服务器或文件夹之间高效地传输数据。如果采用单线程传输方式，当数据量非常大时，整个过程会非常耗时。因此，通过多线程并行处理可以大幅提升数据传输效率。本文将分享一个基于Python多线程实现的高效数据传输工具，通过遍历源文件夹中的所有文件，将它们移动到目标文件夹。工具和库这个数据集转移工具主要依赖于以下Python标准库：os：用于文件系统操作，如
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
linux挂载文件夹小码快撩 linux
1.使用NFS（NetworkFileSystem）NFS是一种分布式文件系统协议，允许一个系统将其文件系统的一部分共享给其他系统。检查是否安装NFSrpm-qa|grepnfs2.启动和启用NFS服务假设服务名称为nfs-server.service，你可以使用以下命令启动和启用它：sudosystemctlstartnfs-server.servicesudosystemctlenablenf
nfs服务搭建 GHope
nfs是什么？基哥度娘网络文件系统(NFS)是sun微系统最初开发的分布式文件系统协议,[1]允许客户端计算机上的用户通过计算机网络访问文件很像本地存储被访问。NFS与许多其他协议一样,在开放网络计算远程过程调用(很久以前RPC)系统上建立。NFS是在请求注释(RFC)中定义的开放标准,允许任何人实现协议。NFSNFS优势：节省本地存储空间，将常用的数据存放在一台NFS服务器上且可以通过网络访问，
⭐Unity 安卓环境中正确地读取和处理 XML 文件惊鸿醉 Unity unity android xml
写了一个选择题Demo，电脑包和编辑器内无问题，但是打包安卓手机之后题目无法正常使用，想到的是安卓环境中正确地读取文件的问题改进方案：1.由于XmlDocument.Load方法在Android上的路径问题（由于文件位于APK内部，无法像在文件系统中那样直接访问），需要先使用UnityWebRequest来异步加载文件内容，然后再解析XML。2.异步处理：修改你的代码，以支持异步文件加载和处理，这
pnpm解說白总Server 服务器 kubernetes 网络运维云原生 python java
pnpm（PerformanceNodePackageManager）是一个高性能的Node.js包管理器，它旨在解决npm和yarn在处理依赖关系时可能遇到的一些问题，如重复安装相同版本的包、包的存储空间占用过大等。pnpm使用了一种称为“硬链接”和“符号链接”的文件系统技术，这使得它能够以更高效的方式存储和管理依赖项。关键特点：高效存储：pnpm使用一种称为内容可寻址存储（ContentAdd
鸿萌数据恢复服务：Mac 文件系统是如何影响 Mac 数据恢复的? 鸿萌数据安全 macos mac数据恢复
天津鸿萌科贸发展有限公司从事数据安全服务二十余年，致力于为各领域客户提供专业的数据备份、数据恢复解决方案与服务，并针对企业面临的数据安全风险，提供专业的相关数据安全培训。公司是多款国际主流数据恢复软件的授权代理商，为数据恢复公司、数据取证机构及有专业技能的个人或企业提供官方正版软件产品。文章内容：1.什么是文件系统?2.Mac文件系统的类型3.了解各种Mac文件系统4.在Mac上恢复被删除或丢失的
Tuxera NTFS for Mac破解版下载 Tuxera NTFS for Mac2023激活码 mac电脑ntfs磁盘软件雨林谷果粉俱乐部 macos 电脑免费的NTFS软件
TuxeraNTFSforMac是一款优秀的Mac系统完全读写软件，提供Fat32、NTFS、Exfat、macos扩展格式的转换，稳定性好，传输速度极快。TuxeraNTFSforMac功能丰富，能修复NTFS卷、创建NTFS磁盘映像、创建NTFS分区等等。同时软件支持所有从OSX10.4Tiger开始的Mac平台，TuxeraNTFS还可以无阻碍地使用各种文件系统磁盘，还能解决磁盘无法正常显示
windows 列出文件的树形结构（tree的用法） abments 办公工具 windows
在Windows操作系统中，tree命令是一个强大的命令行工具，用于以树状结构显示指定路径下的目录和文件。这对于快速查看文件和文件夹的层次结构非常有用，尤其是在大型项目或文件系统中。以下是tree命令的基本用法和一些高级功能：基本用法显示当前目录及其子目录结构：在命令行中输入tree（不带任何参数）将显示当前目录及其所有子目录的结构。显示指定路径下的目录结构：可以通过在tree命令后指定一个路径来
【Mac/Linux终端快捷操作】Finder移动/复制/合并文件 TUTO_TUTO 终端快捷操作 linux macos 运维学习笔记
【注】所有使用相对路径的方法都需要：使用cd命令导航到指定文件夹目录（cd空格把文件夹直接拖进终端）补充在终端中使用cd命令导航文件系统:cd/full/path/to/folder进入特定文件夹。cdsubfolder进入当前目录的子文件夹。cd..返回上一级目录。cd或cd~返回主目录。注意:可以使用Tab键自动补全文件夹名1.多个txt文件中的内容合并成一个txt文件使用相对路径：cat./
掌握检索技术：构建高效知识检索系统的架构与算法23 是小旭啊人工智能
在检索专业知识层需要涵盖更高级的检索技术，包括工程架构和算法策略。一、工程架构工程架构在构建检索系统中决定了系统的可扩展性、高可用性和性能。比如需要考虑的基本点：分布式架构：水平扩展：采用分布式架构，将检索任务分布到多个节点上，实现水平扩展。这可以通过将索引数据分片存储在不同的节点上，并使用分布式文件系统或对象存储来存储大规模的索引数据。任务分配：设计任务调度器，负责将查询请求分配到空闲的节点上进
掌握检索技术：构建高效知识检索系统的架构与算法21 是小旭啊人工智能
在检索专业知识层需要涵盖更高级的检索技术，包括工程架构和算法策略。一、工程架构工程架构在构建检索系统中决定了系统的可扩展性、高可用性和性能。比如需要考虑的基本点：分布式架构：水平扩展：采用分布式架构，将检索任务分布到多个节点上，实现水平扩展。这可以通过将索引数据分片存储在不同的节点上，并使用分布式文件系统或对象存储来存储大规模的索引数据。任务分配：设计任务调度器，负责将查询请求分配到空闲的节点上进
【HDFS】角色的架构设计流辉fglow #HDFS 大数据 hdfs hadoop 大数据学习分布式
HDFS角色的架构设计前置知识：Windows与Linux文件系统的差异HDFS中的角色及功能HDFS的架构NameNodeDataNodeNameNode元数据的持久化说明：/表示两个词是同一语义，方便你理解的前置知识：Windows与Linux文件系统的差异Windows&LInux虽然都有硬盘/分区、目录，但感受很不同的是：Windows：有很强的分区概念，要先通过不同的“盘符”去找文件在命
Hadoop常见面试题整理及解答叶青舟 Linux hdfs 大数据 hadoop linux
Hadoop常见面试题整理及解答一、基础知识篇：1.把数据仓库从传统关系型数据库转到hadoop有什么优势？答：（1）关系型数据库成本高，且存储空间有限。而Hadoop使用较为廉价的机器存储数据，且Hadoop可以将大量机器构建成一个集群，并在集群中使用HDFS文件系统统一管理数据，极大的提高了数据的存储及处理能力。（2）关系型数据库仅支持标准结构化数据格式，Hadoop不仅支持标准结构化数据格式
故障恢复（残次版） Cat God 007 备忘录服务器数据库运维
视频地址一：文件系统故障修复案例模拟搞坏磁盘中的某一块ddif=/dev/zeroof=/dev/sdb1bs=1kcount=10(默认4K)1.修补分区中每个组中坏掉的超级块部分查看超级块的备份块dumpe2fs磁盘位置如：dumpe2fs/dev/sdb1使用备份超级块进行修复（超级块的备份块有几份，默认最近，可能最近的备份块可能修复不了，可以制定其他备份块进行恢复{组0，1{32768}，
使用Python通过字节串或字节数组加载和保存PDF文档 Eiceblue Python PDF python pdf 开发语言 pycharm visual studio code
处理PDF文件的可以直接读取和写入文件系统中的PDF文件，然而，通过字节串（bytestring）或字节数组（bytearray）来加载和保存PDF文档在某些情况下更高效。这种方法不仅可以提高数据处理的灵活性，允许开发者在内存中直接操作PDF，而且还能增强安全性，同时方便跨应用传输和网络传输。本文将介绍如何使用Python通过字节串或字节数组来加载和保存PDF文档。文章目录创建PDF文档并保存为字
mysql整体架构描述问道飞鱼数据库相关技术 mysql 架构数据库
文章目录数据库架构示意图1.连接层2.服务层3.存储引擎层4.文件系统层5.系统层主要特性数据库文件格式InnoDB存储引擎文件类型及用途MyISAM存储引擎文件类型及用途其他文件类型文件内容示例表结构文件示例(`.frm`)InnoDB数据文件示例（`.ibd`）MyISAM数据文件示例（`.MYD`）SQL脚本文件示例（`.sql`）数据库内存结构示意图MySQLServer层面的内存结构In
Linux格式化命令 sky wide linux 运维服务器
Linux格式化命令：格式化硬盘成ext4文件系统：mkfs.ext4/dev/sdb1格式化硬盘成NTFS文件系统：mkfs.ntfs/dev/sdb1格式化U盘成FAT32文件系统：mkfs.vfat-F32/dev/sdc1格式化U盘成exFAT文件系统：mkfs.exfat/dev/sdc1格式化硬盘成XFS文件系统：mkfs.xfs/dev/sdb1格式化硬盘成Btrfs文件系统：mkf
存储课程学习笔记7_fuse库的简单使用（fuse,opencv的demo） yun6853992 dpdk学习 fuse
fuse一般称为用户态度文件系统，可以实现在用户层实现对文件系统的控制。通过fuse内核模块的支持，基于libfuse提供的接口，就可以实现一个文件系统。fuse内核模块实现了与VFS的对接，运行后可以看到/dev/fuse，拦截相关请求，反馈给fuse进程，进行操作。使用fuse进行开发，不用关注内核模块，直接使用libfuse库在用户态实现文件系统即可。0：总结1：fuse的开发，实际上和前面
chmod命令学习2 天南地北飞 linux基础学习学习 linux 服务器
递归地修改权限chmod-R很多Linux命令可以递归地应用于文件和目录，chmod命令也不例外。使用-R（或–recursive）选项能够在短时间内修改数百个文件系统对象的权限。$pwd/home/scott/pictures/libby$ls-lFdrwxrw----2scottscott...by_pool/-rw-r--r--1scottscott...libby_arrowrock.jp
浅谈一下B树 AIGC Ball b树
B树（平衡二叉树）是一种自平衡的二叉查找树，它允许搜索、顺序访问、插入和删除操作在对数时间内完成。B树的关键特性是它可以保持所有叶子节点在同一层，这使得它非常适合用于数据库和文件系统中的索引结构。B树的基本概念节点：B树的每个节点可以包含一个键值对和两个子节点的指针，除了根节点和叶子节点。根节点至少含有一个键，叶子节点包含n个键和n+1个子节点指针（n>1）。键：B树中的键是用于排序和查找的值，每
linux运维常见命令行问道飞鱼运维 linux 服务器
文章目录用户管理创建用户修改用户信息列出用户信息添加用户到组删除用户创建和管理组查看用户和组的信息其他相关命令文件管理文件和目录的基本操作文件权限管理文件压缩和归档磁盘管理查看磁盘使用情况查看文件和目录的磁盘使用情况磁盘分区管理挂载和卸载文件系统磁盘配额管理LVM（LogicalVolumeManager）管理网络管理查看网络接口状态配置网络接口查看和管理路由表管理DNS和主机名网络诊断工具网络流
数据库服务器运维最佳实践 bigbig猩猩数据库运维服务器
数据库服务器运维是确保数据库系统高效、稳定和安全运行的关键环节。随着信息技术的不断发展，数据库系统的规模和复杂性不断增加，对运维工作的要求也越来越高。以下将从硬件选择、操作系统和文件系统优化、数据库版本选择、参数优化、数据备份与恢复、性能监控与调优、安全管理以及高可用性和灾难恢复等方面详细介绍数据库服务器运维的最佳实践。一、硬件选择1.CPU选择多核高主频的处理器是保障数据库性能的基础。数据库服务
消息中间件之ActiveMQ — 07 筑梦之人消息中间件MQ java activemq
集群配置官方文档主备集群官方文档MasterSlaveTypeRequirementsProsConsSharedFileSystemMasterSlave共享文件系统，如SAN需要运行多个slave。当master挂掉之后会自动进行故障恢复需要共享文件系统JDBCMasterSlave共享数据库需要运行多个slave。当master挂掉之后会自动进行故障恢复需要一个共享的数据库。也相对缓慢，因为
大数据分析与安全分析 Zh&&Li 网络安全运维数据分析安全数据挖掘运维数据库
大数据分析一、大数据安全威胁与需求分析1.1大数据相关概念发展大数据：是指非传统的数据处理工具的数据集大数据特征：海量的数据规模、快速的数据流转、多样的数据类型和价值密度低等大数据的种类和来源非常多，包括结构化、半结构化和非结构化数据有关大数据的新兴网络信息技术应用不断出现，主要包括大规模数据分析处理、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和存储系统1.2大数据安全威胁分析“数
【网络安全 | 渗透工具】IIS 短文件名枚举工具—shortscan安装使用教程秋说渗透工具 web安全漏洞挖掘渗透工具
未经许可，不得转载。文章目录shortscan安装使用Shortutil工具shortscanShortScan是一种用于在MicrosoftIIS(InternetInformationServices)Web服务器上进行短文件名枚举的工具。该工具可以帮助攻击者利用IIS的文件名处理特性，通过预测性扫描枚举服务器上的文件和目录名称。背景：在早期的Windows文件系统（如FAT和NTFS）中，每
数据采集与数据预处理（python）概述（一）数学难 python 开发语言
一，数据采集的概念在处理海量事务时，我们经常需要针对特定条件进行数据的精准获取，这一过程被称为数据采集。数据采集的核心在于从多样化的数据存储形式中，根据具体需求进行有针对性的数据提取。这些数据存储形式丰富多样，涵盖了从简单的文本文档到复杂的数据库系统，再到多媒体文件等多个领域。常见的数据存储方式包括：文件系统（FileSystem）：文本文档：TXT,DOC,PDF,XLS(Excel),CSV等
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f