Juicedata

文件系统考古2：1984 - BSD Fast Filing System

今天继续与大家分享系列文章《50 years in filesystems》，由 KRISTIAN KÖHNTOPP 撰写。

我们将进入文件系统的第二个十年，即1984年，计算机由微型计算机发展到了桌面和机柜工作站， BSD Fast Filing System 登场。

回看第一篇： 1974-Unix V7 File System

早期的 Unix 文件系统已经表现得很好，但也存在一些明显的问题。这些问题在操作系统 BSD（Berkeley Software Distribution）中进行了许多修复。 BSD 起源于 20 世纪 70 年代末和 80 年代初，由加州大学伯克利分校的计算机科学系开发和推广。在 Leffler、McKusick 等人撰写的的书中《The Design and Implementation of the 4.3BSD UNIX Operating System》有所记录。

1984 年发表的一篇经典论文《A Fast File System for UNIX》中，可以找到更简明、也更学术的讨论。该论文的作者包括 Marshall McKusick、Bill Joy（当时在Sun公司）、Samuel Leffler（当时在LucasFilm 公司）和 Robert Fabry。该论文提出了一个对 Unix 文件系统的重新实现方案，旨在提升文件系统的吞吐能力、优化存储空间的分配和增强数据访问的局部性。

The hardware

在1984 年，4.3BSD 所针对的计算机是桌面和机柜工作站。这些机器具有 32 位数据寄存器和 32 位地址寄存器。

外部数据和地址总线的大小各不相同：早期的 68k 系列 CPU 总线尺寸较小。但在 1984 年，Motorola 68020 诞生了。它是首款提供完整 32 位宽度总线的 68k 系列，集成了大约 200,000 个晶体管在芯片上。后来，68030 将原本独立的 MMU（内存管理单元）集成到了芯片上，而 68040 则将原本独立的 FPU（浮点运算单元）也集成到了芯片上。

早期的 Sun 工作站，如 Sun-3系列，采用了这些 CPU。但 Sun 公司从伯克利实验性的 RISC 系统中借鉴了设计思路，并于1986年发布了基于 SPARC 架构的 Sun-4 系列工作站。SPARC 架构采取了一些妥协的策略，但运行地很好，在 Sun 公司被 Oracle 收购之前持续得到改进与发展。然而，在之后的发展中 Oracle 先后终止了 SPARC和 Itanium CPU 架构的发展。

Curt Schimmel 在《UNIX Systems for Modern Architectures》一书中讨论了 SPARC 在 MMU、寄存器和内存访问设计上所做的权衡，以及为什么这样做是合理的。与此同时，在1985年，MIPS 架构首次亮相，这是另一系列的 RISC CPU 架构。它也是一个完全的 32位系统，被用于 SGI 工作站。

惠普公司也有另一种 RISC 类型的 CPU，即 PA-RISC，它是“Spectrum”研究计划的产物，在1986 年上市（后来被 Intel 的一款失败产品 Itanium 取代）。

计算机系统领域的先锋公司 DEC自己有 VAX，这是一种具有 CISC CPU 的 32 位机柜式计算机，从 1977 年开始就已经存在。直到 1992 年，他们才转向 RISC 架构，而后采用 Alpha AXP（“DEC Alpha”）架构，完全实现了 64 位。尽管这个架构很有趣，但它的存在时间不长：1998年被康柏公司收购后，该 CPU 停产，其知识产权于 2001 年出售给了英特尔。

总的来说，1984 年的工作站类型系统的主内存容量在几十 MB 左右，运行时的系统时钟频率在几十 MHz 左右。

传统文件系统的短板

在 20 世纪 80 年代，32 位 VAX 系统被用于典型的工作站任务，包括图像处理和 VLSI 芯片设计等工作。当时使用的 Unix 文件系统在处理文件大小、 I/O 速度和文件数量方面出现了结构性问题。此外，只有 512 字节的 I/O 大小大大降低了磁盘子系统的性能。

论文中提到，文件系统的元数据和数据严格分离，即元数据位于文件系统的前部，而实际数据则位于文件系统的后部。这种分离设计有助于提高文件系统的性能和扩展性。

一个150MB 的传统 Unix 文件系统由4MB 的inode（索引节点）和146MB 的数据组成。这种组织方式将 inode 信息与数据分隔开来，因此访问文件通常需要从文件的 inode 到其数据之间进行一次长距离寻道。在一个目录中，文件通常不会被分配到 4MB 的 inode 连续槽位中，这就导致在对目录中多个文件的 inode 执行操作时，需要访问许多非连续的 inode 块。

正是因为这个元数据和数据分离的设计带来的问题，BSD FFS （BSD Fast Filing System) 的一个主要目标是改善文件系统的布局，将元数据和数据更加靠近，将单个目录中的文件存储得更加紧凑，避免文件被分散成小碎片，从而提高加载效率。

碎片化：首先，创建四个文件，每个文件使用两个块。然后删除了文件 B 和 D。接着，空闲的空间被一个占用三个块大小的文件E回收，但是文件 E 被存储在不连续的块中。这导致了小的磁盘寻道和较慢的 I/O 操作。

另一个明确的目标是增加磁盘块的大小。较大的磁盘块在两个方面有助于提高吞吐量：

较大的磁盘块提供了更大的 I/O 单元，因此可以在单个 I/O 操作中传输更多的数据；
较大的磁盘块还允许文件系统在一个间接块中存储更多的文件指针，大大减少了对间接块的访问次数。

该论文引用了一个 Unix 文件系统经过优化后的吞吐量，大约是理论最大值的4%，这是非常低效的。这主要归因于文件的碎片化，即文件中相邻块的非连续存储。对于碎片整理，虽然在 1976 年已经提出，但被认为不可行而被放弃。作者们希望通过在文件的初始存储位置上合理地放置文件来解决这个问题。

BSD FFS 的创新之处

理解柱面组和扇区

BSD FFS 的设计基于对硬盘的物理布局的理解，包括柱面、磁头和扇区（CHS）。它将硬盘分成柱面组，相邻的磁道属于同一个柱面组。

当硬盘旋转时，不同的磁头进入盘片堆中，就像一个梳子。每个磁头在磁盘上标记一个磁道，控制器硬件将该磁道细分为物理磁盘块。所有磁头标记的磁道组成一个柱面。柱面组是一组连续的柱面。（图像来源：OSTEP，第3页）

每个柱面组都是一个传统 Unix 文件系统的迷你版本，包括超级块的副本、自己的本地索引节点区域以及本地索引节点和块使用位图。位图的使用也是新颖的，它们取代了传统文件系统中使用的空闲列表。由于文件系统知道 CHS 布局的信息，它能够确保每个副本的超级块不总是放置在同一盘片上，以提高文件系统对硬盘故障的容错性。

在 RAID（冗余磁盘阵列）论文发表之前几年，根据 Katz 的说法，RAID也是在伯克利开发的，时间为1983/1984年。

Katz 还提到，在那个时候，Stonebraker 一直在开发 Ingres（Postgres的前身），并提到他对低提交延迟的要求推动了改善 FFS 和后来 RAID 磁盘带宽的尝试。然而，对于RAID 分类的正统的研究直到1987年才开始。

许多初创公司和存储公司都将 RAID 论文作为他们开发的基础，其中包括 NetApp 和 EMC（通过Data General的Clariion 磁盘阵列）。

BSD FFS 不仅了解磁盘的 CHS 几何结构，还了解处理器速度和磁盘的旋转速度。这使得它能够配置并在超级块中记录交错因子，以优化磁盘 I/O 吞吐量。

硬盘持续不断地旋转，但是 CPU 需要时间来设置下一次传输。在此期间，磁头可能已经超过了下一个块的起始边界，现在系统需要等待一次完整的旋转才能进行写入。使用适当的交错因子，相邻的块号不会被连续地存储在磁盘上，而是在它们之间交错插入其他块。这给了 CPU 足够的时间来思考和设置下一个块的传输。

CPU速度越快，所需的交错因子就越低。

随着硬盘开始配备集成控制器，并开始隐藏 CHS几何结构，并最终被线性块地址（LBA）取代，所有这些优化相对变得无关紧要。然而，在过去的十到十五年间，这些优化为系统提供了显著的性能优势。

大分块、小片段和尾部合并

在内部，FFS 使用至少4 KB大小的逻辑块。这些逻辑块，通过最多不超过两级间接块可以创建出最大 4GB 的文件。

较大的块可以提高 I/O 速度，但它们也会带来存储开销，因为文件的大小会按块递增。由于 FFS中的逻辑块由多个物理块组成，因此 FFS引入了片段（fragment）的概念，以公开较小的内部物理块。片段表示逻辑块内部的更小存储单位。通过引入片段的概念，FFS 可以更细粒度地管理和利用存储空间。尾部打包（tail packing）是一种技术，可以将多个文件的末尾存储在同一个逻辑块中。在传统的文件系统中，当文件的末尾部分不足以填满一个完整的物理块时，会导致空间浪费。因此，尾部打包的方法可以减少空间浪费。同时，通过利用片段的概念，尾部打包可以尽可能提升存储空间利用率。

为了防止进入片段逐渐增长和不断需要重新布局的阶段，此处系统采用的设计是：系统预先分配空间以填满逻辑块，并且尾部打包仅在文件关闭（即取消预分配）时才会发生。

长距离寻址分配策略

BSD FFS 引入了一系列布局策略，用于控制新目录、新文件的放置以及大文件的处理。全局策略主要关注选择适合的柱面组来存放数据，而本地策略则负责柱面组内的具体放置。
新的文件系统布局采用柱面组。每个柱面组都有自己的 inode 表，以及用于 inode 和块的空闲空间位图。文件系统旨在防止碎片化。

在某些情况下，是无法实现的：例如，如果一个柱面组的大小为 512 MB，并且要写入一个大于512 MB的文件，它将使用该柱面组中的一个 inode，但所有可用的空闲块已经用完。如果要将第二个文件放置到该柱面组中，inode可以被使用，但是该文件的数据块需要放置在其他地方，这是不理想的。

对于大文件，最好强制进行长距离寻道，从一个柱面组切换到下一个柱面组。文件系统可以从每一兆字节文件大小开始强制执行这样的长距离寻道。这将均匀地使用相邻柱面组之间的空闲块，同时在每个柱面组中保留一定数量的空闲块供其他文件使用。

这会有意地使文件产生碎片，但同时也确保碎片足够大以支持大文件的 I/O。碎片化（文件中块的非相邻放置）只有在碎片太小以至于无法高效读取时才会真正成为性能问题。

目录分配策略

相同目录中的文件通常会一起使用。将同一目录中的所有文件放置在同一个柱面组中是很有效的做法。

当然，这样做时还需要将不同的目录放置在不同的柱面组中，以确保文件系统空间的均匀使用。这意味着一个像这样的 Shell 脚本：

这个脚本将创建名为 fileXX 的十个文件，并将它们全部放置在与当前目录相同的柱面组中。

它还会在当前目录下创建十个名为 dirXX 的子目录。条件允许的话，每个子目录都会被放置在不同的柱面组中。FFS 会选择那些空闲 inode 数量高于平均水平且已有目录数量最少的柱面组。在柱面组中选择 inode 的方式是“下一个可用的”，因为整个柱面组的 inode 表只占用 8-16 个块。

为了放置数据块，考虑到这台机器所需的交错因子，FFS 投入了很多精力来寻找旋转最优的块。

BSD FFS 要求文件系统始终保持一定的可用空间。如果文件系统填满超过90％，许多算法将退化为传统文件系统的性能水平。

BSD FFS 其他改进

更大 Inode 和分块地址

例如，inode 号现在是 32 位数字。这个改变使得文件系统中可能的文件数量从 64K 增加到 42亿。

Inode 的大小已经翻倍：它现在被强制为 128 字节的大小（其中有 20 个未使用的字节）。此外，磁盘块地址现在是 4 个字节。在 4KB 块大小的情况下，这足以支持 42 亿个块，或者最大 16TB 的文件系统大小。

文件长度被记录在一个 quad 中，这样可以支持超过 4GB 的单个文件大小。
Inode 现在包含 12 个直接块和三种类型的间接块。在 4KB 块大小的情况下，每个间接块可以容纳 1024 个块地址，因此每个文件可以容纳 12 + 1024 + 1024^2 + 1024^3 = 1074791436 个块，或者最大文件大小略大于 4TB。

Unix 用户 ID 和组 ID 长度仍然限制为一个 short 类型，每个系统的用户和组数量限制为 64 K。

即使 inode 中的时间类型仍然限制为 4 字节，但已经为 8 字节的时间戳预先分配了空间。

长文件名

传统文件系统中，目录项具有固定的 16 字节长度，其中 2 字节用于存储 inode 号，14字节用于存储文件名。

BSD FFS 定义了更复杂的目录项结构。一个目录项包含一个 4 字节的 inode 号，一个 2 字节的记录长度和一个 2 字节的名称长度，然后是实际的文件名。路径中的每个文件或者目录名限制为 255 字节，目录项的长度向上取整到下一个 4 字节边界。

目录仍然基本上是一个链表，因此在大型目录中搜索名称是很慢的。而在目录中搜索可用空间则更加复杂：为了创建一个新的目录条目，我们需要从开头开始遍历目录，试图找到当前结构中足够大以容纳待创建名称的空隙。如果找不到空隙，则将新名称追加到末尾，从而增加目录的大小。

目录中的空闲空间不会通过压缩来回收，只有在新的文件名称恰好适合时才会最终重新使用，也就是说当系统需要在目录中创建新的目录项或文件时，它会首先尝试找到一个已有的空间，其大小足够容纳待创建的名称。如果找到这样的空间，系统将把新的名称插入到该空间中，利用已有的空闲空间，而无需增加目录的大小。然而，如果没有足够大的空间可用，系统将追加新的名称到目录的末尾，从而增加目录的大小。

符号链接

传统的文件系统允许一个文件拥有多个名称，使用link()系统调用和硬链接机制。硬链接有数量限制（一个 short 类型，最多 64K 个名称）。

硬链接（hardlink）可能会意外丢失，例如，通过使用某些编辑器保存一个有硬链接的文件时。如果编辑器将文件保存为 filename.new，然后取消链接旧的 filename 并将新文件移动到相应位置，那么文件的硬链接属性将会被修改。

硬链接（hardlink）是指在文件系统中创建的指向同一文件或目录的多个文件名。它们与原始文件（或目录）共享相同的 inode（索引节点），因此它们实际上是相同的文件，只是具有不同的文件名。硬链接允许多个文件名引用同一份数据，节省存储空间，并且对文件的更改会在所有硬链接之间保持同步。

硬链接还会多次引用原始文件的 inode，而 inode 是特定于文件系统的，因此它们不能跨越文件系统。

BSD 引入了一种新的文件类型（l，符号链接），并在链接文件中放置一个“替换文件名”，用于确定链接目标位置。它可以是绝对路径或相对路径（相对于符号链接文件的位置）。

当尝试访问符号链接时，系统将在 namei() 函数中重新解析文件名，使用链接中的文件名，从而将 open() 系统调用重定向到链接指向的位置。简单来说，符号链接提供了一个文件名的替代方式，当访问符号链接时，实际上是在访问链接的目标文件。

由于重定向发生在 namei() 中，它可以跨文件系统，因此新的链接类型不受单个文件系统的限制。它也不计入任何链接计数限制。

重命名系统调用

BSD 引入了 rename() 系统调用。过去，则需要通过调用 unlink() 和 link() 实现。由于这涉及多个系统调用，该操作不是原子操作：它可能会部分执行，并且容易受到恶意干扰。

配额

BSD 引入了文件系统使用配额的概念：这是对用户或组可以使用的文件数量和磁盘空间量设置的软限制（soft limit）和硬限制（hard limit）。

为了有效地实现它们，需要做如下修改：

现在，如果一个用户想要把自己文件的所有者改为其他用户，那么他必须拥有特权操作的权限。否则，他就只能创建一个只有自己能访问的目录，然后把目录里的所有文件都发送给目标用户。这样一来，这些文件就会占用另一个用户的配额，而不是自己的配额。
类似地，不再允许将文件的组员身份更改为任意组。只允许设置为该用户所属的某个组。
最后，新创建的目录和文件继承自它们的父目录，而不是用户的主要组。这样，项目目录中的文件将计入项目的配额，而不是用户主要组配额。

咨询式文件锁

4.2BSD 中已经引入了咨询式文件锁。为了实现这种机制，它引入了新的 flock() 系统调用。

文件锁可以是共享的（读锁）或独占的（写锁）；
它们总是作用于整个文件，而不是字节范围；
不尝试检测死锁；
它们与文件描述符绑定。因此，当进程死亡时，其文件句柄会自动关闭，从而自动释放所有持有的锁。这非常健壮，直到 dup() 和 fork() 开始发挥作用。

后来，POSIX 试图改进这一点，引入了第二种完全不同的锁系统 fcntl()。它存在一些缺陷，但可以对字节范围进行操作，并实现了一些基本的死锁检测。

在这类实现了这两种文件锁机制的内核中如Linux系统，这两种锁机制互不兼容，也不知道对方的存在。

在《Advisory File Locking – My take on POSIX and BSD locks》这篇文章中进一步讨论了所有这些内容，并提供了示例程序。

总体表现

在论文中，作者指出了以下优点：

Ls 和ls -l 命令的速度很快，因为单个目录中文件的 inode 位于同一个柱面组内。因此，读取和列出目录时，寻道次数非常少，寻道距离也很短（除了子目录，它们通常要保证彼此的距离很远）。测试发现，当检索一个没有包含子目录的目录时，速度提高了8倍；
在传统文件系统中，理论最大带宽的利用率仅为3%，而在使用不同的控制器硬件的情况下，这一利用率增加到了22%甚至47%。作者对这些结果感到非常自豪，因为这些结果是在实际的生产系统上产生的。尽管文件的数量和规模可能会改变，但文件系统在其生命周期内能够持续相对稳定的吞吐量。

这些改进解决了主要的需求，即提高吞吐量和稳定的布局，使性能不会随时间降低。

此外，还进行了许多提升用户体验的改进，使得 BSD 在团队使用的过程中表现地更好；以及开启了一些新功能。

虽然 Linux 中并没有 BSD 代码，但 Ext2 文件系统基本上是对 BSD FFS 的重新实现。

无论是 BSD FFS 还是 Linux ext2，它们仍然是非日志文件系统，在发生崩溃后需要进行文件系统检查。它们在处理具有许多条目的目录方面也表现不佳，在处理深层次目录结构时稍好一些。为了跟上不断增长的存储容量，BSD FFS 和 Linux ext2 这两个文件系统需要进行额外的改进和优化，以便能够更好地支持处理大容量存储介质和大型文件系统。

此外，仍然存在其他一些不太明显的限制：文件系统代码中的几个位置受到锁的保护，使得在具有高并发性的系统上扩展某些操作变得困难。

直到1994年，SGI 的 XFS 才开始解决这些问题，经过了另外十年的时间。

未完待续。

如有帮助的话欢迎关注我们项目 Juicedata/JuiceFS 哟！ (0ᴗ0✿)

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
【从浅识到熟知Linux】Linux发展史 Jammingpro 从浅学到熟知Linux linux 运维服务器
归属专栏：从浅学到熟知Linux个人主页：Jammingpro每日努力一点点，技术变化看得见文章前言：本篇文章记录Linux发展的历史，因在介绍Linux过程中涉及的其他操作系统及人物，本文对相关内容也有所介绍。文章目录Unix发展史Linux发展史开源Linux官网企业应用情况发行版本在学习Linux前，我们可能都会问Linux从哪里来？它是如何发展的。但在介绍Linux之前，需要先介绍一下Un
linux 发展史种树的猴子内核 java 操作系统 linux 大数据
linux发展史说明此前对linux认识模糊一知半解，近期通过学习将自己对于linux的发展总结一下方便大家日后的学习。那Linux是目前一款非常火热的开源操作系统，可是linux是什么时候出现的，又是因为什么样的原因被开发出来的呢。以下将对linux的发展历程进行详细的讲解。目录一、Linux发展背景二、UINIX的诞生三、UNIX的重要分支-BSD的诞生四、Minix的诞生五、GNU与Free
Linux sh命令 fengyehongWorld Linux linux
目录一.基本语法二.选项2.1-c字符串中读取内容，并执行2.1.1基本用法2.1.2获取当前目录下失效的超链接2.2-x每个命令执行之前，将其打印出来2.3结合Here文档使用一.基本语法⏹Linux和Unix系统中用于执行shell脚本或运行命令的命令。sh[选项][脚本文件][参数...]⏹选项-c：从字符串中读取内容，并执行。-x：在每个命令执行之前，将其打印出来。-s：从标准流中读取内容
Linux vi常用命令 fengyehongWorld Linux linux
参考资料viコマンド（vimコマンド）リファレンス目录一.保存系命令二.删除系命令三.移动系命令四.复制粘贴系命令一.保存系命令⏹保存并退出:wq⏹强制保存并退出:wq!⏹退出(文件未编辑):q⏹强制退出(忽略已编辑内容):q!⏹另存为:w新文件名二.删除系命令⏹删除当前行dd⏹清空整个文档gg：移动到文档顶部dG：删除到最后一行ggdG三.移动系命令⏹移动到文档顶部gg⏹移动到文档底部#方式1G
Linux查看服务器日志 TPBoreas 运维 linux 运维
一、tail这个是我最常用的一种查看方式用法如下：tail-n10test.log查询日志尾部最后10行的日志;tail-n+10test.log查询10行之后的所有日志;tail-fn10test.log循环实时查看最后1000行记录(最常用的)一般还会配合着grep用，(实时抓包)例如:tail-fn1000test.log|grep'关键字'（动态抓包）tail-fn1000test.log
笋丁网页自动回复机器人V3.0.0免授权版源码希希分享软希网58soho_cn 源码资源笋丁网页自动回复机器人
笋丁网页机器人一款可设置自动回复，默认消息，调用自定义api接口的网页机器人。此程序后端语言使用Golang，内存占用最高不超过30MB，1H1G服务器流畅运行。仅支持Linux服务器部署，不支持虚拟主机，请悉知！使用自定义api功能需要有一定的建站基础。源码下载：https://download.csdn.net/download/m0_66047725/89754250更多资源下载：关注我。安
#千锋逆战班郭燕学习的一天开启郭千岁呗
在千锋"逆战"学习云计算第17天加油努力会有好结果复习昨天知识中国加油！武汉加油！千峰加油!我自己加油！
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
Linux CTF逆向入门蚁景网络安全 linux 运维 CTF
1.ELF格式我们先来看看ELF文件头，如果想详细了解，可以查看ELF的manpage文档。关于ELF更详细的说明：e_shoff：节头表的文件偏移量（字节）。如果文件没有节头表，则此成员值为零。sh_offset：表示了该section（节）离开文件头部位置的距离+-------------------+|ELFheader|---++--------->+-------------------
NPM私库搭建-verdaccio（Linux） Beam007 npm linux 前端
1、安装nodelinux服务器安装nodea)、官网下载所需的node版本https://nodejs.org/dist/v14.21.0/b)、解压安装包若下载的是xxx.tar.xz文件，解压命令为tar-xvfxxx.tar.xzc)、修改环境变量修改：/etc/profile文件#SETPATHFORNODEJSexportNODE_HOME=NODEJS解压安装的路径exportPAT
信息系统安全相关概念(上) YuanDaima2048 课程笔记基础概念安全信息安全笔记
文章总览：YuanDaiMa2048博客文章总览下篇:信息系统安全相关概念(下)信息系统安全相关概念[上]信息系统概述信息系统信息系统架构信息系统发展趋势：信息系统日趋大型化、复杂化信息系统面临的安全威胁信息系统安全架构设计--以云计算为例信息系统安全需求及安全策略自主访问控制策略DAC强制访问控制策略MAC信息系统概述信息系统用于收集、存储和处理数据以及传递信息、知识和数字产品的一组集成组件。几
【2023年】云计算金砖牛刀小试6 geekgold 云计算服务器网络 kubernetes 容器
第一套【任务1】私有云服务搭建[10分]【题目1】基础环境配置[0.5分]使用提供的用户名密码，登录提供的OpenStack私有云平台，在当前租户下，使用CentOS7.9镜像，创建两台云主机，云主机类型使用4vCPU/12G/100G_50G类型。当前租户下默认存在一张网卡，自行创建第二张网卡并连接至controller和compute节点（第二张网卡的网段为10.10.X.0/24，X为工位号
C++常见知识掌握 nfgo c++开发语言
1.Linux软件开发、调试与维护内核与系统结构Linux内核是操作系统的核心，负责管理硬件资源，提供系统服务，它是系统软件与硬件之间的桥梁。主要组成部分包括：进程管理：内核通过调度器分配CPU时间给各个进程，实现进程的创建、调度、终止等操作。使用进程描述符（task_struct）来存储进程信息，包括状态（就绪、运行、阻塞等）、优先级、内存映射等。内存管理：包括物理内存和虚拟内存管理。通过页表映
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include