木合杉

GFS分布式文件系统（详解与配置）

存储

存储是计算机系统中用于保留数据、程序和信息的过程和设备。它包括了数据的永久性保存，以便在需要时可以检索、读取和操作。存储可以分为多种类型，包括：

存储类型

主存储 (RAM - Random Access Memory)

用于存储正在运行的程序、操作系统和当前需要的数据。
是临时性的，失去电源时数据会丢失。

辅助存储

硬盘驱动器 (HDD)：常见的机械式存储设备，以磁盘存储数据。
固态驱动器 (SSD)：使用闪存技术，速度更快且更耐用，适合提高性能要求。

网络存储

网络附加存储 (NAS)：连接到网络并提供文件访问的设备。
存储区域网络 (SAN)：高速网络连接多个存储设备，通常用于大规模数据存储和管理。

云存储

基于云服务提供商的分布式存储，允许用户通过互联网存储和访问数据。

分布式文件系统

将数据分布式地存储在多个节点上，如GFS、HDFS（Hadoop分布式文件系统）等。

数据库

用于结构化和组织数据，提供高效的数据检索和管理。

存储技术的发展趋势：

大规模存储：云存储和分布式文件系统满足了大规模数据的存储需求。
快速、低延迟：SSD等新型存储介质提供更快的数据读写速度。
数据安全：加密、备份和灾难恢复方面的技术进步。
智能化管理：利用AI和机器学习优化存储资源的利用和管理。

存储在应用中的重要性：

数据处理：存储对于数据处理和计算至关重要，影响着效率和速度。
数据安全：良好的存储系统可以保护数据不被损坏、丢失或被非法访问。
大数据：存储是大数据时代不可或缺的一部分，需要高效、可扩展的存储系统来管理海量数据。

存储技术的发展和创新对于计算机系统的性能、可靠性和可扩展性都有着深远的影响，因此存储一直是计算机科学领域的一个核心关注点。

文件系统

文件系统是操作系统中负责管理和组织存储设备上数据的一种机制。它定义了文件和目录的结构，提供了文件的创建、读取、写入、删除等操作。文件系统使得用户和应用程序能够方便地管理和访问存储在计算机上的数据。

以下是文件系统的基本概念和组成部分：

文件（File）： 存储在存储设备上的数据单元，可以包含文本、图像、程序等。
目录（Directory）： 用于组织和存储文件的容器，形成了层次结构。

文件系统的基本操作：

创建（Create）： 新建文件或目录。
读取（Read）： 从文件中获取数据。
写入（Write）： 向文件中写入数据。
删除（Delete）： 删除文件或目录。

文件系统层次结构：

文件层次结构（File Hierarchy）： 文件和目录形成了一个层次结构，使得数据的组织更有序。
路径（Path）： 描述文件或目录在文件系统中的位置。

文件系统元数据：

文件描述符（File Descriptor）： 记录文件的基本属性，如大小、创建时间、修改时间等。
索引节点（Inode）： 存储文件元数据的数据结构。

磁盘管理：

簇或块（Cluster/Block）： 存储设备被划分为固定大小的块，文件被存储在这些块中。
文件分配表（File Allocation Table，FAT）： 记录磁盘上每个簇的使用情况。

文件系统类型：

FAT32、NTFS（Windows）： Windows操作系统常用的文件系统。
ext4、XFS（Linux）： Linux操作系统中常见的文件系统。
HFS+、APFS（macOS）： macOS操作系统使用的文件系统。

文件系统安全性和权限：

权限管理（Permissions）： 控制用户对文件和目录的访问权限。
加密（Encryption）： 保护文件内容的安全性。

日志（Journaling）：

事务日志（Transaction Log）： 记录文件系统的变更，以防止因突然断电等原因导致数据损坏。

网络文件系统（Network File System，NFS）：

分布式文件系统：

如Google的GFS、Hadoop的HDFS等，用于跨多个计算机节点的大规模数据存储和访问。

文件系统是计算机系统中非常重要的组成部分，不仅提供了对数据的有序管理，还涉及到数据的安全性、可靠性和性能等方面。各个操作系统使用不同的文件系统来满足其特定需求和功能。

弹性 HASH 算法

"弹性哈希算法" 是一种用于实现数据分布和负载均衡的哈希算法，特别适用于分布式系统中的数据存储。这种算法允许动态地增加或减少节点，同时尽量保持已有数据在节点之间的平均分布，以提高系统的可伸缩性和性能。

弹性哈希算法的基本思想是将数据和节点都映射到一个相同的哈希空间中，然后通过某种方式决定数据应该存储在哪个节点上。下面是弹性哈希算法的一般步骤：

确定哈希空间范围： 将哈希空间划分为一定范围，通常使用 0 到 2^32-1 或其他适当范围的哈希值。假设逻辑卷中有 N 个存储单位 Brick，则 32 位的整数范围将被划分为 N 个连续的子空间，每个空间对应一个 Brick。当用户或应用程序访问某一个命名空间时，通过对该命名空间计算 HASH 值，根据该 HASH 值所对应的 32 位整数空间定位数据所在的 Brick。
节点映射： 将每个节点通过哈希算法映射到哈希空间中的一个点。这个哈希算法可以是简单的散列函数。
数据映射： 将要存储的数据也通过哈希算法映射到哈希空间中的一个点。
找到最近的节点： 从数据所在的点开始，沿着哈希空间的方向寻找最近的节点。这个节点将被确定为存储该数据的节点。
数据存储： 将数据存储在确定的节点上。

优点

动态扩展和收缩： 弹性哈希算法允许系统动态地添加或移除节点，而不会显著影响已有数据的分布。这使得系统更容易扩展，同时也提供了高度的灵活性。
负载均衡： 弹性哈希算法有助于在节点数量变化时保持负载均衡。当节点增加或减少时，只有部分数据需要重新映射，而不是整个数据集，从而减小了系统的维护开销。
减少数据迁移： 在节点发生变化时，弹性哈希算法通过仅将部分数据进行重新映射，而不是全部数据迁移，减少了数据迁移的开销。这对于大规模分布式系统而言非常重要，因为数据迁移可能是一项昂贵的操作。
容错性： 弹性哈希算法对节点故障有一定的容错性。当节点发生故障时，仅需重新映射该节点上的部分数据，而不是整个数据集，从而减小了系统的脆弱性。
简化路由： 弹性哈希算法通过在节点之间分配数据块，简化了数据的路由过程。每个节点负责处理一部分数据，使得在查找特定数据时，只需查询相应的节点，而不必搜索整个系统。

总体而言，保证数据平均分布在每一个 Brick 中。解决了对元数据服务器的依赖，进而解决了单点故障以及访问瓶颈。

GlusterFs简述

概念

分布式架构：

GlusterFS采用分布式架构，允许用户将数据存储在多个节点上，以实现横向扩展和高性能。

横向扩展性：

可以通过添加新的存储节点来扩展存储容量和性能，使系统适应不断增长的数据需求。

存储卷（Volume）：

GlusterFS通过存储卷的概念来组织和管理数据。存储卷是由多个存储节点组成的逻辑存储单元。

复制和条带化：

GlusterFS支持数据的复制和条带化，以提高数据的冗余性和读写性能。

弹性/动态伸缩：

能够动态添加或删除存储节点，系统会自动重新平衡数据以确保负载均衡。

统一命名空间：

提供一个统一的命名空间，使用户和应用程序可以方便地访问存储卷中的数据。

透明性和一致性：

对用户而言，GlusterFS提供透明的文件和目录访问，同时确保数据的一致性。

原子操作和事务：

支持原子操作和事务，确保对存储卷的修改是原子的和可靠的。

集群管理和监控：

提供管理工具和监控机制，帮助管理员轻松地管理和监视GlusterFS集群。

开源和社区支持：

作为开源项目，GlusterFS允许用户根据需要自由使用、修改和分发。同时，有活跃的社区提供支持和贡献新的功能。

应用领域：

适用于需要大规模、高性能、高可用性存储的场景，如云存储、大数据分析等。

GlusterFS的设计理念是通过横向扩展和分布式存储来满足现代数据存储和处理的需求，使得用户能够构建可靠、高性能的存储基础设施。

特点

横向扩展性： GlusterFS具有良好的横向扩展性，可以轻松地扩展到数PB的存储容量和数千个客户端。Scale-Out架构允许通过简单地增加存储节点的方式来提高存储容量和性能（磁盘、计算和I/O资源都可以独立增加），支持10GbE和 InfiniBand等高速网络互联。Gluster弹性哈希（ElasticHash）解决了GlusterFS对元数据服务器的依赖，改善了单点故障和性能瓶颈，真正实现了并行化数据访问。GlusterFS采用弹性哈希算法在存储池中可以智能地定位任意数据分片（将数据分片存储在不同节点上），不需要查看索引或者向元数据服务器查询。
容错性和高可用性： GlusterFS通过数据复制和分布式存储的方式提供容错性和高可用性。数据可以在多个节点上复制，确保在节点故障时仍然可以访问数据。此外，它支持自动的数据自愈机制，即修复由于节点故障导致的数据损坏。
灵活的部署选项： GlusterFS支持多种部署模式，包括分布式、条带（striping）、复制、条带复制等。这使得它可以根据特定的使用场景和性能需求进行灵活配置，满足不同应用的要求。
统一命名空间： GlusterFS提供了一个统一的命名空间，允许用户以常规文件系统的方式访问分布式文件系统中的文件。分布式存储中，将所有节点的命名空间整合为统一命名空间，将整个系统的所有节点的存储容量组成一个大的虚拟存储池，供前端主机访问这些节点完成数据读写操作。
协议支持： GlusterFS支持多种协议，包括NFS（Network File System）、CIFS（Common Internet File System）等，使得它能够与不同类型的客户端和应用程序无缝集成。
弹性和动态性： GlusterFS允许在运行时动态添加或删除存储节点，从而实现弹性和动态性。通过将数据储存在逻辑卷中，逻辑卷从逻辑存储池进行独立逻辑划分而得到。逻辑存储池可以在线进行增加和移除，不会导致业务中断。逻辑卷可以根据需求在线增长和缩减，并可以在多个节点中实现负载均衡。
开源和社区支持： 作为开源项目，GlusterFS得到了广泛的社区支持。用户可以通过社区获得支持、参与开发，以及访问详细的文档和资源。

总体而言，GlusterFS适用于许多不同的应用场景，特别是需要横向扩展、高可用性和容错性的大规模分布式存储需求。

术语

砖（Brick）： 指可信主机池中由主机提供的用于物理存储的专用分区，是GlusterFS中的基本存储单元，同时也是可信存储池中服务器上对外提供的存储目录。存储目录的格式由服务器和目录的绝对路径构成，表示方法为 SERVER:EXPORT，如 192.168.80.10:/data/mydir/。
卷（Volume）： 在GlusterFS中，卷是一个由多个存储服务器组成的逻辑存储单元。它表示一个完整的分布式文件系统，用户可以通过卷来进行数据访问和管理。
存储池（Storage Pool）： 存储池是一组物理存储设备，它们被组合在一起以提供数据冗余和高可用性。砖通常存储在这些存储池中。
复制（Replication）： 复制是一种数据冗余机制，通过在不同的节点上保存数据的多个副本来增加系统的可靠性。在GlusterFS中，复制是通过配置卷的方式实现的。
条带（Striping）： 条带是将文件分成固定大小的块并分布在多个砖上的过程。这有助于提高文件的读写性能，因为可以并行地从多个砖上读取或写入数据。
客户端（Client）： 客户端是连接到GlusterFS卷并访问存储的计算机或设备。它可以是一个应用程序、操作系统或其他支持GlusterFS协议的实体。
GNFS（Gluster Native File System）： GNFS是GlusterFS的本地文件系统，它提供了类似于POSIX的文件系统接口，并允许应用程序直接通过本地文件系统访问GlusterFS。
分布式文件系统（Distributed File System）： GlusterFS是一种分布式文件系统，它通过将数据分布在多个节点上来提供高性能和可扩展性。
存储卷管理器（Volume Manager）： 存储卷管理器负责卷的创建、删除和管理。它是GlusterFS的组件之一，用于配置和维护卷的状态。

架构组件

FUSE（Filesystem in Userspace）：

定义： FUSE是一个用户空间文件系统的框架，允许非特权用户在用户空间中实现文件系统。通过FUSE，文件系统的实现不需要修改内核，而是在用户空间中运行。
在GlusterFS中的应用： GlusterFS可以利用FUSE来提供用户空间文件系统，使得可以在没有特殊内核模块的情况下运行GlusterFS。这种方式使得GlusterFS可以更容易地被集成到各种操作系统中。

VFS（Virtual File System）：

定义： VFS是操作系统内核中的抽象层，用于提供对不同文件系统的统一接口。它允许应用程序使用相同的系统调用来访问不同类型的文件系统，而不必关心底层文件系统的细节。
在GlusterFS中的应用： GlusterFS通过VFS模块与操作系统内核进行交互。这样，用户可以像使用本地文件系统一样访问分布式的GlusterFS文件系统，而VFS层会负责将这些操作转发到GlusterFS的实现。

Glusterd：

定义： Glusterd是GlusterFS的管理守护进程，负责管理和维护GlusterFS集群的状态，以及执行一些基本的管理任务。
在GlusterFS中的应用： Glusterd用于卷的创建、修改和删除，以及对存储池和砖的管理。它协调集群中各个节点的操作，并确保卷的一致性和可靠性。Glusterd起到了集群管理的关键作用。

模块化堆栈式架构

GlusterFS 采用模块化、堆栈式的架构。通过对模块进行各种组合，即可实现复杂的功能。例如 Replicate 模块可实现 RAID1，Stripe 模块可实现 RAID0，通过两者的组合可实现 RAID10 和 RAID01，同时获得更高的性能及可靠性。

模块化： 意味着系统被分解成相对独立、可重用、易于维护的模块。每个模块负责一个明确定义的功能，而且模块之间的耦合度较低，这样可以提高代码的可读性和可维护性。
堆栈式： 意味着这些模块被组织成一种层次结构，形成一个堆栈。每一层都有特定的职责和功能，而且模块在堆栈中按照一定的顺序进行组织。这有助于清晰地定义系统中不同层次的责任和交互。

在 GlusterFS 的背景下，模块化堆栈式架构包括以下组件：

底层存储模块： 处理底层存储设备的模块，负责与硬件通信、数据读写等底层操作。
分布式存储模块： 处理分布式存储的模块，负责数据分发、复制、一致性等任务。
网络通信模块： 处理节点之间的通信，确保数据在集群中的传输是可靠和高效的。
卷管理模块： 负责管理 GlusterFS 卷的模块，包括卷的创建、配置、修改和删除。
用户接口模块： 提供用户接口，让用户可以通过不同的协议（如NFS、FUSE等）与 GlusterFS 交互。

每个模块都有清晰的接口定义，使得它们可以相对独立地开发、测试和维护。整个系统通过这些模块协同工作，提供了一个高度可扩展和灵活的分布式存储解决方案。这种模块化和堆栈式的设计模式有助于满足不同应用场景下的需求。

GlusterFS 的工作流程

卷的创建：

管理员使用 Gluster CLI（命令行界面）或其他管理工具创建一个 GlusterFS 卷。
卷的创建涉及选择存储池、添加砖（Brick）等配置。

存储池的配置：

存储池（Storage Pool）是由多个物理存储设备组成的逻辑单元。这些存储设备可以是硬盘、SSD 等。
管理员配置存储池，将多个存储设备添加到存储池中，为后续卷的创建提供基础。

砖的配置：

Brick 是 GlusterFS 存储的基本单元，通常对应一个物理存储服务器上的目录或磁盘。
在存储池中选择存储设备，并配置这些设备为砖，作为 GlusterFS 存储的一部分。

卷的启动：

通过 Glusterd，管理员启动创建好的卷，让 GlusterFS 开始管理和分发数据。

分布式存储：

GlusterFS 使用分布式存储机制将数据分散存储在多个砖上。这增加了存储容量、提高了性能，并提供了数据冗余。

数据复制/条带化：

根据卷的配置，GlusterFS 可以使用复制机制（Replication）或条带化（Striping）来处理数据。复制提供数据冗余，而条带化则有助于提高性能。

网络通信：

GlusterFS 节点之间通过网络通信交换数据。TCP/IP 等协议用于确保数据在节点之间的可靠传输。

客户端访问：

客户端通过支持的协议（例如 NFS、FUSE）连接到 GlusterFS 卷。这可以在客户端系统中挂载 GlusterFS 文件系统。

用户访问和操作：

用户可以像访问本地文件系统一样，通过文件路径进行读写、创建和删除文件等操作。GlusterFS 的用户接口模块负责处理客户端请求。

卷的管理和监控：

管理员可以使用 Gluster CLI 或其他管理工具监控和管理卷的状态，进行调整和优化配置。

（1）客户端或应用程序通过 GlusterFS 的挂载点访问数据。（2）linux系统内核通过 VFS API 收到请求并处理。（3）VFS 将数据递交给 FUSE 内核文件系统，并向系统注册一个实际的文件系统 FUSE，而 FUSE 文件系统则是将数据通过 /dev/fuse 设备文件递交给了 GlusterFS client 端。可以将 FUSE 文件系统理解为一个代理。（4）GlusterFS client 收到数据后，client 根据配置文件的配置对数据进行处理。（5）经过 GlusterFS client 处理后，通过网络将数据传递至远端的 GlusterFS Server，并且将数据写入到服务器存储设备上。

GlusterFS的卷类型

GlusterFS支持多种卷类型，每种类型都有不同的特性，以满足不同应用场景的需求。以下是GlusterFS支持的主要卷类型：

Distribute卷（分布式卷）： 这是GlusterFS的默认卷类型。在分布式卷中，文件被平均地分布在各个存储服务器上，没有对文件进行分块处理。这种卷类型适用于需要简单的横向扩展的场景。
Stripe卷（条带卷）： Stripe卷将文件分成固定大小的条带，并将这些条带分布在各个存储服务器上。这有助于提高文件的读/写性能，特别是对于大文件而言。
Replica卷（复制卷）： 在Replica卷中，文件的多个副本存储在不同的存储服务器上。这提供了高可用性，因为即使某个存储服务器发生故障，数据仍然可以从其他副本中访问。
Distribute Stripe卷（分布式条带卷）： 这是Distribute和Stripe两种卷类型的结合，文件被分成条带并分布在各个存储服务器上。
Distribute Replica卷（分布式复制卷）： 这是Distribute和Replica两种卷类型的结合，文件被复制到多个存储服务器上，并且分布在这些服务器上。
Distribute Stripe Replica卷（分布式条带复制卷）： 这是Distribute、Stripe和Replica三种卷类型的结合，结合了条带化和数据复制，提供了高性能和高可用性。
Arbiter卷（仲裁卷）： 在Arbiter卷中，文件的一个副本存储在额外的仲裁节点上，而不是在数据节点上。这有助于减少数据副本的数量，节省存储空间。

卷实例

分布式卷示例

文件通过 HASH 算法分布到所有 Brick Server 上，这种卷是 GlusterFS 的默认卷；以文件为单位根据 HASH 算法散列到不同的 Brick，其实只是扩大了磁盘空间，如果有一块磁盘损坏，数据也将丢失，属于文件级的 RAID0，不具有容错能力。
在该模式下，并没有对文件进行分块处理，文件直接存储在某个 Server 节点上。由于直接使用本地文件系统进行文件存储，所以存取效率并没有提高，反而会因为网络通信的原因而有所降低。

#示例原理：
File1 和 File2 存放在 Server1，而 File3 存放在 Server2，文件都是随机存储，一个文件（如 File1）要么在 Server1 上，要么在 Server2 上，不能分块同时存放在 Server1和 Server2 上。

#分布式卷具有如下特点：
文件分布在不同的服务器，不具备冗余性。
更容易和廉价地扩展卷的大小。
单点故障会造成数据丢失。
依赖底层的数据保护。

#创建一个名为dis-volume的分布式卷，文件将根据HASH分布在server1:/dir1、server2:/dir2和server3:/dir3中
gluster volume create dis-volume server1:/dir1 server2:/dir2 server3:/dir3

条带卷示例

类似 RAID0，文件被分成数据块并以轮询的方式分布到多个 Brick Server 上，文件存储以数据块为单位，支持大文件存储，文件越大，读取效率越高，但是不具备冗余性。

#示例原理：
File 被分割为 6 段，1、3、5 放在 Server1，2、4、6 放在 Server2。

#条带卷特点：
数据被分割成更小块分布到块服务器群中的不同条带区。
分布减少了负载且更小的文件加速了存取的速度。
没有数据冗余。

#创建了一个名为stripe-volume的条带卷，文件将被分块轮询的存储在Server1:/dir1和Server2:/dir2两个Brick中
gluster volume create stripe-volume stripe 2 transport tcp server1:/dir1 server2:/dir2

复制卷示例

将文件同步到多个 Brick 上，使其具备多个文件副本，属于文件级 RAID 1，具有容错能力。因为数据分散在多个 Brick 中，所以读性能得到很大提升，但写性能下降。
复制卷具备冗余性，即使一个节点损坏，也不影响数据的正常使用。但因为要保存副本，所以磁盘利用率较低。

#示例原理：
File1 同时存在 Server1 和 Server2，File2 也是如此，相当于 Server2 中的文件是 Server1 中文件的副本。

#复制卷特点：
卷中所有的服务器均保存一个完整的副本。
卷的副本数量可由客户创建的时候决定，但复制数必须等于卷中 Brick 所包含的存储服务器数。
至少由两个块服务器或更多服务器。
具备冗余性。

#创建名为rep-volume的复制卷，文件将同时存储两个副本，分别在Server1:/dir1和Server2:/dir2两个Brick中
gluster volume create rep-volume replica 2 transport tcp server1:/dir1 server2:/dir2

分布式条带卷示例

Brick Server 数量是条带数（数据块分布的 Brick 数量）的倍数，兼具分布式卷和条带卷的特点。主要用于大文件访问处理，创建一个分布式条带卷最少需要 4 台服务器。

#示例原理：
File1 和 File2 通过分布式卷的功能分别定位到Server1和 Server2。在 Server1 中，File1 被分割成 4 段，其中 1、3 在 Server1 中的 exp1 目录中，2、4 在 Server1 中的 exp2 目录中。在 Server2 中，File2 也被分割成 4 段，其中 1、3 在 Server2 中的 exp3 目录中，2、4 在 Server2 中的 exp4 目录中。

#创建一个名为dis-stripe的分布式条带卷，配置分布式的条带卷时，卷中Brick所包含的存储服务器数必须是条带数的倍数（>=2倍）。Brick 的数量是 4（Server1:/dir1、Server2:/dir2、Server3:/dir3 和 Server4:/dir4），条带数为 2（stripe 2）
gluster volume create dis-stripe stripe 2 transport tcp server1:/dir1 server2:/dir2 server3:/dir3 server4:/dir4

创建卷时，存储服务器的数量如果等于条带或复制数，那么创建的是条带卷或者复制卷；如果存储服务器的数量是条带或复制数的 2 倍甚至更多，那么将创建的是分布式条带卷或分布式复制卷。

分布式复制卷示例

Brick Server 数量是镜像数（数据副本数量）的倍数，兼具分布式卷和复制卷的特点。主要用于需要冗余的情况下。

#示例原理：
File1 和 File2 通过分布式卷的功能分别定位到 Server1 和 Server2。在存放 File1 时，File1 根据复制卷的特性，将存在两个相同的副本，分别是 Server1 中的exp1 目录和 Server2 中的 exp2 目录。在存放 File2 时，File2 根据复制卷的特性，也将存在两个相同的副本，分别是 Server3 中的 exp3 目录和 Server4 中的 exp4 目录。

#创建一个名为dis-rep的分布式复制卷，配置分布式的复制卷时，卷中Brick所包含的存储服务器数必须是复制数的倍数（>=2倍）。Brick 的数量是 4（Server1:/dir1、Server2:/dir2、Server3:/dir3 和 Server4:/dir4），复制数为 2（replica 2）
gluster volume create dis-rep replica 2 transport tcp server1:/dir1 server2:/dir2 server3:/dir3 server4:/dir4

条带复制卷：

在条带复制卷中，数据被分成条带，并且每个条带都有多个副本。这提供了高性能和高可用性。
类似 RAID 10，同时具有条带卷和复制卷的特点。

# 创建一个包含两个存储服务器的条带复制卷
$ gluster volume create stripe_replica_vol stripe 2 replica 2 transport tcp server1:/data/brick1 server2:/data/brick1

# 启动卷
$ gluster volume start stripe_replica_vol

在上述示例中，stripe参数指定为2，表示使用条带化，replica参数指定为2，表示每个条带有两个副本。server1和server2是两个存储服务器的主机名，/data/brick1是存储卷的路径。

分布式条带复制卷：

分布式条带复制卷是条带复制卷和分布式卷的结合，既具有条带的性能优势，又具有数据在多个存储服务器上的分布式特性。
三种基本卷的复合卷，通常用于类 Map Reduce 应用。

# 创建一个包含两个存储服务器的分布式条带复制卷
$ gluster volume create distribute_stripe_replica_vol disperse 2 stripe 2 transport tcp server1:/data/brick1 server2:/data/brick1

# 启动卷
$ gluster volume start distribute_stripe_replica_vol

在上述示例中，disperse参数指定为2，表示使用分布式，stripe参数指定为2，表示使用条带化。其他参数和配置与条带复制卷类似。

仲裁卷：

仲裁卷在其中一个独立节点上存储数据的一个副本，用于提高系统的容错性。

# 创建一个包含仲裁节点的仲裁卷
$ gluster volume create arbiter_vol replica 2 arbiter 1 transport tcp server1:/data/brick1 server2:/data/brick1 server3:/data/brick1

# 启动卷
$ gluster volume start arbiter_vol

部署GlusterFS 群集实例

环境准备

Node1节点：node1/192.168.41.31          磁盘：/dev/sdb1          挂载点：/data/sdb1
                                            /dev/sdc1                   /data/sdc1
                                            /dev/sdd1                   /data/sdd1
                                            /dev/sde1                   /data/sde1

Node2节点：node2/192.168.41.32          磁盘：/dev/sdb1          挂载点：/data/sdb1
                                            /dev/sdc1                   /data/sdc1
                                            /dev/sdd1                   /data/sdd1
                                            /dev/sde1                   /data/sde1

Node3节点：node3/192.168.41.33          磁盘：/dev/sdb1          挂载点：/data/sdb1
                                            /dev/sdc1                   /data/sdc1
                                            /dev/sdd1                   /data/sdd1
                                            /dev/sde1                   /data/sde1

Node4节点：node4/192.168.41.34          磁盘：/dev/sdb1          挂载点：/data/sdb1
                                            /dev/sdc1                   /data/sdc1
                                            /dev/sdd1                   /data/sdd1
                                            /dev/sde1                   /data/sde1

客户端节点：192.168.10.11

systemctl stop firewalld
setenforce 0

磁盘分区并挂载

vim /opt/fdisk.sh
#!/bin/bash
NEWDEV=`ls /dev/sd* | grep -o 'sd[b-z]' | uniq`
for VAR in $NEWDEV
do
   echo -e "n\np\n\n\n\nw\n" | fdisk /dev/$VAR &> /dev/null
   mkfs.xfs /dev/${VAR}"1" &> /dev/null
   mkdir -p /data/${VAR}"1" &> /dev/null
   echo "/dev/${VAR}"1" /data/${VAR}"1" xfs defaults 0 0" >> /etc/fstab
done
mount -a &> /dev/null

chmod +x /opt/fdisk.sh
cd /opt/
./fdisk.sh

vim /opt/fdisk.sh

在/opt目录下创建并编辑fdisk.sh文件。

#!/bin/bash

指定脚本解释器为bash。

NEWDEV=`ls /dev/sd* | grep -o 'sd[b-z]' | uniq`

通过ls命令获取所有以sd开头的设备，然后使用grep筛选出sd后跟有字母b到z的设备，最后通过uniq去重。结果存储在NEWDEV变量中。

for VAR in $NEWDEV
do

对NEWDEV中的每个设备执行以下操作。

   echo -e "n\np\n\n\n\nw\n" | fdisk /dev/$VAR &> /dev/null

使用echo命令向fdisk发送一系列的命令，创建新分区。这些命令是：n（新建分区）、p（主分区）、回车（默认分区号）、回车（默认起始扇区）、回车（默认结束扇区）、w（写入并退出）。&> /dev/null用于将输出重定向到/dev/null，以避免显示输出。

   mkfs.xfs /dev/${VAR}"1" &> /dev/null

使用mkfs.xfs命令将新创建的分区格式化为XFS文件系统。

   mkdir -p /data/${VAR}"1" &> /dev/null

创建用于挂载的目录，-p选项用于递归创建目录，如果目录已存在则不会报错。

   echo "/dev/${VAR}"1" /data/${VAR}"1" xfs defaults 0 0" >> /etc/fstab

将新分区的挂载信息添加到/etc/fstab文件，以便系统启动时自动挂载。这一行使用echo命令将一行文本追加到/etc/fstab文件。

done

结束for循环。

mount -a &> /dev/null

使用mount命令挂载所有在/etc/fstab中定义的分区。&> /dev/null用于将输出重定向到/dev/null，以避免显示输出。

chmod +x /opt/fdisk.sh

赋予fdisk.sh脚本执行权限。

cd /opt/

切换到/opt目录。

./fdisk.sh

执行fdisk.sh脚本，开始磁盘分区、格式化和挂载的操作。

配置/etc/hosts文件

hostnamectl set-hostname node1  #修改主机名方便辨别
su

echo "192.168.41.31 node1" >> /etc/hosts
echo "192.168.41.32 node2" >> /etc/hosts
echo "192.168.41.33 node3" >> /etc/hosts
echo "192.168.41.34 node4" >> /etc/hosts

通过su命令切换当前用户为超级用户（root），通常需要输入超级用户的密码。

echo "192.168.41.31 node1" >> /etc/hosts

将"192.168.10.13 node1"这一行追加到/etc/hosts文件。这是为了将IP地址192.168.10.13与主机名node1进行关联，用于解析主机名。

echo "192.168.41.32 node2" >> /etc/hosts
echo "192.168.41.33 node3" >> /etc/hosts
echo "192.168.41.34 node4" >> /etc/hosts

同样，将其他三个IP地址和相应的主机名追加到/etc/hosts文件，以便系统可以通过主机名解析到相应的IP地址。

安装、启动GlusterFS

所有node节点都部署操作

#将gfsrepo 软件上传到/opt目录下
cd /etc/yum.repos.d/
mkdir repo.bak
mv *.repo repo.bak

vim glfs.repo
[glfs]
name=glfs
baseurl=file:///opt/gfsrepo
gpgcheck=0
enabled=1

yum clean all && yum makecache

#yum -y install centos-release-gluster            #如采用官方 YUM 源安装，可以直接指向互联网仓库
yum -y install glusterfs glusterfs-server glusterfs-fuse glusterfs-rdma

systemctl start glusterd.service 
systemctl enable glusterd.service
systemctl status glusterd.service

#如果出现版本报错，移除检测软件包
yum remove glusterfs-api.x86_64 glusterfs-cli.x86_64 glusterfs.x86_64 glusterfs-libs.x86_64 glusterfs-client-xlators.x86_64 glusterfs-fuse.x86_64 -y

这段脚本主要用于将名为"gfsrepo"的软件上传到/opt目录，并配置一个名为glfs.repo的YUM仓库文件，然后安装 GlusterFS 分布式文件系统的相关软件包，并启动 GlusterFS 服务。

以下是脚本的解析：

移动到/etc/yum.repos.d/目录：

cd /etc/yum.repos.d/

创建名为repo.bak的备份目录，并将该目录下的所有.repo文件移动到备份目录中：

mkdir repo.bak
mv *.repo repo.bak

使用vim编辑器创建或编辑glfs.repo文件，添加以下内容：

[glfs]
name=glfs
baseurl=file:///opt/gfsrepo
gpgcheck=0
enabled=1

这个配置文件指定了一个名为glfs的YUM仓库，其baseurl指向file:///opt/gfsrepo，表示软件包位于/opt/gfsrepo目录。gpgcheck设置为0表示不进行 GPG 签名检查，enabled设置为1表示启用该仓库。

清理YUM缓存并生成新的缓存：

yum clean all && yum makecache

安装 GlusterFS 相关软件包：

yum -y install glusterfs glusterfs-server glusterfs-fuse glusterfs-rdma

如果使用官方 YUM 源进行安装，可以使用以下命令替代上述软件包安装：

#yum -y install centos-release-gluster

启动 GlusterFS 服务：

systemctl start glusterd.service

设置 GlusterFS 服务开机自启动：

systemctl enable glusterd.service

查看 GlusterFS 服务状态：

systemctl status glusterd.service

这个脚本主要用于配置 GlusterFS 文件系统，确保相关软件包已安装，并启动 GlusterFS 服务。

添加节点到存储信任池中

在node1节点上配置

#只要在一台Node节点上添加其它节点即可
gluster peer probe node1
gluster peer probe node2
gluster peer probe node3
gluster peer probe node4

#在每个Node节点上查看群集状态
gluster peer status


----- 创建卷 -----
#根据规划创建如下卷：
卷名称                 卷类型             Brick
dis-volume            分布式卷            node1(/data/sdb1)、node2(/data/sdb1)
stripe-volume        条带卷             node1(/data/sdc1)、node2(/data/sdc1)
rep-volume            复制卷             node3(/data/sdb1)、node4(/data/sdb1)
dis-stripe            分布式条带卷      node1(/data/sdd1)、node2(/data/sdd1)、node3(/data/sdd1)、node4(/data/sdd1)
dis-rep                分布式复制卷      node1(/data/sde1)、node2(/data/sde1)、node3(/data/sde1)、node4(/data/sde1)

创建卷

创建分布式卷

#创建分布式卷，没有指定类型，默认创建的是分布式卷
gluster volume create dis-volume node1:/data/sdb1 node2:/data/sdb1 force    

#查看卷列表
gluster volume list

#启动新建分布式卷
gluster volume start dis-volume

#查看创建分布式卷信息
gluster volume info dis-volume

创建条带卷

#指定类型为 stripe，数值为 2，且后面跟了 2 个 Brick Server，所以创建的是条带卷
gluster volume create stripe-volume stripe 2 node1:/data/sdc1 node2:/data/sdc1 force
gluster volume start stripe-volume
gluster volume info stripe-volume

创建复制卷

#指定类型为 replica，数值为 2，且后面跟了 2 个 Brick Server，所以创建的是复制卷
gluster volume create rep-volume replica 2 node3:/data/sdb1 node4:/data/sdb1 force
gluster volume start rep-volume
gluster volume info rep-volume

创建分布式条带卷

#指定类型为 stripe，数值为 2，而且后面跟了 4 个 Brick Server，是 2 的两倍，所以创建的是分布式条带卷
gluster volume create dis-stripe stripe 2 node1:/data/sdd1 node2:/data/sdd1 node3:/data/sdd1 node4:/data/sdd1 force
gluster volume start dis-stripe
gluster volume info dis-stripe

创建分布式复制卷

指定类型为 replica，数值为 2，而且后面跟了 4 个 Brick Server，是 2 的两倍，所以创建的是分布式复制卷
gluster volume create dis-rep replica 2 node1:/data/sde1 node2:/data/sde1 node3:/data/sde1 node4:/data/sde1 force
gluster volume start dis-rep
gluster volume info dis-rep

查看当前所有卷的列表

gluster volume list

部署 Gluster 客户端

安装客户端软件

#将gfsrepo 软件上传到/opt目下 
cd /etc/yum.repos.d/
mkdir repo.bak
mv *.repo repo.bak

vim glfs.repo
[glfs]
name=glfs
baseurl=file:///opt/gfsrepo
gpgcheck=0
enabled=1

yum clean all && yum makecache

yum -y install glusterfs glusterfs-fuse

这段脚本主要用于将名为"gfsrepo"的软件上传到/opt目录，并配置一个名为glfs.repo的YUM仓库文件，然后安装 GlusterFS 分布式文件系统的相关软件包。

以下是脚本的解析：

移动到/etc/yum.repos.d/目录：

cd /etc/yum.repos.d/

创建名为repo.bak的备份目录，并将该目录下的所有.repo文件移动到备份目录中：

mkdir repo.bak
mv *.repo repo.bak

使用vim编辑器创建或编辑glfs.repo文件，添加以下内容：

[glfs]
name=glfs
baseurl=file:///opt/gfsrepo
gpgcheck=0
enabled=1

清理YUM缓存并生成新的缓存：

yum clean all && yum makecache

安装 GlusterFS 相关软件包：

yum -y install glusterfs glusterfs-fuse

这个脚本主要用于配置 GlusterFS 文件系统，确保相关软件包已安装，并指定了一个本地 YUM 仓库路径为/opt/gfsrepo。然后通过yum安装了 GlusterFS 和 GlusterFS FUSE（用户空间文件系统）软件包。

创建挂载目录

mkdir -p /test/{dis,stripe,rep,dis_stripe,dis_rep}
ls /test

这段命令用于创建一个名为/test的目录，并在该目录下创建五个子目录，分别命名为dis、stripe、rep、dis_stripe和dis_rep。然后，通过ls /test命令列出/test目录下的文件和子目录。

解析：

mkdir -p /test/{dis,stripe,rep,dis_stripe,dis_rep}:

mkdir: 创建目录的命令。
-p: 如果父目录不存在，则递归创建父目录。
/test/{dis,stripe,rep,dis_stripe,dis_rep}: 使用大括号扩展语法，创建了五个子目录，即/test/dis、/test/stripe、/test/rep、/test/dis_stripe和/test/dis_rep。

ls /test:

通过执行以上两个命令，你将在/test目录下创建了五个子目录，然后使用ls命令列出了/test目录下的文件和子目录。

配置/etc/hosts文件

echo "192.168.41.31 node1" >> /etc/hosts
echo "192.168.41.32 node2" >> /etc/hosts
echo "192.168.41.33 node3" >> /etc/hosts
echo "192.168.41.34 node4" >> /etc/hosts

挂载 Gluster 文件系统

#临时挂载
mount.glusterfs node1:dis-volume /test/dis
mount.glusterfs node1:stripe-volume /test/stripe
mount.glusterfs node1:rep-volume /test/rep
mount.glusterfs node1:dis-stripe /test/dis_stripe
mount.glusterfs node1:dis-rep /test/dis_rep

df -Th

#永久挂载
vim /etc/fstab
node1:dis-volume        /test/dis               glusterfs       defaults,_netdev        0 0
node1:stripe-volume        /test/stripe            glusterfs       defaults,_netdev        0 0
node1:rep-volume        /test/rep               glusterfs       defaults,_netdev        0 0
node1:dis-stripe        /test/dis_stripe        glusterfs       defaults,_netdev        0 0
node1:dis-rep            /test/dis_rep           glusterfs       defaults,_netdev        0 0

测试 Gluster 文件系统

1．卷中写入文件，客户端操作
cd /opt
dd if=/dev/zero of=/opt/demo1.log bs=1M count=40
dd if=/dev/zero of=/opt/demo2.log bs=1M count=40
dd if=/dev/zero of=/opt/demo3.log bs=1M count=40
dd if=/dev/zero of=/opt/demo4.log bs=1M count=40
dd if=/dev/zero of=/opt/demo5.log bs=1M count=40

ls -lh /opt

cp /opt/demo* /test/dis
cp /opt/demo* /test/stripe/
cp /opt/demo* /test/rep/
cp /opt/demo* /test/dis_stripe/
cp /opt/demo* /test/dis_rep/

2．查看文件分布
#查看分布式文件分布
[root@node1 ~]# ls -lh /data/sdb1                    #数据没有被分片
总用量 160M

[root@node2 ~]# ll -h /data/sdb1
总用量 40M

#查看条带卷文件分布
[root@node1 ~]# ls -lh /data/sdc1                    #数据被分片50% 没副本 没冗余
总用量 101M

[root@node2 ~]# ll -h /data/sdc1                    #数据被分片50% 没副本 没冗余
总用量 101M

#查看复制卷分布
[root@node3 ~]# ll -h /data/sdb1                    #数据没有被分片 有副本 有冗余     
总用量 201M

[root@node4 ~]# ll -h /data/sdb1                    #数据没有被分片 有副本 有冗余
总用量 201M

#查看分布式条带卷分布
[root@node1 ~]# ll -h /data/sdd1                    #数据被分片50% 没副本 没冗余
总用量 81M

[root@node2 ~]# ll -h /data/sdd1
总用量 81M

[root@node3 ~]# ll -h /data/sdd1
总用量 21M

[root@node4 ~]# ll -h /data/sdd1
总用量 21M

#查看分布式复制卷分布                                #数据没有被分片 有副本 有冗余
[root@node1 ~]# ll -h /data/sde1
总用量 161M

[root@node2 ~]# ll -h /data/sde1
总用量 161M

[root@node3 ~]# ll -h /data/sde1
总用量 41M

[root@node4 ~]# ll -h /data/sde1
总用量 41M

破坏性测试

#挂起 node2 节点或者关闭glusterd服务来模拟故障
[root@node2 ~]# systemctl stop glusterd.service

#在客户端上查看文件是否正常
#分布式卷数据查看
[root@localhost test]# ll /test/dis/        #在客户机上发现少了demo5.log文件，这个是在node2上的
总用量 163840

#条带卷
[root@localhost test]# cd /test/stripe/        #无法访问，条带卷不具备冗余性
[root@localhost stripe]# ll
总用量 0

#分布式条带卷
[root@localhost test]# ll /test/dis_stripe/        #无法访问，分布条带卷不具备冗余性
总用量 40960

#分布式复制卷
[root@localhost test]# ll /test/dis_rep/    #可以访问，分布式复制卷具备冗余性
总用量 204800

#挂起 node2 和 node4 节点，在客户端上查看文件是否正常
#测试复制卷是否正常
[root@localhost rep]# ls -l /test/rep/        #在客户机上测试正常 数据有
总用量 204800

#测试分布式条卷是否正常
[root@localhost dis_stripe]# ll /test/dis_stripe/        #在客户机上测试没有数据 
总用量 0

#测试分布式复制卷是否正常
[root@localhost dis_rep]# ll /test/dis_rep/        #在客户机上测试正常 有数据
总用量 204800

其他维护命令

上述实验测试，凡是带复制数据，相比而言，数据比较安全

查看GlusterFS卷

gluster volume list

该命令用于列出所有GlusterFS卷的名称。

查看所有卷的信息

gluster volume info

用于获取所有GlusterFS卷的详细信息。

查看所有卷的状态

gluster volume status

该命令提供了所有GlusterFS卷的状态信息，包括节点的健康状态等。

停止一个卷

gluster volume stop dis-stripe

用于停止名为"dis-stripe"的GlusterFS卷。

删除一个卷

gluster volume delete dis-stripe

该命令用于删除名为"dis-stripe"的GlusterFS卷。在删除之前，需要确保卷已停止，且信任池中没有处于宕机状态的主机，否则删除操作将失败。

设置卷的访问控制

仅拒绝特定IP地址的访问：

gluster volume set dis-rep auth.deny 192.168.41.100

仅允许特定IP地址范围的访问：
```
gluster volume set dis-rep auth.allow 192.168.41.*
```
该命令允许所有以192.168.41开头的IP地址范围的主机访问"dis-rep"卷（分布式复制卷）。这是一种基于IP地址的访问控制。

你可能感兴趣的:(系统,系统架构)

小鹏P7自动泊车技术方案浅析 yuyuelongfly 自动驾驶小鹏P7 APA 自动泊车自动驾驶
目录一、概述二、感知算法1.视觉库位检测1.1.视觉系统1.2.库位检测算法1.3.同步建图与定位技术1.4.其他要素检测2.超声波库位检测3.视觉库位检测与超声波库位检测融合三、路径规划与控制四、HMI一、概述泊车算法离不开感知&融合、规划&控制，从目前行业技术发展的角度来看，泊车涉及的每一个算法都不算完美，甚至可以说仍不成熟。然而，小鹏P7采用优秀的系统方案设计，特别是通过引入同步建图与定位技
小白必看！2025 网络安全保姆级学习路线来啦~ 白帽黑客-晨哥学习 web安全安全数据库 php
关键词：网络安全入门、渗透测试学习、零基础学安全、网络安全学习路首先咱们聊聊，学习网络安全方向通常会有哪些问题1.初学者常见问题1.1如何开始学习网络安全？问题：网络安全领域广泛，初学者往往不知道从哪里入手。解答：从基础知识开始：学习计算机网络、操作系统、编程语言（如Python、Bash）。了解网络安全的基本概念，如加密、认证、漏洞、攻击类型等。使用在线资源（如Cybrary、OWASP）或书籍
docker引擎断电后启动失败常见问题和解决方案 handsomestWei 运维 docker 容器运维云原生
docker引擎断电后启动失败常见问题和解决方案常用排查命令查看containerd运行状态systemctlstatuscontainerd查看docker引擎运行状态systemctlstatusdocker在系统日志中查看docker引擎最近日志并持续追踪journalctl-udocker.service-f-n100常见问题和解决容器加载失败问题使用journalctl命令查看docke
IMX6ULL驱动开发uboot篇01 charlie114514191 从0开始的学习ARMv7a IMX6ULL芯片驱动开发 IMX6ULL 嵌入式硬件 uboot
目录所以，啥是UBoot使用uboot的命令行完成点事情bdinfo,printenv和version环境变量内存操作所以，啥是UBoot我们搞过STM32或者啥其他单片机的朋友都知道，我们的程序想要跑上去，需要一个BOOTLoader来提供一个最基本的，被初始化后的软硬件环境（比如说中断向量要布置好，C语言的栈环境要布置好等等！），对于跑操作系统，想要让一个大系统跑在一个板子上的重要步骤就是提供
基于TableStore的海量气象格点数据解决方案实战阿里云云栖号数据存储与数据库 exception Java核心技术
前言气象数据是一类典型的大数据，具有数据量大、时效性高、数据种类丰富等特点。气象数据中大量的数据是时空数据，记录了时间和空间范围内各个点的各个物理量的观测量或者模拟量，每天产生的数据量常在几十TB到上百TB的规模，且在爆发性增长。如何存储和高效的查询这些气象数据越来越成为一个难题。传统的方案常常采用关系型数据库加文件系统的方式实现这类气象数据的存储和实时查询，这种方案在可扩展性、可维护性和性能上都
Linux利用PROMPT_COMMAND实现审计功能 yes_is_ok linux linux history 记录
Linux利用PROMPT_COMMAND实现审计功能这个系统审计，记录什么用户，在什么时间，做了什么操作。然后将查到的信息记录到一个文件里。一.配置1.在/etc/profile文件的最后，添加如下2行代码：exportHISTORY_FILE=/var/log/history/`date'+%Y%m'`.logexportPROMPT_COMMAND='{date"+%Y-%m-%d%T###
服务器、群晖，飞牛NAS等部署Whisper ASR教程来啦！让我们的Nas轻松实现音频转文字服务！ xiaoqiangclub 群晖助手服务器 whisper 音视频 ASR 语音转文字实用教程
文章目录介绍演示环境服务器/群晖/飞牛NAS部署WhisperASR，语音识别soeasy！准备部署使用Python调用示例注意事项⚓️相关链接⚓️介绍最近有人私信我，有没有什么办法能在NAS上搞个语音识别服务，实现将语音或开会录音自动转成文字？那么今天我们就一起来看看如何在服务器或群晖/飞牛等Nas上部署一个语音转文字的服务，让我们的NAS瞬间变身“听译”大师！演示环境本文演示环境如下：群晖系统
【MATLAB源码-第128期】基于matlab的雷达系统回波信号仿真，输出脉压，MTI,MTD等图像。 Matlab_猿助手调制解调通信原理 MATLAB matlab 开发语言信息与通信
操作环境：MATLAB2022a1、算法描述雷达（RadioDetectionandRanging）是一种使用无线电波来探测和定位物体的系统。它的基本原理是发射无线电波，然后接收这些波从目标物体上反射回来的信号。通过分析这些反射波，雷达能够确定物体的位置、速度、方向和其他特性。历史背景雷达技术起源于20世纪初。最初的发展动机主要是军事上的需求，特别是在第二次世界大战期间，雷达在侦测敌机和舰船上发挥
具身智能行业 [shenhonglei] 具身觉醒：智能进化的未来之路人工智能机器人
具身智能行业综合分析资源下载-具身智能导图.xmind资源下载-具身智能导图.xmind一、行业概况定义与核心特征具身智能（EmbodiedAI）指通过物理实体（如机器人、自动驾驶设备等）与环境的动态交互，实现感知、认知和行动控制的智能系统。其核心特征是“知行合一”，强调通过实际交互提升智能水平，而非仅依赖数据训练。技术融合：结合人工智能（AI）、机器人技术、多模态大模型
分布式基本理论 - CAP,BASE 和 RAFT 算法 Yellow明算法分布式
分布式基本理论-CAP,BASE和RAFT算法1.分布式基本理论1.1CAP理论在理论计算机科学中，CAP定理（CAPtheorem），又被称作布鲁尔定理（Brewer’stheorem），它指出对于一个分布式计算系统来说，不可能同时满足以下三点：[1][2]一致性（Consistency）（等同于所有节点访问同一份最新的数据副本）可用性（Availability）（每次请求都能获取到非错的响应—
存储性能调优：掌握I/O性能调优和缓存策略配置 Morris只会敲命令缓存
引言在数字化转型加速的今天，数据已成为企业核心资产，而存储系统的性能直接影响业务响应速度、用户体验和IT基础设施的总体效率。无论是高并发交易系统、实时分析平台，还是AI训练场景，存储I/O瓶颈和缓存策略配置不当都可能引发性能雪崩。本文将从硬件层到软件层，系统性地解析存储性能调优的核心技术，并提供可落地的优化策略。1.1存储介质特性与选型HDDvs.SSDvs.NVMeHDD的机械寻道延迟（平均5-
DeepSeek本地部署教程（Windows操作系统笔记本电脑适用）程序员辣条 AI产品经理产品经理大模型人工智能 DeepSeek Windows AI大模型
最近DeepSeek非常火，你想不想也本地部署，玩转AI呢？一、将DeepSeek部署到自己的电脑有以下好处：1.数据隐私与安全本地存储：所有数据保存在本地，避免第三方服务器存储带来的隐私风险。数据控制：完全掌控数据访问权限，防止未经授权的访问或泄露。2.性能优化低延迟：本地运行减少网络延迟，响应速度更快。资源利用：可根据硬件配置优化性能，充分利用本地计算资源。3.定制化灵活配置：可根据需求调整模
llama_deploy 伊织code #文档翻译 llama llama_deploy llamaindex
本文于240924翻译整理自：https://docs.llamaindex.ai/en/stable/module_guides/workflow/deployment/文章目录一、关于`llama_deploy`为什么使用`llama_deploy`？等等，`llama-agents`在哪里？二、入门1、安装2、高级部署3、部署核心系统4、部署工作流5、与部署交互6、部署嵌套工作流三、一个`l
最硬核DNS详解运维开发那些事 linux linux
1、是什么DNS（域名系统）是互联网的一项服务，它作为将域名和IP地址相互映射的一个分布式数据库，能够使人更方便地访问互联网。DNS协议基于UDP协议，使用端口号53。2、域名服务器类型域名服务器在DNS体系中扮演着不同的角色，根据其功能和位置可以分为几种类型。以下是主要的域名服务器类型：根域名服务器：根域名服务器是DNS层次结构的最高层，它们并不直接提供具体的域名解析结果，而是指引查询到正确的顶
mysql新手常见问题解决方法总结微刻时光笔记 mysql 数据库人工智能影刀证书影刀RPA pyhon rpa
1.安装与配置问题1.1无法安装MySQLServerMySQLServer安装失败是新手常见的问题之一，以下是具体原因及解决方案：系统要求不满足：MySQL对操作系统有最低版本要求，如Windows7SP1及以上、macOS10.13及以上。若系统版本过低，安装程序可能无法正常运行。例如，在WindowsXP系统上安装MySQLServer8.0，会直接提示系统不兼容，无法进行安装。安装包选择错
用例图中actor的基本类型 Warren2Lynch Scrum uml
UML用例图是用于新的软件程序的系统/软件要求的主要形式下开发。用例指定预期的行为（什么），而不是确定它的确切方法（如何）。指定的用例可以表示文本和可视表示（即用例图）。用例建模的一个关键概念是它帮助我们从最终用户的角度设计系统。通过指定所有外部可见的系统行为，它是一种有效的技术，用于通过用户的术语来传达系统行为。用例图通常很简单。它没有显示用例的详细信息：它只概括了用例，参与者和系统之间的一些关
预置第三方apk到MTK项目相关问题总结 System_sleep android MTK 三方apk预置
预置第三方apk到MTK项目相关问题总结标签：MTK预置apk目前5.0之后项目预置方式通用步骤为：建立apk文件夹;置目标apk到该文件夹下;解压缩apk查看是否包含lib/文件夹（apk项目是否包含lib库文件）;在该文件夹下编写Android.mk脚本；理论上apk文件夹可以建立在项目内任意目录，编译系统会自动搜索并根据其内Android.mk(编译脚本)来进行编译。编译系统采用的是递归搜索
CD刻录的一点个人经验：铭大、铼德、三菱、万盛， Nero、Burnatonce、Burrrn、Feurio System_sleep CD刻录 CD音乐刻录 Feurio Burnatonce CD刻录碟 Nero
基本信息操作系统win1021H119043刻录机型号ASUSSDRW-08D3S-U（USB2.0外置）最低x10碟片信息1.铭大金碟（MNDA）江南水乡，制造商Plasmondatasystemsltd.ShortStrategyTypePhthalocyanine2.三菱AZO水蓝，制造商MitsubishChemicalCorporationLongStrategyTypeCyanine3
Java接口（3）与图书管理系统风吹落叶3257 java 开发语言
抽象类与接口的区别1.抽象类包含普通类和抽象方法，子类可以直接调用普通类方法不用重写。接口包含抽象方法和全局变量。2.抽象类有各种权限，接口只有pubilc。3.子类使用抽象类用extend，使用接口用implement。4.一个抽象类可以实现若干个接口，接口不能继承抽象类，但是接口可以继承多个接口5.一个类只能继承一个抽象类，一个子类可以实现多个接口。Object类Object类没有父类，可以引
Linux开启命令审计功能记录用户的每一步操作自由鬼安全运维技术 IT应用探讨 linux 运维服务器
默认情况下，Linux不记录用户的每一步操作到系统级别的日志文件中。但是，Linux确实记录了一些与用户操作相关的信息，并且提供了多种方法来开启更详细的用户操作记录，以满足安全审计或故障排除的需求。一、Linux默认记录的信息：用户登录和退出信息：Linux会记录用户的登录(login)和退出(logout)事件。这些信息通常被记录在/var/log/wtmp和/var/log/btmp文件中。你
深入探究LLamaFactory推理DeepSeek蒸馏模型时无法展示＜think＞思考过程的问题羊城迷鹿 DeepSeek LLama-Factory 思维链
文章目录问题背景初始测试与问题发现LLaMAFactory测试结果对照实验：Ollama测试系统性排查与解决方案探索1.尝试更换模板2.深入研究官方文档3.自定义模板实现优化界面展示：实现思考过程的可视化实现方法参数调整影响分析实验一实验二进入大模型应用与实战专栏|查看更多专栏内容问题背景最近在本地环境中部署了DeepSeek-R1-Distill-Qwen-1.5B，即由Qwen2.5-Math
迷你世界api 系统事件 yonghumyicunzai 游戏游戏游戏开发
迷你世界api系统事件游戏活动管理只需添加需要监视的事件，而无需创建事件对象，如下所示：--GameEvent---ScriptSupportEvent:registerEvent([=[Game.Start]=],Game_StartGame)ScriptSupportEvent:registerEvent([=[Game.Run]=],Game_Update)ScriptSupportEven
【学习笔记5】Linux下cuda、cudnn、pytorch版本对应关系 longii11 linux pytorch 运维
一、cuda和cudnnNVIDIACUDAToolkit（CUDA）为创建高性能GPU加速应用程序提供了一个开发环境。借助CUDA工具包，您可以在GPU加速的嵌入式系统、桌面工作站、企业数据中心、基于云的平台和HPC超级计算机上开发、优化和部署您的应用程序。该工具包包括GPU加速库、调试和优化工具、C/C++编译器以及用于部署应用程序的运行时库。全球的深度学习研究人员和框架开发人员都依赖cuDN
字节跳动2024校招后端开发面试题大全（含解题思路） AI天才研究院 ChatGPT AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
字节跳动2024校招后端开发面试题大全（含解题思路）关键词：字节跳动、校招、后端开发、面试题、解题思路摘要：本文将围绕字节跳动2024校招后端开发面试题进行深入分析，包括数据结构与算法、编程语言基础、后端技术栈、微服务架构、系统设计与优化等方面的面试题。通过详细解析这些面试题，帮助读者理解解题思路，提升后端开发面试技能。字节跳动2024校招后端开发面试背景字节跳动（ByteDance）是中国领先的
【Qt】Qt Widgets和QML（Qt Quick）开发界面的区别￡އއ昔年 qt 开发语言
Qt提供了两种主要的UI技术：QtWidgets和QML（QtQuick）。它们的核心区别主要体现在使用方式、架构、性能、开发难度和适用场景等方面。1.QtWidgetsvs.QML总体对比对比项QtWidgetsQML(QtQuick)语言C++(带QtUI库)QML+JavaScript(底层C++)渲染方式传统窗口系统控件（原生或模拟）基于OpenGL，使用GPU加速UI风格经典桌面UI（W
DeepSeek：AI赋能的无限可能——从日常生活到职业进阶的全场景探索 Hello kele 人工智能人工智能
引言在人工智能技术飞速发展的今天，DeepSeek作为一款国产AI工具，凭借其强大的推理能力、自然语言处理效率和场景化应用潜力，正在重塑人类解决问题的方式。从撰写演讲稿到制定投资策略，从家庭教育到企业管理，DeepSeek通过“自然语言对话”的交互模式，将复杂任务简化为几步提示词的输入，真正实现了“所想即所得”。本文将从七大核心场景出发，系统解析DeepSeek如何成为个人与组织的智能助手，推动效
MySQL锁机制深度解析：从乐观锁到悲观锁的哲学思辨与技术实践
一、并发控制的本质与挑战在数据库系统的核心地带，并发控制始终是保障数据一致性的核心命题。当每秒百万级的交易请求在金融系统中穿梭，当电商平台的库存数字在促销瞬间剧烈波动，当社交媒体的点赞计数以指数级增长时，数据库工程师们必须直面并发控制的终极挑战：如何在保证数据一致性的前提下，实现最大程度的并发性能。这个问题的解决之道，本质上是对"时间"这个维度的不同处理策略。悲观锁（PessimisticLock
企业信息查询系统的技术实现路径探析——以某大数据平台为例探熵科技大数据
引言在数字化转型加速的背景下，企业信息服务领域正经历着从传统工商查询向智能决策支持的演进。本文将以某企业信息查询系统为研究样本，解析其技术架构与实现路径，探讨大数据技术在企业服务场景中的落地应用。一、行业技术现状分析当前企业信息服务面临三大技术挑战：多源异构数据整合：需聚合工商数据（结构化）、招投标公告（半结构化）、企业新闻（非结构化）等差异化数据源数据实时性要求：企业经营状态变更、联系方式更新等
大数据面试系列之——Hadoop 潜心_守道大数据面经面试大数据 Hadoop
Hadoop的三个核心：HDFS（分布式存储系统）MapReduce（分布式计算系统）YARN(分布式资源调度)1.Hadoop集群的几种搭建模式1.单机模式：直接解压安装，不存在分布式存储系统2.伪分布式：NameNode和DataNode安装于同一个节点，无法体现分布式处理的优势。3.完全分布式：一个主节点，多个从节点，存在如果主节点宕机，集群就无法使用的缺点。4.高可用模式：多个主节点，多个
大型项目，选择conda还是Poetry要点分析 Hello kele conda Python Poetry AI编程人工智能
在大型项目中选择conda还是Poetry，取决于项目的具体需求，以下从多个维度进行分析，助你判断哪个更合适：包管理方面支持的包类型conda：作为跨语言的包管理系统，不仅能管理Python包，还能处理其他语言（如C、C++、R等）的包和依赖。对于大型项目，尤其是涉及多语言协同开发的项目，比如数据科学项目中可能会用到Python进行数据分析，同时依赖底层用C语言编写的高性能计算库，conda可以很
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi