OneCode2World

linux 学习笔记----文件系统的实现------目录实现和文件实现

转载自：http://c.biancheng.net/cpp/html/2625.html

文件系统的实现：目录实现和文件实现

零基础在线学习IT热门课程，掌握最前沿技术：北风网

C语言中文网VIP会员：低至19.9元/月，阅读所有高级教程，还有1T资料赠送！

目录实现

在读文件前，必须先打开文件。打开文件时，操作系统利用路径名找到相应目录项，目录项中提供了查找文件磁盘块所需要的信息。目录实现的基本方法有线性列表和哈希表两种。

1) 线性列表

最简单的目录实现方法是使用存储文件名和数据块指针的线性表。创建新文件时，必须首先搜索目录表以确定没有同名的文件存在，然后在目录表后增加一个目录项。删除文件则根据给定的文件名搜索目录表，接着释放分配给它的空间。若要重用目录项，有许多方法：可以将目录项标记为不再使用，或者将它加到空闲目录项表上，还可以将目录表中最后一个目录项复制到空闲位置，并降低目录表长度。釆用链表结构可以减少删除文件的时间。其优点在于实现简单，不过由于线性表的特殊性，比较费时。

2) 哈希表

哈希表根据文件名得到一个值，并返回一个指向线性列表中元素的指针。这种方法的优点是查找非常迅速，插入和删除也较简单，不过需要一些预备措施来避免冲突。最大的困难是哈希表长度固定以及哈希函数对表长的依赖性。

目录查询是通过在磁盘上反复搜索完成，需要不断地进行I/O操作，开销较大。所以如前面所述，为了减少I/O操作，把当前使用的文件目录复制到内存，以后要使用该文件时只要在内存中操作，从而降低了磁盘操作次数，提高了系统速度。

文件实现

1. 文件分配方式

文件分配对应于文件的物理结构，是指如何为文件分配磁盘块。常用的磁盘空间分配方法有三种：连续分配、链接分配和索引分配。有的系统（如RD0S操作系统）对三种方法都支持，但是更普遍的是一个系统只提供一种方法的支持。

1) 连续分配。

连续分配方法要求每个文件在磁盘上占有一组连续的块，如图4-12所示。磁盘地址定义了磁盘上的一个线性排序。这种排序使作业访问磁盘时需要的寻道数和寻道时间最小。

图4-12 连续分配

文件的连续分配可以用第一块的磁盘地址和连续块的数量来定义。如果文件有n块长并从位置b开始，那么该文件将占有块b, b+1, b+2, …, b+n-1。一个文件的目录条目包括开始块的地址和该文件所分配区域的长度。

连续分配支持顺序访问和直接访问。其优点是实现简单、存取速度快。缺点在于，文件长度不宜动态增加，因为一个文件末尾后的盘块可能已经分配给其他文件，一旦需要增加，就需要大量移动盘块。此外，反复增删文件后会产生外部碎片（与内存管理分配方式中的碎片相似)，并且很难确定一个文件需要的空间大小，因而只适用于长度固定的文件。

2) 链接分配。

链接分配是釆取离散分配的方式，消除了外部碎片，故而显著地提高了磁盘空间的利用率；又因为是根据文件的当前需求，为它分配必需的盘块，当文件动态增长时，可以动态地再为它分配盘块，故而无需事先知道文件的大小。此外，对文件的增、删、改也非常方便。链接分配又可以分为隐式链接和显式链接两种形式。

隐式连接如图4-13所示。每个文件对应一个磁盘块的链表；磁盘块分布在磁盘的任何地方，除最后一个盘块外，每一个盘块都有指向下一个盘块的指针，这些指针对用户是透明. 的。目录包括文件第一块的指针和最后一块的指针。

创建新文件时，目录中增加一个新条目。每个目录项都有一个指向文件首块的指针。该指针初始化为NULL以表示空文件，大小字段为0。写文件会通过空闲空间管理系统找到空闲块，将该块链接到文件的尾部，以便写入。读文件则通过块到块的指针顺序读块。

隐式链接分配的缺点在于无法直接访问盘块，只能通过指针顺序访问文件，以及盘块指针消耗了一定的存储空间。隐式链接分配的稳定性也是一个问题，系统在运行过程中由于软件或者硬件错误导致链表中的指针丢失或损坏，会导致文件数据的丢失。

图4-13 隐式链接分配

显式链接，是指把用于链接文件各物理块的指针，显式地存放在内存的一张链接表中。该表在整个磁盘仅设置一张，每个表项中存放链接指针，即下一个盘块号。在该表中，凡是属于某一文件的第一个盘块号，或者说是每一条链的链首指针所对应的盘块号，均作为文件地址被填入相应文件的FCB的“物理地址”字段中。由于查找记录的过程是在内存中进行的，因而不仅显著地提高了检索速度，而且大大减少了访问磁盘的次数。由于分配给文件的所有盘块号都放在该表中，故称该表为文件分配表（File Allocation Table, FAT)。

3) 索引分配。

链接分配解决了连续分配的外部碎片和文件大小管理的问题。但是，链接分配不能有效支持直接访问（FAT除外）。索引分配解决了这个问题，它把每个文件的所有的盘块号都集中放在一起构成索引块（表），如图4-14所示。

图4-14 索引分配

每个文件都有其索引块，这是一个磁盘块地址的数组。索引块的第i个条目指向文件的第i个块。目录条目包括索引块的地址。要读第i块，通过索引块的第i个条目的指针来查找和读入所需的块。

创建文件时，索引块的所有指针都设为空。当首次写入第i块时，先从空闲空间中取得一个块，再将其地址写到索引块的第i个条目。索引分配支持直接访问，且没有外部碎片问题。其缺点是由于索引块的分配，增加了系统存储空间的开销。索引块的大小是一个重要的问题，每个文件必须有一个索引块，因此索引块应尽可能小，但索引块太小就无法支持大文件。可以釆用以下机制来处理这个问题。

链接方案：一个索引块通常为一个磁盘块，因此，它本身能直接读写。为了处理大文件，可以将多个索引块链接起来。

多层索引：多层索引使第一层索引块指向第二层的索引块，第二层索引块再指向文件块。这种方法根据最大文件大小的要求，可以继续到第三层或第四层。例如，4096B的块，能在索引块中存入1024个4B的指针。两层索引允许1048576个数据块，即允许最大文件为4GB。

混合索引：将多种索引分配方式相结合的分配方式。例如，系统既釆用直接地址，又采用单级索引分配方式或两级索引分配方式。

表4-2是三种分配方式的比较。

表4-2 文件三种分配方式的比较
	访问第n个记录	优点	缺点
顺序分配	需访问磁盘1次	顺序存取时速度怏，当文件是定长时可以根据文件起始地址及记录长度进行随机访问	文件存储要求连续的存储空间，会产生碎片，也不利于文件的动态扩充
链接分配	需访问磁盘n次	可以解决外存的碎片问题，提髙了外存空间的利用率，动态增长较方便	只能按照文件的指针链顺序访问，查找效率低，指针信息存放消耗外存空间
索引分配	m级需访问磁盘m+1次	可以随机访问，易于文件的增删	索引表增加存储空间的开销，索引表的查找策略对文件系统效率影响较大

此外，访问文件需要两次访问外存——首先要读取索引块的内容，然后再访问具体的磁盘块，因而降低了文件的存取速度。为了解决这一问题，通常将文件的索引块读入内存的缓冲区中，以加快文件的访问速度。

2. 文件存储空间管理

1) 文件存储器空间的划分与初始化。

一般来说，一个文件存储在一个文件卷中。文件卷可以是物理盘的一部分，也可以是整个物理盘，支持超大型文件的文件卷也可以由多个物理盘组成，如图4-15所示。

在一个文件卷中，文件数据信息的空间（文件区）和存放文件控制信息FCB的空间（目录区）是分离的。由于存在很多种类的文件表示和存放格式，所以现代操作系统中一般都有很多不同的文件管理模块，通过它们可以访问不同格式的逻辑卷中的文件。逻辑卷在提供文件服务前，必须由对应的文件程序进行初始化，划分好目录区和文件区，建立空闲空间管理表格及存放逻辑卷信息的超级块。

2) 文件存储器空间管理。

文件存储设备分成许多大小相同的物理块，并以块为单位交换信息，因此，文件存储设备的管理实质上是对空闲块的组织和管理，它包括空闲块的组织、分配与回收等问题。

图4-15 逻辑卷与物理盘的关系

①空闲表法
空闲表法属于连续分配方式，它与内存的动态分配方式类似，为每个文件分配一块连续的存储空间。系统为外存上的所有空闲区建立一张空闲盘块表，每个空闲区对应于一个空闲表项，其中包括表项序号、该空闲区第一个盘块号、该区的空闲盘块数等信息。再将所有空闲区按其起始盘块号递增的次序排列，见表4-3。

空闲盘区的分配与内存的动态分配类似，同样是釆用首次适应算法、循环首次适应算法等。例如，在系统为某新创建的文件分配空闲盘块时，先顺序地检索空闲盘块表的各表项，直至找到第一个其大小能满足要求的空闲区，再将该盘区分配给用户，同时修改空闲盘块表。系统在对用户所释放的存储空间进行回收时，也釆取类似于内存回收的方法，即要考虑回收区是否与空闲表中插入点的前区和后区相邻接，对相邻接者应予以合并。

表4-3 空闲盘块表
序号	第一个空闲盘块号	空闲盘块数
1	2	4
2	9	3
3	15	5
4	--	--

②空闲链表法
将所有空闲盘区拉成一条空闲链，根据构成链所用的基本元素不同，可把链表分成两种形式：空闲盘块链和空闲盘区链。

空闲盘块链是将磁盘上的所有空闲空间，以盘块为单位拉成一条链。当用户因创建文件而请求分配存储空间时，系统从链首开始，依次摘下适当的数目的空闲盘块分配给用户。当用户因删除文件而释放存储空间时，系统将回收的盘块依次插入空闲盘块链的末尾。这种方法的优点是分配和回收一个盘块的过程非常简单，但在为一个文件分配盘块时，可能要重复多次操作。

空闲盘区链是将磁盘上的所有空闲盘区（每个盘区可包含若干个盘块）拉成一条链。在每个盘区上除含有用于指示下一个空闲盘区的指针外，还应有能指明本盘区大小（盘块数）的信息。分配盘区的方法与内存的动态分区分配类似，通常釆用首次适应算法。在回收盘区时，同样也要将回收区与相邻接的空闲盘区相合并。

③位示图法
位示图是利用二进制的一位来表示磁盘中一个盘块的使用情况，磁盘上所有的盘块都有一个二进制位与之对应。当其值为“0”时，表示对应的盘块空闲；当其值为“1”时，表示对应的盘块已分配。位示图法示意如图4-16所示。

盘块的分配：

顺序扫描位示图，从中找出一个或一组其值为“0”的二进制位。
将所找到的一个或一组二进制位，转换成与之对应的盘块号。假定找到的其值为“0” 的二进制位，位于位示图的第i行、第j列，则其相应的盘块号应按下式计算（n代表每行的位数）：
b = n (i-1) + j
修改位示图，令map[i, j] = 1。

盘块的回收：

将回收盘块的盘块号转换成位示图中的行号和列号。
转换公式为
i=(b-1)DIVn+l
j=(b-l)MOD n+1
修改位示图，令map[i, j] = 0。

④成组链接法
空闲表法和空闲链表法都不适合用于大型文件系统，因为这会使空闲表或空闲链表太大。在UNIX系统中釆用的是成组链接法，这种方法结合了空闲表和空闲链表两种方法，克月艮了表太大的缺点。其大致的思想是:把顺序的n个空闲扇区地址保存在第一个空闲扇区内，其后一个空闲扇区内则保存另一顺序空闲扇区的地址，如此继续，直至所有空闲扇区均予以链接。系统只需要保存一个指向第一个空闲扇区的指针。假设磁盘最初全为空闲扇区；其成组链接如图4-17所示。通过这种方式可以迅速找到大批空闲块地址。

图4-17 成组链接法示意图

表示文件存储器空闲空间的“位向量”表或第一个成组链块以及卷中的目录区、文件区划分信息都需要存放在辅存储器中，一般放在卷头位置，在UNIX系统中称为“超级块”。在对卷中文件进行操作前，“超级块”需要预先读入系统空间的主存，并且经常保持主存“超级块”与辅存卷中“超级块”的一致性。

注意：本书如无特别提示，所使用的位示图法，行和列都是从1开始编号。特别注意，如果题目中指明从0开始编号，则上述的计算方法要进行相应调整。

java版在线评标竞标邀标评审专家招标公告发布招投标系统源码 m0_72864708 java
功能描述1、门户管理：所有用户可在门户页面查看所有的公告信息及相关的通知信息。主要板块包含：招标公告、非招标公告、系统通知、政策法规。2、立项管理：企业用户可对需要采购的项目进行立项申请，并提交审批，查看所有的立项信息。主要功能包含：招标立项申请、非招标立项申请、采购立项管理。3、采购项目管理：可对项目采购过程全流程管理，包含功能有：评审人员的选取/抽取、基准价维护、供应商缴费审核、投标过程记录查
Java程序设计（二十四）：基于SSM框架的基于的快递代取系统的设计与实现人工智能_SYBH 2025年java程序设计 java python 开发语言 spring boot spring 后端
引言随着电子商务的发展，越来越多的高校学生通过网购获取日常所需物品，快递服务也逐渐成为大学生活中不可或缺的一部分。然而，繁忙的学习与生活让部分学生无法及时领取自己的快递，因此基于高校校园的快递代取服务应运而生。本文将详细介绍如何基于SSM（Spring、SpringMVC、MyBatis）技术栈设计并实现一个高校快递代取系统，解决高校学生快递代取问题。通过该系统，管理员、代取人和发布者三类用户可以
ESP32-C3入门教程环境篇③——VS Code IDE快速入门小康师兄 ESP32-C3入门教程 VS Code ESP32-C3 ESP32 嵌入式物联网
文章目录一、安装VisualStudioCode二、安装扩展三、配置ESP-IDF插件四、创建工程五、配置工程5.1选择目标芯片5.2项目配置方法一方法二六、编译工程6.1方法一6.2方法二七、固件分析八、固件下载8.1方法一8.2方法二8.3方法三九、串口日志9.1方法一9.2方法二十、遇到问题及解决10.1restartVisualStudioCodeandrunthiswizardagain
ESP32-C3入门教程环境篇①——简单介绍与硬件准备小康师兄 ESP32-C3入门教程物联网嵌入式 ESP32 ESP32-C3 WiFi
文章目录一、ESP32-C3简单介绍二、开发板差异三、开发板主要组件四、开发板原理图五、工作准备六、参考一、ESP32-C3简单介绍2.4GHzWi-Fi低功耗蓝牙高性能32位RISC-V单核处理器多种外设内置安全硬件二、开发板差异官方文档介绍了两种开发板ESP32-C3-DevKitM-1ESP32-C3-DevKitC-02认真看了下资料介绍，其实会发现两个开发板都差不多，底板功能pin都差不
如何修改Chromium内核|浏览器指纹伪装|Puppeteer指纹|Playwright指纹- Chromium内核修改与浏览器指纹伪装方法-anti-fingerprint指纹浏览器如何搭建环境药尘韩立前端 javascript 开发语言 python 自动化 ai
Chromium内核是许多现代浏览器的基础，如Chrome和Edge。在进行网络爬取、自动化测试或数据挖掘等任务时，使用Puppeteer或Playwright等工具时，浏览器指纹的重要性不言而喻。本文将介绍如何修改Chromium内核以及浏览器指纹伪装的方法，以构建一个抗指纹的浏览环境。首先，了解如何修改Chromium内核是至关重要的。您可以从Chromium源代码仓库中获取最新的代码，并根据
账号IP属地：依据手机号还是网络环境？ hgdlip 网络 ip 网络 tcp/ip 服务器
在数字化生活中，账号的IP属地信息往往成为我们关注的一个焦点。无论是出于安全考虑，还是为了满足某些特定服务的需求，了解账号IP属地的确定方式都显得尤为重要。那么，账号IP属地根据手机号还是网络来确定的呢？本文将深入探讨这一问题。一、IP地址与账号属地显示的基本原理IP地址，即互联网协议地址，是互联网中用于唯一标识网络设备的数字标签。每当我们的设备（如手机、电脑）连接到互联网时，都会被分配一个或多个
网络传输中的三张表，MAC地址表、ARP缓存表以及路由表 h490516509 网络编程
一：MAC地址表详解说到MAC地址表，就不得不说一下交换机的工作原理了，因为交换机是根据MAC地址表转发数据帧的。在交换机中有一张记录着局域网主机MAC地址与交换机接口的对应关系的表，交换机就是根据这张表负责将数据帧传输到指定的主机上的。交换机的工作原理交换机在接收到数据帧以后，首先、会记录数据帧中的源MAC地址和对应的接口到MAC表中，接着、会检查自己的MAC表中是否有数据帧中目标MAC地址的信
在 Windows 系统上，将 Ubuntu 从 C 盘迁移到 D 盘 YiHanXii windows ubuntu postgresql
在Windows系统上，如果你使用的是WSL（WindowsSubsystemforLinux）并安装了Ubuntu，你可以将Ubuntu从C盘迁移到D盘。迁移过程涉及导出当前的Ubuntu发行版，然后将其导入到D盘的目标目录。以下是详细的步骤：1.导出Ubuntu发行版首先，你需要将Ubuntu发行版从当前的C盘导出为.tar文件。打开PowerShell（管理员权限）：按Win+X，选择Win
【深度学习】常见模型-卷积神经网络（Convolutional Neural Networks, CNN） IT古董人工智能深度学习机器学习深度学习 cnn 人工智能
卷积神经网络（CNN）概念简介卷积神经网络（ConvolutionalNeuralNetworks,CNN）是一种专门用于处理数据具有网格状拓扑结构（如图像、语音）的深度学习模型。它通过卷积操作从输入数据中提取局部特征，并逐层构建更复杂的特征表示，广泛应用于图像分类、目标检测、语音识别等领域。关键组成部分卷积层（ConvolutionalLayer）使用卷积核（滤波器）在输入上滑动，提取局部特征。
solidity基础 -- 映射迭代第十六年盛夏. Solidity 区块链智能合约
前提提要本文中出现的所有代码均可在本人GitHubGitHub--solidity学习代码中查询到基本概念在Solidity中，映射是一种非常有用的数据结构，它允许我们通过键来快速访问值。然而，映射本身是不可迭代的，这意味着我们不能直接遍历映射中的所有键值对。在某些情况下，我们需要对映射中的数据进行迭代操作，例如在处理用户余额、资产记录等场景时。为了实现映射的迭代功能，我们可以结合使用数组和映射来
solidity基础 -- 合约结构第十六年盛夏. Solidity 区块链智能合约
所有本篇以及以前出现的代码均可以在本人GitHubGitHub-solidity学习代码上找到合约结构在Solidity中，合约类似于面向对象编程语言中的类。每个合约中可以包含状态变量、函数、函数修饰器、事件、结构类型、和枚举类型的声明，且合约可以从其他合约继承。状态变量状态变量是永久地存储在合约存储中的值。pragmasolidity^0.4.0;contractSimpleStorage{ui
NVIDIA L40s、A10、A40、A100、A6000横评，哪个GPU 更适合 AI 推理任务？ DO_Community 技术科普商业建议人工智能 gpu算力 DigitalOcean ai AIGC
近年来，随着人工智能技术的发展，特别是深度学习模型的广泛应用，GPU（图形处理单元）作为加速计算的重要硬件，在AI领域扮演着越来越重要的角色。AI推理是指已经训练好的模型对新数据进行预测的过程。与训练阶段相比，推理通常对GPU的要求有所不同，更注重于能效比、延迟以及并发处理能力。本文将从这些角度出发，对比分析NVIDIA的L40s、A10、A40、A100、A6000五款GPU在AI推理任务中的表
Linux基于Redis实现短地址服务百晓生-小小白数据库服务器 linux redis 缓存 c语言后端
一、应用场景为什么要使用短地址服务，具体使用的业务场景如下：URL压缩，把原始长地址压缩成短地址，便于文本长度限制的场景使用（短信、社交网络、网络营销）—营销短信有字数限制，链接太长会影响短信内容的条数（涉及到费用问题）。—相对于长链接，短链接更安全，不暴露访问参数，同时可以做访问限制。—方便短链接进行统计。例如网络新媒体营销渠道统计，点击量，访问用户使用设备等。—短链接更简洁，不像长链接有一大堆
【趋势】《2024—2026金融科技十大趋势预测》一览学客汇商业研究商业观察人工智能大数据金融科技科技洞察 IT趋势金融行业预测
本白皮书基于新华三在金融行业的前沿实践和IDC的全球研究成果，深入分析了金融科技领域的十大关键趋势，旨在为金融机构提供前瞻性的战略指导和业务创新的参考。导言当前，在地缘政治冲突加剧、商业经济市场环境高度不确定、数字化业务加速发展的背景下，金融行业处于深度变革的潮流中，金融机构亟需重新思考其在技术支出、业务决策及业务创新发展等方面的投资重点。此外，金融机构也越来越需要借助大数据和AI技术来提升业务的
航空客户价值的数据挖掘与分析（numpy+pandas+matplotlib+scikit-learn） Want595 Python数据分析数据挖掘 numpy pandas
文章目录航空客户价值的数据挖掘与分析（numpy+pandas+matplotlib+scikit-learn）写在前面背景与挖掘目标1.1需求背景1.2挖掘目标1.3项目概述项目分析方法规划2.1RFM模型2.2LRFMC模型指标2.3分析总体流程图数据抽取探索及预处理3.1数据抽取3.2数据探索分析3.3数据预处理3.3.1数据清洗3.3.2属性规约3.3.3数据变换数据建模&应用4.1模型构
mysql 学习3 SQL语句--整体概述。SQL通用语法；DDL创建数据库，查看数据库，删除数据库，使用数据库； hunandede mysql 学习 sql
SQL通用语法SQL语句分类DDLdatadefinitionlanguage:用来创建数据库，创建表，创建表中的字段，创建索引。因此成为数据定义语言DMLdatamanipulationlanguage有了数据库和表以及字段后，那么我们就需要给这个表中添加数据，删除数据，改动数据，这些都是对数据有改动的行为，因此叫做数据操作语言manipulation中文是操作的意思DQLdataqueryla
跨域问题及其解决方案山禾女鬼001 网络网络协议
在现代Web开发中，跨域问题是开发者经常遇到的一个难题，尤其是在前后端分离架构中。跨域问题的核心在于浏览器的同源策略，这种策略的设计目的是防止恶意网站窃取用户的数据。然而，在一些场景下，比如前后端分离的Web应用中，前端需要访问不同域的资源，这时就会遇到跨域请求的问题。为了解决这个问题，CORS（跨域资源共享）机制应运而生。本文将详细探讨跨域问题的成因、CORS机制的工作原理以及常见的跨域解决方案
浅谈Linux C基础9----数据链表 Oracle_666 linux c语言运维
前言:基于C语言实现数据链表1.实现代码函数:#include"loop_list.h"//创建单向循环链表node_pcreate_loop(){node_pH=(node_p)malloc(sizeof(node));if(H==NULL){printf("空间申请失败\n");returnNULL;}H->data=0;//链表中暂无数据H->next=H;//单向循环链表，尾结点指向头结点
linux性能提升之sendmmsg和recvmmsg 夏天匆匆2过 C/C++linux 单片机 c++网络协议 udp tcp
目录sendmsg、sendmmsg和recvmmsg相关结构体：mmsghdr、msghdr、iovecsendmmsg性能测试关于connectsendmsg、sendmmsg和recvmmsg以udp发送为例。sendmsg和sendmmsg：两者都能发送多块数据，区别在于sendmsg会将所有数据整合成一个UDP包发出，sendmmsg是每个mmsghdr一个UDP包。sendmmsg是s
GBase 8s数据库替换Oracle方案简介 wangzhejijie 国产数据库数据库架构数据仓库数据库
采用GBase8s安全数据库替换Oracle应用数据库，其优势如下：系统兼容性得到全面提升。GBase8s安全数据库作为国产自主可控产品，全面兼容国产化软硬件环境。系统安全性得到提升。首先GBase8s是一款安全数据库，其安全等级高于Oracle数据库；其次GBase8s作为通用关系型数据库，可对应用系统提供更好的查询和分析支持。重新统一规划，综合考虑未来业务因素的数据量增长及服务器性能，预估未来
Markdown Viewer 浏览器, vscode sun007700 linux
使用VSCode插件打造完美的MarkDown编辑器（插件安装、插件配置、markdown语法）_vscodemarkdown-CSDN博客右键.md文件，选择打开方式（安装一些markdown的插件)vscode如何预览markdown文件|FromideaGitCode-全球开发者的开源社区,开源代码托管平台MarkdownViewer安装与配置完全指南-CSDN博客Chrome安装Markd
文本嵌入技术Text Embedding模型详解：text2vec、OpenAI ada-002到M3E及BGE-M3的演变汀、人工智能 embedding RAG 文本嵌入词嵌入模型 m3e bge
TextEmbedding模型：从text2vec、openai-textembedding到m3e、BGE1.TextEmbedding榜单：MTEB、C-MTEB1.1《MTEB:MassiveTextEmbeddingBenchmark(海量文本嵌入基准)》判断哪些文本嵌入模型效果较好，通常需要一个评估指标来进行比较，《MTEB:MassiveTextEmbeddingBenchmark(海
selenium自动化测试01 Meng XY selenium自动化测试 selenium 自动化测试工具
前言新人一个，打算写写博客，去记录个人的学习历程。花了一周的时间去学习了selenium自动化，然后记录下来，一些语法、代码之类的。文笔不是很好，一些代码标注、注释可能不是很准确，望见谅。selenium自动化测试呢我用的是Java+maven，工具是IDEA。我在学习自动化的时候用的是eclipse，我习惯用IDEA，看个人喜好了。（要有Java编程基础，Java的话可能会在后续上线，还没写）介
QGroundControl（QGC）详细介绍 QGC二次开发 QGC qt qml QGC 无人机地面控制站无人机无人机手持机
目录一.QGC官网：1.64位版本Windows：2.MacOSX：3.UbuntuLinux：二.QGC的基本功能1.无人机控制2.实时监视3.校准功能4.设置功能5.传感器校准6.通信协议支持三.QGC的用途1.航拍与地形测绘2.农业监测3.环境监测4.搜索与救援5.安全巡逻与监控QGroundControl（简称QGC）是一款开源的无人机地面站软件，专为无人机操作员设计，集成了实时飞行监控、
web开发工具之：一、UUID的介绍，java如何产生UUID，作为数据库的主键和加密算法的盐 java冯坚持 web开发 java 数据库
文章目录前言一、UUID是什么二、java如何产生UUID1.生成随机UUID（Version4）2.通过指定的字符串生成UUID三、UUID作为数据库主键1.优点2.缺点四、UUID作为加密的盐总结前言现在web开发中，很多使用UUID作为主键和加密的盐的，其实很简单，这里学习和介绍一下。一、UUID是什么UUID（UniversallyUniqueIdentifier，通用唯一标识符）是一种1
web开发工具之：二、加密和解密工具类，学习加密算法和非加密算法（哈希算法）知识，Java支持MD5和SHA系列的哈希算法。使用UUID作为盐进行增强哈希算法加密的数据完整性验证 java冯坚持 web开发前端学习哈希算法
文章目录前言一、加密算法/非加密算法-了解和学习为主1、加密算法和秘钥a、介绍b、常用加密算法-对称加密算法c、常用加密算法-对称加密算法2、非加密算法：哈希算法（MD5、SHA系列）a、哈希算法介绍b、MD5和SHA系列介绍二、哈希算法应用场景概念介绍1.数据完整性验证2.密码存储（借助数据完整性验证来进行密码存储）3.数字签名4.总结三、注册和登录-采用哈希算法进行密码存储和验证流程1.加密过
国内的AI大模型有可能超过ChatGPT吗？ AIWritePaper官方账号 Prompt ChatGPT AIWritePaper chatgpt 人工智能深度学习 AI写作 AIGC
这是一个非常有前瞻性和现实意义的问题。要回答国内AI是否有可能超过ChatGPT，我们需要从多个方面来分析，包括技术基础、数据资源、应用场景、政策支持以及人才储备等。以下是对这一问题的详细探讨：1.技术基础（1）现状国内AI技术：国内的AI技术发展迅速，尤其在深度学习、自然语言处理（NLP）和计算机视觉等领域已经取得了显著进展。例如，百度的文心一言、阿里的通义千问等大语言模型（LLM）已经在技术上
路径矢量路由协议之BGP-1基础知识 pt1043 BGP 网络
BGP（BorderGatewayProtocol，边界网关协议）是现代网络架构中几乎所有高级技术的基础，任何一项现代网络体系下的高级技术都离不开它。在学习BGP之前，需要具备一定的基础知识。基础准备：CCNA基础——至少需要一半的CCNA基础；推荐阅读《CCNA学习指南：路由和交换认证》（作者：ToddLammle）。OSPF——如果具备基本的多区域OSPF或其他IGP等理论和配置能力，将为学习
Jetson Orin Nano Super之jetson-fpv开源代码下载 lida2003 DIY Drones Linux linux 开源 jetson-fpv
JetsonOrinNanoSuper之jetson-fpv开源代码下载1.源由2.方法2.1优化配置方案一：增加缓冲方案二：降低并发数方案三：临时禁用深度克隆2.2路径更换方案一：设置代理方案二：替换git协议方案三：替换https协议方案四：手动clone3.总结4.参考资料1.源由问题还是源于国内的网络环境，应该说对于技术研发来说非常不友好。虽然，前面有过很多方式方法，但是“与时俱进”的氛围
C语言从入门到精通 - 学习资源颜栩原
C语言从入门到精通-学习资源【下载地址】C语言从入门到精通-学习资源C语言从入门到精通-学习资源欢迎来到《C语言从入门到精通》的学习资源页面项目地址:https://gitcode.com/open-source-toolkit/a3eac欢迎来到《C语言从入门到精通》的学习资源页面。这本书是专为那些渴望深入理解并掌握C语言的初学者以及进阶者所准备的宝贵资料。通过本书，你将能够系统地学习C语言的基
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><