亦梦亦醒乐逍遥

操作系统笔记——储存系统、文件系统（王道408）

文章目录

前言
储存系统
- 地址转换
- 内存扩展
- - 覆盖
  - 交换
- 储存器分配——连续分配
- - 固定大小分区
  - 动态分区分配
  - 动态分区分配算法
- 储存器分配——非连续分配
- - 页式管理
  - - 基本思想
    - 地址变换硬件
    - 快表（TLB）
    - 多级页表
  - 段式管理
  - 段页式管理
- 虚拟储存器——基于交换的内存扩充技术
- - 基本概念
  - 请求分页
  - 页面置换算法
  - 页面分配策略、抖动、工作集
  - 内存映射文件
文件管理
- 概述
- 目录结构
- - 文件目录的概念
  - 文件目录结构
  - 索引节点
- 文件结构
- - 文件结构分类
  - 逻辑结构
  - - 顺序文件
    - 索引文件
    - 索引顺序文件
  - 物理结构
  - - 磁盘块
    - 连续分配（顺序分配）
    - 链接分配
    - 索引分配
  - 逻辑结构vs物理结构（难点）
  - 从头查找一个文件的过程
- 文件储存空间管理（空闲部分）
- - 空闲表
  - 空闲链表
  - 位示图
  - 成组链表
- 文件管理服务
- - 文件基本操作
  - 文件共享
  - 文件保护
- 文件系统
- - 文件系统的布局
  - 虚拟文件系统
  - 文件系统挂载

前言

属实是极限冲刺了，距离考研还有10天，我还有俩本书没学完（乐），昨天一下午一晚上学完进程，今天再接再厉，直接学完储存和文件系统

IO部分参见我的计组笔记，非常详细

储存系统

我不喜欢重复造轮子，这一章我会比较简略，尽量写高层次的思想，具体内容我的另一篇笔记里面记录的很详细，如果基础不是很好，可以对照看。

操作系统笔记——储存器管理、文件管理、设备管理

地址转换

关于物理地址：

逻辑地址：从源程序到汇编语言程序的这些阶段，都用逻辑地址
- 逻辑地址默认0为地址起点，不考虑和其他程序之间的相互作用
- 因此，后续几步，直到把程序装入内存的整个过程，肯定是要将逻辑地址变为物理地址的
后续的步骤为编译链接为目标模块，装入内存。如何变，就形成了3种不同的方法
- 绝对装入（很low，没OS才这么做）：在编译链接阶段形成物理地址
- 静态重定位（可重定位装入）：在装入的过程中，将指令内容修改，形成物理地址
- 动态重定位（动态运行时装入）：指令内容一直是逻辑地址，使用重定位寄存器辅助地址偏移，在程序真正运行访存的时候才形成物理地址

（才发现我们OS老师上课用的那张图是从王道这里来的，我就说风格怎么不一样）

我们前面讨论的是如何形成物理地址，其实形成如何把多个.o文件的逻辑地址统一起来，也是一个需要注意的点，这个技术就是链接

静态链接：链接阶段一次性组合
动态链接
- 装入时动态链接：装入的时候，一次性组合
- 运行时动态链接：调用的时候，才针对性的装入对应的模块（.dll动态链接库）

联系前面的物理地址生成，很显然，绝对装入方法只能搭配静态链接使用，而动态链接只能和重定位方法结合使用

视角抬高，内存管理除了负责部分地址转换以外，还有很多功能。

内存保护的两种思路：

上下限寄存器：直接记录程序物理地址的上下线
重定位寄存器+界地址寄存器：界地址寄存器规定了逻辑地址的上限

内存扩展

覆盖

覆盖，就是让互斥的程序段公用一片内存，有两种可能：

固定区：互斥程序段只有一个，那么这片区域就是独占
- 一般来说，只有一个固定区（main函数）
覆盖区：有多个程序公用，每一个覆盖区都由当前覆盖段里占内存最大的模块决定。
- 比如B先用内存，C要用，就把B的部分直接覆盖就行，这也是这个名字的来源

这个方法的缺点就是需要人为指定覆盖结构（计算机不会分析），不方便。

交换

交换就是把暂时不用的程序换出，腾出空间给其他程序运行。

结合第二章，交换其实就对应着中级调度
因此换出的程序首选被挂起的程序，其次就是低优先级的，总之尽可能减小换出的副作用。

交换区要频繁读写，因此单独划出。
为了加快读写，采用连续分配的方式管理磁盘（IO更快）

储存器分配——连续分配

所谓连续分配，就是程序要放就是一整段全放进去，不可以拆开。

固定大小分区

说白了，单一连续分配就是只有一个应用分区
因此没有外部碎片，只有内部碎片

下面的固定分区分配，其实就是把这一个区，拆分成多个固定的区，只分配，不改变大小。
既然思想一致，只是分区数量的差异，那么碎片的逻辑也就一样了。

多个分区还要进行管理，需要一个固定分区表，这个表能修改的只有分配标记

如果最大的那个分区都满足不了当前程序，就上覆盖技术。

动态分区分配

动态分区就是固定分区加强版，除了可以修改标记以外，还可以修改区域的大小。

数据结构有两种：

分区表
- 沿用固定分区的思路
空闲分区链。这里注意一下其结构
- 这是一个双向链表，有首尾两侧链域
- 中间部分，可以存放分区的描述信息

分配和回收的过程中，要涉及到分区的拆分和回收合并：

拆分：动态分配算法
回收：会涉及到表项/节点的修改或者删除，要具体讨论

动态分区的思路，可以保证新分的区是满的，所以没有内部碎片
代价就是会产生外部碎片，内存中有一些地方因为太小是怎么也用不到的

解决方法也很直接，就是把分区挪一下，挤一挤，即紧凑技术。
很明显，程序在这个过程中浮动了，因此只能搭配动态运行时装入（动态重定位）技术使用。

动态分区分配算法

首次适应
- 遍历空闲分区表/链，第一个能用的就直接用，同时进行修改
- 优点：快
最佳适应（最小适应）
- 一种粗暴的思路是遍历全部空闲分区链
- 另一种更好一点的思路是维持空闲分区链的有序性
  - 在修改后重新排序，因为分配只会导致减小，所以我们只需要对着前半截进行一次插入排序即可
- 优点：保证大空间
- 缺点：产生小碎片，慢
最坏适应（最大适应）
- 与2反其道而行之
- 优点：减少小碎片
- 缺点：破坏大空间，慢
邻近适应
- 对1的修改
- 从上一次停下的位置开始查找，这样可以跳过前面因为分配而产生的小空间，快速用到后面的大空间
- 缺点是破坏大空间
- 优点是比首次适应还快

储存器分配——非连续分配

页式管理

基本思想

页式管理其实是分区的进化版，将分区粒度变得非常细，同时用页表建立索引，因此可以分散储存，大大提高空间利用率。

页表负责索引功能，将逻辑页号转为物理页号，这里区分一下名词：

逻辑页：对应程序，叫页，页面
物理页：对应内存，叫页框，页帧，物理块，物理页面，内存块

因为逻辑页是连续递增的，因此直接隐含在偏移地址里了，不在页表项里，而页表项的长度一定是要对齐的（k字节）

如何转换呢？

逻辑到物理：
- 说白了就是用索引表的页号查找对应页框号，然后拼接就可以
- 注意，页框号要乘系数才是页起始地址
物理到逻辑：
- 1的逆过程，在二进制下其实很简单，直接截取地址，后半段就是页内偏移，前半段就是页框号
- 本质在于，页框大小固定，因此两部分都是定长

地址变换硬件

学过汇编的话，这个过程非常熟悉。

因为页表位置可以浮动，我们干脆就用一个页表寄存器储存地址（PTR）
考虑到安全性检验，还要再存页表长度，这两个是分成两节存在一个寄存器里的

需要注意，既然是寄存器，那其实也是程序上下文，所以随着进程切换，肯定也会有装入和保存的过程

这个转换流程，用字母描述：

P页号
W页内偏移
需要注意的是越界验证，因为PTR存的是页表长度，所以是虚高1位的，因此只要P等于M，就算越界
我们都是手算，实际上计算机直接拼接就行

前面说到页表项大小要对齐到k字节，实际上不仅仅如此。

3B情况下，会产生页框内碎片，那么我如果要访问这个碎片地址上的页表项呢？那只能+1偏移，这样做很麻烦，而且容易出bug

所以干脆进行二次对齐，对齐到能够被页框大小整除，所以一般是用4字节，做题的时候要考虑这两种对齐。

快表（TLB）

参考cache原理，TLB其实就是页表的cache，材料也都是SRAM，只不过TLB的等级还要在cache之上，是最紧贴CPU的

TLB是一种cache，更具体的说，应该是全相联方式储存的模式。

因此快表不能像页表那样，把页号隐藏在地址里，而是多加一个字段，且每次要遍历快表。

查找过程有两种：

先查TLB，再查页表
同时查询

进而衍生出不同耗时·的计算结果

TLB和cache的区别：

cache会缓存一整个内存块
TLB只cache页表项
- 从这个角度来看，其实TLB就是比cache更细，TLB是内存块的cache，而cache是整个内存的cache

多级页表

当一个页表存不下页表项，就需要用二级。

一般来说，只有二级页表，实际上可以多层

区分一下名称：

二级页表
- 外层页表，或顶层页表，页目录表
- 每一行：页目录项，页表描述符
一级页表
- 每一行：页表项，页描述符

转换过程无非就是前N次确定最终页号，最后1次进行访存，即N+1次

页表具体分几级，要根据地址长度来定，先抛去页内偏移，之后看看能拆几节页号地址。

段式管理

首先要明确，段式管理和页式管理是并列的，都是非连续的分配。

段式管理很像动态分区，但领域不一样：

动态分区是给内存进行分区，分区表是针对内存的，每个分区对应一个进程
段式管理是给进程空间进行分区，段表是针对一个进程的，每个分区对应程序的一个内存段

段表和页式管理类似，每个段表项都是等长的，段号都是隐含的（但是段不等长）
寻址过程也很类似，都是两次+越界检测
越界也是同理，这个段长是具体长度，虚高，所以只要满足W=C就代表越界了

从设计理念上来说，段页还是不同的，如下：

页式管理完全是为了系统服务的
- 是物理性的，纯粹按照地址切分的
- 用户不可见
段式管理更多的是为了用户服务
- 是逻辑性的，分模块的
- 用户可见

由设计理念来引申，共享与保护：

因为段是逻辑的，我们共享的时候也是按照模块共享的，逻辑上非常直观
- 比如我可以专门为可重入代码，或者共享数据建立一个段，这个段直接整体共享即可（不可重入代码不可共享）
- 而页并不具备这种逻辑的整体性，一页里面可能啥都有
同理，段也更有利于保护，整个模块一起保护很方便
- 页的内容很复杂错乱，所以共享管理很麻烦

定不定长也是一个区分点：

页式管理定长，因此给定一个逻辑地址，就可以直接通过除法运算锁定页号
- 页式管理一维，给地址直接上线性地址
段式管理不定长，给一个逻辑地址，只能截取段号，而不是除法运算
- 因此段式管理是二维的，给地址的时候要给两部分，段命（对应段号）和段内地址

段页式管理

终于到了段页式管理了，这才是版本真神。

段页式管理是页+段的综合，底层用页，高层用段。
另一种理解就是把二级页表爆改成段表了

段页式是两级的，所以访存次数是2+1=3
要进行两次越界判断，由此可得，其实二级页表也得进行两次越界判断。

注意，这个TLB是把段号和页号一起作为一个tag的，而不是弄两个TLB

虚拟储存器——基于交换的内存扩充技术

基本概念

虚拟内存的特征：

多次性：针对装入过程来说
对换性：内外交换
虚拟性：针对空间视图来说，看到的很大，但是是虚拟的

因为虚拟内存是把进程的内存空间拆分了，所以必须使用非连续性内存分配技术。
在此基础上，增添两个功能：

请求调入
置换

后面以页举例，更复杂的也是类似逻辑。

请求分页

请求分页逻辑可以参考cache来，其实是一个思想
但是具体还是不太一样：cache仅仅是缓存，管理能力很弱，而虚拟内存的管理能力很强，除了页框内容的缓存外，还专门有页表来管理页框，我们研究的其实是页表的管理。

请求页表结构：

首先，虚拟页表的管控对象是内存+外存
- 管控对象到底在内存还是外存？因此要用状态位+内存块号+外存地址进行区分和寻址
其次，考虑置换过程
- 置换哪一个？因此要有访问字段，辅助置换算法
- 换出的时候是否要写回？因此有修改位，需要考虑是否被修改（类似cache脏位）

如果目标页的有效位=0，说明在外存，发生缺页中断。
注意，缺页中断并不是外中断，而是广义的中断，实际上是异常。

之后研究一下请求分页管理中的细节，其实和基本分页的区别无非就是两点：

额外的检查
- 状态位
额外的修改
- 外存：置换前是否写回外存
- 页表：置换后页表的标志位要刷新
- TLB：快表的有效位恒等于1，因此换出的时候，要TLB删除（否则出错），换入的时候也可以根据局部性原理将这个页表项复制到TLB

不过不得不说，这个过程真的挺复杂的，后面做题继续细化吧，你且知道相关联的三个部分就可以：外存，页表项（以及对应的页框），TLB

页面置换算法

这几个方法在我另一篇笔记里已经有详细的描述了，这里进行细化。
注意，页面置换次数≠缺页次数，缺页是要更加广泛的，注意题目问的是哪个。

首先是OPT

具体做的时候，就是从发生缺页的位置开始，查看后面要调用的页，在这里面找我们当前物理块里装的页，排在最后一个的就是要置换出去的。

然后是FIFO和LRU，具体过程很简单：

FIFO，有两种理解方式，效果相同，做题的时候自己看着办
- 新进来的页会把原来的页推下去，末位淘汰，直观
- 另一种理解方式是用一个指针指向即将要替换的位置，每次替换都让指针挪一位
LRU，也是两种理解方式
- 类似于FIFO的下推+末位淘汰，但是如果命中，就把这个块提到最上面（刷新存在感）
- 另一种理解方式是逆向遍历访问序列，类似于OPT，最后一个出现的就是要淘汰的（只不过方向相反）
效果对比
- FIFO有Belady异常，而LRU就没有
- LRU效果是最接近OPT的，但是开销太大，需要硬件计时器（参考cache替换），要求的数量还不少。

再说时钟置换算法CLOCK(NRU)

思想很简单：

排成循环队列
命中，刷新访问位=1
- 注意，命中不需要转时钟，指针不变
不命中，按照时钟方式扫描，进行替换
- 1置0，访问位=1，相当于免死金牌
- 0置换，访问位=0，则受斩
  - 置换后要将指针后移，防止这个新的页面在下一轮扫描的一开始就掉血

极限情况是进行1轮+1次扫描，也就是两轮扫描，这个方法兼顾了效率和效果。

改进NRU还考虑到了写回的IO损耗，尽可能避免IO（替换修改位=0的页面），同时还要维持原本NRU的原则，于是根据（访问位，修改位），可以分成4个优先级：

0,0，既没用，又没修改过，直接换
0,1，没用，但是被修改过，换的成本大点，但是造成的影响不大
1,0，用过，不得不换，只能找个换的成本小点的
1,1，成本最大，不得已的办法

具体如何去扫描呢？分4轮：

先在没访问过的里面扫两轮
- 第一轮扫（0,0），
- 第二轮扫（0,1），同时置零访问位
- 第二轮才会像NRU一样置零访问位，因为这两轮整体并做对访问位的检查，所以只置零一次
之后在访问过的里面扫两轮
- 注意，这两轮本来是（1,0），（1,1）的专长，但是因为第一组操作已经把访问位置0，所以走到这里的，肯定在第一组操作之前全部都是（1，x）的情况
- 第三轮扫（0,0）
- 第四轮扫（0,1），走到这一步一定会有一个页被置换出去
- 这一组操作其实是针对修改位而来的

改进NRU非常的完美：

两组操作继承自NRU，对访问位的置0也和NRU完全一致
而在在两组操作内部，又加入了对修改位的考察

虽然改进NRU最多进行4轮考察，但是这点内存中的消耗和降低IO损耗带来的收益相比，微不足道

页面分配策略、抖动、工作集

之后介绍三种分配+置换的搭配：

固定分配+局部置换
- 其实就是我们前面做题的时候用的思路
- 当前进程和外存进行交换
可变分配+全局置换
- 只要缺页，就增加物理块
- 当前进程不直接和外存进行交换，而是直接用空闲的，或者从其他进程抢一个（未锁定）的页框过来
- 之所以不直接，是因为抢夺其他进程页框，也会间接导致其他进程的交换，实际上还是要交换
- 这个方法反而还不如局部置换稳定
可变分配+局部置换
- 在1的前提下，如果系统察觉到1的缺页率比较高，就分配空闲块
- 当然，3方法也存在抢夺物理块的情况，但是频率比2低多了

请求调页
- 就是缺页中断，精确度很高，IO开销大
预调页策略
- 目标是减少IO开销
- 就是一种预测，因为其效果一般，所以只是在程序刚启动才这么干，这个时候调入不需要置换，就算翻车也无所谓。

再论从何处调页：

普通系统
- 对换区大，那就全在对换区操作就行，因此要先复制到对换区再调入
- 对换区小，因此要尽可能精细化，只把要修改的，可能反复IO的数据写回到对换区
Unix系统
- 介于普通系统的两个策略之间，精细度居中
- 第一次是从文件区调入
- 之后换出的页面，不管是否被修改过，都放到对换区

内存映射文件

传统文件读写，要进行内存文件的多级索引，比较麻烦，如果你不是一次性读入，那么每读一个块都要多级索引一次。

内存映射文件直接把文件索引一次性读到内存里，分出一些页表项直接把文件地址记录进去
出于效率考虑，这里只是分配了页表项，并没有将文件读入，但是后续的读入已经很简单了，不需要多级索引，只需要IO就可以，效率高多了。

修改只需要在内存中，这进一步减少了IO损耗，最后进程关闭文件的时候，才将文件一次性写回，非常方便。

总之，内存映射，既可以减少索引损耗，又可以减少IO损耗

文件映射还有另一个好处，就是便于共享文件。

注意区分页表项和物理页框，实际上读入后的文件是放在物理页框里的，我们说的共享只是让不同进程的页表项指向同一个页框。

文件管理

文件系统复杂之处在于非常庞杂，需要一个良好的整体观，明确区分各种概念，接下来直接简要的把整个文件系统简单概括一下：

文件这一章整体都比较乱，因为文件系统确实是比较庞大，我在看我以前笔记的时候也同样有此感觉，因此我在这篇笔记里要尽可能让宏观逻辑顺畅。

因为文件系统庞大，所以我会自上而下的写（1,2，3），从逻辑逐渐过渡到物理，最后再拔高统筹（4，5）：

先说目录结构，这是和用户最直接关联的
- 这一部分会着重讲解目录树的分支节点，即目录文件
这一节讲目录树叶节点上的，普通文件
- 先讲文件的逻辑结构
- 再往下讲文件的物理结构，这一节尤为重要，决定了你访问文件的IO成本
这一节加深对物理层面的理解，文件之外的地方（空闲块）如何管理

到此为止，你已经可以从上到下，找到一个文件的所有磁盘块了，并且你也知道一个文件的空间从哪来，到哪去了，文件管理最基本的功能已经有了

视角开始拔高，补充一些文件的管理服务
最后用文件系统统筹，从最底层的磁盘分区到高层的VFS顺一遍

概述

区分：

标识符vs文件名
- 前者是OS内部用，后者给用户
外存地址vs文件目录
- 前者给OS内部用，后者给用户

文件内部，和文件之间，都需要组织。

目录结构

文件目录的概念

文件目录离我们很近，Windows文件夹就是一个文件目录的GUI

文件夹本身就是一个文件，现实中你装文件的袋子肯定也是有实体的，通过文件夹，就可以找到文件夹里面的文件，文件夹里面，可能有文件夹，也可能有文件，这叫嵌套，和你电脑里的逻辑是一样的。

虽然他们都是文件，但是性质不一样：

文件：
- 文件分为两部分，数据本身（文件体）以及FCB
- 一个文件对应一个FCB，记录其元数据，包括名称和物理地址等，实现了按名访问。对文件修改的同时也要修改FCB
- 文件夹也是文件，所以文件夹本身也有数据+FCB
文件夹（文件目录）：
- 文件夹记录了这个文件夹下面的所有文件，包括下级目录和本层文件
- 文件夹是一种特殊文件，内含多个FCB，而不是普通数据

文件目录结构

文件是要给人用的，所以肯定会有一个名字，也就是说文件和文件之间是要有区分的，而内存里的东西就不需要，这就是文件系统和内存的本质区别。

既然有名字，在一个文件夹下就不能重名，因此文件目录结构是一个重要问题。

最开始叫一级目录，说白了就是整个系统只有一个文件夹（MFD，Master File Directory），很显然，如果文件太多，则需要遍历文件目录，耗时很多
之后升级二级目录，多出来的一级代表用户（UFD，User FD），此时有一点区分度，但是不太够

多级目录就是我们现在见到的目录结构，层层嵌套

比如上图的路径，要读3次目录，才能找到文件，之后你还得再读文件，所以消耗是读目录+读文件
当然，其灵活性的好处远远大于这点IO损耗

索引节点

回顾一下B树和B+树，这两者的区别在于B树节点本身就储存着数据，而B+树很精简，索引节点只是索引，叶节点只储存指针。

当时还说了文件系统用B+树，一个重大原因就是其可以在一个磁盘块有限的空间里尽可能塞入多的索引项。
越精简，储存一个文件目录需要的磁盘块就越少，从而减少在遍历索引表时的IO次数。

因此，直接把FCB中文件名字以外的元数据都剥离出去，构成一个索引节点（inode？）

文件结构

这一章开始讲一个文件如何组织，FCB和文件体两部分要统筹着看。

文件结构分类

流式文件和有结构文件的本质区别在于对齐。

无结构文件（流式文件）
- 基本单位很小，比如txt，每个字符是一个字节，字节流压根就不需要考虑对齐，直接切割到不同磁盘块里肯定是齐的
结构文件（记录式文件）
- 基本单位类似结构体，你不能把结构体从中间切开吧，所以要考虑对齐
- 定长记录vs可变长记录，可变长记录复杂，但是利用率高，定长记录直观简单

逻辑结构

类似于数据结构，逻辑结构主要讨论逻辑，不讨论具体实现

这里说的地址，通通指代逻辑地址，与物理无关

顺序文件

顺序文件对应顺序表，顺序表又可以分为链表和数组。

链式储存，只能顺序，优点是可以分散储存
顺序储存
- 不定长，只能顺序，没有优点
- 定长，其实就相当于数组了，优点是可以随机存取
  - 定长+乱序（串结构），普通数组
  - 定长+有序（顺序结构），可以上特殊算法了，代价就是维护成本大

总结一下：

但凡用了可变长记录，就会破坏数组特性，顺序文件就只能顺序查找了。
FCB记录顺序表的首地址和长度
注意，题目会模糊逻辑结构和物理结构，比如顺序文件（储存），其实暗含了物理结构，默认的是顺序文件+顺序分配

索引文件

前面说了，在顺序文件的前提下，一旦引入可变长记录，就啥也不是了，但是索引表可以完美解决这个问题。

索引表本身是定长的，因此可以随机访问索引表，找到对应项目后，再根据指针找到对应的数据记录
虽然分两次查找速度会慢一点，但是总比从头遍历数据记录好。

数据库的索引原理就是这样，索引的思想就在于，给非随机存取的东西，附加上随机存取的性质，代价就是多走一层，更占空间

总结：

索引文件可以实现间接的随机存取
FCB指向一个索引文件，通过索引文件再找到文件所有的数据记录

索引顺序文件

索引文件有个缺点，索引和数据记录一一对应，也就是说其消耗是比例性的。
如果数据记录本身太小了，那么这个占比就很大，类似于用链表节点存一个字符，浪费率高达8/9

索引顺序文件双管齐下：

将数据记录分组，内部为顺序结构，每一组对应一个索引，原来是一个数据，很显然可以降低浪费率
组之间分散，分组后，数据记录组的数量变少，索引表项就少了

如果索引表还是大，那么还可拆分多级，这个时候你就会发现，已经有了B+树的感觉了，唯一细节的地方就在于，这棵树的叶节点指向的是一组数据记录，而不是一个数据记录。

所以查数据也很简单，先逐层查索引，之后再到组内进行顺序查找，把整体切分为组后，顺序存储查找时间太长的缺点就被消除了，而且组内存不定长记录也是没问题的。

总之就是一个完美。

物理结构

物理结构和逻辑结构无关，物理结构要解决的问题是，给定一片连续的逻辑地址，如何将其分配到物理空间，并组织起来

磁盘块

如果磁盘块和内存块大小不一样呢？扇区的大小一般为512B，而我们之前学页式管理，一页经常是4KB的，这显然不对劲。

我们姑且不讨论这些区别，我们就默认磁盘块大小=内存块大小，在内外存交换的时候很方便，直接以块为单位，再联系一下cache和内存块的交换，也是这个单位，所以整个数据运行过程都非常流畅。

类似于内存，外存同样采用逻辑地址+物理地址的思想。

连续分配（顺序分配）

顺序文件+连续分配方式，说白了就是串结构，类似数组，因此可以随机（直接）+顺序访问

注意，磁盘和内存不一样，磁盘（特指HDD）本身是无法进行随机读写的，严格来说只能说叫直接读写，即DAM，介于纯粹顺序和纯粹随机之间，磁盘本身的特性就决定了，再快也快不到哪去。

因此访问分散的磁盘块还是很耗时的，这种顺序分配读起来是最快的。

啥都好，就是不够灵活，扩展性很差，而且会产生大量磁盘碎片（终于知道以前windows上面说的磁盘碎片是啥了），而且紧凑也很费时间，这是致命缺点

链接分配

链式分配即链表。链表的优缺点，隐式分配都有。

最大的缺点就是只能顺序访问，是纯粹的顺序访问
读一个文件必须从头遍历，这个过程中要反复IO，每个块都要IO一次，消耗非常大

优点在于拓展是很简单的，只需要改一下链域，然后把FCB中的尾磁盘块指针改一下就行。

这里有个问题，为什么不像链表那样用NULL呢？可能是磁盘里面没有NULL这个概念，所以只能用块号限制
相比而言，下面的显式链接就是在内存中的链表，因此是通过NULL机制（-1）来实现的收尾，不需要尾块号

显式链接的区别在于，把磁盘中的连接结构提取到了内存中，以FAT（File Allocation Table）的形式保存，就是数组形式的链表，一个磁盘只需要一个超大的FAT统一管理即可。

虽然还是链表，性能有显著提升，本质区别在于，隐式链接的遍历需要在内存和磁盘之间反复横跳，而显式链接的链表遍历都可以在内存中操作，而内存速度快的很，就算按照链表的方式遍历，速度也比反复IO快多了

也就是说，遍历的方式其实并没有太大变化，只是n次内存操作比n次IO速度快多了，此外还要做一些区分：

显式链表可以实现随机访问。
- 在磁盘读写中，一切随机访问都不是严格的随机访问
- 这里的随机，指的是可以跳过前面的磁盘块
- 但是并不意味着可以跳过前面的显式链接，因为你还是个链表嘛
优缺点分析
- 优点：具有媲美顺序结构的性能（随机访问）
- 优点：具有媲美隐式链接的扩展性（链表本质）
- 缺点：内存驻留FAT消耗大，外存空间也会有占用，统称为储存空间

索引分配

显式链接比较优秀，是以前系统常用的方案，但是随着文件越来越多，FAT逐渐变大，负荷就太大了
同时CPU性能之类的也提升了，可以考虑通过若干次IO，多次索引的方式来把压力分摊到IO上了

索引分配的一个目标就是给FAT瘦身，曾经的FAT是所有文件一张，而现在是一个文件一张索引表，然后逐级构成B+树结构（但是并不等同于数据结构学的那个B+树）

类似于页表，属实是万法归宗了，我可以这么说，凡是大规模的数据组织，储存，使用B树或者B+都是很好的方案，内存，外存，不约而同地使用了这种方法。

在这里，磁盘块可以被分成两类：

索引块，存放索引表
数据块

单级索引非常简单，就是先读索引，然后通过索引把逻辑块号映射为物理块号，再读物理块即可。

如果一个索引块放不下一个文件的索引项，就要扩展，方案如下：

使用隐式链接方案链接索引块
- 缺点同隐式链接，如果索引块多了，IO次数太多
多层索引
- 经典的B+树思想（但是并不等同数据结构那个B+树）
- 其中涉及到逻辑地址到物理地址的转换，需要根据情况进行除和模的计算，尤其是多级情况下，计算还是有一点复杂的
- 具体来说，除以一个子节点可以容纳的最大索引数（ $m^{k}$ ，m为下图的256，k为剩余索引层数），比如上图中两层索引，k=1，因此除以256，如果是三层索引，那么计算第一层的索引下标就得除以 $256^2$ ，然后求模，用这个模再除以 $256^1$ ，再求模，总之就是除一下，求个模，循环往复，直到最后一层
混合索引
- 多层索引比较死板，无论多小的文件，都需要固定的索引层数，浪费，现代操作系统中采用混合索引的方式，根据文件的大小灵活扩充索引的级数
- 以下图为例，一个文件的顶级索引节点比较特殊，是顶级索引表，项目并不多。如果用到的块比较少，那么就只用直接地址，如果要多一些，就要用一级间接索引，从间接索引开始的索引节点，这种索引节点就是填满的，如果再放不下，就启用二级间接。
- 在Linux里面的顶级索引表是12+1+1+1个索引项，最高开三级索引
- 注意，因为FCB是改进版本，所以根据指针读顶级索引表也算一次读内存，所以不要被“二级索引”误导，严格来看其实要高一级的，IO次数计算的时候要注意。反过来，如果题目告诉你顶级索引表已经读入了，那么就不用修正了

逻辑结构vs物理结构（难点）

关键词区分：

xx文件=xx储存=逻辑结构
xx分配=物理结构

先区分一下逻辑地址和物理地址，基础要牢固：

逻辑地址，每个文件默认是从0开始的
物理地址，就是真实的磁盘块号

从逻辑地址到物理地址的转换，就是文件的物理结构来负责的，与逻辑结构毫无关系。

比如是用xx文件+索引分配方式，那么无论你是什么逻辑结构，你都要通过索引表进行映射，而如果是链式分配，那么就需要给定物理首地址+顺序遍历的方式去映射，说白了这些分配方式都是逻辑到物理的映射方式

进一步辨析，文件/储存≠分配

直观来看，似乎就应该是连续文件配连续分配，链式文件配链式分配，但是其实不是这样的。

无论你逻辑上文件是什么样的，总之都是一片连续的逻辑地址，思考一下C语言创建文件的过程，你最终都是要write到这个文件里的，无论你用什么逻辑组织，最后你都要调用write函数逻辑上连续地写入文件，这个write函数就决定了逻辑地址一定是连续的。

因为逻辑空间必然连续，所以OS会一视同仁，自行决定分配方式，比如下图，逻辑结构是链式存储，但是物理分配采用的是连续分配。

总之，逻辑结构和物理结构一点关系都没，只不过是思想互相借鉴，并不能对应，不然为啥要分开讲呢？

从头查找一个文件的过程

学到这里，从头盘一下吧，如何从文件系统里查一个文件的一项数据记录呢？

找到文件的目录：逐级查找目录
- 这个过程本身就是用FCB找目录文件，再从中挑出FCB继续找目录文件的过程。
- 目录通常都比较小，所以没有复杂的物理结构，获取目录每次IO一次即可
找到目标文件的FCB：遍历最下级文件目录
- 注意，目录里面的改进版FCB为索引结构，只有名字和索引节点指针两项
找到目标文件的索引节点，解析节点
- 从这里开始，就要区分文件的物理结构了
- 假设文件本身采用k级索引分配的逻辑结构储存文件
在文件内查找数据记录
- 从索引节点层层索引，索引k次
- 最后读取1次，成功获得目标磁盘块

完全跑下来，IO成本=查找目录的成本+读文件的成本
查找目录的成本就是目录级数（斜杠个数）
读文件的成本要根据物理结构而定

文件储存空间管理（空闲部分）

前面说的目录结构，文件结构，都是对非空闲块进行管理，还有空闲的部分，在这一章集中讲解

分区可以理解为一个特殊的文件夹

目录区，存放FCB以及索引节点，以及各种分区元数据
文件区，放数据体

FCB，索引，以及文件体，这些我们都在前面讲过了，属于非空闲部分的管理
接下来讲解一下，如何管理空闲部分（其实类似于内存管理，思路都是类似的）

空闲表

空闲表，参考内存分区里面的空闲分区表，同样的记录了起始地址+长度

分配和回收都是一模一样的

具体到文件的物理结构来说，这种空闲管理方式比较适合连续分配方式。

空闲链表

两种方式，空闲盘区链，类似于分区里面的空闲区链表，重点都在“区”，而空闲盘块链粒度更细，区分：

空闲盘区链同内存中空闲区链表
- 分配使用适应算法
- 回收要检测被回收区两侧是否有空闲区相邻
空闲盘块链，这是一个全新的概念
- OS视角下，相当于把所有空闲的磁盘块变成了一个队列
- 分配和回收，分别是出队和入队的过程

两种方式都适用于离散或者连续分配，只是效率不同：

连续分配，或者一次分多个，空闲区块链快，而如果是离散少量，则空闲盘块链快

位示图

位示图很经典，这里额外讲了字

注意，这里的字针对的是位示图的一行，如果一行有kbit，那么一个字对应k个磁盘块。
还需要注意的是从0开始还是从1开始，非典型情况可以参考矩阵压缩那一块，思路一模一样。

之所以要引入字，是因为这样便于定位。
分配的时候，要将字号位号转化为盘块号，同时将0置1，回收的时候是逆向过程

成组链表

略，0.1%的几率考，我就当他0%，主打一个效率

文件管理服务

文件基本操作

create，创建文件两件事

占用空闲磁盘块，放文件体
添加FCB到目录

delete是逆向过程

open，两件事：

找到，并检查权限
打开，此时FCB作为进程资源复制到进程的“打开文件表里”
- 还会把文件索引号（文件描述符）返回给用户（程序），其实就是一个key，用于快速锁定内存中的这个FCB

考虑到文件的读写共享，还需要在系统中维持一张系统打开文件表，并且计数（类似于硬链接的思想）

删除是逆过程，删除的是进程本身的打开文件表项，计数-1，同样类似于硬链接，如果计数为0，则在系统打开文件表里删除对应项

读文件：

从哪里读：打开文件表中的读写指针
读多少
读到哪里：内存中的位置

写文件类似

文件共享

树结构的特点在于分支之间隔离。

既然如此，如何通过一个目录，访问另一个目录呢？分为软硬两种链接方法

上图为硬链接，文件和索引节点一一对应，硬链接直接让当前目录里的FCB指向对应索引节点即可，或者说在两个目录里，存在一样的FCB。

索引节点会维护一个计数器，只有在全部硬链接都失效的时候（count=0），才删除文件体和索引节点。

还有一种软链接（符号链接）方式，是Windows的方式，即快捷方式.ink文件，link本身就是一个文件，当OS判断其为链接文件时，会读取里面记录的目标文件的路径，用这个路径找到对应文件目录下的文件，而不是直接用FCB指向。

软链接的本身只是快捷方式，指向的文件删了就删了，快捷方式本身不会受到影响，只是没用了罢了。

文件保护

口令就是密码，密码本身在文件之中（FCB或者索引节点），因此可以用技术手段去逆向分析破解。

加密本质上也是把密码放在文件之中，但是加密是把密码“分散”在整个文件之中了，加密后的文件本身就是密码，我们用密码去和加密后的文件比对（解密），就可以得到源文件。比较费事

ACL最基本的形式如上，我们Linux里面用的chmod 777之类的指令，变成二进制其实就是111 111 111

如果每个用户对每个文件都有这么一行，实际上在列方向上是有冗余的，在MySQL里面，采用角色的思路来进行权限控制，下面这个思路也是一样，文件给每个角色（分组）整体分配权限，然后某个用户访问的时候，直接检查其归属于哪些分组即可。

这样，无论用户有多少，一个文件ACL的长度也只有分组的个数。

下图中，组就是用户组
一个文件，可以针对每一个组配置对应的权限。

文件系统

文件系统的布局

本节，从最底层一个空磁盘开始，逐步构建文件系统，与内存接轨：

物理格式化（低级格式化）
- 磁盘刚生产出来，空白一片，厂商会首先划分扇区，进行编号（固化在磁盘中），这是最低级的格式化，和用户的那个格式化不同
- 有坏扇区，物理上是无法挪动的，可以将其信息固化，编号的时候跳过，顺延
高级格式化后会形成MBR（统筹所有分区）+若干磁盘分区，下面列出分区内部结构：
- 如果安装有系统，则会有一个引导块，用于拉起系统
- 超级块和空闲空间管理区功能类似，互相补充
- i节点区，存放inode即索引节点，这片空间可以看做数组（注意，如果是混合索引分配，那么i节点区不储存非顶层索引，因为长度不对）
- 根目录
规划好物理结构，逻辑结构后，文件系统基本构建完毕，接下来是与内存的接轨
- 接轨之前是文件的访问，要先访问目录，然后根据物理结构找到具体的磁盘块
打开文件后，进程以及系统会在内存中保持对文件的引用
- 目录缓存和系统打开文件表归属于系统，自然在内核空间
- 进程打开文件表包含在PCB中，而PCB又是在内核空间里
- 打开流程如下，需要注意下面三张表

虚拟文件系统

如果没有VFS，不同文件系统的规范完全不同，OS对于外接文件系统的兼容性就非常差。

VFS的宏观功能：

向上提供统一的文件标准接口，比如POSIX接口
向下规定协议，对接入此VFS的文件系统一点硬性规定

具体到细节上，VFS通过若干思路实现接口的统一化：

统一不同文件系统的目录项
- 统一用vnode保存，只存在于内存中
- 相对来说，其他文件系统的目录项会同时存在于外存和内存中
- 函数功能指针的意义，在于区分不同v节点的文件系统类型，毕竟上层OS下发的函数调用，最终还是要落到具体的系统中的，通过函数功能指针，就可以找到这个文件对应的系统类型的函数接口，进行专属于这个文件系统的操作

文件系统挂载

所谓的挂载，就是把异种文件系统接入宿主机的VFS中，日常中插U盘其实就是挂载，要做三件事：

注册：
- VFS首先要知道这是个什么系统，要记入挂载表里
- VFS还要知道这个系统如何操作，即把其提供的函数接口保存下来
接入
- 把文件夹挂载到挂载点上

一般来说，Windows挂载点在磁盘根目录

用过虚拟机的应该都有过挂载的经历，比如说你是一个Linux的虚拟机，但是你想要将主系统(Windows）的文件夹共享到这个Linux中，需要执行一个挂载命令才可以在hgfs文件夹里面看到共享文件夹，这其实也是一个挂载的过程。

你可能感兴趣的:(计算机体系结构,个人随笔/学习笔记,笔记,系统架构,考研)

10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
厉国刚：新闻学与传播学到底有何区别微观大道
厉国刚：新闻学与传播学到底有何区别头几天，有人在知乎上问我：新闻学与传播学到底有何区别。他是一位想要跨专业考研的学生，对新闻传播学学科可谓了解甚少，甚至一头雾水，想要让我帮他解释解释。在研究生学硕层面，新闻传播学是一级学科，分成新闻学、传播学这两个二级学科。有些高校，还自设了广告学、出版发行学等其他二级学科，但从官方角度，新闻传播学一级学科下，正统的就是那两个二级学科。招生时，一般会按一级学科招，
女儿考研完报考雅思捡拾流年
是否我过于焦虑？会不会无形间让女儿觉得压力太大了啊。2022年对于我们家来说是不平常的一年。女儿今年大四，为了准备考研，暑假也没回家，年初去了学校到了年末才回家。女儿自己一个人面对考研，没有参加培训，大四学校作业论文等课业也多，她同时也是很努力复习考研的。在疫情开放很多羊的时期，女儿终于顺顺利利参加12月24、25号的考研，我们和家人都觉得女儿回家来要好好休息调养。可女儿回到家，我再查阅考研信息，
童年那些故事教给我们的山川大地日月星辰
同事的女儿二次考研失败，但是仍不气馁还想接着再学再考，得为孩子点个赞，可是同事很矛盾，以她的意见，当初女儿大学毕业就该直接考编，回到家过安稳日子，我问她还记不记得《小马过河》的故事？她说跟小马有啥关系？幼儿园就给孩子讲《小马过河》，当然孩子们除了喜欢故事里的“人物”小松鼠、老牛、小马跟老马，对小马爱劳动喜欢帮助妈妈干活也是有基本认知的，孩子们对为什么老牛说水浅、而松鼠说水深也有一定的常识，到了成人
为什么你总是对下属不满意? ZhaoWu1050
【ZhaoWu的听课笔记】大多数公司，都存在两种问题。我创业四年，更是体会深切。这两种问题就是：老板经常不满意下属的表现；下属总是不知道老板想要什么；虽然这两种问题普遍存在，其实解决方法并不复杂。这节课，我们再聊聊第一个问题：为什么老板经常不满意下属表现?其实，这背后也是一条管理常识。管理学家德鲁克先生早就说过：管理者的任务，不是去改变人。*来自《卓有成效的管理者》只是大多数老板和我一样，都是一边
母亲节如何做小红书营销美橙传媒
小红书的一举一动引起了外界的高度关注。通过爆款笔记和流行话题，我们可以看到“干货”类型的内容在小红书中偏向实用的生活经验共享和生活指南非常受欢迎。根据运营社的分析，这种现象是由小红书用户心智和内容社区背后机制共同决定的。首先，小红书将使用“强搜索”逻辑为用户提供特定的“搜索场景”。在“我必须这样生活”中，大量使用了满足小红书站用户喜好和需求的内容。内容社区自制的高质量内容也吸引了寻找营销新途径的品
读书笔记|《遇见孩子，遇见更好的自己》5 抹茶社长
为人父母意味着放弃自己的过去，不要对以往没有实现的心愿耿耿于怀，只有这样，孩子们才能做回自己。985909803.jpg孩子在与父母保持亲密的同时更需要独立，唯有这样，孩子才会成为孩子，父母才会成其为父母。有耐心的人生往往更幸福，给孩子留点余地。认识到养儿育女是对耐心的考验。为失败做好心理准备，教会孩子控制情绪。了解自己的底线，说到底线，有一点很重要，父母之所以发脾气，真正的原因往往在于他们自己，
基于Python给出的PDF文档转Markdown文档的方法程序媛了了 python pdf 开发语言
注：网上有很多将Markdown文档转为PDF文档的方法，但是却很少有将PDF文档转为Markdown文档的方法。就算有，比如某些网站声称可以将PDF文档转为Markdown文档，尝试过，不太符合自己的要求，而且无法保证文档没有泄露风险。于是本人为了解决这个问题，借助GPT（能使用GPT镜像或者有条件直接使用GPT的，反正能调用GPT接口就行）生成Python代码来完成这个功能。笔记、代码难免存在
系统架构设计师需求分析篇二 AmHardy 软件架构设计师系统架构需求分析面向对象分析分析模型 UML和SysML
面向对象分析方法1.用例模型构建用例模型一般需要经历4个阶段：识别参与者：识别与系统交互的所有事物。合并需求获得用例：将需求分配给予其相关的参与者。细化用例描述：详细描述每个用例的功能。调整用例模型：优化用例之间的关系和结构，前三个阶段是必需的。2.用例图的三元素参与者：使用系统的用户或其他外部系统和设备。用例：系统所提供的服务。通信关联：参与者和用例之间的关系，或用例与用例之间的关系。3.识别参
2019考研 | 西交大软件工程笔者阿蓉
本科背景：某北京211学校电子信息工程互联网开发工作两年录取结果：全日制软件工程学院分数：初试350+复试笔试80+面试85+总排名：100+从五月份开始脱产学习，我主要说一下专业课和复试还有我对非全的一些看法。【数学100+】张宇，张宇，张宇。跟着张宇学习，入门视频刷一遍，真题刷两遍，错题刷三遍。书刷N多遍。从视频开始学习，是最快的学习方法。5-7月份把主要是数学学好，8-9月份开始给自己每个周
语文主题教学学习笔记之87 东哥杂谈
“语文主题教学”学习笔记之八十七（0125）今天继续学习小学语文主题教学的实践样态。板块三：教学中体现“书艺”味道。作为四大名著之一的《水浒传》，堪称我国文学宝库之经典。对从《水浒传》中摘选的单元，教师就要了解其原生态，即评书体特点。这也要求教师要了解一些常用的评书行话术语，然后在教学时适时地加入一些，让学生体味其文本中原有的特色。学生也要尽可能地通过朗读的方式，而不单是分析讲解的方式进行学习。细
Armv8.3 体系结构扩展--原文版代码改变世界ctw ARM-TEE-Android armv8 嵌入式 arm架构安全架构芯片 Trustzone Secureboot
快速链接:.ARMv8/ARMv9架构入门到精通-[目录]付费专栏-付费课程【购买须知】:个人博客笔记导读目录(全部)TheArmv8.3architectureextensionTheArmv8.3architectureextensionisanextensiontoArmv8.2.Itaddsmandatoryandoptionalarchitecturalfeatures.Somefeat
大三成了分手季? 三聿鱼
图片发自App一次玩真心话大冒险的时候，知道漂亮的A学姐原来和社团那个帅帅的学长H原来是彼此的前任。知道时还是惊讶的，知道学长H现在在准备考研，上次从湖边回学校时，他说现在很忙，所以社团那边也没有再去。他想考武汉大学，每天都是泡图书馆。后来和学姐A在假期一次一次合作后，也熟络很多，知道她也将要回老家实习，想考公务员。学姐A大学专业是英语，当时想问更多，觉得不变开口，也没再问。在那次真心话大冒险中，
springboot+vue项目实战一-创建SpringBoot简单项目苹果酱0567 面试题汇总与解析 spring boot 后端 java 中间件开发语言
这段时间抽空给女朋友搭建一个个人博客，想着记录一下建站的过程，就当做笔记吧。虽然复制zjblog只要一个小时就可以搞定一个网站，或者用cms系统，三四个小时就可以做出一个前后台都有的网站，而且想做成啥样也都行。但是就是要从新做，自己做的意义不一样，更何况，俺就是专门干这个的，嘿嘿嘿要做一个网站，而且从零开始，首先呢就是技术选型了，经过一番思量决定选择-SpringBoot做后端，前端使用Vue做一
阅读《认知觉醒》读书笔记就看看书
本周阅读了周岭的《认知觉醒开启自我改变的原动力》，启发较多，故做读书笔记一则，留待学习。全书共八章，讲述了大脑、潜意识、元认知、专注力、学习力、行动力、情绪力及成本最低的成长之道。具体描述了大脑、焦虑、耐心、模糊、感性、元认知、自控力、专注力、情绪专注、学习专注、匹配、深度、关联、体系、打卡、反馈、休息、清晰、傻瓜、行动、心智宽带、单一视角、游戏心态、早起、冥想、阅读、写作、运动等相关知识点。大脑
基于STM32与Qt的自动平衡机器人：从控制到人机交互的的详细设计流程极客小张 stm32 qt 机器人物联网人机交互毕业设计 c语言
一、项目概述目标和用途本项目旨在开发一款基于STM32控制的自动平衡机器人，结合步进电机和陀螺仪传感器，实现对平衡机器人的精确控制。该机器人可以用于教育、科研、娱乐等多个领域，帮助用户了解自动控制、机器人运动学等相关知识。技术栈关键词STM32单片机步进电机陀螺仪传感器AD采集电路Qt人机界面实时数据监控二、系统架构系统架构设计本项目的系统架构设计包括以下主要组件：控制单元:STM32单片机传感器
阅读笔记：阅读方法中的逻辑和转念施吉涛
聊聊一些阅读的方法论吧，别人家的读书方法刚开始想写，然后就不知道写什么了，因为作者写的非常的“精致”我有一种乡巴佬进城的感觉，看到精美的摆盘，精致的食材不知道该如何下口也就是《阅读的方法》，我们姑且来试一下强劲的大脑篇，第一节：逻辑通俗的来讲，也就是表达的排列和顺序，再进一步就是因果关系和关联实际上书已经看了大概一遍，但直到打算写一下笔记的时候，才发现作者讲的推理更多的是阅读的对象中呈现出的逻辑也
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息