友人帐_

《深入理解计算机系统(CSAPP)》第9章虚拟内存 - 学习笔记

写在前面的话：此系列文章为笔者学习CSAPP时的个人笔记，分享出来与大家学习交流，目录大体与《深入理解计算机系统》书本一致。因是初次预习时写的笔记，在复习回看时发现部分内容存在一些小问题，因时间紧张来不及再次整理总结，希望读者理解。

《深入理解计算机系统(CSAPP)》第3章程序的机器级表示 - 学习笔记_友人帐_的博客-CSDN博客

《深入理解计算机系统(CSAPP)》第5章优化程序性能 - 学习笔记_友人帐_的博客-CSDN博客

《深入理解计算机系统(CSAPP)》第6章存储器层次结构 - 学习笔记_友人帐_的博客-CSDN博客

《深入理解计算机系统(CSAPP)》第7章链接- 学习笔记_友人帐_的博客-CSDN博客

《深入理解计算机系统(CSAPP)》第8章异常控制流 - 学习笔记_友人帐_的博客-CSDN博客

《深入理解计算机系统(CSAPP)》第9章虚拟内存 - 学习笔记_友人帐_的博客-CSDN博客

第九章虚拟内存

内存管理单元(Memory Management Unit, MMU)：专用硬件，利用存放在主存中的查询表来动态翻译虚拟地址，该表的内容由操作系统管理。

1. 地址空间

地址空间(address space)：一个非负整数地址的有序集合：{0, 1, 2, …}
线性地址空间(linear address space)：地址空间中的整数是连续的，则称为线性地址空间
物理地址空间(physical address sapce)： $M=2^m$ 个物理地址的集合{0, 1, 2, 3, …, M-1}
虚拟地址空间(virtual address space)： $N=2^n$ 个虚拟地址的集合{0, 1, 2, 3,…, N-1}

虚拟地址的思想：允许每个数据对象有多个独立的地址，其中每个地址都选自一个不同的地址空间。

为什么要使用虚拟内存Virtual Memory(VM)?

有效使用主存：使用DRAM作为部分虚拟地址空间的缓存
简化内存管理：每个进程都使用统一的线性地址空间
独立地址空间：个进程不能影响其他进程的内存；用户程序无法获取特权内核信息和代码

2. 虚拟内存作为缓存的工具

虚拟内存：存放在磁盘上、有N个连续字节的数组。

磁盘上这个数组的内容被缓存在物理内存中(DRAM cache)，缓存块被称为页(页面大小为 $P=2^p$ )。

虚拟页分类：

未分配的：VM系统还未分配（或者创建）的页。未分配的块没有任何数据和它们相关联，因此也就不占用任何磁盘空间。
缓存的：当前已缓存在物理内存中的已分配页。
未缓存的：未缓存在物理内存中的已分配页。

2.1 DRAM缓存的组织结构

DRAM若不命中，会产生巨大的不命中开销，因此采用：

大的虚拟页面。标准4KB，可达到4MB/页。
DRAM缓存使用全相联映射：任何虚拟页都可以放置在任何物理页中。
不命中时使用了更复杂精密的替换算法。
DRAM缓存使用写回法(磁盘访问时间长)。

2.2 页表(Page Table, PT)

存放**页表条目(Page Table Entry, PTE)**的数组，将虚拟页地址映射到物理页地址。DRAM中的每个进程都有自己的页表。

如果设置了有效位，那么地址字段就表示DRAM中相应的物理页的起始位置，这个物理页中缓存了该虚拟页。
如果没有设置有效位，
- 那么一个空地址表示这个虚拟页还未被分配。
- 否则，这个地址就指向该虚拟页在磁盘上的起始位置。

2.3 页命中

要访问的虚拟内存中的内容存在于物理内存中，即DRAM缓存命中。

2.4 缺页

DRAM缓存不命中称为缺页(page fault)。

缺页处理：

以访问VP3，选择VP4作为牺牲页为例：

CPU引用了VP3中的一个字，地址翻译硬件从内存中读取PTE3，有效位为0推断出VP3未被缓存，并且触发一个缺页异常。

缺页异常调用内核中的缺页异常处理程序，该程序会选择一个牺牲页，在此例中就是存放在PP3中的VP4。如果VP4已经被修改了，那么内核就会将它复制回磁盘。接着内核将VP4的页表条目有效位置0。

接下来，内核从磁盘复制VP3到内存中的PP3，更新PTE3，随后异常处理程序返回，重新执行导致缺页的指令，然后页命中。

使用按需页面调度：只有当不命中时，才换入页面。

2.5 分配页面

内核在磁盘上分配一个新的虚拟内存页，并且将某个PTE指向这个新的位置(该虚拟页在磁盘上的起始位置)。

仅是分配，未载入内存，有效位是0。

2.6 虚拟内存效率高的原因

尽管在整个运行过程中程序引用的不同页面的总数可能超出物理内存总的大小，但是局部性原则保证了在任意时刻，程序将趋向于在一个较小的活动页面(active page)集合上工作，这个集合叫做工作集(working set)或者常驻集合(resident set)。在初始开销，也就是将工作集页面调度到内存中之后，接下来对这个工作集的引用将导致命中，而不会产生额外的磁盘流量。

如果工作集的大小超出了物理内存的大小，这时页面将不断地换进换出，叫做抖动(thrashing)，性能暴跌。

3. 虚拟内存作为内存管理的工具

核心思想：每个进程都拥有一个独立的虚拟地址空间。

页表将虚拟地址映射到物理地址，多个虚拟页面可以映射到同一个共享物理页面上。

简化链接

独立的地址空间允许每个进程的内存映像使用相同的基本格式，而不管代码和数据实际存放在物理内存的何处(结构一致)。

简化加载

使向内存中加载可执行文件和共享对象文件更容易。

要把目标文件中.text和.data节加载到一个新创建的进程中，Linux加载器为代码和数据段分配虚拟页，把它们标记为无效的（即未被缓存的），将页表条目指向目标文件中适当的位置。

加载器从不从磁盘到内存实际复制任何数据。而是在每个页初次被引用时，由虚拟内存系统会按照需要自动地调入数据页。

简化共享

将不同进程中适当的虚拟页面映射到相同的物理页面，使得进程共享代码和数据，而不必在各进程私有区域内重复复制。

简化内存分配

当一个运行在用户进程中的程序要求额外的堆空间时（如调用ma1loc的结果），操作系统分配适当多个连续的虚拟内存页面，并且将它们映射到物理内存中任意位置的物理页面。

4. 虚拟内存作为内存保护的工具

通过在PTE上扩展许可位以对访问控制做权限限制。

（内核模式才可访问；可读；可写；可执行）

内存管理单元(MMU)每次访问数据都要检查许可位。如果一条指令违反了这些许可条件，那么CPU就触发一个一般保护故障，将控制传递给一个内核中的异常处理程序。Linux shell一般将这种异常报告为"段错误(segmentation fault)"。

5. 地址翻译

地址翻译就是由一个虚拟地址A获得其物理地址(DRAM)的过程。若结果未空，则说明虚拟地址A是无效的地址，或其对应的内容存储在磁盘上。

5.1 基于页表的地址翻译

页表基址寄存器CR3(Page Table Base Register, PTBR)：CR3控制寄存器指向第一级页表(L1)的起始位置。CR3的值是每个进程上下文的一部分，每次上下文切换时，CR3的值都会被恢复。
由VPN在页表中匹配PTE，获取PPN，与页偏移量PO拼接得到物理地址。
VPO与PPO是相同的。

（1）页面命中时硬件执行步骤：

第1步：处理器生成一个虚拟地址，并把它传送给MMU。

第2步：MMU生成PTE地址(PTEA)，并从高速缓存/主存请求得到PTE。

第3步：高速缓存/主存向MMU返回PTE。

第4步：MMU构造物理地址，并把它传送给高速缓存/主存。

第5步：高速缓存/主存返回所请求的数据字给处理器。

整个过程完全由硬件处理。
需要访存两次(在高速缓存/主存中获取PTE以构造虚拟地址、由物理地址在高速缓存/主存找数据)。

（2）缺页异常时执行步骤：

第1步：处理器生成一个虚拟地址，并将其传送给MMU。

第2步：MMU生成PTE地址(PTEA)，并从高速缓存/主存请求得到PTE。

第3步：高速缓存/主存向MMU返回PTE。

第4步：PTE中的有效位是零，所以MMU触发缺页异常，传递CPU中的控制到操作系统内核中的缺页异常处理程序。

第5步：缺页处理程序确定出物理内存中的牺牲页，如果这个页面已经被修改了，则把它换出到磁盘。

第6步：缺页处理程序页面调入新的页面，并更新内存中的PTE。

第7步：缺页处理程序返回到原来的进程，再次执行导致缺页的指令。

由硬件、OS内核协作完成。
2x2次访存，(1次内存写入磁盘+1次磁盘写入内存)。

5.2 结合高速缓存和虚拟内存

高速缓存采用物理寻址，多个进程同时在高速缓存中有存储块和共享来自相同虚拟页面的块。

注意，页表条目可以缓存，就像其他的数据字一样。

5.3 利用快表TLB加速地址翻译

后备缓冲器(Translation Lookaside Buffer, TLB)。

目的：为了减少寻找PTE的开销。

TLB是MMU中一个小的、具有高相联度的缓存，实现虚拟页号VPN向物理页号PPN的映射，页数很少的页表可以完全放在TLB中。

（1）访问TLB

TLB的每行都保存着一个由单个PTE组成的块。MMU使用虚拟地址的VPN部分来访问TLB：将VPN划分为TLB的组选择和行匹配的标记字段。

（2）TLB的命中与不命中操作

注意：不命中时MMU从L1缓存中取出相应的PTE，并同时存放在TLB中、提供给MMU。

5.4 多级页表

目的：压缩页表的大小。

思想：虚拟地址空间中每个虚拟页不一定全部都分配，也即都还未被使用，也就没必要保存一条PTE在页表中占用空间。

（1）二级页表示例

**基本情况：**假设32位虚拟地址空间被分为4KB的页，每个页表条目都是4字节。分配情况：内存的前2K个页面分配给了代码和数据，接下来的6K个页面还未分配，再接下来的1023个页面也未分配，接下来的1个页面分配给了用户栈。

**使用一级页表：**需要有 $\frac{2^{32}}{2^{12}}=2^{20}=1M$ 个PTE。

使用二级页表：

一级页表中的每个PTE负责映射虚拟地址空间中一个4MB的片(chunk)，这里每一片都是由1024个连续的页面组成的。一级页表中仅需要1K个PTE。

如果片 $i$ 中的每个页面都未被分配，那么一级 $PTE_i$ 就为空。如果在片 $i$ 中至少有一个页是分配了的，那么一级 $PTE_i$ 就指向一个二级页表的基址。二级页表中的每个PTE都负责映射一个4KB的虚拟内存页面。

为什么二级页表可以减少内存要求：

①如果一级页表中的一个PTE是空的，那么相应的二级页表就根本不会存在。

②只有一级页表才需要总是在主存中(因为使用最频繁)；虚拟内存系统可以在需要时创建、页面调入或调出二级页表，这就减少了主存的压力；只有最经常使用的二级页表才需要缓存在主存中。

（2）K级页表的地址翻译

虚拟地址被划分成为k个VPN和1个VPO，每个 $VPN_i$ 都是一个到第 $i$ 级页表的索引。
前k-1级页表中的每个PT都指向下一级的某个页表的基址。
第k级页表中的每个PTE包含某个物理页面的PPN，或者一个磁盘块的地址。

为了构造物理地址，在能够确定PPN之前，MMU必须访问k个PTE。对于只有一级的页表结构，PPO和VPO是相同的。

通过将不同层次上页表的PTE缓存起来，带多级页表的地址翻译并不比单级页表慢很多。

5.5 一个端到端的地址翻译示例

（1）基本假设

内存是按字节寻址的。
虚拟地址是14位长的(n=14)。
物理地址是12位长的(m=12)。
页面大小是64字节(P=64)。
TLB是四路组相联的，总共有16个条目。
L1d-cache是物理寻址、直接映射的，行大小为4字节，而总共有16个组。

（2）虚拟地址和物理地址的格式

每个页面大小为64B，需要6位地址做页内偏移量。故低6位为VPO、PPO，其余的作为VPN和PPN。

（3）TLB的格式

TLB是四路组相联的，总共有16个条目。故共有4组，需要2位作为组索引TLBI，其余作为标记TLBT。

(TLB是利用VPN的位进行虚拟寻址的)

（4）页表格式

采用单级页表。共需要 $\frac{2^{14}}{2^{6}}=2^{8}=256$ 条PTE(虚拟页面大小/页面大小)

使用VPN来进行标识，VPN并不是页表的一部分，也不存储在内存中。

（5）Cache格式

由每行4字节，需要块内偏移量2位；

直接映射(1行就是1组)，共16个组，需要4位组索引。

使用物理地址寻址。

（6）读取示例

TLB读取命中示例

假设CPU读取0x03d4处的1个字节：

CPU给出的即虚拟地址，故写出VPN和VPO，在VPN中划分出TLBT和TLBI：

先上TLB中去寻找第0x3组中有无标记为0x03的块，发现有且valid为1。故此时TLB命中，不存在缺页故障，找到PPN为0x0D
MMU将来自PTE的PPN和来自虚拟地址的VPO连接起来，形成物理地址0x354。
MMU将物理地址发给高速缓存L1，缓存从物理地址中划分出块内偏移CO(0x0)、组索引CI(0x5)和缓存表及CT(0x0D)。在Cache中找到对应块，且valid有效，读出在偏移量CO处的数据字节0x36返回给MMU，由MMU传递给CPU。

TLB不命中示例

如果TLB不命中，那么MMU必须从页表中的PTE中取出PPN。如果得到的PTE是无效的，那么就产生一个缺页，内核必须调入合适的页面，重新运行这条加载指令。

TLB命中但是Cache不命中

另一种可能性是PTE是有效的，但是所需要的内存块在缓存中不命中。

6. Core i7/Linux内存系统

6.1 虚拟内存系统

（1）四级页表层次结构

（2）地址翻译概况

为了简化，没有显示i-cache、i-TLB和L2统一TLB。

（3）各级页表中条目格式

第1~3级

每个条目引用一个4KB子页表。注意PS位

当P=1时：地址字段包含一个40位，对于的下一级页表的基地址。

当P=0时：前面保存的都是磁盘上的页表位置。

第4级

注意D位

P=1时：地址字段包括一个40位PPN，指向物理内存中某一页的基地址。

当P=0时：前面保存的都是磁盘上的页表位置。

（4）页表翻译过程

当MMU翻译每一个虚拟地址时：

每次访问一个页时，MMU都会设置A位，称为引用位(reference bit)。内核可以用这个引用位来实现它的页替换算法。
每次对一个页进行了写之后，MMU都会设置D位，又称修改位或脏位(dirty bit)。修改位告诉内核在复制替换页之前是否必须写回牺牲页
内核可以通过调用一条特殊的内核模式指令来清除引用位或修改位。

下图给出了Core i7MMU如何使用四级的页表来将虚拟地址翻译成物理地址。

36位VPN被划分成四个9位的片，每个片被用作到一个页表的偏移量。CR3寄存器包含L1页表的物理地址。VPN1提供到一个L1PET的偏移量，这个PTE包含L2页表的基地址。VPN2提供到一个L2PTE的偏移量，以此类推。

6.2 单个进程的虚拟地址空间

物理内存：方便内核访问物理内存中任何特定的位置。

（1）Linux虚拟内存区域

任务结构中的一个条目指向mm_struct，它描述了虚拟内存的当前状态：

pgd指向第一级页表（页全局目录）的基址；
mmap指向一个vm_area_structs(区域结构)的链表，其中每个vm_area_structs都描述了当前虚拟地址空间的一个区域。当内核运行这个进程时，就将pgd存放在CR3控制寄存器中。

其中，每个vm_area_structs包含：

vm_start：指向这个区域的起始处。
vm_end：指向这个区域的结束处。
vm_prot：描述这个区域内包含的所有页的读写许可权限。
vm_flags：描述这个区域内的页面是与其他进程共享的，还是这个进程私有的（还描述了其他一些信息)。
vm_next：指向链表中下一个区域结构。

（2）Linux缺页异常处理

缺页处理程序检查：

地址是否合法？搜索区域链表，确认地址在(合法的某个区域内？否则，非法->段错误
访问是否合法？有读、写或执行区域内页面的权限。否则，违反许可，触发保护异常->段错误

7. 内存映射

Linux通过将一个虚拟内存区域与一个磁盘上的对象(object)关联起来，以初始化这个虚拟内存区域的内容，这个过程称为内存映射(memory mapping)。

虚拟内存区域可以映射到两种类型的对象中的一种：

磁盘上的普通文件(eg,一个可执行目标文件)
- 文件区被分成页大小的片，对虚拟页面初始化
匿名文件(内核创建，全是二进制零)
- 首次访问该区域的虚拟页会引发缺页异常->分配一个全零的物理页(demand-zero pagei请求二进制零的页)
- 一旦该页面被修改，即和其他页面一样

无论在哪种情况中，一旦一个虚拟页面被初始化了，它就在一个由内核维护的专门的交换文件(swap file)，之间换来换去。交换文件也叫做交换空间(swap space)或者交换区域。

7.1 再看共享对象

两个进程映射了同一个共享对象，两个进程的虚拟地址可以是不同的：

对于每个映射私有对象的进程，相应私有区域的页表条目都被标记为只读，并且区域结构被标记为私有的写时复制。只要没有进程试图写它自己的私有区域，它们就可以继续共享物理内存中对象的一个单独副本。

然而，只要有一个进程试图写私有区域内的某个页面，那么这个写操作就会触发一个保护故障。当故障处理程序注意到保护异常是由于进程试图写私有的写时复制区域中的一个页面而引起的，它就会在物理内存中创建这个页面的一个新副本，更新页表条目指向这个新的副本，然后恢复这个页面的可写权限，当故障处理程序返回时，CPU重新执行这个写操作，现在在新创建的页面上这个写操作就可以正常执行了。

7.2 再看fork函数

当fork函数被当前进程调用时，内核为新进程创建各种数据结构，并分配给它一个唯一的PID。

为了给这个新进程创建虚拟内存，它创建了当前进程的mm_struct、区域结构和页表的原样副本。它将两个进程中的每个页面都标记为只读，并将两个进程中的每个区域结构都标记为私有的写时复制。

当fork在新进程中返回时，新进程现在的虚拟内存刚好和调用fork时存在的虚拟内存相同。

当这两个进程中的任一个后来进行写操作时，写时复制机制就会创建新页面，因此，也就为每个进程保持了私有地址空间的抽象概念。

即：

完全copy，标为只读，也使得能够共享虚拟内存对应的物理空间
写操作时，写时复制机制就会创建新页面，保持了每个进程的私有地址空间

7.3 再看execve函数

假设调用execve("a.out", NULL, NULL)

execve函数在当前进程中加载并运行包含在可执行目标文件a.out中的程序，用a.out程序有效地替代了当前程序。加载并运行a.out需要以下几个步骤：

删除当前进程虚拟地址的用户部分中的已存在的区域结构(页表、结构体、vm_area_strcut链表)。
映射私有区域(创建自己的新的区域结构)。为新程序的代码、数据、bss和栈区域创建新的区域结构，所有这些新的区域都是私有的、写时复制的。
- 代码和数据区域被映射为a.out文件中的.text和.data区。
- bss区域是请求二进制零的，映射到匿名文件，其大小包含在a.out中。
- 栈和堆区域也是请求二进制零的，初始长度为零。
映射共享区域。将共享对象动态链接到这个程序，然后再映射到用户虚拟地址空间中的共享区域内。
设置程序计数器(PC)。设置当前进程上下文中的PC，使之指向代码区域的入口点。

7.4 使用mmap函数的用户级内存映射

Linux进程可以使用rmap函数来创建新的虚拟内存区域，并将对象映射到这些区域中。

void *mmap(void *start, int len, int prot, int flags, int fd, int offset)

从fd指定磁盘文件的offset处，映射len个字节到一个新创建的虚拟内存区域，该区域从地址stat处开始。

start：虚拟内存的起始地址，通常定义为NULL
prot：虚拟内存区域的访问权限
- PROT_READ(可读)
- PROT_WRITE(可写)
- PROT_EXEC(可执行)
- PROT_NONE(不能被访问)
flags：被映射对象的类型
- MAP_ANON(匿名对象)
- MAP_PRIVATE(私有的写时复制对象)
- MAP_SHARED(共享对象)
返回值：指向映射区域开始处的指针

你可能感兴趣的:(计算机系统,学习,笔记,jvm,linux)

RK平台下Buildroot驱动编译环境入门 ItJavawfc RK系统-驱动驱动学习 Kernel Ubuntu Buildroot
提示：低配置电脑下驱动编译环境搭建，驱动学习环境准备文章目录目的需求环境Ubuntu18Desk桌面开发环境Buildroot编译环境基本要求个人环境VM环境配置+Buildroot编译环境配置Buildroot编译总结目的搭建驱动开发编译环境硬件环境要求不达标如何进行配置规避，使编译环境编译OK为后续自己开发工作中，学习环境做一个简单的指导需求这里我需要搭建的环境是Ubuntu上面用Linux源
量化交易系统中如何处理机器学习模型的训练和部署？ openwin_top 量化交易系统开发机器学习人工智能量化交易
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位量化交易系统中，机器学习模型的训练和部署需要遵循一套严密的流程，以确保模型的可靠性、性能和安全性。以下是详细描述以及相关的示例：1.数据收集和预处理数据收集在量化交易中，数据是最重要的资产。收集的数
不懂英语可以学编程吗?,不懂英文可以学编程吗 P5688346 人工智能
大家好，给大家分享一下英语不好能学python编程吗，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！Sourcecodedownload:本文相关源码提到人工智能，就不得不提Python编程语言，大多数人觉得编程语言肯定会涉及到很多代码，满屏的英文字母，想想就头疼，觉得自己不会英语，肯定学不好Python，但是不会英语到底能不能够学习Python呢，下面小编给大家分析分析。其实各位想要
编译乱序 vs 执行乱序三境界操作系统 linux 驱动开发
背景今天留意了一下linux内核对writel和readl的实现，涉及到了dmb，imb这类屏障指令，过去对这类机制的了解比较模糊，所以查阅了一些资料，做一下记录。#if__LINUX_ARM_ARCH__>=7#defineisb(option)__asm____volatile__("isb"#option:::"memory")#definedsb(option)__asm____volat
Qemu&KVM 第一篇（3）QEMU 架构 weixin_34160277 操作系统
QEMU架构我们首先了解一下QEMU如何实现仿真。本节将介绍QEMU的两种操作模式，以及QEMU动态翻译程序的一些有趣特点。QEMU基本操作QEMU支持两种操作模式：用户模式仿真和系统模式仿真。用户模式仿真允许一个CPU构建的进程在另一个CPU上执行（执行主机CPU指令的动态翻译并相应地转换Linux系统调用）。系统模式仿真允许对整个系统进行仿真，包括处理器和配套的外围设备。在x86主机系统上仿真
sqlmap笔记君如尘网络安全-渗透笔记笔记
1.运行环境sqlmap是用Python编写的，因此首先需要确保你的系统上安装了Python。sqlmap支持Python2.6、2.7和Python3.4及以上版本。2.常用命令通用格式：bythonsqlmap.py-r注入点地址--参数-rpost请求-uget请求--level=测试等级--risk=测试风险-v显示详细信息级别-p针对某个注入点注入-threads更改线程数，加速--ba
JDK8新特性陈天在睡觉知识点总结 JavaSE java JDK8 javase 八股文后端
JDK8是官方发布的一个大版本,提供了很多新特性功能给开发者使用,包含语言、编译器、库、工具和JVM等方面的十多个新特性。本文将介绍编码过程中常用的一些新特性。一、Lambda表达式1.优点简化匿名内部类的写法，允许你以简洁的方式表示可传递给方法或存储在变量中的代码块，用更加简洁和表达性的语法来编写匿名函数，从而简化了对函数式接口的实现，使代码更加简洁紧凑。提高了代码的可读性和可维护性，尤其是在处
Java面试高频问题深度解析：JVM、锁机制、SQL优化与并发处理 Debug Your Career 面试 java 面试 jvm
问题列表Java中如何实现一个工作流引擎？Bean的作用域有哪些？JVM中的锁机制是如何工作的？三个方法分别被synchronized锁住，方法a调用方法b，b能获取到a的锁吗？会有什么问题？SQL优化时，EXPLAIN中需要关注哪些关键点？什么是覆盖索引？SELECT*一定不会命中索引吗？SELECT*和SELECT全字段在性能上有区别吗？什么是回表？它与索引有什么关系？100万数据分给10个线
QEMU源码全解析 —— CPU虚拟化（12）蓝天居士 QEMU/KVM QEMU KVM CPU虚拟化
接前一篇文章：本文内容参考：《趣谈Linux操作系统》——刘超，极客时间《QEMU/KVM》源码解析与应用——李强，机械工业出版社《深度探索Linux系统虚拟化原理与实现》——王柏生谢广军，机械工业出版社特此致谢！三、KVM模块初始化介绍1.KVM简介与源码组织结构KVM全称为Kernel-BasedVirtualMachine，中文译为基于内核的虚拟化技术。KVM是由以色列初创公司Qumrane
C#基础学习（二）C#数组生存手册：从入门到“血压拉满“的奇妙旅程 FAREWELL00075 c#学习开发语言数组 Array
作为一只C#萌新，当你试图用数组装下整个世界时，系统可能会温柔地弹出一句**"Indexwasoutsidetheboundsofthearray."**。别慌！这份求生指南将用段子教你玩转数组一、数组是什么数组简单来说就是由相同元素组成的一个集合，数组里面不一定是数，还可能是bool,string等类型组成的集合。那么他有些什么特点呢：本质：装着相同类型元素的集装箱（比如一箱肥宅快乐水）特性：长
笔记：代码随想录算法训练营day60：并查集理论基础、寻找存在的路径 jingjingjing1111 笔记
本文为学习并查集理论基础|代码随想录、代码随想录过程中的思考find是找的顶头上司，而不是当前上司，最后怎么也得找到一个顶头上司的上司是自己，要不然这个结构也不成立使用issame替换会使被操作者为当前节点，而非根节点。join(u,v)的功能为将v的根节点挂到u的根节点下模拟过程可以看出，join中的find中的路径压缩要在长度大于2（路径大于1）的时候才会体现出来107.寻找存在的路径卡码网题
Docker 容器基础技术：namespace 寻雾&启示 docker 容器运维
在容器内进程是隔离的，比如容器有自己的网络和文件系统，容器内进程的PID为1，这些都是依赖于Linuxnamespace所提供的隔离机制。本篇我们来了解下Linux有哪些namespace，以及它们是如何实现隔离的。文中案例代码均由ChatGPT生成，在Linux内核5.15.0-124-generic，ubuntu22.04LTS系统上测试通过。namespace类型每个进程都有自己所属的nam
计算机基础：编码04，认识反码和补码水饺编程 MFC学习笔记 Win32学习笔记 windows c++mfc c语言
专栏导航本节文章分别属于《Win32学习笔记》和《MFC学习笔记》两个专栏，故划分为两个专栏导航。读者可以自行选择前往哪个专栏。（一）WIn32专栏导航上一篇：计算机基础：编码03，根据十进制数，求其原码回到目录下一篇：无（二）MFC专栏导航上一篇：计算机基础：编码03，根据十进制数，求其原码回到目录下一篇：无本节前言在前两节，我讲解了关于原码的知识。本节，我来讲解反码和补码。在学习本节之前，你需
Linux系统编程：目录操作、文件权限与库管理网恋东雪莲被骗114514 linux 运维服务器
Linux系统编程：目录操作、文件权限与库管理目录的读取在Linux系统编程中，目录操作是常见的任务之一。以下是用于目录操作的核心函数及其用法：1.opendir功能：打开一个目录，返回指向目录流的指针。原型：#includeDIR*opendir(constchar*name);参数：name：目录路径字符串。返回值：成功：返回DIR*指针；失败返回NULL。示例：DIR*dir=opendir
【access开发】导入excel 并生成表 Access开发易登软件 vba Access开发 Excel html vba access excel 前端 access数据库低代码
hi，大家好呀！最近天气越来越暖了，在这个春暖花开的季节了，每天心情应该都是美美的，正所谓一年之计在于春，在这个美好的季节，大家一起努力学习学习吧！那我们来看看今天学点啥呢？大家在刚接触access时，很多都是excel的高手，学习的过程中，总会想着，怎么把现在的excel数据导入到access，那这个时候该怎么来操作呢？如果是新手，那肯定是导入excel就可以了，那如果你是一个爱show技术的e
Android Jetpack 应用架构指南小李子学编程 Android 开发文档指南 android android jetpack 学习
AndroidJetpack应用架构指南本指南涵盖Android应用开发的最佳实践和推荐架构，助力开发者构建健壮高效的应用程序。。前置要求本文假设您已具备Android框架基础知识。若需系统学习Android开发，建议先完成《Android基础知识》目录新架构设计背景移动应用交互特性核心架构原则分离关注点数据模型驱动界面单一数据源单向数据流分层架构设计界面层数据层领域层依赖管理方案工程实践指南参考
使用Python构建去中心化预测市场：从概念到实现 Echo_Wish Python！实战！python 去中心化开发语言
使用Python构建去中心化预测市场：从概念到实现大家好，我是Echo_Wish。今天，我们将深入探讨一个前沿的区块链应用——去中心化预测市场，并学习如何使用Python来构建一个简易的预测市场平台。预测市场是基于市场参与者对未来事件的预测来产生结果的地方，通常被用来预测政治事件、金融市场走向、体育比赛结果等。传统的预测市场如Augur、Polymarket等，基于去中心化平台，利用区块链技术确保
RocketMQ学习-Springboot整合RocketMQ wechatt_fee1024 面试 maven spring boot java
SpringBoot整合RocketMQ需要注意的是SpringBoot的starter集成包时，要注意版本。因为SpringBoot集成的RocketMQ的starter依赖由Spring社区提供，迭代比较快，版本之间的差异还是比较大的。可能版本不同，就导致使用的时候出现错误。maven依赖,直接把我的maven工程的配置放到这里了。普通消息maven工程创建我直接创建了一个空的maven工程，
Python爬虫笔记一（来自MOOC） Requests库入门小灰不停前进 #Python python pycharm 爬虫
Python爬虫笔记一通用代码框架：importrequestsdefgetHTMLText(url):try:r=requests.get(url,timeput=30)r.raise_for_status()#如果状态不是200，引发HTTPError异常r.encoding=r.apparemt_encodingreturnr.textexcept:return"产生异常"if__name_
回答我！！！如何用“快递分拣”讲明白OSI五层模型？茫忙然计算机网络网络
刚开始学习计算机网络时，会比较难理解计算机网络的五层协议，毕竟确实挺抽象的，接下来我用寄快递的过程来类比计算机网络的五层协议（物理层、数据链路层、网络层、传输层、应用层），帮助大家理解每一层的功能和作用。1.物理层（PhysicalLayer）——交通工具和道路快递中的比喻：卡车、飞机、轮船等运输工具，以及高速公路、铁路、航线等物理路径。功能：负责将包裹（数据）从一个地点物理传输到另一个地点，不关
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【Spark】查询优化中分区（Partitioning）和分桶（Bucketing）是什么关系？什么时候应当分区，什么时候应当分桶？ petrel2015 spark 大数据分布式数据库
在学习Spark的过程中，分区和分桶乍一看很像，都能为了计算加速，但是仔细一想，一查还是有些差异的，甚至说差异很大。那么具体有什么差异点，有什么相同点。我做出了如下的整理，供大家参考，欢迎指正。相同点分区（Partitioning）和分桶（Bucketing）在很多方面具有相似性，它们都是用于优化大数据查询性能的技术数据划分的目的：优化查询性能分区和分桶的核心目标是通过将数据分割成更小的逻辑单元来
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
Linux脚本实践1 一点多余. linux 运维服务器脚本
前言日常在Liunx中用到多个版本的java修改很麻烦，一个脚本搞定。1.准备两个jdk(如下图所示)2.准备脚本文件viswitch_jdk.sh#!/bin/bash#提示用户输入JDK路径read-p"请输入JDK的绝对路径（例如/usr/local/jdk/jdk-11.0.21）："jdk_path#检查输入的路径是否存在if[!-d"$jdk_path"];thenecho"错误：路径
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
Docker之安装与配置雨五夜 Docker docker 容器运维
Docker之安装与配置一、Docker环境配置1.基本配置2.镜像加速3.网络配置4.数据持久化5.优化建议6.常见问题与解决方案7.补充工具二、Docker配置本地仓库指南1.拉取Registry镜像2.启动本地仓库3.配置Docker客户端Linux/macOSWindows4.推送镜像到本地仓库标记镜像推送镜像5.推送镜像到本地仓库6.管理本地仓库7.优化与安全性8.常见问题一、Docke
Linux中的 mutex [二] —— 乐观自旋机制 jianchi88 内核同步 Linux 稳定性 android 服务器 linux ubuntu
本文基于5.4.86版本内核mutex可视作是spinlock的可睡眠版本，同样是线程无法继续向前执行，但spinlock是"spin"，导致该CPU上无法发生线程切换，而mutex是"block"（我们通常翻译成「阻塞」），可以发生线程切换，让所在CPU上的其他线程继续执行。阻塞既可以发生在线程试图获取mutex时，也可以发生在线程持有mutex时。现在的mutex机制，要从这几方面纬度理解：o
论文阅读笔记——MAGICDRIVE: STREET VIEW GENERATION WITH DIVERSE 3D GEOMETRY CONTROL 寻丶幽风论文阅读笔记论文阅读笔记 3d 人工智能自动驾驶
MagicDrive论文MagicDrive通过对3D数据和文本数据的多模态条件融合和隐式视角转换，实现了高质量、多视角一致的3D场景生成。几何条件编码Cross-attention：针对顺序数据，适合处理文本标记和边界框等可变长度输入。Additiveencoderbranch：对于地图等网络状规则数据，能够有效保留空间结构。对于文本按照模版构建：“Adrivingsceneat{locatio
【笔记】扩散模型（五）：Classifier-Free Guidance 理论推导与代码实现 LittleNyima Diffusion Models 笔记机器学习深度学习
论文链接：Classifier-FreeDiffusionGuidance上一篇文章我们学习了ClassifierGuidance，这种方法通过引入一个额外的分类器，使用梯度引导的方式成功地实现了条件生成。虽然ClassifierGuidance可以直接复用训练好的diffusionmodels，不过这种方法的问题是很明显的，首先需要额外训练一个分类器，而且这个分类器不仅仅分类一般的图像，还需要分
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源