wwwlyj123321

linux内核对进程虚拟地址空间管理

一、进程虚拟地址空间管理概览

在进程描述符 task_struct 结构中，有一个专门描述进程虚拟地址空间的内存描述符 mm_struct 结构，这个结构体中包含了前边几个小节中介绍的进程虚拟内存空间的全部信息。每个进程都有唯一的 mm_struct 结构体，也就是前边提到的每个进程的虚拟地址空间都是独立，互不干扰的。当我们调用 fork() 函数创建进程的时候，表示进程地址空间的 mm_struct 结构会随着进程描述符 task_struct 的创建而创建。

通过 fork() 函数创建子进程，子进程在新创建出来之后它的虚拟内存空间是和父进程的虚拟内存空间一模一样的，直接拷贝过来。

而当我们通过 vfork 或者 clone 系统调用创建出的子进程，将父进程的虚拟内存空间以及相关页表直接赋值给子进程。这样一来父进程和子进程的虚拟内存空间就变成共享的了。也就是说父子进程之间使用的虚拟内存空间是一样的，并不是一份拷贝。子进程共享了父进程的虚拟内存空间，这样子进程就变成了我们熟悉的线程。

二、内核如何划分虚拟内存空间

进程的虚拟内存空间分为两个部分：一部分是用户态虚拟内存空间，另一部分是内核态虚拟内存空间。

2.1 用户态和内核态之间的划分

这就用到了进程的内存描述符 mm_struct 结构体中的 task_size 变量，task_size 定义了用户态地址空间与内核态地址空间之间的分界线。

2.1.1、32位系统

32 位系统中用户地址空间和内核地址空间的分界线在 0xC000 000 地址处，那么自然进程的 mm_struct 结构中的 task_size 为 0xC000 000。

我们来看下内核在 /arch/x86/include/asm/page_32_types.h 文件中关于 TASK_SIZE 的定义。

/*
 * User space process size: 3GB (default).
 */
#define TASK_SIZE  __PAGE_OFFSET

如下图所示：__PAGE_OFFSET 的值在 32 位系统下为 0xC000 000。

/arch/arm/Kconfig

2.1.2、64位系统

64 位系统中用户地址空间和内核地址空间的分界线在 0x0000 7FFF FFFF F000 地址处，那么自然进程的 mm_struct 结构中的 task_size 为 0x0000 7FFF FFFF F000 。

我们来看下内核在 /arch/x86/include/asm/page_64_types.h 文件中关于 TASK_SIZE 的定义。

#define TASK_SIZE  (test_thread_flag(TIF_ADDR32) ? \
     IA32_PAGE_OFFSET : TASK_SIZE_MAX)

#define TASK_SIZE_MAX  task_size_max()

#define task_size_max()  ((_AC(1,UL) << __VIRTUAL_MASK_SHIFT) - PAGE_SIZE)

#define __VIRTUAL_MASK_SHIFT 47

我们来看下在 64 位系统中内核如何来计算 TASK_SIZE，在 task_size_max() 的计算逻辑中 1 左移 47 位得到的地址是 0x0000800000000000，然后减去一个 PAGE_SIZE （默认为 4K），就是 0x00007FFFFFFFF000，共 128T。所以在 64 位系统中的 TASK_SIZE 为 0x00007FFFFFFFF000 。

这里我们可以看出，64 位虚拟内存空间的布局是和物理内存页 page 的大小有关的，物理内存页 page 默认大小 PAGE_SIZE 为 4K。

PAGE_SIZE 定义在 /arch/x86/include/asm/page_types.h文件中：

/* PAGE_SHIFT determines the page size */
#define PAGE_SHIFT  12
#define PAGE_SIZE  (_AC(1,UL) << PAGE_SHIFT)

2.2、用户态的内部划分

mm_struct结构体的主要成员如下：

atomic_t mm_users;	共享同一个用户虚拟地址空间的进程的数量，也就是线程组包含的进程的数量
atomic_t mm_count;	内存描述符的引用计数
struct vm_area_struct *mmap;	虚拟内存区域链表
struct rb_root mm_rb;	虚拟内存区域红黑树
unsigned long (get_unmapped_area) (struct file filp, unsigned long addr, unsigned long len,unsigned long pgoff, unsigned long flags);	在内存映射区域找到一个没有映射的区域
pgd_t * pgd;	指向页全局目录，即第一级页表
unsigned long mmap_base;	内存映射区域的起始地址
unsigned long task_size;	用户虚拟地址空间的长度，用于划分用户态空间和内核态空间
unsigned long start_code, end_code;	代码段的起始地址和结束地址
unsigned long start_data, end_data;	数据段的起始地址和结束地址
unsigned long start_brk, brk;	堆的起始地址和结束地址
unsigned long start_stack;	栈的起始地址
unsigned long arg_start, arg_end;	参数字符串的起始地址和结束地址
unsigned long env_start, env_end;	环境变量的起始地址和结束地址
mm_context_t context;	处理器架构特定的内存管理上下文

在 mm_struct 结构体中除了上述用于划分虚拟内存区域的变量之外，还定义了一些虚拟内存与物理内存映射内容相关的统计变量，操作系统会把物理内存划分成一页一页的区域来进行管理，所以物理内存到虚拟内存之间的映射也是按照页为单位进行的。

mm_struct 结构体中的 total_vm 表示在进程虚拟内存空间中总共与物理内存映射的页的总数。

注意映射这个概念，它表示只是将虚拟内存与物理内存建立关联关系，并不代表真正的分配物理内存。

当内存吃紧的时候，有些页可以换出到硬盘上，而有些页因为比较重要，不能换出。locked_vm 就是被锁定不能换出的内存页总数，pinned_vm 表示既不能换出，也不能移动的内存页总数。

data_vm 表示数据段中映射的内存页数目，exec_vm 是代码段中存放可执行文件的内存页数目，stack_vm 是栈中所映射的内存页数目，这些变量均是表示进程虚拟内存空间中的虚拟内存使用情况。

现在关于内核如何对进程虚拟内存空间进行布局的内容我们已经清楚了，那么布局之后划分出的这些虚拟内存区域在内核中又是如何被管理的呢？我们接着往下看~~~

三、内核如何管理虚拟内存空间

我们知道内核是通过一个 mm_struct 结构的内存描述符来表示进程的虚拟内存空间的，并通过 task_size 域来划分用户态虚拟内存空间和内核态虚拟内存空间。

而在划分出的这些虚拟内存空间中如上图所示，里边又包含了许多特定的虚拟内存区域，比如：代码段，数据段，堆，内存映射区，栈。那么这些特定虚拟内存区域在内核中又是如何表示的呢？本小节中，笔者将为大家介绍一个新的结构体 vm_area_struct，正是这个结构体描述了这些虚拟内存区域 VMA（virtual memory area）。

struct vm_area_struct {

 unsigned long vm_start;  /* Our start address within vm_mm. */
 unsigned long vm_end;  /* The first byte after our end address
        within vm_mm. */
 /*
  * Access permissions of this VMA.
  */
 pgprot_t vm_page_prot;
 unsigned long vm_flags; 

 struct anon_vma *anon_vma; /* Serialized by page_table_lock */
    struct file * vm_file;  /* File we map to (can be NULL). */
 unsigned long vm_pgoff;  /* Offset (within vm_file) in PAGE_SIZE
        units */ 
 void * vm_private_data;  /* was vm_pte (shared mem) */
 /* Function pointers to deal with this struct. */
 const struct vm_operations_struct *vm_ops;
}

3.1、使用vm_start和vm_end描述虚拟内存区域

每个 vm_area_struct 结构对应于虚拟内存空间中的唯一虚拟内存区域 VMA，vm_start 指向了这块虚拟内存区域的起始地址（最低地址），vm_end 指向了这块虚拟内存区域的结束地址（最高地址）。所以 vm_area_struct 结构描述的是 [vm_start，vm_end) 这样一段左闭右开的虚拟内存区域。

3.2、定义虚拟内存区域的访问权限和行为规范

内核会将整块物理内存划分为一页一页大小的区域，以页为单位来管理这些物理内存，每页大小默认 4K 。而虚拟内存最终也是要和物理内存一一映射起来的，所以在虚拟内存空间中也有虚拟页的概念与之对应，虚拟内存中的虚拟页映射到物理内存中的物理页。无论是在虚拟内存空间中还是在物理内存中，内核管理内存的最小单位都是页。

vm_page_prot 偏向于定义底层内存管理架构中页这一级别的访问控制权限，它可以直接应用在底层页表中，它是一个具体的概念。

页表用于管理虚拟内存到物理内存之间的映射关系，页表也可以叫做映射表。这部分内容笔者后续会详细讲解，这里大家有个初步的概念就行。

虚拟内存区域 VMA 由许多的虚拟页 (page) 组成，每个虚拟页需要经过页表的转换才能找到对应的物理页面。页表中关于内存页的访问权限就是由 vm_page_prot 决定的。

vm_flags 则偏向于定于整个虚拟内存区域的访问权限以及行为规范。描述的是虚拟内存区域中的整体信息，而不是虚拟内存区域中具体的某个独立页面。它是一个抽象的概念。可以通过 vma->vm_page_prot = vm_get_page_prot(vma->vm_flags) 实现到具体页面访问权限 vm_page_prot 的转换。

下面笔者列举一些常用到的 vm_flags 方便大家有一个直观的感受：

vm_flags	访问权限
VM_READ	可读
VM_WRITE	可写
VM_EXEC	可执行
VM_SHARD	可多进程之间共享
VM_IO	可映射至设备 IO 空间
VM_RESERVED	内存区域不可被换出
VM_SEQ_READ	内存区域可能被顺序访问
VM_RAND_READ	内存区域可能被随机访问

比如代码段这块内存区域的权限是可读，可执行，但是不可写。数据段具有可读可写的权限但是不可执行。堆则具有可读可写，可执行的权限（Java 中的字节码存储在堆中，所以需要可执行权限），栈一般是可读可写的权限，一般很少有可执行权限。而文件映射与匿名映射区存放了共享链接库，所以也需要可执行的权限。

VM_SHARD 用于指定这块虚拟内存区域映射的物理内存是否可以在多进程之间共享，以便完成进程间通讯。

设置这个值即为 mmap 的共享映射，不设置的话则为私有映射。这个等后面我们讲到 mmap 的相关实现时还会再次提起。

VM_IO 的设置表示这块虚拟内存区域可以映射至设备 IO 空间中。通常在设备驱动程序执行 mmap 进行 IO 空间映射时才会被设置。

VM_RESERVED 的设置表示在内存紧张的时候，这块虚拟内存区域非常重要，不能被换出到磁盘中。

VM_SEQ_READ 的设置用来暗示内核，应用程序对这块虚拟内存区域的读取是会采用顺序读的方式进行，内核会根据实际情况决定预读后续的内存页数，以便加快下次顺序访问速度。

VM_RAND_READ 的设置会暗示内核，应用程序会对这块虚拟内存区域进行随机读取，内核则会根据实际情况减少预读的内存页数甚至停止预读。

我们可以通过 posix_fadvise，madvise 系统调用来暗示内核是否对相关内存区域进行顺序读取或者随机读取。相关的详细内容，大家可以看下笔者上篇文章《从 Linux 内核角度探秘 JDK NIO 文件读写本质》中的第 9 小节文件页预读部分。

通过这一系列的介绍，我们可以看到 vm_flags 就是定义整个虚拟内存区域的访问权限以及行为规范，而内存区域中内存的最小单位为页（4K），虚拟内存区域中包含了很多这样的虚拟页，对于虚拟内存区域 VMA 设置的访问权限也会全部复制到区域中包含的内存页中。

3.3、关联内存映射中的映射关系

接下来的三个属性 anon_vma，vm_file，vm_pgoff 分别和虚拟内存映射相关，虚拟内存区域可以映射到物理内存上，也可以映射到文件中，映射到物理内存上我们称之为匿名映射，映射到文件中我们称之为文件映射。

那么这个映射关系在内核中该如何表示呢？这就用到了 vm_area_struct 结构体中的上述三个属性。

当我们调用 malloc 申请内存时，如果申请的是小块内存（低于 128K）则会使用 do_brk() 系统调用通过调整堆中的 brk 指针大小来增加或者回收堆内存。

如果申请的是比较大块的内存（超过 128K）时，则会调用 mmap 在上图虚拟内存空间中的文件映射与匿名映射区创建出一块 VMA 内存区域（这里是匿名映射）。这块匿名映射区域就用 struct anon_vma 结构表示。

当调用 mmap 进行文件映射时，vm_file 属性就用来关联被映射的文件。这样一来虚拟内存区域就与映射文件关联了起来。vm_pgoff 则表示映射进虚拟内存中的文件内容，在文件中的偏移。

当然在匿名映射中，vm_area_struct 结构中的 vm_file 就为 null，vm_pgoff 也就没有了意义。

vm_private_data 则用于存储 VMA 中的私有数据。具体的存储内容和内存映射的类型有关，我们暂不展开论述。

3.4、特定虚拟内存区域的操作函数

struct vm_area_struct 结构中还有一个 vm_ops 用来指向针对虚拟内存区域 VMA 的相关操作的函数指针。

struct vm_operations_struct {
 void (*open)(struct vm_area_struct * area);
 void (*close)(struct vm_area_struct * area);
    vm_fault_t (*fault)(struct vm_fault *vmf);
    vm_fault_t (*page_mkwrite)(struct vm_fault *vmf);

    ..... 省略 .......
}

当指定的虚拟内存区域被加入到进程虚拟内存空间中时，open 函数会被调用
当虚拟内存区域 VMA 从进程虚拟内存空间中被删除时，close 函数会被调用
当进程访问虚拟内存时，访问的页面不在物理内存中，可能是未分配物理内存也可能是被置换到磁盘中，这时就会产生缺页异常，fault 函数就会被调用。
当一个只读的页面将要变为可写时，page_mkwrite 函数会被调用。

四、linux内核如何组织这些特定的虚拟内存区域的？

我们继续来到 struct vm_area_struct 结构中，来看一下与组织结构相关的一些属性：

struct vm_area_struct {

 struct vm_area_struct *vm_next, *vm_prev;
 struct rb_node vm_rb;
 struct list_head anon_vma_chain; 
 struct mm_struct *vm_mm; /* The address space we belong to. */
 /**省略**/
}

在内核中其实是通过一个 struct vm_area_struct 结构的双向链表将虚拟内存空间中的这些虚拟内存区域 VMA 串联起来的。

vm_area_struct 结构中的 vm_next ，vm_prev 指针分别指向 VMA 节点所在双向链表中的后继节点和前驱节点，内核中的这个 VMA 双向链表是有顺序的，所有 VMA 节点按照低地址到高地址的增长方向排序。

双向链表中的最后一个 VMA 节点的 vm_next 指针指向 NULL，双向链表的头指针存储在内存描述符 struct mm_struct 结构中的 mmap 中，正是这个 mmap 串联起了整个虚拟内存空间中的虚拟内存区域。

struct mm_struct {
    struct vm_area_struct *mmap;  /* list of VMAs */
}

在每个虚拟内存区域 VMA 中又通过 struct vm_area_struct 中的 vm_mm 指针指向了所属的虚拟内存空间 mm_struct。

我们可以通过 cat /proc/pid/maps 或者 pmap pid 查看进程的虚拟内存空间布局以及其中包含的所有内存区域。这两个命令背后的实现原理就是通过遍历内核中的这个 vm_area_struct 双向链表获取的。

内核中关于这些虚拟内存区域的操作除了遍历之外还有许多需要根据特定虚拟内存地址在虚拟内存空间中查找特定的虚拟内存区域。尤其在进程虚拟内存空间中包含的内存区域 VMA 比较多的情况下，使用红黑树查找特定虚拟内存区域的时间复杂度是 O( logN ) ，可以显著减少查找所需的时间。

所以在内核中，同样的内存区域 vm_area_struct 会有两种组织形式，一种是双向链表用于高效的遍历，另一种就是红黑树用于高效的查找。

每个 VMA 区域都是红黑树中的一个节点，通过 struct vm_area_struct 结构中的 vm_rb 将自己连接到红黑树中。

而红黑树中的根节点存储在内存描述符 struct mm_struct 中的 mm_rb 中：

struct mm_struct {
     struct rb_root mm_rb;
}

三、mm和active_mm

在进程的task_struct结构体中包含两个指向mm_struct结构的指针：

struct task_struct
{
    // ...
   struct mm_struct *mm;//内核线程没有用户虚拟地址空间，所以内核线程这个值为空
   struct mm_struct *active_mm;//进程的active_mm和mm总是指向同一个内存描述符。内核线程的active_mm在没有运行时是空指针，在运行时指向从上一个进程借用的内存描述符
    // ...
};

如果进程不属于线程组，进程描述符的成员mm和active_mm都指向同一个内存描述符，内存描述符的成员mm_users是1、成员mm_count是1。

如果两个进程属于同一个线程组，每个进程的进程描述符的成员mm和active_mm都指向同一个内存描述符，内存描述符的成员mm_users是2、成员mm_count是1。

内核线程的mm始终为空。当内核线程没有运行时，active_mm为空，当内核线程运行时，借用上一个进程的内存描述符，在被借用进程的用户虚拟地址空间的上方运行，进程描述符的成员active_mm指向借用的内存描述符，假设被借用的内存描述符所属的进程不属于线程组，那么内存描述符的成员mm_users不变，仍然是1，成员mm_count加1变成2。

ref:

Linux的进程地址空间[三] - 知乎

进程—内存描述符（mm_struct）_宇哲_安菲尔德的博客-CSDN博客_mm_struct

mm_struct(内存描述符) - CodeAntenna

mm_struct(内存描述符)_zcl9796的博客-CSDN博客_mm_struct

Linux 内核 | 内存管理——Slab 分配器 - 一丁点儿

《linux内核深度解析-基于ARM64架构的Linux 4.x内核》

一步一图带你深入理解 Linux 虚拟内存管理

【初学数据结构】关于KMP算法的回退思考 Das1 算法数据结构
初学KMP算法时，理解next数组以及回退过程是一个超级劝退过程。如果实在理解不了的，可以直接背。虽然作为十大经典算法之一，但是并不是非常重要，也就考试会考到罢了。关键数据结构解释next数组：next[k]是t[0]~t[j-1]这个串的最大相同前缀的后一个地址，同时也表示最大相同前缀的数量。s串，t串：表示两个索引j,k在进行匹配时所指代的字串next数组是什么？求next数组实际上就是求对于
Java 数据结构篇-用链表、数组实现栈 2401_86450001 java 数据结构链表
2.7用链表实现栈的完整代码3.0用数组来实现栈3.1实现栈-入栈（push）3.2实现栈-出栈（pop）3.3实现栈-查找栈顶元素（peek）3.4实现栈-判断是否为空栈（isEmpty）3.5实现栈-判断是否为满栈（isFull）3.6实现栈-重写迭代器3.7用数组实现栈的完整代码1.0栈的说明栈是一种数据结构，它具有后进先出（LIFO）的特性，即最后入栈的元素最先出栈。栈通常可以通过数组或链
【PTA数据结构 | C语言版】求图中关键活动
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目请编写程序，实现求带权的有向图中关键活动的算法。输入格式：输入首先在第一行给出两个正整数，依次为当前要创建的图的顶点数n（≤100）和边数m。随后m行，每行给出一条有向边的起点编号、终点编号、权重。顶点编号从0开始，权重（≤100）为整数。同行数字均以一个空格分隔。输出格式：按格式输出关键活动，其中u为起点编号，v为终点编号。按起点编号的
【PTA数据结构 | C语言版】最短路的交点
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目给定有向加权图G，和4个顶点u,v,s,t。假设图G中所有边的权值都非负。设计一个算法来判定“从u到v的最短路径”和“从s到t的最短路径”是否存在一个交点w。也即，顶点w是u到v的最短路径上的一个顶点，同时也是s到t的最短路径上的一个顶点。注意：最短路径包含两个端点；一对顶点间的最短路径可能不止一条，求交点时必须将所有最短路径考虑在内。输
【PTA数据结构 | C语言版】哥尼斯堡的“七桥问题” 秋说 PTA 数据结构题目集数据结构 c语言算法
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目哥尼斯堡是位于普累格河上的一座城市，它包含两个岛屿及连接它们的七座桥，如下图所示。可否走过这样的七座桥，而且每桥只走过一次？瑞士数学家欧拉(LeonhardEuler，1707—1783)最终解决了这个问题，并由此创立了拓扑学。这个问题如今可以描述为判断欧拉回路是否存在的问题。欧拉回路是指不令笔离开纸面，可画过图中每条边仅一次，且可以回到
【PTA数据结构 | C语言版】斜堆的合并操作
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目请将给定数据顺次插入初始为空的斜堆，用此法建立两个斜堆，再将两堆合并。为了验证结果的正确性，输出结果堆的前序和中序遍历序列。输入格式：输入先后给出两个堆的元素。每个堆元素输入的格式为：首先在一行中给出正整数n（≤1000），即元素个数；随后一行给出n个元素的整数键值，范围不超过int型整数。输出格式：首先按照前序遍历、其次按照中序遍历，输
[数据结构]#4 用链表实现的栈结构 Marvinem13 数据结构链表学习 linux
使用链表来实现栈是一种比较常见的做法，它能够有效利用链表的动态特性来支持栈的一些基本操作，例如：1.Push（入栈）：向栈中添加一个元素。2.Pop（出栈）：从栈中移除顶部的元素。3.Peek/Top（查看栈顶元素）：返回栈顶元素但不将其移除。4.IsEmpty（判断栈是否为空）：检查栈中是否有元素。我们再来回忆一下链表，它由一系列节点组成，每个节点包含两部分：数据域和指针域（指向下一个节点）。对
【PTA数据结构 | C语言版】求单源最短路的Dijkstra算法
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目请编写程序，实现在带权的有向图中求单源最短路的Dijkstra算法。注意：当多个待收录顶点路径等长时，按编号升序进行收录。输入格式：输入首先在第一行给出两个正整数，依次为当前要创建的图的顶点数n（≤100）和边数m。随后m行，每行给出一条有向边的起点编号、终点编号、权重。顶点编号从0开始，权重（≤100）为整数。同行数字均以一个空格分隔。
QT下SQLite应用（二）菜鸟12号 qt 数据库 linux C++
一.简要介绍Qt是一个跨平台的C++应用程序开发框架，它提供了丰富的库和工具，用于开发GUI应用程序、数据库应用程序等。在Qt中，可以使用QSqlDatabase类和QSqlQuery类来操作SQLite数据库。此外，借助百度智能云文心快码（Comate）的智能代码生成功能，可以进一步提升开发效率。SQLite是一款轻型的数据库，是遵守ACID的关系型数据库管理系统，它包含在一个相对小的C库中。它
[源码和文档分享]基于C++实现的教职工信息管理系统 ggdd5151
一、实验内容教职工信息管理系统用于管理教职工信息，能够根据工号、姓名、科室精确查询职工信息；能分系部进行职称统计，计算各职称的人数；根据职工的职称排序输出；根据工号修改或删除职工信息。二、运行环境软件环境操作系统：windows8.1开发环境：visualstudio2015硬件环境处理器：Intel(R)Core(TM)[email protected]内存：4.00GB系统类
JSON和JSONL、python操作 weixin_668 json python
JSONJSON（JavaScriptObjectNotation）是一种轻量级的数据交换格式，基于文本、易于读写，并支持多种数据结构。以下是常见的JSON格式及示例：1.简单对象（键值对）{"name":"Alice","age":25,"isStudent":true}2.嵌套对象{"person":{"name":"Bob","address":{"city":"NewYork","zipc
leetcode-5. 最长回文子串（c++）应技大学子力扣—字符串 pycharm python ide
题目：给你一个字符串s，找到s中最长的回文子串。示例：输入：s="babad"输出："bab"、"aba"同样是符合题意的答案。解法1：中心扩散法从每一个位置出发，向两边扩散即可。遇到不是回文的时候结束。例str=acdbbdaa我们需要寻找从第一个b。首先往左寻找与当期位置相同的字符，直到遇到不相等为止。然后往右寻找与当期位置相同的字符，直到遇到不相等为止。最后左右双向扩散，直到左和右不相等。如
【c++】leetcode5 最长回文子串
1.题目5.最长回文子串-力扣（LeetCode）2.codeclassSolution{public:stringlongestPalindrome(strings){stringres="";for(autoi=0U;ires.length()?s1:res;res=s2.length()>res.length()?s2:res;}returnres;}stringpalindrome(str
数据结构入门指南：程序世界的基石 Mikhail_G 数据结构 python 开发语言
大家好!在计算机的世界里，数据结构就像我们日常生活中的收纳系统——它决定了数据如何被存储、组织和使用。无论你是刚接触编程的新手，还是希望巩固基础的开发者，理解数据结构都是提升编程能力的关键一步。一、什么是数据结构？数据结构是计算机中组织、管理和存储数据的方式，它定义了数据元素之间的关系以及对数据进行操作的方法。简单来说，数据结构就是数据的“容器”，不同的容器适合存放不同类型的数据，就像书架适合放书
Redis入门教程（一）：基本数据类型
一、Redis是什么？为什么你需要它？Redis（RemoteDictionaryServer）是一个开源的内存数据结构存储系统，它可以用作数据库、缓存和消息中间件。与传统的关系型数据库不同，Redis将数据存储在内存中，使其读写速度达到惊人的11万次读/秒和8.1万次写/秒。同时支持数据持久化，重启后数据不丢失，完美平衡了速度与可靠性。Redis的五大核心优势：丰富的数据结构：支持字符串（Str
C#实现24种数据校验算法的综合指南及工具包.zip 语嫣凝冰
本文还有配套的精品资源，点击获取简介：在数据通信和网络编程中，数据的完整性和准确性是至关重要的。C#作为一种流行的开发语言，提供了强大的工具来实现各类数据校验算法。本压缩包包含了一个名为“WindowsFormsApp”的C#应用程序，用于展示和实验24种数据校验方法，涵盖从简单到复杂的各种算法。这包括CRC校验、MD5、SHA系列、Adler32、Checksum、ParityBit、LRC、H
《数据结构》学习笔记二：算法（二）小曼blog
继续上节的学习，我们在这一篇文章里把“算法”这一章内容学习完。本节解决问题：算法的好坏到底是如何评估的？知识点：1.函数的渐进增长2.算法的时间复杂度3.常见的时间复杂度4.算法的空间复杂度1.函数的渐进增长这一知识点与数学相关，不过没关系都是很容易理解的内容。问题：假如两个算法的输入规模都是n,A的执行次数是2n+3,B的执行次数是3n+1,那么这两个算法哪一个更好呢？我们来分析一下，用数学的折
向量数据库FAISS/Chromadb/ES/milvus简单概述
FAISSFAISS（FacebookAISimilaritySearch）是一种高性能的向量相似性搜索库，用于在大规模向量数据集中快速搜索最相似的向量。它是由FacebookAIResearch开发的，旨在解决大规模向量搜索的问题，广泛应用于各种领域，如图像搜索、文本搜索、推荐系统等。FAISS的主要特点和优势如下：高效的相似性搜索：FAISS使用了一系列高效的算法和数据结构，如倒排索引、局部敏
【数据结构】详解堆排序当中的topk问题（leetcode例题） ylfxw 数据结构 leetcode 算法
文章目录前言如何理解topk问题代码逻辑代码实现前言Leetcode相关题目：215.数组中的第K个最大元素如何理解topk问题**TopK问题是一个经典的问题，在计算机科学中，它的目标是在一组数据中找到前K个最大或最小的元素。**这个问题在许多场景下都很重要，比如搜索引擎的搜索结果排名、数据分析中的热门元素筛选等。.在最简单的形式中，给定一个数组（或列表）和一个整数K，TopK问题要求返回数组中
算法工程师必备：数据结构10大经典算法详解数据结构与算法学习数据结构与算法宝典算法数据结构 ai
算法工程师必备：数据结构10大经典算法详解关键词：数据结构、经典算法、时间复杂度、应用场景、代码实现摘要：本文是算法工程师的“算法工具箱”指南，系统讲解数据结构领域最核心的10大经典算法（快速排序、归并排序、二分查找、深度优先搜索DFS、广度优先搜索BFS、动态规划、贪心算法、KMP字符串匹配、哈希算法、并查集）。通过生活案例、代码示例、复杂度分析和实战场景，帮你彻底掌握这些算法的原理与应用，真正
访问容器中的元素 tal0n
上一篇遗留的问题在上一篇中我们实现了一个类似内建数组的容器，但是这个容器包含了内建数组的缺陷由于operator[]返回的类型T&导致用户可以获取到容器内部元素的地址，在容器不存在以后这个指针依然存在。由于维护了容器到数据的指针关系，我们过多的暴漏了容器的内部机制。用户可以使用指针直接访问容器内部，一旦容器内部占用的内存发生变化，将导致用户错误。导致resize这类的函数很难实现。模拟指针c++中
2x2矩阵教程
2x2矩阵教程1.简介2x2矩阵是线性代数中的基本概念，用于表示二维线性变换。本教程将介绍如何使用C++实现2x2矩阵的基本运算，包括矩阵加减、乘法、行列式、逆矩阵等操作。2.代码实现2.1头文件(matrix2x2.h)#ifndefMATRIX2X2_H#defineMATRIX2X2_H#include#include#includenamespacemath{namespacelinear
Redis实战：第一章-初识Redis案例-文章投票随风而醒 MySQL/数据库 redis
redis全称REmoteDIctionaryServer，即远程字典服务，是一个由SalvatoreSanfilippo写的key-value存储系统。Redis是一个开源的使用ANSIC语言编写、遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。它通常被称为数据结构服务器，因为值（value）可以是字符串(String),哈希(Map),
冒泡排序讲解和优化以及（附C++代码实现）蓝胖子教编程 #入门算法排序算法 c++冒泡排序性能优化
冒泡排序讲解和优化以及【题解】——车厢重组1.冒泡排序介绍2.冒泡排序优化2.1.优化一2.2.优化二2.3.优化三（双向冒泡排序）1.冒泡排序介绍在上一篇文章中，我给大家介绍了计数排序。计数排序虽然快，可也有许多限制。而冒泡排序就能解决这些问题。冒泡排序的基本思想是,每次比较两个相邻的元素,如果他们的顺序错误（比如按从小到大排列时它们是从大到小排列的）就把他们交换过来。注：橙色的\color{o
C++ 从左值引用到右值引用
目录1.前言：2.简单回顾：左值引用语法层面(指针对比引用)：汇编层面：3.本章主角：右值引用移动构造，移动赋值4.左值引用和右值引用5.小结1.前言：C++11是在C++98之后又一个变化比较大的标准。为C++增加了很多东西，其中有一部分是有用的，有一部分是我自认为作用不是很大东西。这一章呢？我们就来说说C++11我，我认为对性能优化最有用的一部分----右值引用2.简单回顾：左值引用左值？我们
从 C# 到 Python：项目实战第五天的飞跃 AI、少年郎数据库 c#开发语言
在前面三天的学习中，我们已经掌握了Python的基础语法、数据结构以及一些核心库的使用。今天，我们将通过三个实战项目，深入对比C#和Python在命令行工具开发、Web应用开发以及数据处理方面的差异，感受Python在实际项目中的强大魅力。一、命令行工具开发：文件批量处理命令行工具是开发者日常工作中经常用到的工具，无论是文件处理、数据转换还是系统管理，都离不开命令行工具的身影。下面我们就来对比一下
YOLO11-obb使用C++及trt进行推理（详细版）范男 c++目标检测计算机视觉 YOLO 图像处理
针对YOLO的使用.engine权重及C++代码进行推理使用TensorRT-YOLO项目网站是：https://github.com/laugh12321/TensorRT-YOLO可以直接选择git或者下载下来gitclonehttps://github.com/laugh12321/TensorRT-YOLOcdTensorRT-YOLO1.编译主程序教程网址是：https://github
C/C++之内存对齐码莎拉蒂 . C&C++内存对齐为什么要内存对齐用#pragma packn对内存不对齐 pragma
1、什么是内存对齐计算机系统对基本类型数据在内存中放的位置做了限制，它们会要求这些数的首地址是一个数(一般为4和8)的整数倍，我们看下结构体的大小#includestructA{chara;intb;};intmain(){printf("sizeofstructAis%d\n",sizeof(structA));return0;}结果：1111deMacBook-Pro:diguia1111$.
章节十四：乱序中的“指挥家”：堆排序奥义 - (堆排序 / Heap Sort) 杨小扩常用算法详解算法
各位老铁，阿扩又来啦！前面我们聊了各种数据结构和算法，从基础的排序查找，到复杂的图算法、动态规划，再到巧妙的Trie树和布隆过滤器。今天，我们要再次回到排序算法的舞台，但这次的主角，可不是简单的“冒泡”或“选择”，而是一位在乱序中能高效组织、精准定位的“指挥家”——堆排序(HeapSort)！你可能听说过快速排序、归并排序，它们都是O(NlogN)级别的排序算法。堆排序也同样拥有这个优秀的性能，而
C/C++ 详谈结构体大小计算(内存对齐) 此心安处是吾乡1024 C++C语言 c语言 c++开发语言
目录1.默认的对齐规则：几个例子与结果：2.修改默认对齐数：例子：3.C++继承场景下的类的大小的计算：1.包含虚函数的类2.包含成员函数的类4.扩展：定义一个计算成员变量在类中偏移量的宏做法：疑问：1.默认的对齐规则：1.结构体的第⼀个成员对⻬到和结构体变量起始位置偏移量为0的地址处其他成员变量要对⻬到某个数字（对⻬数）的整数倍的地址处。2.对⻬数=编译器默认的⼀个对⻬数与该成员变量⼤⼩的较⼩值
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS