bigDxin

【linux 内存管理】深入理解linux内核架构内存管理（3）伙伴系统

在内核初始化完成后,内存管理的责任由伙伴系统承担。伙伴系统基于一种相对简单然而令人吃惊的强大算法,已经伴随我们几乎40年。它结合了优秀内存分配器的两个关键特征:速度和效率。

一、伙伴系统结构

系统内存中的每个物理内存页（页帧），都对应于一个struct page实例。每个内存域都关联了一个struct zone的实例，其中保存了用于管理伙伴数据的主要数组。

struct zone

{
...
/*
* 不同长度的空闲区域
*/
struct free_area free_area[MAX_ORDER];
...
};

struct free_area

{
struct list_head free_list[MIGRATE_TYPES];
unsigned long nr_free;
};
nr_free指定了当前内存区中空闲页块的数目，free_list是用于连接空闲页的链表。
阶是伙伴系统中一个非常重要的术语。它描述了内存分配的数量单位。内存块的长度是2order，其中order的范围从0到MAX_ORDER。MAX_ORDER该常数通常设置为11，这意味着一次分配可以请求的页数最大是2的11次方。free_area[]数组中各个元素的索引也解释为阶，用于指定对应链表中的连续内存区包含多少个页帧。

伙伴不必是彼此连接的。如果一个内存区在分配其间分解为两半，内核会自动将未用的一半加入到对应的链表中。如果在未来的某个时刻，由于内存释放的缘故，两个内存区都处于空闲状态，可通过其地址判断其是否为伙伴。管理工作较少，是伙伴系统的一个主要优点。
基于伙伴系统的内存管理专注于某个结点的某个内存域，例如， DMA或高端内存域。但所有内存域和结点的伙伴系统都通过备用分配列表连接起来。图3-23说明了这种关系。在首选的内存域或节点无法满足内存分配请求时，首先尝试同一结点的另一个内存域，接下来再尝试另一个结点，直至满足请求。

二、避免碎片

在Linux内存管理方面，有一个长期存在的问题：在系统启动并长期运行后，物理内存会产生很多碎片。

注意此时解决的是物理内存的碎片，是物理内存直接映射到内核的896M虚拟内存，由于这段虚拟内存和物理内存是一一映射的，所以此处也是解决这896M虚拟内存的碎片。

很有趣的一点是，在大部分内存仍然未分配时，就也可能发生碎片问题。考虑图3-25的情形。只分配了4页，但可分配的最大连续区只有8页，因为伙伴系统所能工作的分配范围只能是2的幂次。

注意，由以上可以看出，由于内存碎片的存在，系统在长时间使用后，可只用的内存没有变少，但是系统在分配大内存块的时候会受到影响。

内核在处理内存碎片的问题采用的方法是反碎片，即试图从最初开始尽可能防止碎片。

反碎片的工作原理如何？为理解该方法，我们必须知道内核将已分配页划分为下面3种不同类型。

不可移动页：在内存中有固定位置，不能移动到其他地方。核心内核分配的大多数内存属于该类别。
可回收页：不能直接移动，但可以删除，其内容可以从某些源重新生成。例如，映射自文件的数据属于该类别。kswapd守护进程会根据可回收页访问的频繁程度，周期性释放此类内存。这是一个复杂的过程，本身就需要详细论述：第18章详细描述了页面回收。目前，了解到内核会在可回收页占据了太多内存时进行回收，就足够了。另外，在内存短缺（即分配失败）时也可以发起页面回收。有关内核发起页面回收的时机，更具体的信息请参考下文。
可移动页可以随意地移动。属于用户空间应用程序的页属于该类别。它们是通过页表映射的。如果它们复制到新位置，页表项可以相应地更新，应用程序不会注意到任何事。

内核使用的反碎片技术，即基于将具有相同可移动性的页分组的思想。为什么这种方法有助于减少碎片？回想图3-25中，如果页无法移动，导致在原本几乎全空的内存区中无法进行连续分配。根据页的可移动性，将其分配到不同的列表中，即可防止这种情形。例如，不可移动的页不能位于可移动内存区的中间，如果不可移动页分配到了可移动页中间就无法从可移动页内存区分配较大的连续内存块。也就是在可移动页中我们可以将其中的某些页做些移动，这样就更能容易的分出较大的内存块。

试想一下，图3-25中大多数空闲页都属于可回收的类别，而分配的页则是不可移动的。如果这些页聚集到两个不同的列表中，如图3-26所示。在不可移动页中仍然难以找到较大的连续空闲空间，但对可回收的页，就容易多了。

内核定义了一些宏来表示不同的迁移类型：

#define MIGRATE_UNMOVABLE 0 不可移动
#define MIGRATE_RECLAIMABLE 1 可回收
#define MIGRATE_MOVABLE 2 可移动
#define MIGRATE_RESERVE 3
#define MIGRATE_ISOLATE 4 /* 不能从这里分配 */setup_zone_migrate_reserve填充
#define MIGRATE_TYPES 5

三、初始化内存域和节点数据结构

我们知道，体系结构相关代码需要在启动期间建立以下信息：
 系统中各个内存域的页帧边界，保存在max_zone_pfn数组；
 各结点页帧的分配情况，保存在全局变量early_node_map中。

free_area_init_nodes函数简介：

void __init free_area_init_nodes(unsigned long *max_zone_pfn)
{
	unsigned long start_pfn, end_pfn;
	int i, nid;

	/* Record where the zone boundaries are */
	memset(arch_zone_lowest_possible_pfn, 0,
				sizeof(arch_zone_lowest_possible_pfn));
	memset(arch_zone_highest_possible_pfn, 0,
				sizeof(arch_zone_highest_possible_pfn));

	start_pfn = find_min_pfn_with_active_regions();

	for (i = 0; i < MAX_NR_ZONES; i++) {
		if (i == ZONE_MOVABLE)
			continue;

		end_pfn = max(max_zone_pfn[i], start_pfn);
		arch_zone_lowest_possible_pfn[i] = start_pfn;
		arch_zone_highest_possible_pfn[i] = end_pfn;

		start_pfn = end_pfn;
	}
    //以上计算了各内存域的起始和结束的物理帧的编号
	arch_zone_lowest_possible_pfn[ZONE_MOVABLE] = 0;
	arch_zone_highest_possible_pfn[ZONE_MOVABLE] = 0;

	/* Find the PFNs that ZONE_MOVABLE begins at in each node */
	memset(zone_movable_pfn, 0, sizeof(zone_movable_pfn));
	find_zone_movable_pfns_for_nodes();

	/* Initialise every node */
    //以下对所有在线节点调用free_area_init_node函数
	mminit_verify_pageflags_layout();
	setup_nr_node_ids();
	for_each_online_node(nid) {
		pg_data_t *pgdat = NODE_DATA(nid);
		free_area_init_node(nid, NULL,
				find_min_pfn_for_node(nid), NULL);

		/* Any memory on that node */
		if (pgdat->node_present_pages)
			node_set_state(nid, N_MEMORY);
		check_for_memory(pgdat, nid);
	}
}

从上述代码中看到，在内存域边界已经确定之后， free_area_init_nodes分别对各个内存域调用free_area_init_node创建数据结构。

free_area_init_node（）函数简介：

void __paginginit free_area_init_node(int nid, unsigned long *zones_size,
		unsigned long node_start_pfn, unsigned long *zholes_size)
{
	pg_data_t *pgdat = NODE_DATA(nid);
	unsigned long start_pfn = 0;
	unsigned long end_pfn = 0;

	pgdat->node_id = nid;
	pgdat->node_start_pfn = node_start_pfn;
	calculate_node_totalpages(pgdat, start_pfn, end_pfn,
				  zones_size, zholes_size);
	alloc_node_mem_map(pgdat);
	reset_deferred_meminit(pgdat);
	free_area_init_core(pgdat);
}

其中calculate_node_totalpages首先累计各个内存域的页数，计算结点中页的总数。对连续内存模型而言，这可以通过zones_size_init完成，但calculate_zone_totalpages还考虑了内存域中的空洞。

static void __meminit calculate_node_totalpages(struct pglist_data *pgdat,
						unsigned long node_start_pfn,
						unsigned long node_end_pfn,
						unsigned long *zones_size,
						unsigned long *zholes_size)
{
	unsigned long realtotalpages = 0, totalpages = 0;
	enum zone_type i;

	for (i = 0; i < MAX_NR_ZONES; i++) {
		struct zone *zone = pgdat->node_zones + i;
		unsigned long size, real_size;

		size = zone_spanned_pages_in_node(pgdat->node_id, i,
						  node_start_pfn,
						  node_end_pfn,
						  zones_size);
		real_size = size - zone_absent_pages_in_node(pgdat->node_id, i,
						  node_start_pfn, node_end_pfn,
						  zholes_size);
		zone->spanned_pages = size;
		zone->present_pages = real_size;//从这里能看出来zone的那3个字段是在这里初始化

		totalpages += size;
		realtotalpages += real_size;
	}

	pgdat->node_spanned_pages = totalpages;//反应了总页数，包含空洞
	pgdat->node_present_pages = realtotalpages;//反映了实际的页数，不包含空洞
}

alloc_node_mem_map负责初始化一个简单但非常重要的数据结构。如上所述，系统中的各个物理内存页，都对应着一个struct page实例。该结构的初始化由alloc_node_mem_map执行。

mm/page_alloc.c
static void __init_refok alloc_node_mem_map(struct pglist_data *pgdat)
{
/* 跳过空结点 */
if (!pgdat->node_spanned_pages)
return;
if (!pgdat->node_mem_map) {
    unsigned long size, start, end;
    struct page *map;
    start = pgdat->node_start_pfn & ~(MAX_ORDER_NR_PAGES -1);
    end = pgdat->node_start_pfn + pgdat->node_spanned_pages;
    end = ALIGN(end, MAX_ORDER_NR_PAGES);
    size = (end -start) * sizeof(struct page);//申请的物理页的大小，当前节点所对应的所有物理页
    map = alloc_remap(pgdat->node_id, size);
    if (!map)
        map = alloc_bootmem_node(pgdat, size);
    pgdat->node_mem_map = map + (pgdat->node_start_pfn -start);
/* node_mem_map 指向了物理页的开始，这里并没有对物理页的内存进行赋值 */
}
if (pgdat == NODE_DATA(0))
    mem_map = NODE_DATA(0)->node_mem_map;
}

指向该空间的指针不仅保存在pglist_data实例中，还保存在全局变量mem_map中，前提是当前考察的结点是系统的第0个结点（如果系统只有一个内存结点，则总是这样）。 mem_map是一个全局数组，在讲解内存管理时，我们会经常遇到。

mm/memory.c
struct page *mem_map;
初始化内存域数据结构涉及的繁重工作由free_area_init_core执行，它会依次遍历结点的所有内存域。
free_area_init_core()函数简介：

static void __paginginit free_area_init_core(struct pglist_data *pgdat)
{
	enum zone_type j;
	int nid = pgdat->node_id;
	unsigned long zone_start_pfn = pgdat->node_start_pfn;
	int ret;


	for (j = 0; j < MAX_NR_ZONES; j++) {
		struct zone *zone = pgdat->node_zones + j;
		unsigned long size, realsize, freesize, memmap_pages;

		size = zone->spanned_pages;
		realsize = freesize = zone->present_pages;
        //内存域的真实长度，可通过跨越的页数减去空洞覆盖的页数而得到

		/*
		 * Adjust freesize so that it accounts for how much memory
		 * is used by this zone for memmap. This affects the watermark
		 * and per-cpu initialisations
		 */
		memmap_pages = calc_memmap_size(size, realsize);//当前内存域有多少个页，有多少个4k
    

		if (!is_highmem_idx(j))
			nr_kernel_pages += freesize;
		/* Charge for highmem memmap if there are enough kernel pages */
		else if (nr_kernel_pages > memmap_pages * 2)
			nr_kernel_pages -= memmap_pages;
		nr_all_pages += freesize;

		/*
		 * Set an approximate value for lowmem here, it will be adjusted
		 * when the bootmem allocator frees pages into the buddy system.
		 * And all highmem pages will be managed by the buddy system.
		 */
		zone->managed_pages = is_highmem_idx(j) ? realsize : freesize;
		zone->name = zone_names[j];
		spin_lock_init(&zone->lock);
		spin_lock_init(&zone->lru_lock);
		zone_seqlock_init(zone);
		zone->zone_pgdat = pgdat;
		zone_pcp_init(zone);

		/* For bootup, initialized properly in watermark setup */
		mod_zone_page_state(zone, NR_ALLOC_BATCH, zone->managed_pages);

		lruvec_init(&zone->lruvec);
		if (!size)
			continue;

		set_pageblock_order();
		setup_usemap(pgdat, zone, zone_start_pfn, size);
		ret = init_currently_empty_zone(zone, zone_start_pfn, size);
		BUG_ON(ret);
		memmap_init(size, nid, j, zone_start_pfn);
		zone_start_pfn += size;
	}
}

内核使用两个全局变量跟踪系统中的页数。 nr_kernel_pages统计所有一致映射的页，而nr_all_pages还包括高端内存页在内。free_area_init_core剩余部分的任务是初始化zone结构中的各个表头，并将各个结构成员初始化为0。我们比较感兴趣的是调用的两个辅助函数。
 zone_pcp_init初始化该内存域的per-CPU缓存，且将在下一节广泛讨论。
 init_currently_empty_zone初始化free_area列表，并将属于该内存域的所有page实例都设置为初始默认值。正如前文的讨论，调用了memmap_init_zone来初始化内存域的页。我们还可以回想前文提到的，所有页属性起初都设置MIGRATE_MOVABLE。
此外，空闲列表是在zone_init_free_lists中初始化的：
mm/page_alloc.c
static void __meminit zone_init_free_lists(struct pglist_data *pgdat,
struct zone *zone, unsigned long size)
{
int order, t;
for_each_migratetype_order(order, t) {
INIT_LIST_HEAD(&zone->free_area[order].free_list[t]);//双向循环队列初始化
zone->free_area[order].nr_free = 0;
}
}
宏for_each_migratetype_order(order, type)可用于迭代所有迁移类型的所有分配阶。

空闲页的数目（ nr_free）当前仍然规定为0，这显然没有反映真实情况。直至停用bootmem分配器、普通的伙伴分配器生效，才会设置正确的数值。

以上的处理仅仅只是对一些字段进行初始化（比如节点中每个zone中的spanned_pages和present_pages这三个字段初始化、节点和每个zone的起始和结束帧的初始化），并且对伙伴系统的free_area进行队列初始化并将nr_free赋值为0.

四、分配器API

就伙伴系统的接口而言，只能分配2的整数幂个页。因此，接口中不像C标准库的malloc函数或bootmem分配器那样指定了所需内存大小作为参数。相反，必须指定的是分配阶，伙伴系统将在内存中分配2的order次方页。内核中细粒度的分配只能借助于slab分配器（或者slub、 slob分配器），后者基于伙伴系统（更多细节在3.6节给出）。
 alloc_pages(mask, order)分配2order页并返回一个struct page的实例，表示分配的内存块的起始页。 alloc_page(mask)是前者在order = 0情况下的简化形式，只分配一页。
 get_zeroed_page(mask)分配一页并返回一个page实例，页对应的内存填充0（所有其他函数，分配之后页的内容是未定义的）。
 __get_free_pages(mask, order)和__get_free_page(mask)的工作方式与上述函数相同，但返回分配内存块的虚拟地址，而不是page实例。
 get_dma_pages(gfp_mask, order)用来获得适用于DMA的页。
内核除了伙伴系统函数之外，还提供了其他内存管理函数。它们以伙伴系统为基础，但并不属于伙伴分配器自身。这些函数包括vmalloc和vmalloc_32，使用页表将不连续的内存映射到内核地址空间中，使之看上去是连续的。还有一组kmalloc类型的函数，用于分配小于一整页的内存区。其实现将在本章后续的几节分别讨论。

有4个函数用于释放不再使用的页，与所述函数稍有不同。
 free_page(struct page *)和free_pages(struct page *, order)用于将一个或2order页返回给内存管理子系统。内存区的起始地址由指向该内存区的第一个page实例的指针表示。

 __free_page(addr)和__free_pages(addr, order)的语义类似于前两个函数，但在表示需要释放的内存区时，使用了虚拟内存地址而不是page实例。

1、mask掩码

alloc_page的参数掩码mask和内存域修饰符是共用一个字段，如：

#define __GFP_DMA
#define __GFP_HIGHMEM

((__force gfp_t)0x01u)
((__force gfp_t)0x02u)

#define __GFP_DMA32 ((__force gfp_t)0x04u)
...
#define __GFP_MOVABLE ((__force gfp_t)0x100000u) /* 页是可移动的 */

与内存域修饰符不同的是，这些额外的标志并不限制从哪个物理内存段分配内存，但确实可以改变分配器的行为。如：

#define __GFP_WAIT #define __GFP_HIGH #define __GFP_IO #define __GFP_FS #define __GFP_COLD #define __GFP_NOWARN #define __GFP_REPEAT #define __GFP_NOFAIL #define __GFP_NORETRY #define __GFP_NO_GROW #define __GFP_COMP #define __GFP_ZERO	((__force gfp_t)0x10u) ((__force gfp_t)0x20u) ((__force gfp_t)0x40u) ((__force gfp_t)0x80u) ((__force gfp_t)0x100u) ((__force gfp_t)0x200u) ((__force gfp_t)0x400u) ((__force gfp_t)0x800u) ((__force gfp_t)0x1000u) ((__force gfp_t)0x2000u) ((__force gfp_t)0x4000u) ((__force gfp_t)0x8000u)	/* 可以等待和重调度？ / / 应该访问紧急分配池？ / / 可以启动物理IO？ / / 可以调用底层文件系统？ / / 需要非缓存的冷页 / / 禁止分配失败警告 / / 重试分配，可能失败 / / 一直重试，不会失败 / / 不重试，可能失败 / / slab内部使用 / / 增加复合页元数据 / / 成功则返回填充字节0的页 */

 __GFP_WAIT表示分配内存的请求可以中断。也就是说，调度器在该请求期间可随意选择另一个过程执行，或者该请求可以被另一个更重要的事件中断。分配器还可以在返回内存之前，在队列上等待一个事件（相关进程会进入睡眠状态）。
 __GFP_IO说明在查找空闲内存期间内核可以进行I/O操作。实际上，这意味着如果内核在内存分配期间换出页，那么仅当设置该标志时，才能将选择的页写入硬盘。
 __GFP_ZERO在分配成功时，将返回填充字节0的页。

但是，内核对于我们常用的修饰符已经整合成若干个红，我们在大部分情况下使用这些宏即可，如：

#define GFP_ATOMIC #define GFP_NOIO #define GFP_NOFS #define GFP_KERNEL #define GFP_USER #define GFP_HIGHUSER	(__GFP_HIGH) (__GFP_WAIT) (__GFP_WAIT \| __GFP_IO) (__GFP_WAIT \| __GFP_IO \| __GFP_FS) (__GFP_WAIT \| __GFP_IO \| __GFP_FS \| __GFP_HARDWALL) (__GFP_WAIT \| __GFP_IO \| __GFP_FS \| __GFP_HARDWALL \| \ __GFP_HIGHMEM)
#define GFP_HIGHUSER_MOVABLE	(__GFP_WAIT \| __GFP_IO \| __GFP_FS \| \ __GFP_HARDWALL \| __GFP_HIGHMEM \| \ __GFP_MOVABLE)
#define GFP_DMA #define GFP_DMA32	__GFP_DMA __GFP_DMA32

 前3个组合的语义是清楚的。 GFP_ATOMIC用于原子分配，在任何情况下都不能中断，可能使用紧急分配链表中的内存。 GFP_NOIO和GFP_NOFS分别明确禁止I/O操作和访问VFS层，但同时设置了__GFP_WAIT，因此可以被中断。
 GFP_KERNEL和GFP_USER分别是内核和用户分配的默认设置。二者的失败不会立即威胁系统稳定性。 GFP_KERNEL绝对是内核源代码中最常使用的标志。
 GFP_HIGHUSER是GFP_USER的一个扩展，也用于用户空间。它允许分配无法直接映射的高端内
存。使用高端内存页是没有坏处的，因为用户过程的地址空间总是通过非线性页表组织的。
 GFP_HIGHUSER_MOVABLE用途类似于GFP_HIGHUSER，但分配将从虚拟内存域ZONE_MOVABLE进行。
 GFP_DMA用于分配适用于 DMA 的内存，当前是 __GFP_DMA的同义词。 GFP_DMA32也是__GFP_GMA32的同义词。

伙伴系统各分配函数和回收函数关系图

五、分配页

所有API函数都追溯到alloc_pages_node，从某种意义上说，该函数是伙伴系统主要实现的“发射台”


static inline struct page *alloc_pages_node(int nid, gfp_t gfp_mask,
unsigned int order)
{
    if (unlikely(order >= MAX_ORDER))
        return NULL;
    if(nid< 0)
        nid = numa_node_id();
    return __alloc_pages(gfp_mask, order,
        NODE_DATA(nid)->node_zonelists + gfp_zone(gfp_mask));
}
//gfp_zone用于选择分配内存的内存域
static inline struct page *__alloc_pages(gfp_t gfp_mask, unsigned int order, int preferred_nid)
{
	return __alloc_pages_nodemask(gfp_mask, order, preferred_nid, NULL);
}

gfp_mask 宏：
typedef enum {
	GFP_KERNEL,
	GFP_ATOMIC,
	__GFP_HIGHMEM,
	__GFP_HIGH
} gfp_t;

页分配关键函数流程图：

内核源代码将__alloc_pages_nodemask称之为“伙伴系统的心脏”，因为它处理的是实质性的内存分配。由于“心脏”的重要性，我将在下文详细介绍该函数。

__alloc_pages_nodemask函数：

/*
 * This is the 'heart' of the zoned buddy allocator.
 */
struct page *
__alloc_pages_nodemask(gfp_t gfp_mask, unsigned int order, int preferred_nid,
							nodemask_t *nodemask)
{
	struct page *page;
	unsigned int alloc_flags = ALLOC_WMARK_LOW;
	gfp_t alloc_mask; /* The gfp_t that was actually used for allocation */
	struct alloc_context ac = { };

	//检查order
	if (unlikely(order >= MAX_ORDER)) {
		WARN_ON_ONCE(!(gfp_mask & __GFP_NOWARN));
		return NULL;
	}

	gfp_mask &= gfp_allowed_mask;
	alloc_mask = gfp_mask;
	if (!prepare_alloc_pages(gfp_mask, order, preferred_nid, nodemask, &ac, &alloc_mask, &alloc_flags))
		return NULL;

	finalise_ac(gfp_mask, &ac);

	/* 第一次试图分配内存，若内存中有较多空余内存则可以快速分配 */
	page = get_page_from_freelist(alloc_mask, order, alloc_flags, &ac);
	if (likely(page))
		goto out;

	。。。
    /* 内存中没有较多的内存分配，是否有较多的内存分配和zone_watermark_ok函数检查有关，
       内存中没有较多内存分配，触发慢速内存分配 */

	page = __alloc_pages_slowpath(alloc_mask, order, &ac);

out:
	。。。

	trace_mm_page_alloc(page, order, alloc_mask, ac.migratetype);

	return page;
}

prepare_alloc_pages函数在做一些分配之前的内存准备工作，主要对参数ac一些字段赋值，暂时没有看到ac参数的作用。首先这个函数先尝试第一次内存分配调用get_page_from_freelist，如果没成功尝试慢速内存分配__alloc_pages_slowpath。

__alloc_pages_slowpath中内核再次遍历备用列表中的所有内存域，每次都调用wakeup_kswapd。顾名思义，该函数会唤醒负责换出页的kswapd守护进程。交换守护进程的任务比较复杂以后再做了解，在这里需要注意的是，空闲内存可以通过缩减内核缓存和页面回收获得，即写回或换出很少使用的页。这两种措施都是由该守护进程发起的。在交换守护进程唤醒后，内核开始新的尝试，在内存域之一查找适当的内存块。这一次进行的搜索更为积极，对分配标志进行了调整，修改为一些在当前特定情况下更有可能分配成功的标志。同时，将水印降低到最小值。对实时进程和指定了__GFP_WAIT标志因而不能睡眠的调用，会设置ALLOC_HARDER。然后用修改的标志集，再一次调用get_page_from_freelist，试图获得所需的页。
总之，内核会尽量的给调用者分配出内存，如果内存不够，就触发kswapd守护进程，回收一部分页，然后再继续调用get_page_from_freelist尝试分配，如果还不行，那么还有更强有力的措施，内核继续想其他办法挤出内存，当然这里就需要一些标记宏来控制是否强力挤出内存。

get_page_from_freelist函数：

static struct page *
get_page_from_freelist(gfp_t gfp_mask, unsigned int order, int alloc_flags,
						const struct alloc_context *ac)
{
	struct zoneref *z = ac->preferred_zoneref;
	struct zone *zone;
	struct pglist_data *last_pgdat_dirty_limit = NULL;

	/*
	 * Scan zonelist, looking for a zone with enough free.
	 * See also __cpuset_node_allowed() comment in kernel/cpuset.c.
	 */
    /*在预期内存域没有空闲空间的情况下，该列表确定了扫描系统其他内存域（和结点）的顺序。*/
	for_next_zone_zonelist_nodemask(zone, z, ac->zonelist, ac->high_zoneidx,
								ac->nodemask) {
		struct page *page;
		unsigned long mark;
        /* 检查当前cpu是否能分配内存 */
		if (cpusets_enabled() &&
			(alloc_flags & ALLOC_CPUSET) &&
			!__cpuset_zone_allowed(zone, gfp_mask))
				continue;
		。。。
        /* 通过入参alloc_flags来检查当前内存域是否可以分配内存， 
            zone_watermark_fast会调用__zone_watermark_ok, zone_watermark_ok接下来检查
            所遍历到的内存域是否有足够的空闲页，并试图分配一个连续内存块*/

		mark = zone->watermark[alloc_flags & ALLOC_WMARK_MASK];
		if (!zone_watermark_fast(zone, order, mark,
				       ac_classzone_idx(ac), alloc_flags)) {
        。。。


				continue;
			}
		}

try_this_zone:
        /* 最关键的伙伴系统移出free page 所以是rm */
		page = rmqueue(ac->preferred_zoneref->zone, zone, order,
				gfp_mask, alloc_flags, ac->migratetype);
		if (page) {
			prep_new_page(page, order, gfp_mask, alloc_flags);

            。。。
			return page;
		} else {
            。。。
		}
	}

	return NULL;
}

zone_watermark_ok函数中检查，该函数根据设置的标志判断是否能从给定的内存域分配内存。zone_watermark_ok检查所遍历到的内存域是否有足够的空闲页，并试图分配一个连续内存块。

注：watermark
high
当剩余内存在high以上时，系统认为当前内存使用压力不大。
low
当剩余内存降低到low时，系统就认为内存已经不足了，会触发kswapd内核线程进行内存回收处理
min
当剩余内存在min以下时，则系统内存压力非常大。一般情况下min以下的内存是不会被分配的，min以下的内存默
认是保留给特殊用途使用，属于保留的页框，用于原子的内存请求操作。
比如：当我们在中断上下文申请或者在不允许睡眠的地方申请内存时，可以采用标志GFP_ATOMIC来分配内存，
此时才会允许我们使用保留在min水位以下的内存

#define ALLOC_NO_WATERMARKS

#define ALLOC_WMARK_MIN
#define ALLOC_WMARK_LOW
#define ALLOC_WMARK_HIGH
#define ALLOC_HARDER
#define ALLOC_HIGH
#define ALLOC_CPUSET

0x01 /* 完全不检查水印 */

0x02 /* 使用pages_min水印 */
0x04 /* 使用pages_low水印 */
0x08 /* 使用pages_high水印 */
0x10 /* 试图更努力地分配，即放宽限制 */
0x20 /* 设置了__GFP_HIGH */
0x40 /* 检查内存结点是否对应着指定的CPU集合 */

前几个标志表示在判断页是否可分配时，需要考虑哪些水印。默认情况下（即没有因其他因素带来的压力而需要更多的内存），只有内存域包含页的数目至少为zone->pages_high时，才能分配页。这对应于ALLOC_WMARK_HIGH标志。如果要使用较低（ zone->pages_low）或最低（ zone->pages_min）设置，则必须相应地设置ALLOC_WMARK_MIN或ALLOC_WMARK_LOW。 ALLOC_HARDER通知伙伴系统在急需内存时放宽分配规则。在分配高端内存域的内存时， ALLOC_HIGH进一步放宽限制。最后，ALLOC_CPUSET告知内核，内存只能从当前进程允许运行的CPU相关联的内存结点分配，当然该选项只对NUMA系统有意义。

伙伴系统关键的分配函数rmqueue():

/*
 * Allocate a page from the given zone. Use pcplists for order-0 allocations.
 */
static inline
struct page *rmqueue(struct zone *preferred_zone,
			struct zone *zone, unsigned int order,
			gfp_t gfp_flags, unsigned int alloc_flags,
			int migratetype)
{
	unsigned long flags;
	struct page *page;

    /* order=0，从每cpu高速缓存中分配内存 */
	if (likely(order == 0)) {
		page = rmqueue_pcplist(preferred_zone, zone, order,
				gfp_flags, migratetype);
		goto out;
	}

    。。。

	do {
		page = NULL;
		if (alloc_flags & ALLOC_HARDER) {
			page = __rmqueue_smallest(zone, order, MIGRATE_HIGHATOMIC);
			if (page)
				trace_mm_page_alloc_zone_locked(page, order, migratetype);
		}
		if (!page)
			page = __rmqueue(zone, order, migratetype);
	} while (page && check_new_pages(page, order));
	。。。

out:
	VM_BUG_ON_PAGE(page && bad_range(zone, page), page);
	return page;


}

rmqueue函数，如果是0阶分配，那么则直接从cpu高速缓存中来处理，这个以后再讨论。其他阶直接从__rmqueue_smallest中开始分配。

__rmqueue_smallest（）函数：

__rmqueue_smallest的实现不是很长。本质上，它由一个循环组成，按递增顺序遍历内存域的各个特定迁移类型的空闲页列表，直至找到合适的一项。

/*
 * Go through the free lists for the given migratetype and remove
 * the smallest available page from the freelists
 */
static __always_inline
struct page *__rmqueue_smallest(struct zone *zone, unsigned int order,
						int migratetype)
{
	unsigned int current_order;
	struct free_area *area;
	struct page *page;

	/* 从当前需要的order阶中开始向上遍历高阶free area（++current_order），来找到可用的内存块 */
	for (current_order = order; current_order < MAX_ORDER; ++current_order) {
		area = &(zone->free_area[current_order]);
		page = list_first_entry_or_null(&area->free_list[migratetype],
							struct page, lru);
		if (!page)
			continue;
        /* 在当前阶中找到了一个内存块，则将此page从free area中删除 */
		list_del(&page->lru);
        /* rmv_page_order调用
        __ClearPageBuddy(struct page *page){atomic_set(&page->mapcount, -1)}和
        set_page_private(page, 0){page->private = 0}
        __ClearPageBuddy表示该页已经不在伙伴系统管理，set_page_private将struct page的private成员设置为0*/
		rmv_page_order(page);
		area->nr_free--;
		expand(zone, page, order, current_order, area, migratetype);
        /*set_pcppage_migratetype(page, migratetype){page->index = migratetype;}，给page的index赋值上迁移类型*/
		set_pcppage_migratetype(page, migratetype);
		return page;
	}

	return NULL;
}

如果需要分配的内存块长度小于所选择的连续页范围，即如果因为没有更小的适当内存块可用，而从较高的分配阶分配了一块内存，那么该内存块必须按照伙伴系统的原理分裂成小的块。这是通过expand函数完成的。

伙伴系统分裂函数expand（）：

static inline void expand(struct zone *zone, struct page *page,
	int low, int high, struct free_area *area,
	int migratetype)
{
	unsigned long size = 1 << high;

	while (high > low) {
		area--;
		high--;
		size >>= 1;
        。。。
		list_add(&page[size].lru, &area->free_list[migratetype]);
		area->nr_free++;
		set_page_order(&page[size], high);
	}
}

static inline void set_page_order(struct page *page, unsigned int order)
{
	set_page_private(page, order);
	__SetPageBuddy(page);
}
#define set_page_private(page, v)	((page)->private = (v))
void __SetPageBuddy(struct page *page)
{
    atomic_set(&page->_mapcount, -1);
}

我们现在举个例子：我先现在要分配一个3阶的内存，但是__rmqueue_smallest在遍历到5阶时才发现5阶里有空闲的内存块。

expand(page,index=0,low=3,high=5,area)

这里做一些解释，这个page具体指的是什么？它指向每个内存块的首页地址，比如5阶的free area，这个队列里每一个内存块内部地址是连续的，但是内存块之间的地址是不连续的，当我们从对队列里获得一个内存块，则page返回这个内存块的首页。

继续上面的expand，5阶分裂3阶过程：

1、size = 32， 5>3，进入循环，第一步先将5阶分配为4阶。此时将area--指向了4阶队列的头，注意此时size=16.

2、将page[16]开始的页放入了4阶队列里，从这里我们可以知道什么，第一，整个函数的page始终指向的是从5阶队里取出的内存块的首页；第二，这里把后16页放入了4阶队列里；第三，伙伴系统管理的内存块只需要指向内存块的首页地址即可，这里可根据“阶”自动推导出内存块，并且这个内存块里的页一定是连续的。这个page[size].lru的lru是各个数据结构用来管理该page的一个字段。

3、将4阶的nr_free++，并且调用set_page_order，设置page的属性。

循环中各个步骤都调用了set_page_order辅助函数，对于回收到伙伴系统的内存区，该函数将第一个struct page实例的private标志设置为当前分配阶，并设置页的PG_buddy标志位。该标志表示内存块由伙伴系统管理。

如果在特定的迁移类型列表上没有连续内存区可用，则__rmqueue_smallest返回NULL指针。内核接下来根据备用次序，尝试使用其他迁移类型的列表满足分配请求。该任务委托给__rmqueue_fallback。这里不做深入研究了。

在分配单页帧内存时是从per-CPU队列中分配的并不是从伙伴系统中，http://www.voidcn.com/article/p-cchcjxeq-bcp.html这个博客写的非常好。

-------------------------每CPU告诉缓存-----------------------------

这里再重新详细的说下每cpu高速缓存吧。

为了提升系统性能，内核在申请和释放单个页框时，每个内存区域定义了一个“每CPU”页框高速缓存，这些每CPU高速缓存包含了一些预先分配的页框，它们被用于满足本地CPU发出的单一内存请求。注意这里是每个内存区域都对每个CPU都分别有一个高速缓存。

每CPU高速缓存包含一个热高速缓存和一个冷高速缓存。如果内核或者用户态进程刚好分配到页框就立即向页框写，那么从热高速缓存获得页框这样跟有利，因为刚分配的页框会驻留在硬件告诉缓存中（注意meiCPU告诉缓存是软件上用链表实现的记录页框的一个队列结构，而硬件告诉缓存是实实在在的与CPU通信的物理结构）。反过来如果页框将要被DMA操作填充，那么从冷高速缓存中会的页框是方便的，因为这种情况下不会涉及到CPU，不会通过硬件高速缓存，而是直接向页框内写入数据，所以从冷告诉缓存中获取对系统更有利。这里热和冷在每CPU高速缓存队列中仅仅是顺序的关系，热的在队列头、冷的在队列尾哈哈。

1、每CPU高速缓存涉及到的数据结构

zone结构体中pageset成员指向内存域per-CPU管理结构，NR_CPUS定义系统cpu个数

struct zone {
    ...
	struct per_cpu_pageset __percpu *pageset;
    ...
}

struct per_cpu_pageset {
	struct per_cpu_pages pcp;
#ifdef CONFIG_NUMA
	s8 expire;
	u16 vm_numa_stat_diff[NR_VM_NUMA_STAT_ITEMS];
#endif
#ifdef CONFIG_SMP
	s8 stat_threshold;
	s8 vm_stat_diff[NR_VM_ZONE_STAT_ITEMS];
#endif
};

struct per_cpu_pages {
	int count;		/* number of pages in the list */
	int high;		/* high watermark, emptying needed */
	int batch;		/* chunk size for buddy add/remove */

	/* Lists of pages, one per migrate type stored on the pcp-lists */
	struct list_head lists[MIGRATE_PCPTYPES];
};
count:每CPU高速缓冲中页框的数目
high：per_cpu缓存中页帧的上限，如果超过这个值就将释放 batch个页帧到伙伴系统中去
batch:如果per_cpu中没有可分配的页帧就从伙伴系统中分配batch个页帧到缓存中来

2、per-CPU初始化

初始化看这个文章https://blog.csdn.net/oqqYuJi12345678/article/details/100526720

初始化仅仅是对每CPU高速缓存队列初始化为空，并对count、high、batch字段进行赋值，并没有给其预先分配页帧，我个人认为预分配的页帧是在伙伴系统第一次调用__rmqueue_pcplist时直接从伙伴系统中拿出batch个单页帧放入了每CPU高速缓存队里当中。

3、伙伴系统中的单页帧分配

struct page *rmqueue(struct zone *preferred_zone,
			struct zone *zone, unsigned int order,
			gfp_t gfp_flags, unsigned int alloc_flags,
			int migratetype)
{
	...

	if (likely(order == 0)) {
		page = rmqueue_pcplist(preferred_zone, zone, order,
				gfp_flags, migratetype);
		goto out;
	}

    ...
}

static struct page *rmqueue_pcplist(struct zone *preferred_zone,
			struct zone *zone, unsigned int order,
			gfp_t gfp_flags, int migratetype)
{
	struct per_cpu_pages *pcp;
	struct list_head *list;
	struct page *page;
	unsigned long flags;

	local_irq_save(flags);
	pcp = &this_cpu_ptr(zone->pageset)->pcp;//当前cpu的告诉缓存队列
	list = &pcp->lists[migratetype];//取出对应迁移类型的缓冲队列
	page = __rmqueue_pcplist(zone,  migratetype, pcp, list);
	if (page) {
		__count_zid_vm_events(PGALLOC, page_zonenum(page), 1 << order);
		zone_statistics(preferred_zone, zone);
	}
	local_irq_restore(flags);
	return page;
}

static struct page *__rmqueue_pcplist(struct zone *zone, int migratetype,
			struct per_cpu_pages *pcp,
			struct list_head *list)
{
	struct page *page;

	do {
		if (list_empty(list)) {//如果队列是空，则从伙伴系统中取页帧
			pcp->count += rmqueue_bulk(zone, 0,
					pcp->batch, list,
					migratetype);
			if (unlikely(list_empty(list)))
				return NULL;
		}

		page = list_first_entry(list, struct page, lru);//将队列的第一个元素取出来，返回这个page，单页帧分配完毕
		list_del(&page->lru);
		pcp->count--;
	} while (check_new_pcp(page));

	return page;
}

static int rmqueue_bulk(struct zone *zone, unsigned int order,
			unsigned long count, struct list_head *list,
			int migratetype)
{
	int i, alloced = 0;

	spin_lock(&zone->lock);
	for (i = 0; i < count; ++i) {
		struct page *page = __rmqueue(zone, order, migratetype);
		if (unlikely(page == NULL))
			break;

		if (unlikely(check_pcp_refill(page)))
			continue;

		/*
		 * Split buddy pages returned by expand() are received here in
		 * physical page order. The page is added to the tail of
		 * caller's list. From the callers perspective, the linked list
		 * is ordered by page number under some conditions. This is
		 * useful for IO devices that can forward direction from the
		 * head, thus also in the physical page order. This is useful
		 * for IO devices that can merge IO requests if the physical
		 * pages are ordered properly.
		 */
		list_add_tail(&page->lru, list);
		alloced++;
		if (is_migrate_cma(get_pcppage_migratetype(page)))
			__mod_zone_page_state(zone, NR_FREE_CMA_PAGES,
					      -(1 << order));
	}

	/*
	 * i pages were removed from the buddy list even if some leak due
	 * to check_pcp_refill failing so adjust NR_FREE_PAGES based
	 * on i. Do not confuse with 'alloced' which is the number of
	 * pages added to the pcp list.
	 */
	__mod_zone_page_state(zone, NR_FREE_PAGES, -(i << order));
	spin_unlock(&zone->lock);
	return alloced;
}

六、释放页

释放相对比较简单，总的来说如果order=0直接放在的per-CPU中，其他的返回到伙伴系统里，这里介绍放回到伙伴系统

void __free_pages(struct page *page, unsigned int order)
{
	if (put_page_testzero(page)) {
		if (order == 0)
			free_unref_page(page);//放到per-CPU
		else
			__free_pages_ok(page, order);//放到伙伴系统
	}
}

__free_pages_ok最终调用__free_one_page函数
page:释放内存块的第一个page地址
pfn:内存块第一个page所对应页帧号
zone:该内存块所在的内存域
order:阶
migratetype:伙伴系统的migrate类型

static inline void __free_one_page(struct page *page,
		unsigned long pfn,
		struct zone *zone, unsigned int order,
		int migratetype)
{
	...
	while (order < max_order - 1) {
		buddy_pfn = __find_buddy_pfn(pfn, order);//找出伙伴的帧号
		buddy = page + (buddy_pfn - pfn);//找出伙伴的page地址

		if (!page_is_buddy(page, buddy, order))
			goto done_merging;
		/*
		 * Our buddy is free or it is CONFIG_DEBUG_PAGEALLOC guard page,
		 * merge with it and move up one order.
		 */
        /* 将本内存块从当前阶的伙伴队列里删除 */
		list_del(&buddy->lru);
	    zone->free_area[order].nr_free--;
		rmv_page_order(buddy);
		/* 找到若伙伴两者合并后的首帧号 */
		combined_pfn = buddy_pfn & pfn;
		page = page + (combined_pfn - pfn);
		pfn = combined_pfn;
        /* 继续向上一阶循环查找是否能继续合并 */
		order++;
	}
	...
}

/*
 * Locate the struct page for both the matching buddy in our
 * pair (buddy1) and the combined O(n+1) page they form (page).
 *
 * 1) Any buddy B1 will have an order O twin B2 which satisfies
 * the following equation:
 *     B2 = B1 ^ (1 << O)
 * For example, if the starting buddy (buddy2) is #8 its order
 * 1 buddy is #10:
 *     B2 = 8 ^ (1 << 1) = 8 ^ 2 = 10
 *
 * 2) Any buddy B will have an order O+1 parent P which
 * satisfies the following equation:
 *     P = B & ~(1 << O)
 *
 * Assumption: *_mem_map is contiguous at least up to MAX_ORDER
 */
static inline unsigned long
__find_buddy_pfn(unsigned long page_pfn, unsigned int order)
{
	return page_pfn ^ (1 << order);
}

内存块回收到伙伴系统是从当前阶里查找该块内存的伙伴buddy是否在伙伴系统中，如果存在则将伙伴从当前阶删除，将二者合并到上一阶，接下来从上一阶再向上循环查找处理。一定要知道的是根据伙伴系统的分裂expand函数，两个伙伴的page地址（上文介绍过page是在alloc_node_mem_map里申请的）和帧号一定是连续的。

__find_buddy_pfn函数找当前内存块的伙伴，返回伙伴的帧号。函数注释里已经说明的算法：

伙伴buddy_pfn = buddy ^(1<

合并后的父伙伴的首ptn = buddy & (1<

父伙伴的首帧就是两个伙伴都在伙伴系统中，二者会合并成一个内存块，并上移到上一阶伙伴系统中，合并之后的首帧号。以上这两种算法是巧妙的算法，肯定是经过推导之后的最终结果。例如：

释放的内存首帧=8 order=3，则：

它的伙伴的首帧=8 ^(1<<3)=0，这里看出[0,7]和[8-15]是伙伴，这里要明确，伙伴之间的地址或者帧号一定是连续的。（这里说明一下，在伙伴系统分裂expand时，一定是将右侧的高帧号的内存块放入到低阶伙伴系统中，但是内存块回收时可不一定，也许高帧号的内存先回收进来，而此时低帧号的伙伴仍在使用中）

假如伙伴合并之后的首帧pfn = 8 &~(1<<3)或者pfn=B1^B2=8^0，这两个结果是有一样的，数学水平有限没有推导出过程.

伙伴系统需要注意的一点：伙伴系统旨在提供一块大的物理地址连续的内存块，但是伙伴系统所管理的各个大的内存块之间是不一定连续的，比如，3阶内存块A和B，A和B的内部物理地址是连续的，但是A和B之间不一定连续。

你可能感兴趣的:(内存管理)

C++14--内存管理（new delete）大胆飞猪 c++
目录1.C++内存管理方式1.1new/delete操作内置类型1.2new和delete操作自定义类型2.operatornew与operatordelete函数3.new和delete的实现原理3.1内置类型3.2自定义类型4.定位new表达式(placement-new)5.malloc/free和new/delete的区别1.C++内存管理方式前言C语言内存管理在C++中可以继续使用，但是
C++ STL 详解 ——vector 的深度解析与实践指南矛取矛求 C++c++开发语言
一、vector的核心概念与底层机制1.1动态数组的本质连续内存存储：与普通数组相同，vector使用连续的内存空间，支持O(1)时间复杂度的随机访问。动态扩容特性：通过push_back等操作自动调整容量，无需手动管理内存。与数组的区别：特性普通数组vector内存分配静态分配动态分配大小可变否是越界检查无无（需手动检查）内存管理手动释放自动管理1.2扩容策略的深度解析常见扩容方式：指数增长：每
C# AOT生成的hellowwordEXE运行占用多少内存1-5MB? 专注VB编程开发20年 c#策略模式开发语言
C#使用AOT（Ahead-Of-Time，提前编译）生成的"Hello,World!"可执行文件在运行时占用的内存会受到多种因素的影响，以下是详细分析：影响内存占用的因素操作系统：不同的操作系统（如Windows、Linux、macOS）对进程的内存管理机制不同，会导致内存占用有所差异。运行环境：包括系统中已运行的其他程序、系统的内存管理策略等。编译器和运行时配置：不同版本的.NETSDK以及编
为什么Redis对大 Key（Large Key）和大对象不友好？怎样优化？风一样的树懒 redis 数据库缓存
你好，我是风一样的树懒，一个工作十多年的后端专家，曾就职京东、阿里等多家互联网头部企业。公众号“吴计可师”，已经更新了近百篇高质量的面试相关文章，喜欢的朋友欢迎关注点赞Redis对大Key（LargeKey）和大对象不友好，主要源于其内存管理模型、单线程架构和数据结构特性。以下从性能影响、内存管理、集群限制三个维度解析原因，并提供优化方案：一、Redis对大Key不友好的核心原因1.性能瓶颈单线程
【vLLM 学习】使用 TPU 安装 HyperAI超神经 vLLM 学习人工智能 vLLM 深度学习 TPU 机器学习教程
vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/vLLM使用PyTorchXLA支持GoogleCloudTPU。依赖环境GoogleCloudTPUVM（单主机和多主机）TPU版本:v5e、v5p、v4Python:3.10安装选项：href=“https://v
图片加载框架Glide与Picasso原理剖析 Ya-Jun glide android
图片加载框架Glide与Picasso原理剖析一、前言图片加载是Android应用开发中的一个重要环节，良好的图片加载机制可以提升应用性能和用户体验。Glide和Picasso是目前最流行的两个图片加载框架，本文将深入分析这两个框架的核心原理和实现机制。二、图片加载基础2.1图片加载的挑战内存管理OOM（OutOfMemory）问题内存缓存策略图片复用性能优化异步加载图片压缩缓存机制用户体验加载占
全方位 JVM 调优参数详解 2501_91133274 jvm
写在前面：兄弟们，我有个长期项目，想接私活的兄弟可以看看我GitHub！https://github.com/yuhan-9527/coder2retire全方位JVM参数详解JVM的调优对于Java应用的性能至关重要。以下为你详细列举各类JVM调优参数，希望能满足你对“所有”参数的需求。一、内存管理参数堆内存参数•堆初始大小与最大值◦-Xms：设置JVM启动时堆内存的初始大小。如-Xms1g表示
C# WPF学习总结战族狼魂 WPF C#c#wpf 学习
经过一段时间的学习和实践，我对C#WPF（WindowsPresentationFoundation）有了更深入的理解。WPF作为一个强大的桌面应用程序开发框架，为开发者提供了丰富的UI控件、强大的数据绑定和灵活的布局系统。以下是我对C#WPF学习的一些总结：目录1.基础知识2.UI设计3.数据绑定4.动画和特效5.命令和路由事件6.自定义控件和扩展性7.性能优化和内存管理8.实战项目经验9.学习
c++比较与对比动态内存分配和回收运算符new，new[]，delete，delete[]。成风693 c++开发语言
在C++中，动态内存管理是通过运算符new、new[]、delete和delete[]来实现的。它们分别用于分配和释放动态内存。1.new和new[]new1.用途：用于分配单个对象的内存。2.语法：Type*ptr=newType;行为：1.分配足够的内存来存储一个Type类型的对象。2.调用Type的构造函数来初始化对象。3.返回指向分配内存的指针。示例：int*ptr=newint;//分配
深入解析Java虚拟机（JVM）：架构、内存管理与性能优化 EvLast jvm java 职场和发展性能优化
##引言Java虚拟机（JavaVirtualMachine,JVM）是Java生态系统的核心引擎，它不仅实现了"一次编写，到处运行"的跨平台承诺，更通过自动内存管理、即时编译等机制深刻影响着现代软件开发。截至2023年，全球超过90%的《财富》500强企业使用基于JVM的技术栈，其重要性可见一斑。##一、JVM核心架构解析###1.1类加载子系统-**双亲委派模型**：采用层级式加载机制，防止核
Python 内存管理进阶：打造自定义内存池，释放性能潜力清水白石008 python Python题库 python 网络前端
Python内存管理进阶：打造自定义内存池，释放性能潜力引言大家好，我是[您的名字]，一位在Python领域深耕多年的软件专家。今天，我们来聊聊Python内存管理的“高级玩法”——自定义内存分配器。Python以其简洁易用和强大的生态系统而闻名，但当面对性能挑战时，我们往往需要深入底层，探索更精细的优化手段。内存管理，作为程序性能的基石之一，自然也成为了我们关注的焦点。Python默认的内存管理
Java GC的常用算法 yyueshen JVM java jvm
在Java中，垃圾回收（GarbageCollection，GC）是自动内存管理的核心机制，以下是几种常用的JavaGC算法：1.标记-清除算法（Mark-Sweep）原理标记阶段：从根对象（如虚拟机栈中的引用对象、静态变量引用的对象等）开始遍历，标记所有可达对象。清除阶段：遍历整个堆，将未标记的对象（即不可达对象）所占的内存空间回收。优缺点优点：实现简单，不需要额外的空间。缺点：会产生大量的内存
### **Android核心系统服务深度解析（AMS/ATMS/WMS/DMS）** 凤翎鹤冢 python 开发语言
------####**一、AMS（ActivityManagerService）****职责**：管理应用生命周期、进程调度、四大组件（Activity/Service/Broadcast/ContentProvider）协调、权限控制、内存管理等。---#####**1.源码路径**-**核心类**：-`frameworks/base/services/core/java/com/androi
基于boost的共享内存通信demo CV工程师小朱 C++共享内存 IPC通信进程通信父子进程
文章目录前言一、共享内存管理二、图像算法服务中的IPC通信流程三、demo实验结果总结前言在一个系统比较复杂的时候，将模块独立成单独的进程有助于错误定位以及异常重启恢复，不至于某个模块发生崩溃导致整个系统崩溃。当通信数据量比较大时，例如图像数据，可以使用共享内存在进程间交互，比socket快很多。下面介绍一个利用Boost.interprocess和Boost.process模块进行进程间图像数据
自己写的内存块管理办法绵山介子推 RTX实时操作系统嵌入式软件
内存管理模块一、所有的实时操作系统都有自己的内存管理系统，目前的代码是把内存块管理模块自己实现了，其实RTX5有自己的内存块管理系统没必要自己去实现，CSDN链接如下：https://blog.csdn.net/Zhangdfhvxdul/article/details/145474093二、自己实现内存管理模块的方法：//内存块的定义，这里知识举个例子，应该还有1024、4K等等缓存的管理#de
深挖JVM隐藏优化点与百万QPS系统调优【突破认知：JVM内存管理的9大反直觉真相】通过三个违背‘常识‘的调优策略，将GC停顿时间从1.2秒降至80ms，节省40%服务器成本王大师王文峰 jvm 服务器运维
本人详解作者：王文峰，参加过CSDN2020年度博客之星，《Java王大师王天师》公众号：JAVA开发王大师，专注于天道酬勤的Java开发问题中国国学、传统文化和代码爱好者的程序人生，期待你的关注和支持！本人外号：神秘小峯山峯转载说明：务必注明来源（注明：作者：王文峰哦）深挖JVM隐藏优化点与百万QPS系统调优【突破认知：JVM内存管理的9大反直觉真相】通过三个违背'常识'的调优策略，将GC停顿时
Oracle数据库深度优化实战指南：从SQL到架构的全维度调优 AAEllisonPang jvm
目录性能优化方法论1.1性能优化黄金三角（SQL/实例/架构）1.2常用诊断工具全景图（AWR/ASH/SQLMonitor）SQL语句调优实战2.1执行计划深度解析2.2全表扫描灾难案例2.3绑定变量陷阱解决方案索引优化策略3.1索引失效七大场景3.2函数索引实战应用实例参数优化4.1内存管理核心参数4.2连接风暴抑制方案架构设计优化5.1分区表设计陷阱5.2物化视图加速案例统计信息管理6.1统
JavaScript 性能优化实战案例与解决方案 Real Man★ javascript 性能优化开发语言
JavaScript性能优化是提升Web应用流畅度和用户体验的核心环节。以下是针对常见性能问题的实战案例与优化方案，涵盖代码优化、渲染优化、内存管理等多个方面：一、高频事件处理优化案例1：滚动事件卡顿问题：页面监听scroll事件实现动态效果，但频繁触发导致卡顿。优化方案：javascript复制//1.节流（Throttle）：固定时间间隔执行functionthrottle(fn,delay)
深度学习训练中GPU内存管理 @Mr_LiuYang 遇到过的问题内存管理内存溢出 out of memory GPU内存
文章目录概述常见问题1、设备选择和数据迁移2、显存监控函数3、显存释放函数4、自适应batchsize调节5、梯度累积概述在深度学习模型训练中，主流GPU显存通常为8GB~80GB，内存不足会导致训练中断或BatchSize受限，GPU内存管理是优化性能和避免OutOfMemoryError的关键挑战。本博客简介PyTorch中GPU内存管理的核心函数、用法和实战技巧，帮助开发者高效利用显存资源。
如何有效管理 JavaScript 中的内存：垃圾回收与最佳实践名之以父 JavaScript 前端安全 javascript 前端框架 react.js vue.js 网络
“垃圾回收是现代编程语言的核心特性之一，它使得开发者可以专注于功能实现，而无需担心内存管理的细节。”——在JavaScript中，垃圾回收（GC）是一个自动化的内存管理过程，它帮助我们确保不再使用的内存得到释放。尽管JavaScript的垃圾回收机制非常强大，但如果对其原理和工作方式不够了解，也可能导致一些性能问题和内存泄漏。本文将深入探讨JavaScript中的垃圾回收机制、算法以及如何优化垃圾
【JavaScript 】垃圾回收机制进阶解析：提高性能的终极指南名之以父 JavaScript java jvm 开发语言前端安全网络 vue.js
“垃圾回收机制不仅是内存管理的基石，更是高效Web开发的保障。在JavaScript中，理解其工作原理至关重要。”在JavaScript中，垃圾回收（GarbageCollection，GC）是一个自动化的内存管理过程，能够有效防止内存泄漏虽然这看似是一个简单的机制，但背后却包含着丰富的理论与实现细节。理解这些原理，不仅能够帮助我们写出更高效的代码，还能避免一些性能问题和内存泄漏。本文将带你深入探
【C常用的标准库函数】 niuTaylor c语言算法开发语言
以下是C语言在面试和工程中常用的标准库函数的全面总结，按头文件分类，涵盖输入输出、字符串处理、内存管理、数学计算、时间处理等核心内容：一、输入输出（stdio.h）文件操作FILE*fopen(constchar*path,constchar*mode)功能：打开文件。模式："r"（读）、"w"（写）、"a"（追加）、"rb"（二进制读）等。示例：FILE*fp=fopen("data.txt",
FreeRTOS之内存管理 2401_85904908 单片机 stm32 arm开发开发语言
文章目录选用heap函数pvPortMalloc/vPortFreexPortGetFreeHeapSizexPortGetMinimumEverFreeHeapSizemalloc失败的钩子函数选用文件优点缺点heap_1.c内存分配逻辑简单，执行时间可确定仅能分配内存，无法回收已分配的内存heap_2.c支持动态内存分配，能实现最佳匹配（找到最适合请求大小的空闲内存块）会产生内存碎片，内存分配
FreeRTOS概述 2401_85904908 单片机 arm开发 stm32
文章目录核心文件头文件内存管理文件入口函数数据类型前缀核心文件最核心文件：task.c和list.c文件作用tasks.c必需，任务操作list.c必须，列表queue.c基本必需，提供队列操作、信号量(semaphore)操作timer.c可选，softwaretimerevent_groups.c可选，提供eventgroup功能croutine.c可选，过时了头文件头文件作用FreeRTOS
2025年渗透测试面试题总结-快某手-安全实习生（一面、二面）（题目+回答）独行soc 2025年渗透测试面试指南安全科技网络面试护网 2015年
网络安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录快某手-安全实习生一面一、Linux操作：查看进程PID的5种方法二、Elasticsearch（ES）核心要点三、HTTPS建立过程（TLS1.3优化版）四、Python内存管理机制五、深拷贝与浅拷贝对比六、Python多线程局限性七、XSS防御方案八、SQL注入防
JVM内存深度解析：堆内与堆外内存的监控与诊断猿泰山 Java核心技术 jvm
JVM内存深度解析：堆内与堆外内存的监控与诊断一、引言在Java应用中，JVM（JavaVirtualMachine）的内存管理至关重要。其中，堆内内存和堆外内存是两个核心概念。堆内内存主要存储Java对象实例，而堆外内存则与Java的NIO（NewI/O）库密切相关，主要用于存储不受Java堆大小限制的直接缓冲区。本文将深入探讨如何监控和诊断这两种类型的内存使用。二、堆内内存监控与诊断JVM参数
C++内存管理秘籍：深入解析与实战代码示例 my1121716951 编程 c++java 开发语言
C++内存管理秘籍：深入解析与实战代码示例一、内存管理的基本概念二、内存泄漏与野指针三、智能指针：现代C++的内存管理利器四、实战代码示例示例1：传统动态内存管理示例2：使用`std::unique_ptr`示例3：使用`std::shared_ptr`五、总结在C++编程的世界里，内存管理是一项既基础又核心的技能。它直接关系到程序的性能、稳定性和可维护性。不同于一些高级语言自动管理内存的特性，C
JVM常见八股问题学Java的skyyyyyyyy jvm java
1.什么是JVM?回答：JVM是Java虚拟机，负责将Java字节码转换为机器码并执行。它提供了内存管理、垃圾回收、线程管理等功能，使得Java程序能够在不同操作系统上运行而无需修改。2.JVM的内存结构是什么？JVM内存结构主要包括以下几个部分：方法区：存储类的结构信息，如类名、访问修饰符、常量池、字段描述等。堆区：存储对象实例，几乎所有的对象都在这里分配内存。栈区：每个线程都有一个栈帧，用于存
《C语言动态顺序表:从内存管理到功能实现》 Oracle_666 c语言开发语言
1.顺序表1.1概念顺序存储的线性表，叫顺序表。1.2顺序表存放的实现方式可以使用数组存储数据，可以实现逻辑上相连，物理内存上也相连。也可以使用malloc在堆区申请一片连续的空间，存放数据，实现逻辑上相连，物理内存上也相连。1.3顺序表的组成需要一片连续的空间，存放数据。可以是数组，也可以是连续堆区空间还需要一个变量来记录当前顺序表的长度。（已存放的元素个数）1.4对顺序表长度的解析顺序表的长度
Java虚拟机之内存分配原则 JouJz java 开发语言 jvm
目录一、JVM内存模型概览二、核心内存分配原则1.对象优先分配在Eden区2.大对象直接进入老年代3.长期存活对象晋升老年代4.空间分配担保5.TLAB（线程本地分配缓冲）三、内存分配流程图解四、调优参数与实战建议1.堆内存配置2.避免内存泄漏与频繁GC3.案例分析五、总结一、JVM内存模型概览JVM的内存分配围绕“堆（Heap）”展开，堆内存按对象生命周期划分为不同区域，以实现高效的内存管理和垃
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found

【linux 内存管理】深入理解linux内核架构 内存管理（3）伙伴系统