aoyizu7608

内存管理-buddy[代码]

基于2.6.32内核源码分析

首选内存区和gfp描述符关系运算

64位系统默认没有开启CONFIG_HIGHMEM选项，因此只有4个内存区DMA(0),DMA32(1),NORMAL(2),MOVABLE(3)，因此在gfp标志中关于内存区选择的标志有如下4个，并通过宏GFP_ZONEMASK从gfp标志中提取出这些个标志。然后通过一个人工定义的映射表将上面的四个gfp标志映射为具体的内存区，进而确定分配内存时首选内存区。

1 #define __GFP_DMA    ((__force gfp_t)0x01u)
2 #define __GFP_HIGHMEM    ((__force gfp_t)0x02u)
3 #define __GFP_DMA32    ((__force gfp_t)0x04u)
4 #define __GFP_MOVABLE    ((__force gfp_t)0x08u)  /* Page is movable */
5 #define GFP_ZONEMASK    (__GFP_DMA|__GFP_HIGHMEM|__GFP_DMA32|__GFP_MOVABLE)

View Code

这里特意提到：在64位系统下一共有四个内存区，通过gfp标志位选定首选内存区，需要4个标志，上面代码确实有4个标志位，但是对比内存区类型可以看出，标志位多了一个__GFP_HIGHMEM,却少了一个__GFP_NORMAL(内核代码中也确实没有定义这个标志)。为什么会多了__GFP_HIGHMEM下文在详细说，接下来先解释下为什么会少了__GFP_NORMAL，内核使用了一个隐含规则：如果gfp标志低4位全位0（即__GFP_DMA,__GFP_HIGHMEM,__GFP_DMA32,__GFP_MOVABLE都没有被值位时)，那么就默认将NORMAL区作为gfp指定的首选内存区。

 1 #define GFP_ZONE_TABLE ( \
 2     (ZONE_NORMAL << 0 * ZONES_SHIFT)                \    //0
 3     | (OPT_ZONE_DMA << __GFP_DMA * ZONES_SHIFT)             \ //2
 4     | (OPT_ZONE_HIGHMEM << __GFP_HIGHMEM * ZONES_SHIFT)        \ //4
 5     | (OPT_ZONE_DMA32 << __GFP_DMA32 * ZONES_SHIFT)            \ //8
 6     | (ZONE_NORMAL << __GFP_MOVABLE * ZONES_SHIFT)            \ //16
 7     | (OPT_ZONE_DMA << (__GFP_MOVABLE | __GFP_DMA) * ZONES_SHIFT)    \  //18
 8     | (ZONE_MOVABLE << (__GFP_MOVABLE | __GFP_HIGHMEM) * ZONES_SHIFT)\ //20
 9     | (OPT_ZONE_DMA32 << (__GFP_MOVABLE | __GFP_DMA32) * ZONES_SHIFT)\ //24
10 )

View Code

2.如果默认没有设定gfp标志，也就是说GFP_ZONEMASK&gfp为0的，选择NORMAL

3.如果只设置了__GFP_DMA,首选DMA内存区

4.如果只设置了__GFP_HIGHMEM,首选NORMAL(由于64位架构下没有HIGHTMEM区，所以这里即使传入了__GFP_HIGHMEM也是首选NORMAL区）

5.如果只设置了__GFP_DMA32，首选DMA32内存区

6.如果只设置了__GFP_MOVABLE，仍然首选NORMAL区

7.如果同时设置了__GFP_MOVABLE和__GFP_DMA，首选DMA区

8.如果同时设置了__GFP_MOVABLE和__GFP_HIGHMEM,首选MOVABLE区(这个MOVABLE区是个什么东西，内存都来至于哪里?）

9.如果同时设置了__GFP_MOVABLE和__GFP_DMA32 首选DMA32区

上面这个映射表其实给出了gfp中关于首选内存区选择的几个标志的所有的合法组合，在内存分配过程中这种从GFP标志到首选内存区的映射是由gfp_zone函数完成。

__cpuset_node_allowed_softwall 和 __cpuset_node_allowed_hardwall

用来根据GFP标志和当前上下文判断某个内存节点是否满足内存分配的要求

softwall限制如下：

1.如果在中断上下文（包括硬中断上下文，软中断上下文，以及不可屏蔽中断上下文，总是允许在被检查node上分配）

2.如果gfp表中中被打上了__GFP_THISNODE标志，总是允许在被检查node上分配

3.如果1，2条件不满足，但是被检查node在当前进程的current->mems_allowed中允许在被检查node上分配

4.如果当前进程正在因OOM被杀掉时，允许在被检查node上分配。

5.如果设置了gfp __GFP_HARDWALL标志又不满足1，2，3，4则不允许在被检查node上分配

6.如果1，2，3，4，5都不满足，当前进程正在退出（exiting)则允许在被检查node上分配

7.如果1，2，3，4，5，6都不满足，沿着当前进程所在的cpuset往父亲方向遍历找到第一个设置了mem_exclusive或者mem_hardwall的cpuset,如果被检查内存在这个cpuset允许的node列表中，则允许在当前node分配。

8.如果1，2，3，4，5，6，7都不满足这不允许在被检查node上分配。

hardwall限制如下：

1.如果在中断上下文（包括硬中断上下文，软中断上下文，以及不可屏蔽中断上下文，总是允许在被检查node上分配）

2.如果gfp表中中被打上了__GFP_THISNODE标志，总是允许在被检查node上分配

3.如果1，2条件不满足，但是被检查node在当前进程的current->mems_allowed中允许在被检查node上分配

4.如果当前进程正在因OOM被杀掉时，允许在被检查node上分配。

5.如果1，2，3，4都不满足则不允许在当前node上分配

总结：

1.如果gfp标志设置了__GFP_HARDWALL的话,那么softwall和hardwall功能相同

2.如果gfp没有设置__GFP_HARDWALL hardwall要比softwall检查严格，放宽了两种情况下的内存分配。1进程处于exiting状态；2.如果第一个mem_exclusive或者mem_hardwall祖先cpuset中的node列表中有被检查node节点的话，是允许在被检查节点上分配的。

3.如果一个cpuset设置了mem_exclusive或者mem_hardwall的话，无论如何处于以当前cpuset为根的树下的进程上下文是分不到该cpuset之外内存节点上的内存的。

4.中断上下文（包括软中断，硬中断，不可屏蔽中断）中分配内存时是不受cpuset的限制的。

 1 static unsigned interleave_nodes(struct mempolicy *policy)
 2 {
 3     unsigned nid, next;
 4     struct task_struct *me = current;
 5 
 6     nid = me->il_next;
 7     next = next_node(nid, policy->v.nodes);
 8     if (next >= MAX_NUMNODES)
 9         next = first_node(policy->v.nodes);
10     if (next < MAX_NUMNODES)
11         me->il_next = next;
12     return nid;
13 }

View Code

 1 /* Convert GFP flags to their corresponding migrate type */
 2 static inline int allocflags_to_migratetype(gfp_t gfp_flags)
 3 {
 4     WARN_ON((gfp_flags & GFP_MOVABLE_MASK) == GFP_MOVABLE_MASK);
 5 
 6     if (unlikely(page_group_by_mobility_disabled))
 7         return MIGRATE_UNMOVABLE;
 8 
 9     /* Group based on mobility */
10     return (((gfp_flags & __GFP_MOVABLE) != 0) << 1) |
11         ((gfp_flags & __GFP_RECLAIMABLE) != 0);
12 }

View Code

内存水线检查函数：zone_watermark_ok

 1 //如果zone检查通过返回1，否者返回0
 2 int zone_watermark_ok(struct zone *z, int order, unsigned long mark,
 3               int classzone_idx, int alloc_flags)
 4 {
 5     /* free_pages my go negative - that's OK */
 6     long min = mark;
 7     long free_pages = zone_page_state(z, NR_FREE_PAGES) - (1 << order) + 1;
 8     int o;
 9 
10     if (alloc_flags & ALLOC_HIGH)
11         min -= min / 2;
12     if (alloc_flags & ALLOC_HARDER)
13         min -= min / 4;
14 
15     if (free_pages <= min + z->lowmem_reserve[classzone_idx])
16         return 0;
17     for (o = 0; o < order; o++) {
18         /* At the next order, this order's pages become unavailable */
19         free_pages -= z->free_area[o].nr_free << o;
20 
21         /* Require fewer higher order pages to be free */
22         min >>= 1;
23 
24         if (free_pages <= min)
25             return 0;
26     }
27     return 1;
28 }

View Code

1.首先获取当前zone中的空闲页框个数，这里提到一点，这个空闲页框个数是一个估计值且是一个瞬时值（没有加锁）并且减去了本次要申请的2^order次方的页框后加1（这里为什么加1?)

2.根据alloc_flags中是否包含了ALLOC_HIGH或者ALLOC_HARDER对实际水线做调整，得到一个结论，如果打了ALLOC_HIGH或ALLOC_HARDER时将水线调低，等于是放宽了检查标准（俗称：击穿水线)

3.运用lowmem_reserve，先做了一下判断，classzone_idx是首选内存区的下标，这个逻辑的原因举个例子来说明：假设系统中有两个node,分贝是node0，node1,总量分别是5G和90G，这样一来node0会有DMA(16M),DMA32(4G),NOMAL(1G),而node2所有的内存都属于NORMAL(96G)。假设分配流程选到了node0来分配内存，并且首选内存区是NORMAL，而node0上的NORMAL只有1G，假设已经被完全分配出去。根据zone的fallback规则，会依次选择node0(DMA32)->node0(DMA)->node(NORMAL)来分配内存。这样以来这次分配就会优先落到node0的DMA32区和DMA区，但是DMA32和DMA区内存一般相对较少的，如果这种分配过多（实际系统中很可能会出现这种情况)那么node0的DMA和DMA32就会被挤占完。当真正需要分配DMA和DMA32的请求到来时就没有办法满足要求，这会导致不必要的回收，甚至会引起一些驱动不能正常工作。因此针对每一个内存区引入了lowmem_reserve数组。假设node0的DMA32区和DMA区的lowmem_resver数组分别时[0,0,1000],[0,100,500],这样一来即使出现了上述情况，也能为DMA32保留1000个页框，为DMA区保留500个页框。这样至少一定程度上减轻了上面的情况造成的影响。lowmem_reserve参数是可以动态配置的（通过proc文件系统）。

4.接下来的for循环做了更进一步检查，检查的标准是:针对每一个小于order的阶N,大于N阶中，内存的总空闲页框数必须大于(调整后的水线)/2^N次方。这段逻辑的原因没有查到具体的内核文档，作者个人的理解：这么写是提早发现，避免内存的碎片化，因为这段逻辑看，高阶内存过少时，即使总体的空闲页框数满足内存水线，这里内存水线检查函数还是有可能通不过的，这么一来就有两个结果：其一，选择其他的内存区分配内存，其二，提早触发zone回收流程。不管怎样都是为了避免过分分配页框导致当前zone内存碎片化。

page_to_pfn,pfn_to_page 页描述符和页框号的相互转化

pfn_to_page完全由宏定义完成，代码如下：

1.第3行将pfn_to_page 定义为__pfn_to_page

2.第4行开始到第46行定义了具体的__pfn_to_page,__pfn_to_page的具体定义，受内核编译选项控制。具体由如下四个编译选项:CONFIG_FLATMEM，CONFIG_DISCONTIGMEM，CONFIG_SPARSEMEM_VMEMMAP，CONFIG_SPARSEMEM，注意编译控制是if,elif结构控制的，也就是说只能由一种选择，并且如果同时使能了上面几个编译选项（可以同时使能几个编译选项吗?），后面的编译选项会被前面的编译选项覆盖。作者自己的使用的内核没有定义CONFIG_FLATMEM和CONFIG_DISCONTIGMEM，但是同时定义了CONFIG_SPARSEMEM_VMEMMAP和CONFIG_SPARSEMEM。因此这里下面的宏定义中起作用的就是第24到29行。

结合第27行，第2行，第1行可以得到如下结论：

a:linux将所由的页描述符放到了一个大数组里面,数组的名字是vmemmap,数组的其实地址是0xffffea0000000000（一个核心态虚拟地址)

b:从pfn（页框号）到page(页描述符）的转换就是以pfn作为下标取vmemmap数组中的一个元素

c:CONFIG_SPARSEMEM_VMEMMAP的意思就是用一段虚拟地址连续的内核态地址段存放页描述符数组（这段内存的物理地址是不是连续的呢？)

结合第28行，第2行，第1行代码可以得到如下结论

a:从page到pfn的转换就是去了page再vmemmap数组中的下标

[注]：redhat6和redhat7系列的这两个宏定义就是这个逻辑，可以通过crash工具，利用“kmem -p"命令查看具体的vmemmap数组的基地址以及数组中页描述符

TODO：解释下其他的几个配置下，叶匡号和页描述符之间的转换逻辑

 1 #define VMEMMAP_START     _AC(0xffffea0000000000, UL)
 2 #define vmemmap ((struct page *)VMEMMAP_START)
 3 #define pfn_to_page __pfn_to_page
 4 #if defined(CONFIG_FLATMEM)
 5 
 6 #define __pfn_to_page(pfn)    (mem_map + ((pfn) - ARCH_PFN_OFFSET))
 7 #define __page_to_pfn(page)    ((unsigned long)((page) - mem_map) + \
 8                  ARCH_PFN_OFFSET)
 9 #elif defined(CONFIG_DISCONTIGMEM)
10 
11 #define __pfn_to_page(pfn)            \
12 ({    unsigned long __pfn = (pfn);        \
13     unsigned long __nid = arch_pfn_to_nid(__pfn);  \
14     NODE_DATA(__nid)->node_mem_map + arch_local_page_offset(__pfn, __nid);\
15 })
16 
17 #define __page_to_pfn(pg)                        \
18 ({    struct page *__pg = (pg);                    \
19     struct pglist_data *__pgdat = NODE_DATA(page_to_nid(__pg));    \
20     (unsigned long)(__pg - __pgdat->node_mem_map) +            \
21      __pgdat->node_start_pfn;                    \
22 })
23 
24 #elif defined(CONFIG_SPARSEMEM_VMEMMAP)
25 
26 /* memmap is virtually contigious.  */
27 #define __pfn_to_page(pfn)    (vmemmap + (pfn))
28 #define __page_to_pfn(page)    (unsigned long)((page) - vmemmap)
29 
30 #elif defined(CONFIG_SPARSEMEM)
31 /*
32  * Note: section's mem_map is encorded to reflect its start_pfn.
33  * section[i].section_mem_map == mem_map's address - start_pfn;
34  */
35 #define __page_to_pfn(pg)                    \
36 ({    struct page *__pg = (pg);                \
37     int __sec = page_to_section(__pg);            \
38     (unsigned long)(__pg - __section_mem_map_addr(__nr_to_section(__sec)));    \
39 })
40 
41 #define __pfn_to_page(pfn)                \
42 ({    unsigned long __pfn = (pfn);            \
43     struct mem_section *__sec = __pfn_to_section(__pfn);    \
44     __section_mem_map_addr(__sec) + __pfn;        \
45 })
46 #endif

View Code

move_freepages和move_freepages_block：再不同的类型的buddy链表中移动页框

move_freepages

理解这两个函数读者要先了解两个概念：buddy系统，内存迁移类型，(TODO:解释buddy系统和内存类型的概念，以及作用）。在2.6.32源码中move_freepages只被move_freepages_block调用。内核中没有其他的逻辑在直接调用move_freepages. move_freepages代码如下:

函数作用：将buddy系统中一个链表中的伙伴页移动到两外一个链表中，由意义的代码是第20行到第40行的for循环，其他的代码是冗余代码没有任何实际意义。在没有定义CONFIG_HOLE_IN_ZONE(实际redhat6和redhat7发行版本里没有定义这个编译选项 TODO:什么意义？)的时，第24行逻辑始终未假，因此if分支不会走到。要理解这个函数要将剩下的第29行到39行作为一个整体看，这段代码是基于如下几个前提：

1.buddy系统中只有伙伴页的首页被链接到buddy系统的相应链表

2.buddy系统中只有伙伴页的首页被打上pg_buddy标志

3.buddy系统中只有伙伴页的首页其page->private才被设置成该伙伴页的阶

第29行if分支存在的愿意：start_page可能不是伙伴页的首页，因此接下来挨着start_page的若干页也可能不是伙伴系统的首页，用这个分支跳过这些页，已经在链表中移动是针对伙伴页的首页的。

经过第29行的检查通过的页一定是伙伴页的首页，因此才有34行从page->private中取到order,接着将首页从buddy链表中摘下来移动到对应order的目标迁移类型所在的链表上。因为一次移动虽然只移动了一个首页，根据伙伴系统的原理其实以这个首页未首的2的order次方个页都移动到了目标迁移类型上，所以才由pages_moved+=1<

结论：

1.该函数的作用是将start_page和end_page中间的页，以伙伴页未单位移动到目标迁移类型所在的链表上。并返回移动的总页数

 1 static int move_freepages(struct zone *zone,
 2               struct page *start_page, struct page *end_page,
 3               int migratetype)
 4 {
 5     struct page *page;
 6     unsigned long order;
 7     int pages_moved = 0;
 8 
 9 #ifndef CONFIG_HOLES_IN_ZONE
10     /*
11      * page_zone is not safe to call in this context when
12      * CONFIG_HOLES_IN_ZONE is set. This bug check is probably redundant
13      * anyway as we check zone boundaries in move_freepages_block().
14      * Remove at a later date when no bug reports exist related to
15      * grouping pages by mobility
16      */
17     BUG_ON(page_zone(start_page) != page_zone(end_page));
18 #endif
19 
20     for (page = start_page; page <= end_page;) {
21         /* Make sure we are not inadvertently changing nodes */
22         VM_BUG_ON(page_to_nid(page) != zone_to_nid(zone));
23 
24         if (!pfn_valid_within(page_to_pfn(page))) {
25             page++;
26             continue;
27         }
28 
29         if (!PageBuddy(page)) {
30             page++;
31             continue;
32         }
33 
34         order = page_order(page);
35         list_del(&page->lru);
36         list_add(&page->lru,
37             &zone->free_area[order].free_list[migratetype]);
38         page += 1 << order;
39         pages_moved += 1 << order;
40     }
41 
42     return pages_moved;
43 }

View Code

move_freepages_block

linux内核将物理页划分成了页块，页块是独立于页的阶的概念，具体的页块划分方法见下面代码第1行到第16行，第16行说明页块的大小是pageblock_order次方，在redhat6和redhat7发行版本中定义了CONFIG_HUGETLB_PAGE（内核支持透明巨页 TODO：解释透明巨页的概念),但是没有定义CONFIG_HUGETLB_PAGE_SIZE_VARIABLE（透明巨页的大小是可变的)。因此pageblock_order等于HUGETLB_PAGE_ORDER(透明巨页的阶：为什么要等于透明巨页的阶）。结合第1，2，3行代码看到透明巨页的页是9(PAGE_SHIFT是12）因此在上面的内核编译选项配置下得到结论：

1.透明巨页的大小是固定的，即2的9次方个页框，也就是2MB

2.buddy系统划分的页块大小等于透明巨页的大小也是2MB

【注】buddy系统最大的连续页框的阶是10，即最大连续物理地址大小是4MB，大于页块的大小，也大于透明巨页的大小。

因此可以得到move_freepages_block函数的作用如下：

1.将page所在的页块，整块一定到迁移类型migratetype所在的链表中，并处理如下连个特殊情况

a:如果页块的首页和page不在一个zone中，则从zone中的第一个页移动，知道页块结束

b:如果页块所在的尾页和page不在一个zone中，则不移动页块(为什么和a的处理逻辑不一样呢？)

解释：a的情况是存在的，因为页块划分时页块大小时固定的，而zone的大小也是固定的，所以有可能一个页块跨越了两个zone

【注1】由于伙伴系统做大连续物理页框的阶时10，而页块的连续物理内存的阶是9，因此一个页块中有可能包含若干个buddy系统中的伙伴页块，一个伙伴页块中也可能包含一个(当伙伴系统中的连续物理页的阶是9时）或两个页块（当伙伴系统中的连续物理页的阶时10时）

【注2】在移动的过程中保证伙伴系统中连续物理页的阶不变

(一个页块中的物理页有没有可能存在于不同的迁移类型链表中？答：有，举例说明？）

 1 #define PMD_SHIFT    21
 2 #define HPAGE_SHIFT        PMD_SHIFT
 3 #define HUGETLB_PAGE_ORDER    (HPAGE_SHIFT - PAGE_SHIFT)
 4 #ifdef CONFIG_HUGETLB_PAGE_SIZE_VARIABLE
 5 /* Huge page sizes are variable */
 6 extern int pageblock_order;
 7 #else /* CONFIG_HUGETLB_PAGE_SIZE_VARIABLE */
 8 /* Huge pages are a constant size */
 9 #define pageblock_order        HUGETLB_PAGE_ORDER
10 #endif /* CONFIG_HUGETLB_PAGE_SIZE_VARIABLE */
11 #else /* CONFIG_HUGETLB_PAGE */
12 /* If huge pages are not used, group by MAX_ORDER_NR_PAGES */
13 #define pageblock_order        (MAX_ORDER-1)
14 #endif /* CONFIG_HUGETLB_PAGE */
15 
16 #define pageblock_nr_pages    (1UL << pageblock_order)
17 static int move_freepages_block(struct zone *zone, struct page *page,
18                 int migratetype)
19 {
20     unsigned long start_pfn, end_pfn;
21     struct page *start_page, *end_page;
22 
23     start_pfn = page_to_pfn(page);
24     start_pfn = start_pfn & ~(pageblock_nr_pages-1);
25     start_page = pfn_to_page(start_pfn);
26     end_page = start_page + pageblock_nr_pages - 1;
27     end_pfn = start_pfn + pageblock_nr_pages - 1;
28 
29     /* Do not cross zone boundaries */
30     if (start_pfn < zone->zone_start_pfn)
31         start_page = page;
32     if (end_pfn >= zone->zone_start_pfn + zone->spanned_pages)
33         return 0;
34 
35     return move_freepages(zone, start_page, end_page, migratetype);
36 }

View Code

__rmqueue_smallest

函数作用：根据入参zone,order以及migratetype 从buddy系统伙伴页链表中找到2的order次方个连续的物理页框返回，如果找到返回首页的页描述符，如果找不到返回null

代码第10行到第22行从入参order向高阶内存迭代：

a:第12行逻辑：如果current_order阶migratetype所在的伙伴页链表为空则迭代下一个较高阶的伙伴页链表

b:第15行到19行：如果current_order阶migratetype所在的伙伴页链表不为空，则取下链表中的一个伙伴页组，将首页的页描述符的order信息抹掉（page->private=0），接着递减current_order阶伙伴页组的个数

c:第20行：存在的原因是：有可能current_order大于order,如果大于，几个例子：当current_order=4，但是order等于2时，就将2的4次方个页（16个页）中的最后8个放到3阶内存migratetype对应的伙伴页链表上，第4到第7个页放到2阶内存migratetype对应的伙伴页链表上，这时page刚好是第0个页到第3个页的首页，因为第17行已经将page从阶为4的内存migratetype链表上摘下来了，page为首的四个页不在buddy系统，作为结果返回。

d:如果从order一直迭代到MAX_ORDER，migratetype对应的伙伴页链表都是空的，(即：当前zone中migratetype对应的所有伙伴页链表都时空的)则返回NULL。

【注】这个函数不牵涉到不同migratetype链表之间伙伴页组的移动，分配到的页组，以及分配过程中伙伴页组的移动都是在同一个zone同一个migratetype所在的链表之间移动（expand

 1 static inline
 2 struct page *__rmqueue_smallest(struct zone *zone, unsigned int order,
 3                         int migratetype)
 4 {
 5     unsigned int current_order;
 6     struct free_area * area;
 7     struct page *page;
 8 
 9     /* Find a page of the appropriate size in the preferred list */
10     for (current_order = order; current_order < MAX_ORDER; ++current_order) {
11         area = &(zone->free_area[current_order]);
12         if (list_empty(&area->free_list[migratetype]))
13             continue;
14 
15         page = list_entry(area->free_list[migratetype].next,
16                             struct page, lru);
17         list_del(&page->lru);
18         rmv_page_order(page);
19         area->nr_free--;
20         expand(zone, page, order, current_order, area, migratetype);
21         return page;
22     }
23 
24     return NULL;
25 }

View Code

pfn_to_section_nr，__nr_to_section，__pfn_to_section

__pfn_to_section:由page页的物理页框号导出页所在的物理内存section,linux会将内存划分成更小的连续物理内存段，不同的划分规则，对应不同的管理目的，由此引出了下面几个即相互关联又相互独立的概念：node(内存节点），zone(内存去），section（为了更好的支持稀疏内存：为啥在稀疏内存的时候会划分section?），order(著名的buddy系统11阶划分法），page block(页块，为了支持内存迁移类型的概念,内存迁移类型是以page block为单位的）。__pfn_to_section就是由page页的叶匡号导出描述该页框所在的section的描述符。

pfn_to_section_nr:每一个section有一个编号，姑且称为section num,该函数的作用就是将页框号转化成页所在的section的section num

代码第30行到第47行给出了pfn_to_section_nr的实现，同时也给出了划分section的方法，在划分section时满足如下约束条件：

1.系统中所有的section中物理页框个数彼此相同并且对其到2的order次方（代码第42，43行）。

2.每一个section中所有的物理页框在物理上连续（物理叶匡号是连续的）。

在linux具体实现中，section的长度是128MB(第37行），因此将pfn向左移动15位就是对应的section num(假设页框大小是4KB，pfn等于对应的页框物理首地址向右移动12位，因此section num等于pfn对应页框的物理首地址向左移动27位）

__nr_to_section:该函数通过secton num得到section描述符，同时也反应系统中所有section描述符的组织形式，代码第1行到24行给出了该函数的实现。系统中所有的section描述符的组织形式如下：

1.所有的section描述符都在一个二维数组里（代码13到17行，redhat6和redhat7发行版本中默认开启了：CONFIG_SPARSEMEM_EXTREME),数组的第二维长度是4KB（第7到11行）。系统中最大的section个数是2的19次方个（代码1，3，37，39行)。

【注1】：__pfn_to_section其实就是先通过pfn_to_section_nr将页框号导出页所在section的section num，再由section num导出section描述符

【注2】：section描述的的是对物理地址的划分，划分标准：等大，section中的物理页相邻.

【注3】：每一个section又一个编号section num，从0开始到最大值（见上文），每个section又一个section描述符，所有的section描述符放到一个全局二维数组里面，数组第二位长度大小是4KB

TODO:解释为啥要将内存划分成section

 1 #define SECTIONS_SHIFT        (MAX_PHYSMEM_BITS - SECTION_SIZE_BITS)
 2 
 3 #define NR_MEM_SECTIONS        (1UL << SECTIONS_SHIFT)
 4 
 5 #define NR_SECTION_ROOTS    (NR_MEM_SECTIONS / SECTIONS_PER_ROOT)
 6 
 7 #ifdef CONFIG_SPARSEMEM_EXTREME
 8 #define SECTIONS_PER_ROOT       (PAGE_SIZE / sizeof (struct mem_section))
 9 #else
10 #define SECTIONS_PER_ROOT    1
11 #endif
12 
13 #ifdef CONFIG_SPARSEMEM_EXTREME
14 extern struct mem_section *mem_section[NR_SECTION_ROOTS];
15 #else
16 extern struct mem_section mem_section[NR_SECTION_ROOTS][SECTIONS_PER_ROOT];
17 #endif
18 #define SECTION_NR_TO_ROOT(sec)    ((sec) / SECTIONS_PER_ROOT)
19 static inline struct mem_section *__nr_to_section(unsigned long nr)
20 {
21     if (!mem_section[SECTION_NR_TO_ROOT(nr)])
22         return NULL;
23     return &mem_section[SECTION_NR_TO_ROOT(nr)][nr & SECTION_ROOT_MASK];
24 }
25 
26 #ifdef CONFIG_X86_32
27 # ifdef CONFIG_X86_PAE
28 #  define SECTION_SIZE_BITS    29
29 #  define MAX_PHYSADDR_BITS    36
30 #  define MAX_PHYSMEM_BITS    36
31 # else
32 #  define SECTION_SIZE_BITS    26
33 #  define MAX_PHYSADDR_BITS    32
34 #  define MAX_PHYSMEM_BITS    32
35 # endif
36 #else /* CONFIG_X86_32 */
37 # define SECTION_SIZE_BITS    27 /* matt - 128 is convenient right now */
38 # define MAX_PHYSADDR_BITS    44
39 # define MAX_PHYSMEM_BITS    46
40 #endif
41 
42 #define PFN_SECTION_SHIFT    (SECTION_SIZE_BITS - PAGE_SHIFT)
43 #define pfn_to_section_nr(pfn) ((pfn) >> PFN_SECTION_SHIFT)
44 
45 static inline struct mem_section *__pfn_to_section(unsigned long pfn)
46 {
47     return __nr_to_section(pfn_to_section_nr(pfn));
48 }

View Code

set_pageblock_flags_group，set_pageblock_migratetype

每一个page block有一组标志，标志该page block的属性，该函数就是设置page所在的page block对应的标志位。由于在内核源码中该函数只被set_pageblock_migratetype调用，因此将这两个函数放到一起来说，redhat6,7模式具体是现实如下：

1.每一个page block有且仅有3个标志位，分别用来标志page block的4个迁移属性（MIGRATE_UNMOVABLE,MIGRATE_RECLAIMABLE,MIGRATE_MOVABLE,MIGRATE_ISOLATE),解释下：3个标志位全位0时表示该page block的迁移属性时MIGRATE_UNMOVABLE,所以可以用3个标志位表示四个迁移属性。

3.标志位存放在section描述符中，由于一个section的长度时128MB（见上文），而每个page block的长度时2MB(见上文），因此每个section可以包含64个page block，一个page block需要3bit的flag,所以在对应的section描述符中就存放了3*64/8bit长度的字节数组描述该section中所有page block的标志位

4.针对每一个page block标志位如下：000：MIGRATE_UNMOVABLE,001:MIGRATE_RECLAIMABLE,010:MIGRATE_MOVABLE,100:MIGRATE_ISOLATE(是否可以同时设置多个标志位，比如：111，110，011，101这种组合?

 1 #define MIGRATE_UNMOVABLE 0
 2 #define MIGRATE_RECLAIMABLE 1
 3 #define MIGRATE_MOVABLE 2
 4 #define MIGRATE_PCPTYPES 3 /* the number of types on the pcp lists */
 5 #define MIGRATE_RESERVE 3
 6 #define MIGRATE_ISOLATE 4 /* can't allocate from here */
 7 #define MIGRATE_TYPES 5
 8 /**
 9  * set_pageblock_flags_group - Set the requested group of flags for a pageblock_nr_pages block of pages
10  * @page: The page within the block of interest
11  * @start_bitidx: The first bit of interest
12  * @end_bitidx: The last bit of interest
13  * @flags: The flags to set
14  */
15 void set_pageblock_flags_group(struct page *page, unsigned long flags,
16                     int start_bitidx, int end_bitidx)
17 {
18     struct zone *zone;
19     unsigned long *bitmap;
20     unsigned long pfn, bitidx;
21     unsigned long value = 1;
22 
23     zone = page_zone(page);
24     pfn = page_to_pfn(page);
25     bitmap = get_pageblock_bitmap(zone, pfn);
26     bitidx = pfn_to_bitidx(zone, pfn);
27     VM_BUG_ON(pfn < zone->zone_start_pfn);
28     VM_BUG_ON(pfn >= zone->zone_start_pfn + zone->spanned_pages);
29 
30     for (; start_bitidx <= end_bitidx; start_bitidx++, value <<= 1)
31         if (flags & value)
32             __set_bit(bitidx + start_bitidx, bitmap);
33         else
34             __clear_bit(bitidx + start_bitidx, bitmap);
35 }
36 
37 static void set_pageblock_migratetype(struct page *page, int migratetype)
38 {
39 
40     if (unlikely(page_group_by_mobility_disabled))
41         migratetype = MIGRATE_UNMOVABLE;
42 
43     set_pageblock_flags_group(page, (unsigned long)migratetype,
44                     PB_migrate, PB_migrate_end);
45 }

View Code

change_pageblock_range　　

start_order是buddy系统的阶，pageblock_page是一个阶为start_order的内存块的首页描述符。函数功能：将以pageblock_page为首页的阶为start_order的内存段中包含的所有页块儿的迁移类型设置为migratetype.

第4行：求start_order阶内存段中包含了多少个页块（pageblock_order见上文）

第6-9行：开始迭代，将所有的页块的迁移类型设置为migratetype

【注】内核所有的控制路径（其实就一处调用该函数），在调用该函数前，都检查了start_order是否大于pageblock_order,只有在大于的情况下才调用该函数，因此第4行是安全的

 1 static void change_pageblock_range(struct page *pageblock_page,
 2                     int start_order, int migratetype)
 3 {
 4     int nr_pageblocks = 1 << (start_order - pageblock_order);
 5 
 6     while (nr_pageblocks--) {
 7         set_pageblock_migratetype(pageblock_page, migratetype);
 8         pageblock_page += pageblock_nr_pages;
 9     }
10 }

View Code

__rmqueue_fallback

当前zone在start_migratetype表示的迁移类型链表中分配order阶内存失败(参考：__rmqueue_smalles函数）后，会调用到该函数，从而，从当前zone中后备迁移类型链表中分配内存，后备迁移类型链表是通过静态定义一个规则确定的。

代码第5-10行：各个类型的迁移链表的后备迁移类型链表，其中等号左边时start_migratetype的可能类型（MIGRATE_RESERVE除外），等号的右边是等号左边满足不了order阶内存申请时，依次fallback到的迁移类型链表

代码第21-76行：按内存阶从大到小迭代，开始时current_order=MAX_ORDER-1（10），结束时current_order大于等于order(入参），这里是外层迭代

代码第23-75行：在current_order下根据start_migratetype和fallback规则，迭代规则中定义的所有fallback迁移类型链表，当前迁移类型是migratetype

代码第27-28行：保证该函数不处理迁移类型：MIGRATE_RESERVE（为啥？)

代码第30-36行：判断current_order对应的area中迁移类型位migratetype的链表是否未空：如果为空，则迭代下一个迁移类型；如果不为空，则取到链表中第一个current_order阶连续物理页框的第一个页的页描述符地址

代码第44-58行：如果current_order大于等于pageblock_order/2，或者start_migratetype为MIGRATE_RECLAIMABLE，或者 page_group_by_mobility_disabled = 1时，执行如下操作：

1.将当前page所在的page block中的所有空闲页都移动到start_migratetype所在的链表中(参考上文：move_freepages_block)

2.如果1中移动的空闲页个数大于等于2^(pageblock_order-1)，则将当前页所在的page block的类型设置成start_migratetype(参考上文：set_pageblock_migratetype)

3.函数执行到44行if分支，可以确定整个函数，将在本次内迭代中结束，又因为在本分支中将从page开始的current_order阶个连续页框已经移动到start_migratetype对应的链表上，为了第65行到74行处理的统一性（即在进入44行分支和不进入44行分支两种情况下，65行和74行的逻辑使用相同的代码）将migratetype改成了start_migratetype.

代码第61-62行：将current_order阶个连续物理页框从其所在的链表上摘下来（这里有可能经过44行的分支迁移过，也可能没有经过第44行的分支迁移过），将page->private清零

代码第65-67行：如果current_order大于pageblock_order（这种情况是存在的，具体见上文关于move_freepages_block的解释），就将当前这个current_order大小的连续物理页框中的所有page block的迁移类型都设置成start_migratetype（注意：这一步和44-58行中的第2步的功能并不完全等价，即在current_order>=pageblock_order+2时必须用到该逻辑（实际上这种情况在redhat6,7的实现中是不存在的，之所以这么写可能作者考虑到max page order和page block order是可配置的，这么些逻辑上比较完备））

代码第69行：将以page 为首的current_order阶连续物理内存分裂出order大小，作为返回值返回。将分裂出的剩余内存放回到对应的buddy系统链表。

代码第78行：如果两层迭代完后仍然找不到非空的链表，则返回NULL,表示本轮fallback分配失败

 1 /*
 2  * This array describes the order lists are fallen back to when
 3  * the free lists for the desirable migrate type are depleted
 4  */
 5 static int fallbacks[MIGRATE_TYPES][MIGRATE_TYPES-1] = {
 6     [MIGRATE_UNMOVABLE]   = { MIGRATE_RECLAIMABLE, MIGRATE_MOVABLE,   MIGRATE_RESERVE },
 7     [MIGRATE_RECLAIMABLE] = { MIGRATE_UNMOVABLE,   MIGRATE_MOVABLE,   MIGRATE_RESERVE },
 8     [MIGRATE_MOVABLE]     = { MIGRATE_RECLAIMABLE, MIGRATE_UNMOVABLE, MIGRATE_RESERVE },
 9     [MIGRATE_RESERVE]     = { MIGRATE_RESERVE,     MIGRATE_RESERVE,   MIGRATE_RESERVE }, /* Never used */
10 };
11 /* Remove an element from the buddy allocator from the fallback list */
12 static inline struct page *
13 __rmqueue_fallback(struct zone *zone, int order, int start_migratetype)
14 {
15     struct free_area * area;
16     int current_order;
17     struct page *page;
18     int migratetype, i;
19 
20     /* Find the largest possible block of pages in the other list */
21     for (current_order = MAX_ORDER-1; current_order >= order;
22                         --current_order) {
23         for (i = 0; i < MIGRATE_TYPES - 1; i++) {
24             migratetype = fallbacks[start_migratetype][i];
25 
26             /* MIGRATE_RESERVE handled later if necessary */
27             if (migratetype == MIGRATE_RESERVE)
28                 continue;
29 
30             area = &(zone->free_area[current_order]);
31             if (list_empty(&area->free_list[migratetype]))
32                 continue;
33 
34             page = list_entry(area->free_list[migratetype].next,
35                     struct page, lru);
36             area->nr_free--;
37 
38             /*
39              * If breaking a large block of pages, move all free
40              * pages to the preferred allocation list. If falling
41              * back for a reclaimable kernel allocation, be more
42              * agressive about taking ownership of free pages
43              */
44             if (unlikely(current_order >= (pageblock_order >> 1)) ||
45                     start_migratetype == MIGRATE_RECLAIMABLE ||
46                     page_group_by_mobility_disabled) {
47                 unsigned long pages;
48                 pages = move_freepages_block(zone, page,
49                                 start_migratetype);
50 
51                 /* Claim the whole block if over half of it is free */
52                 if (pages >= (1 << (pageblock_order-1)) ||
53                         page_group_by_mobility_disabled)
54                     set_pageblock_migratetype(page,
55                                 start_migratetype);
56 
57                 migratetype = start_migratetype;
58             }
59 
60             /* Remove the page from the freelists */
61             list_del(&page->lru);
62             rmv_page_order(page);
63 
64             /* Take ownership for orders >= pageblock_order */
65             if (current_order >= pageblock_order)
66                 change_pageblock_range(page, current_order,
67                             start_migratetype);
68 
69             expand(zone, page, order, current_order, area, migratetype);
70 
71             trace_mm_page_alloc_extfrag(page, order, current_order,
72                 start_migratetype, migratetype);
73 
74             return page;
75         }
76     }
77 
78     return NULL;
79 }

View Code

__rmqueue

函数作用：在zone中分配order阶连续的物理内存，在分配的时候首先在在migratetype类型的内存中分配，如果分配不到，就fallback到其他迁移类型的内存中分配内存。

函数第13行的if分支最多进入依次，也就是说第23行的goto语句最多被执行一次：if分支被执行一次的条件：__rmqueue_smallest函数返回NULL且migratetype不为MIGRATE_RESERVE,goto被执行一次的条件是：__rmqueue_smallest返回NULL且migratetype不为MIGRATE_RESERVE且__rmqueue_fallback也返回了NULL,

goto语句意义：如果migratetype不为MIGRATE_RESERVE,如果__rmqueue_smallest函数返回NULL,并且__rmqueue_fallback函数也返回NULL,则将migratetype设置成MIGRATE_RESERVE，从新调用__rmqueue_smallest函数。关于__rmqueue_smallest函数以及__rm_queue_fallback函数的说明参考上文。

【注】：_rmqueue_fallback函数是不会从MIGRATE_RESERVE类型的内存中分配内存的，只有__rmqueue_smallest函数会从MIGRATE_RESERVE类型的内存中分配内存。也就是说：该函数实现的核心功能：如果migratetype不等于MIGRATETYPE_RESERVE,那么先从migratetype的链表中分配内存（第11行），如果分配失败，根据fallback规则依次从migratetype的fallback链表中分配内存（第14行，注意这里是不处理MIGRATETYPE_RESERVE迁移类型链表的），如果仍然分配失败，则从MIGRATE_RESERVE链表中分配内存。

 1 /*
 2  * Do the hard work of removing an element from the buddy allocator.
 3  * Call me with the zone->lock already held.
 4  */
 5 static struct page *__rmqueue(struct zone *zone, unsigned int order,
 6                         int migratetype)
 7 {
 8     struct page *page;
 9 
10 retry_reserve:
11     page = __rmqueue_smallest(zone, order, migratetype);
12 
13     if (unlikely(!page) && migratetype != MIGRATE_RESERVE) {
14         page = __rmqueue_fallback(zone, order, migratetype);
15 
16         /*
17          * Use MIGRATE_RESERVE rather than fail an allocation. goto
18          * is used because __rmqueue_smallest is an inline function
19          * and we want just one call site
20          */
21         if (!page) {
22             migratetype = MIGRATE_RESERVE;
23             goto retry_reserve;
24         }
25     }
26 
27     trace_mm_page_alloc_zone_locked(page, order, migratetype);
28     return page;
29 }

View Code

rmqueue_bulk

从zone中最多申请count个order阶连续内存段，并且将这些连续内存段的首页描述符的private字段初始化为migrate类型，然后将这些描述符挂接到list链表上，返回实际申请到的连续order阶物理连续内存段的实际个数

代码第12行：获取自旋锁（避免多cpu上执行路径产生竞争），因为在调用该函数之间已经关闭了中断（避免了进程上下文和中断上下文产生的竞争：参考下文：buffered_rmqueue），关了抢占（避免当前cpu上由于任务切换导致不同进程上下文的竞争：参考下文：buffered_rmqueue），因此这三个条件只能保证了只有在当前cpu上的当前上下文中才能修改zone相关，以及zone中page对应的pageblock相关，以及当前cpu中的percpu_pageset中相关的全局数据（接下来的__rmqueue函数会修改zone相关，以及zone中page对应的pageblock相关的数据--参考上文：__rmqueue函数。本函数剩下逻辑会修改percpu_pageset以及zone相关的数据）

代码第13行：开始count次迭代，每次迭代从zone中以migratetype的为首选迁移类型试图分配一段order阶连续的物理内存(注意：这里分配到的内存的迁移类型不一定就是migratetype,因为__rmqueue会根据迁移类型的fallback规则分配其他迁移类型下的页，具体参考函数：__rmqueue

代码第15-16行：如果分配失败，证明当前zone中迁移类型为MIGRATE_UNMOVABLE,MIGRATE_RELAIMABLE,MIGRATE_MOVABLE,MIGRATE_RESERVE这几个迁移类型对应的链表中没有大于等于order阶的连续物理内存了，接着尝试分配意义不大，因此这里break跳出循环

代码第27-30行：如果是cold为真，则将page挂到list链表的结尾，如果cold为假，就将page挂到list的开头（为什么要这么做？）

代码第31行：将page的private字段设置为migratetype(这里有个疑问：其实这个内存段所在的迁移类型链表，以及对应的pageblock的迁移类型都有可能不为migratetype，这里将page的private字段设置为migratetype是否有意义呢？）

代码第34行：退出for迭代后，i等于实际分配到的连续物理内存段的个数，这里将zone中的NR_FREE_PAGE（zone中空闲页的总数）剪掉i*2^order个

代码第36行：释放自旋锁，和代码第12行对应

【注】代码第18行到25行的注释，值得把玩下，结合page cache的分配流程，以及第32，27-32行的逻辑就能体会到作者的用意。

 1 /* 
 2  * Obtain a specified number of elements from the buddy allocator, all under
 3  * a single hold of the lock, for efficiency.  Add them to the supplied list.
 4  * Returns the number of new pages which were placed at *list.
 5  */
 6 static int rmqueue_bulk(struct zone *zone, unsigned int order, 
 7             unsigned long count, struct list_head *list,
 8             int migratetype, int cold)
 9 {
10     int i;
11     
12     spin_lock(&zone->lock);
13     for (i = 0; i < count; ++i) {
14         struct page *page = __rmqueue(zone, order, migratetype);
15         if (unlikely(page == NULL))
16             break;
17 
18         /*
19          * Split buddy pages returned by expand() are received here
20          * in physical page order. The page is added to the callers and
21          * list and the list head then moves forward. From the callers
22          * perspective, the linked list is ordered by page number in
23          * some conditions. This is useful for IO devices that can
24          * merge IO requests if the physical pages are ordered
25          * properly.
26          */
27         if (likely(cold == 0))
28             list_add(&page->lru, list);
29         else
30             list_add_tail(&page->lru, list);
31         set_page_private(page, migratetype);
32         list = &page->lru;
33     }
34     __mod_zone_page_state(zone, NR_FREE_PAGES, -(i << order));
35     spin_unlock(&zone->lock);
36     return i;
37 }

View Code

__mod_zone_page_state，__count_zone_vm_events，zone_statistics

这几个函数用于更新zone相关的统计信息，首先看__mod_zone_page_state,item是需要修改的具体统计项，代码第1到38行给出了zone相关的所有统计项，linux用一个数组记录这些统计数据，数组的长度是统计项的个数(NR_Vm_ZONE_STAT_ITEMS),在系统中存在三种这样的数组，可以从下面的代码看出都有那三种。代码第45行去了第一种数组：zone中有一个percpu变量：per_cpu_pageset。该变量中有一个统计数组，也就是说这种统计数组是“每cpu,每zone的”

代码第46-49行：获取了item对应的统计项的当前值（46行），并将本次的差分累加到统计项上（49行）

代码第51行：如果累加后的统计项大于pcp->stat_threadhold或小于负的pcp->stat_threadhold 就调用zone_page_stat_add函数，将该项的“每cpu统计值”一次累加到zone的整体统计项里，同时，将该项的“每cpu统计值”一次累加到系统全局的统计项里，并将percpu中该项对应的统计项清0.

代码第57-62行：每个zone有一个统计数组，记录该zone的整体统计信息（代码第60行），系统中有一个全局的统计数组，记录了系统中所有内存的统计信息（第61行）该函数的作用就是

【注】TODO：解释：1.为啥需要针对zone做每cpu统计数组？2.zone整体统计信息有没有可能出现负值？3.系统全局的统计项信息有没有可能出现负值？4.percpu的统计项信息有没有可能出现负值？

 1 enum zone_stat_item {
 2     /* First 128 byte cacheline (assuming 64 bit words) */
 3     NR_FREE_PAGES,
 4     NR_LRU_BASE,
 5     NR_INACTIVE_ANON = NR_LRU_BASE, /* must match order of LRU_[IN]ACTIVE */
 6     NR_ACTIVE_ANON,        /*  "     "     "   "       "         */
 7     NR_INACTIVE_FILE,    /*  "     "     "   "       "         */
 8     NR_ACTIVE_FILE,        /*  "     "     "   "       "         */
 9     NR_UNEVICTABLE,        /*  "     "     "   "       "         */
10     NR_MLOCK,        /* mlock()ed pages found and moved off LRU */
11     NR_ANON_PAGES,    /* Mapped anonymous pages */
12     NR_FILE_MAPPED,    /* pagecache pages mapped into pagetables.
13                only modified from process context */
14     NR_FILE_PAGES,
15     NR_FILE_DIRTY,
16     NR_WRITEBACK,
17     NR_SLAB_RECLAIMABLE,
18     NR_SLAB_UNRECLAIMABLE,
19     NR_PAGETABLE,        /* used for pagetables */
20     NR_KERNEL_STACK,
21     /* Second 128 byte cacheline */
22     NR_UNSTABLE_NFS,    /* NFS unstable pages */
23     NR_BOUNCE,
24     NR_VMSCAN_WRITE,
25     NR_WRITEBACK_TEMP,    /* Writeback using temporary buffers */
26     NR_ISOLATED_ANON,    /* Temporary isolated pages from anon lru */
27     NR_ISOLATED_FILE,    /* Temporary isolated pages from file lru */
28     NR_SHMEM,        /* shmem pages (included tmpfs/GEM pages) */
29 #ifdef CONFIG_NUMA
30     NUMA_HIT,        /* allocated in intended node */
31     NUMA_MISS,        /* allocated in non intended node */
32     NUMA_FOREIGN,        /* was intended here, hit elsewhere */
33     NUMA_INTERLEAVE_HIT,    /* interleaver preferred this zone */
34     NUMA_LOCAL,        /* allocation from local node */
35     NUMA_OTHER,        /* allocation from other node */
36 #endif
37     NR_VM_ZONE_STAT_ITEMS 
38 };
39 /*
40  * For use when we know that interrupts are disabled.
41  */
42 void __mod_zone_page_state(struct zone *zone, enum zone_stat_item item,
43                 int delta)
44 {
45     struct per_cpu_pageset *pcp = zone_pcp(zone, smp_processor_id());
46     s8 *p = pcp->vm_stat_diff + item;
47     long x;
48 
49     x = delta + *p;
50 
51     if (unlikely(x > pcp->stat_threshold || x < -pcp->stat_threshold)) {
52         zone_page_state_add(x, zone, item);
53         x = 0;
54     }
55     *p = x;
56 }
57 static inline void zone_page_state_add(long x, struct zone *zone,
58                  enum zone_stat_item item)
59 {
60     atomic_long_add(x, &zone->vm_stat[item]);
61     atomic_long_add(x, &vm_stat[item]);
62 }

View Code

__count_zone_vm_events

代码第1-28行：定义了需要统计的事件类型

代码第29-32行：获取每cpu变量vm_event_states,将delta变量累加到对应的时间类型

代码第33-35行：将delta累加到zone对应的item统计事件类型上，对第34行的理解可以结合代码第1行的定义。

 1 #define FOR_ALL_ZONES(xx) DMA_ZONE(xx) DMA32_ZONE(xx) xx##_NORMAL HIGHMEM_ZONE(xx) , xx##_MOVABLE
 2 
 3 enum vm_event_item { PGPGIN, PGPGOUT, PSWPIN, PSWPOUT,
 4         FOR_ALL_ZONES(PGALLOC),
 5         PGFREE, PGACTIVATE, PGDEACTIVATE,
 6         PGFAULT, PGMAJFAULT,
 7         FOR_ALL_ZONES(PGREFILL),
 8         FOR_ALL_ZONES(PGSTEAL),
 9         FOR_ALL_ZONES(PGSCAN_KSWAPD),
10         FOR_ALL_ZONES(PGSCAN_DIRECT),
11 #ifdef CONFIG_NUMA
12         PGSCAN_ZONE_RECLAIM_FAILED,
13 #endif
14         PGINODESTEAL, SLABS_SCANNED, KSWAPD_STEAL, KSWAPD_INODESTEAL,
15         PAGEOUTRUN, ALLOCSTALL, PGROTATED,
16 #ifdef CONFIG_HUGETLB_PAGE
17         HTLB_BUDDY_PGALLOC, HTLB_BUDDY_PGALLOC_FAIL,
18 #endif
19         UNEVICTABLE_PGCULLED,    /* culled to noreclaim list */
20         UNEVICTABLE_PGSCANNED,    /* scanned for reclaimability */
21         UNEVICTABLE_PGRESCUED,    /* rescued from noreclaim list */
22         UNEVICTABLE_PGMLOCKED,
23         UNEVICTABLE_PGMUNLOCKED,
24         UNEVICTABLE_PGCLEARED,    /* on COW, page truncate */
25         UNEVICTABLE_PGSTRANDED,    /* unable to isolate on unlock */
26         UNEVICTABLE_MLOCKFREED,
27         NR_VM_EVENT_ITEMS
28 };
29 static inline void __count_vm_events(enum vm_event_item item, long delta)
30 {
31     __get_cpu_var(vm_event_states).event[item] += delta;
32 }
33 #define __count_zone_vm_events(item, zone, delta) \
34         __count_vm_events(item##_NORMAL - ZONE_NORMAL + \
35         zone_idx(zone), delta)

View Code

zone_statistics

该函数主要做NUMA相关的统计包括：NUMA_HIT,NUMA_MISS,NUMA_LOCAL,NUMA_OTHER. numa hit：故名思意，就是如果页分配流程分配到的页所在的内存区和首选内存区来至同一个numa节点时，则认为分配命中了numa节点；相反如果页分配流程分配到的页所在的内存区和首选内存区不属于同一个内存节点，则认为本次分配MISS了。如果页分配流程分配到的页所在的内存区属于当前cpu的本地numa节点，则累加NUMA_LOCAL技术，想法则认为本次内存分配分配到了非本地numa节点的内存，则递增NUMA_OTHER计数。该函数主要为了跟踪系统在多zone，多numa节点的内存分配情况。

代码9-10行：如果z所在的内存区和perferred_zone来至同一个内存节点就增加z和全局统计的NUMA_HIT计数

代码11-13行：否则就增加z和全局的NUMA_MISS计数，并增加perferred_zone和全局的NUMA_FOREIGN计数

代码15-17行：如果z所在的内存节点是前cpu的本地numa节点，则增加z和全局NUMA_LOCAL计数

代码17-18行：否则增加z和全局的NUMA_OTHER计数

代码第21-56行：给出了zone_statistics调用的子函数：__inc_zone_state的逻辑，该函数实际逻辑和上文提到的__mod_zone_page_state函数相同，同时又一下区别：

第一个不同：__mod_zone_page_state每次更改zone相关的统计信息时，一次可以改变绝对值大于等于1的值，为什么时觉得值呢？因为__mod_zone_page_state可以将值改大或者改小；但是__inc_zone_state只能改大相关统计项的值，并且一次只能增加1。既然__mod_zone_page_state实现了__inc_zone_state的功能，为啥还要定义这么个“多余”的函数呢？原因：递增zone统计值的操作在内核热点路径上，这么以来该函数的执行效率就变得非常非常重要，对比__mod_zone_page_state的代码，代码第43行的++操作会被编译器优化成inc指令，而__mod_zone_page_state就只能用add指令，inc指令比add指令执行的更快；再者：对比55行的逻辑，正式因为__inc_zone_state函数只增不减，相比较__mod_zone_page_state少了一个判断分支，这也可以提高执行效率。因此在设计内核代码时，一定先评估所写的代码执行热度，并且尝试优化任何可优化的内容（甚至不惜嵌入汇编指令）

第二个不同：代码第50-54行：__mod_zone_page_state这里判断per cpu统计量大于stat_threadhold后，就直接将per cpu统计量分别累加到zone中的统计量和全局统计量，但是__inc_zone_state却只累加了一般（为什么？）

 1 /*
 2  * zonelist = the list of zones passed to the allocator
 3  * z         = the zone from which the allocation occurred.
 4  *
 5  * Must be called with interrupts disabled.
 6  */
 7 void zone_statistics(struct zone *preferred_zone, struct zone *z)
 8 {
 9     if (z->zone_pgdat == preferred_zone->zone_pgdat) {
10         __inc_zone_state(z, NUMA_HIT);
11     } else {
12         __inc_zone_state(z, NUMA_MISS);
13         __inc_zone_state(preferred_zone, NUMA_FOREIGN);
14     }
15     if (z->node == numa_node_id())
16         __inc_zone_state(z, NUMA_LOCAL);
17     else
18         __inc_zone_state(z, NUMA_OTHER);
19 }
20 /*
21  * Optimized increment and decrement functions.
22  *
23  * These are only for a single page and therefore can take a struct page *
24  * argument instead of struct zone *. This allows the inclusion of the code
25  * generated for page_zone(page) into the optimized functions.
26  *
27  * No overflow check is necessary and therefore the differential can be
28  * incremented or decremented in place which may allow the compilers to
29  * generate better code.
30  * The increment or decrement is known and therefore one boundary check can
31  * be omitted.
32  *
33  * NOTE: These functions are very performance sensitive. Change only
34  * with care.
35  *
36  * Some processors have inc/dec instructions that are atomic vs an interrupt.
37  * However, the code must first determine the differential location in a zone
38  * based on the processor number and then inc/dec the counter. There is no
39  * guarantee without disabling preemption that the processor will not change
40  * in between and therefore the atomicity vs. interrupt cannot be exploited
41  * in a useful way here.
42  */
43 void __inc_zone_state(struct zone *zone, enum zone_stat_item item)
44 {
45     struct per_cpu_pageset *pcp = zone_pcp(zone, smp_processor_id());
46     s8 *p = pcp->vm_stat_diff + item;
47 
48     (*p)++;
49 
50     if (unlikely(*p > pcp->stat_threshold)) {
51         int overstep = pcp->stat_threshold / 2;
52 
53         zone_page_state_add(*p + overstep, zone, item);
54         *p = -overstep;
55     }
56 }

View Code

buffered_rmqueue

从zone中分配一个order阶的物理连续内存段，首选迁移类型为：migratetype,首选内存去是perferred_zone：

 1 /*
 2  * Really, prep_compound_page() should be called from __rmqueue_bulk().  But
 3  * we cheat by calling it from here, in the order > 0 path.  Saves a branch
 4  * or two.
 5  */
 6 static inline
 7 struct page *buffered_rmqueue(struct zone *preferred_zone,
 8             struct zone *zone, int order, gfp_t gfp_flags,
 9             int migratetype)
10 {
11     unsigned long flags;
12     struct page *page;
13     int cold = !!(gfp_flags & __GFP_COLD);
14     int cpu;
15 
16 again:
17     cpu  = get_cpu();
18     if (likely(order == 0)) {
19         struct per_cpu_pages *pcp;
20         struct list_head *list;
21 
22         pcp = &zone_pcp(zone, cpu)->pcp;
23         list = &pcp->lists[migratetype];
24         local_irq_save(flags);
25         if (list_empty(list)) {
26             pcp->count += rmqueue_bulk(zone, 0,
27                     pcp->batch, list,
28                     migratetype, cold);
29             if (unlikely(list_empty(list)))
30                 goto failed;
31         }
32 
33         if (cold)
34             page = list_entry(list->prev, struct page, lru);
35         else
36             page = list_entry(list->next, struct page, lru);
37 
38         list_del(&page->lru);
39         pcp->count--;
40     } else {
41         if (unlikely(gfp_flags & __GFP_NOFAIL)) {
42             /*
43              * __GFP_NOFAIL is not to be used in new code.
44              *
45              * All __GFP_NOFAIL callers should be fixed so that they
46              * properly detect and handle allocation failures.
47              *
48              * We most definitely don't want callers attempting to
49              * allocate greater than order-1 page units with
50              * __GFP_NOFAIL.
51              */
52             WARN_ON_ONCE(order > 1);
53         }
54         spin_lock_irqsave(&zone->lock, flags);
55         page = __rmqueue(zone, order, migratetype);
56         __mod_zone_page_state(zone, NR_FREE_PAGES, -(1 << order));
57         spin_unlock(&zone->lock);
58         if (!page)
59             goto failed;
60     }
61 
62     __count_zone_vm_events(PGALLOC, zone, 1 << order);
63     zone_statistics(preferred_zone, zone);
64     local_irq_restore(flags);
65     put_cpu();
66 
67     VM_BUG_ON(bad_range(zone, page));
68     if (prep_new_page(page, order, gfp_flags))
69         goto again;
70     return page;
71 
72 failed:
73     local_irq_restore(flags);
74     put_cpu();
75     return NULL;
76 }

View Code

changelog----------------------------------------------------------------------------------------------------------------------------------------------
20190109：添加了page_to_pfn,pfn_to_page,move_freepages,move_freepages_block说明
20190110：添加了__rmqueue_smallest说明
20190111:添加了pfn_to_section_nr，__nr_to_section，__pfn_to_section,set_pageblock_migratetype->set_pageblock_flags_group的说明
20190113：修改了代码框，原有的代码框在google浏览器上展开后，看不到折叠按钮，从新修订了代码框的样式，现在能在google，火狐上能展开和折叠，但是ie展开和折叠代码仍然有问题，暂时就先这样。
20190114：添加了对__rmqueue_fallback函数的部分说明，没有能添加完，需要进一步完善
20190115：完善了__rmqueue_fallback函数的说明，添加了rmqueue_bulk函数的说明
20190116:添加了__mod_zone_page_state相关说明
20190118:添加了 zone_statistics， __count_zone_vm_events相关说明
TODO--------------------------------------------------------------------------------------------------------------------------------------------------
长期目标：本文要详细描述内核buddy子系统的相关函数，对外提供的内存分配和回收接口的流程，不拘泥于形式，力求深入测底。
计划分三步完成：
第一步：阅读代码，零碎整理各个函数的作用。
第二步：梳理流程，描述buddy系统对外提供的接口，每个接口的整体流程，使用的先行条件：例如，是否可以睡眠，是否需要持有锁，是否需要关中断，以及能够使用的上下文。
第三步：总结buddy系统代码实现的关键点，涉及的所有概念，以及概念之间的关系。
现阶段目标:get_page_from_freelist->buffered_rmqueue，总结page统计相关几个全局数据结构，说明page prepare相关逻辑

转载于:https://www.cnblogs.com/DoOrDie/p/10146545.html

你可能感兴趣的:(内存管理-buddy[代码])

JavaScript 中的性能优化：从基础到高级技巧 lina_mua 深入 javascript 性能优化开发语言
1.引言1.1性能优化的重要性在现代前端开发中，性能优化是提升用户体验的关键。无论是页面加载速度、交互响应时间，还是内存占用，性能优化都能显著提升应用的流畅度和用户满意度。1.2本文的目标本文旨在深入探讨JavaScript中的性能优化，从基础到高级技巧，帮助开发者理解性能优化的核心概念，并掌握其在实际开发中的应用。2.性能优化的基础2.1什么是性能优化？性能优化是指通过改进代码、减少资源消耗、优
8、Python 字符串处理与正则表达式实战指南 wolf犭良 python python 正则表达式
Python字符串处理与正则表达式实战指南文章概述本文深入探讨Python字符串处理核心方法与正则表达式实战技巧，涵盖字符串编码转换、分割替换、正则表达式语法精髓，并通过日志解析、数据清洗等真实场景案例展示高阶应用。最后提供10道阶梯式练习题（附完整答案代码），助你从基础到进阶全面掌握文本处理技能。一、字符串处理核心三剑客1.1编码转换（encode/decode）text="中文文本"utf8_
【AI大模型应用开发】RAG-Fusion框架：忘掉 RAG，未来是 RAG-Fusion 同学小张大模型人工智能笔记 chatgpt agi embedding RAG prompt
大家好，我是同学小张，+v:jasper_8017一起交流，持续学习C++进阶、OpenGL、WebGL知识和AI大模型应用实战案例，持续分享，欢迎大家点赞+关注，共同学习和进步。RAG目前很火，但是也有一些不足的地方。有不足就有改进方法。本文我们来看一个方法：RAG-Fusion，理解其原理，并看一下其实现源码。文章目录0.RAG的不足1.RAG-Fusion原理概述2.步骤拆解与代码示例2.1
使用python中you-get库实现下载网抑云瞎老弟 python python 音视频爬虫
WYY音乐下载前言代码实现使用说明前言前几天，我做了b站视频的下载，有好兄弟表示，只下载视频，不能够让人满足，我还希望能够下载网易云的音乐。上一次在我发布的b站视频下载中，使用了you-get库作为下载方式，但是实际上，这个库也可以下载网易云音乐，因此，我们只需要参考我们上次的b站视频下载，简单的进行一下修改，就可以完成音乐的下载了。为了能够更加方便的批量下载音乐，这里采用了“按艺术家“的下载方式
【C语言】动态内存管理用realloc管理更灵活 xiaofann_ C c语言算法
realloc——动态内存空间管理更灵活为了合理使用内存，我们会对内存的大小做灵活的调整。那realloc函数就可以做到对动态开辟内存大小的调整。头文件：#includevoid*realloc(要调整的内存地址,调整之后新大小)void*realloc(void*ptr,size_tsize)注意：返回值为调整之后的内存起始位置。这个函数调整原内存空间大小的基础上，还会将原来内存中的数据移动到新
VScode使用教程晓码bigdata C++python vscode 编辑器
VScode使用教程1VScode概览1.1特性1.2VScode下载安装1.3VScode基本使用1.4vsCode安装插件的3种方式1.5不能联网的电脑vscode安装插件3种方式1.6vsCode调试代码（3种模式）2VScode编写c++代码2.1怎么编写c++代码2.2出现了c++自带库无法识别的情况，是因为没配置好编译器gcc路径2.3使用gcc编译器编译c++程序报错找不到std3V
机器学习课堂4线性回归模型+特征缩放木尘152132 机器学习线性回归 python
一、实验2-2，线性回归模型，计算模型在训练数据集和测试数据集上的均方根误差代码：#2-2线性回归模型importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt#参数设置iterations=3000#迭代次数learning_rate=0.0001#学习率m_train=3000#训练样本的数量flag_plot_lines=False
连续子数组最大乘积（C语言） Charon424 c语言
代码如下：#includeintmaxn(int*num,intsizenum){if(sizenum==0){return0;}int*maxnum=(int*)malloc(sizeof(int)*sizenum);int*minnum=(int*)malloc(sizeof(int)*sizenum);maxnum[0]=minnum[0]=num[0];intmaxproduct=maxn
验证哥德巴赫猜想（C语言） Charon424 c语言
哥德巴赫猜想：任一大于2的偶数都可写成两个质数之和。（——欧拉提出的观点）代码如下：#include#include#includeboolisprime(intn){if(n<2)returnfalse;for(inti=2;i<=sqrt(n);i++){if(n%i==0){returnfalse;}}returntrue;}boolgoldbach(intnum){if(num<=2)re
移除元素（C语言） Charon424 leetcode简单题 c语言算法数据结构
题目：给你一个数组nums和一个值val，你需要原地移除所有数值等于val的元素。元素的顺序可能发生改变。然后返回nums中与val不同的元素的数量。假设nums中不等于val的元素数量为k，要通过此题，您需要执行以下操作：更改nums数组，使nums的前k个元素包含不等于val的元素。nums的其余元素和nums的大小并不重要。返回k。用户评测：评测机将使用以下代码测试您的解决方案：int[]n
商店管理系统 Charon424 c语言链表数据结构
源代码：//商店管理系统（人员信息，商品信息）#include#include#include#includetypedefstructdate//出生年月日{intyear;intmonth;intday;}DATA;typedefstructinformation//人员信息{charname[20];//名字longid;//编号charsex[20];//性别charfunction[20
代码管理工具——SVN weixin_33728708 git 开发工具 python
2019独角兽企业重金招聘Python工程师标准>>>SVN版本控制的作用：记录若干文件内容变化，以便将来查阅特定版本修订情况。版本管理工具发展简史，cvs-->svn-->Git（参考：http://luckypoem14.github.io/test/2012/04/24/scm-history/）。svn全称subversion，是一个开源版本控制系统（C/S架构），始于2000年；git（
SVN学习无妄无望工具使用 svn 学习
1、SVN是什么SVN（Subversion）是一个开源的版本控制系统，用于跟踪文件和目录的更改。它允许团队协作开发项目，管理代码的版本历史，并支持多人同时对代码进行修改和提交。SVN是集中式版本控制系统（CVCS）的代表之一，与Git（分布式版本控制系统）不同，SVN的代码库通常存储在一个中央服务器上。SVN的主要特点版本控制：记录文件和目录的每一次更改，支持版本回溯和历史查看。多人协作：允许多
c-通讯录【动态通讯录，文件版本通讯录】 pupu周子晗 c语言 c语言开发语言
一、通讯录的结构首先如何实现一个通讯录呢？a.根据日常生活我们知道一个通讯录包括：1.可以保存多少个联系人的信息2.增加联系人3.删除指定联系人4.查找指定联系人的信息5.修改指定联系人的信息6.显示所有联系人的信息b.而每一个联系人，我们也需要填写相关信息：1.名字2.年龄3.性别4.电话5.住址根据以上需求，我们可以有目的的开始编写代码。c.为了增加代码的可读性我们将代码分为三个部分：1.te
深入理解正则表达式：语法全解析谢兴豪
本文还有配套的精品资源，点击获取简介：正则表达式是一种用于文本匹配的模式，广泛应用在文本处理、数据验证等领域。本文将全面探讨正则表达式的语法细节，包括字符匹配、元字符、字符类、量词、分组与反向引用、选择与否定、位置锚点、预定义字符集、模式修饰符、回溯控制以及正向先行断言和正向后行断言。掌握这些知识有助于提高编程效率和代码质量。1.正则表达式简介正则表达式是IT行业中的“瑞士军刀”，它们在文本处理、
JavaScript 模块化语法 import、export详解 qq39138814 javascript 开发语言 ecmascript
JavaScript模块化语法import、export详解1.为什么需要模块化？在JavaScript早期，所有代码都是写在一个全局作用域中，这样做的问题是：变量污染：所有变量、函数都是全局的，容易互相干扰。文件依赖管理困难：多个JS文件之间的依赖关系混乱，难以维护。代码复用困难：无法方便地拆分和复用代码。为了解决这些问题，模块化方案应运而生。2.JavaScript模块化的发展2.1早期的模块
笔记：代码随想录算法训练营day57：99.岛屿数量深搜、岛屿数量广搜、100.岛屿的最大面积 jingjingjing1111 深度优先算法笔记
学习资料：代码随想录注：文中含大模型生成内容99.岛屿数量卡码网题目链接（ACM模式）先看深搜方法：找到未标标记过的说明找到一片陆地的或者一片陆地的一个角落，dfs搜索是寻找相连接的陆地其余部分并做好标记#include#includeusingnamespacestd;intdirection[4][2]={0,1,-1,0,0,-1,1,0};voiddfs(constvector>&B612
C#：实现二个数组求并集(附完整源码) 源代码大师 C#算法完整教程 c#linq 开发语言
C#：实现二个数组求并集下面是C#代码，用于计算两个数组的并集：usingSystem;usingSystem.Linq;classProgram{staticvoidMain(string
webpack提升打包构建速度02--webpack优化 _xiyang webpack webpack 前端 node.js javascript
提升打包构建速度HotModuleReplacement为什么开发时我们修改了其中一个模块代码，Webpack默认会将所有模块全部重新打包编译，速度很慢。所以我们需要做到修改某个模块代码，就只有这个模块代码需要重新打包编译，其他模块不变，这样打包速度就能很快。是什么HotModuleReplacement（HMR/热模块替换）：在程序运行中，替换、添加或删除模块，而无需重新加载整个页面。怎么用1.
141.HarmonyOS NEXT系列教程之3D立方体旋转轮播案例讲解之IDataSource接口实现 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之3D立方体旋转轮播案例讲解之IDataSource接口实现效果演示1.IDataSource接口概述1.1接口作用IDataSource接口定义了数据源的标准接口，提供了：数据访问方法数据操作方法监听器管理方法1.2接口实现e
笔记：代码随想录算法训练营day56:图论理论基础、深搜理论基础、98. 所有可达路径、广搜理论基础 jingjingjing1111 笔记
学习资料：代码随想录连通图是给无向图的定义，强连通图是给有向图的定义朴素存储：二维数组邻接矩阵邻接表：list基础知识：C++容器类|菜鸟教程深搜是沿着一个方向搜到头再不断回溯，转向；广搜是每一次搜索要把当前能够得到的方向搜个遍深搜三部曲：传入参数、终止条件、处理节点+递推+回溯98.所有可达路径卡码网题目链接（ACM模式）先是用邻接矩阵，矩阵的x,y表示从x到y有一条边主要还是用回溯方法遍历整个
浏览器工作原理深度解析（阶段一）：从 URL 到页面渲染的完整流程码农的时光故事 javascript 前端
一、浏览器工作流程概述作为前端开发者，我们每天都在与浏览器打交道，但多数人对其内部工作机制却知之甚少。实际上，浏览器的核心功能就是将用户输入的URL转换为可视化的网页。这一过程大致分为六个关键步骤：网络请求：通过HTTP/HTTPS协议获取页面资源构建DOM树：解析HTML代码生成文档对象模型样式计算：解析CSS规则并应用到对应元素布局渲染：计算元素位置和尺寸生成渲染树合成优化：将渲染层合并为位图
研发源代码防泄密加密软件分析 Cnsidna.No.1 企业数据防泄密源代码防泄密企业信息安全网络安全
目前很多企业都拥有自己的研发机构，其研发成果往往体现在源代码和技术文档方面，这些核心机密，如何防止研发参与人员泄密，如何防止核心成员把研究成果带走另立山头，或者提供给竞争对手，是一个很现实的一个问题。有些公司通过和员工签署保密协议，来对应上述的泄密问题，但由于计算机的特性，源代码图纸的取证困难，效果很不理想。如果能够事先进行防范，减少或者杜绝泄密风险，那将大大提升保密性，所以需要购买源代码以及技术
python的离线安装包下载 Lake说科技 python 服务器 linux 开发语言运维
Python,安装相关视频讲解：python的or运算赋值用法用python编程Excel有没有用处？011_编程到底好玩在哪？查看python文件_输出py文件_cat_运行python文件_shel如何实现Python的离线安装包下载一、流程：步骤说明1确定需要下载的Python安装包版本2下载对应版本的离线安装包3将下载好的安装包传输至目标机器4在目标机器上进行安装二、具体步骤及代码：步骤1
python3+ffmpeg下载B站视频，附代码才华横溢吴道简爬虫 python windows
最近要去外面玩，旅途漫长，于是乎，就写了个代码，从B站上下载纪录片看，代码附后，请自取，如果觉得有用，麻烦点个赞，鼓励一下。感谢~~一、下载安装ffmpegFfmpeg是一款自由软件，用于视频和音频文件的处理，在本例中，我使用它进行视频文件和音频文件的合并。合并代码写在python脚本中，你只需下载好ffmpeg即可，而且因为合并代码中使用ffmpeg的绝对路径，所以也不用设置环境配置。Ffmpe
群体智能优化算法-粒子群优化算法（Particle Swarm Optimization, PSO，含Matlab源代码） HR Zhou 算法 matlab 智能优化算法优化
摘要（Abstract）粒子群优化（PSO）是一种基于群体智能的优化算法，受鸟群觅食行为的启发。PSO通过模拟粒子（个体）在搜索空间中的运动来寻找最优解。每个粒子根据自身的历史最优位置（pBest）和全局最优位置（gBest）动态调整速度和位置，从而在全局搜索和局部搜索之间取得平衡。PSO具有收敛速度快、实现简单、计算复杂度低等优点，广泛应用于函数优化、神经网络训练、工程优化等领域。算法介绍1.主
matlab中s-function模块局部变量的应用 0如约而至0 matlab
最近在项目中，涉及到了matlab中s-function函数的应用。需要在输出信号上加一个受地面站控制的3211激励信号。实现的过程中，遇到了s-function函数内部局部变量每次进入都会初始化置0的问题，网上查阅资料并结合模型实例，最后通过isempty函数来实现。具体的matlab实现代码如下：//functiony=fcn(act_sign,act)persistentt2ifisempt
将Git远程仓库中的项目迁移到另一个远程库, So easy oscar999 Git极简教程与常用问题解决 git 仓库迁移
需求描述将一个Git远程仓库中的项目迁移到另一个远程库，这里的示例是将原来控管在Bitbucket的项目迁移到GitHub。当然，能想到的最简单的方式就是在GitHub创建一个新项目，然后把原来的文件add,commit,push。这样的话虽然代码是控管了，但是之前提交的历史记录并没有迁移过去。其实包含历史记录的项目的迁移也很简单。参考Bitbucket是Atlassian公司提供的一个基于web
JS中事件处理机制（秒懂事件委托、事件捕获和事件冒泡）码农白衣前端知识 JS javascript 前端开发语言
目录一、概念事件委托（EventDelegation）：事件捕获（EventCapturing）：事件冒泡（EventBubbling）：二、好处事件委托的好处：事件捕获的好处：事件冒泡的好处：三、工作原理事件委托（EventDelegation）：事件捕获（EventCapturing）：事件冒泡（EventBubbling）：四、代码实例1.简单代码实例（事件监听）2.复杂代码实例（简单的待办
【Android 】零基础到飞升 | Git之使用GitHub搭建远程仓库 A little strawberry git java github python 编程语言
1.5.2Git之使用GitHub搭建远程仓库本节引言：在上一节中，我们学习了如何使用Git，构建我们的本地仓库，轻松的实现了版本控制以及代码还原，修改日志查看等；读者肯定不满足与本地是吧，假如是多个人一起来开发一个程序呢？我们需要一个作为服务器的远程仓库！当然搭建一个服务器是需要成本的，为什么不把项目托管到Github上呢？作为开源代码库以及版本控制系统，Github拥有140多万开发者用户。随
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s