houzengjiang

dlmalloc源码分析

我们写过很多C程序了，经常会分配内存。记得刚学C语言时老师说过，可以向两个地方申请内存：一个是栈、一个是堆。小块内存向栈申请，函数调用结束后程序会自动释放内存。大块内存向堆申请，记得一定要自己释放，否则会造成内存泄漏。向堆申请内存直接调用malloc()就可以了，参数是你申请的内存量。释放内存时直接调用free()就可以了，参数是内存块指针。

看似平静的海面，海底则波涛汹涌。当时还没有学操作系统原理，更没有读过Linux内核代码。现在仔细想想才发现申请动态内存是一件多么麻烦的事情。动态内存管理涉及到两个层面的问题：内核层面和用户层面。系统中的内存如何管理这是内核考虑的事情，总不能让应用程序随便使用系统中的内存吧。内核向应用程序提供了接口（为此Linux提供了两个系统调用brk和mmap），当应用程序需要申请内存时向内核提出请求，内核查找并分配一块可用内存供应用程序使用。这部分内容属于内核范畴，不属于C基础库，因此不深入说了。那么用户层面做什么呢？用户层面需要合理管理内存申请和释放请求。比如：brk()可以扩充或收缩堆的大小，你总不能每分配一次内存就调用一次brk()吧？释放内存时更麻烦，你必须保证内存块的释放顺序。比如先申请了内存块a，然后申请了内存块b，然后释放a（b仍然在使用），如果释放a时调用了brk()就会出问题。你不能在使用b的同时释放a。

好在出现了一个叫做“内存分配器”的东西，内存分配器接管了应用程序申请内存和释放内存的请求，应用程序再也不需要直接调用brk()和mmap()了，而是向内存分配器提交申请。有了内存分配器，我们只需要记住malloc()和free()两个接口函数就可以了，其他繁琐事情全部交给内存分配器负责了。申请内存时，内存分配器会一次向内核申请大量内存，然后分批交给应用程序，从而提高了效率。释放内存时，应用程序也是将内存释放给内存分配器，内存分配器在合适的时候再将内存释放会内核。

dlmalloc就是一种内存分配器，由Doug Lea在1987年开发完成，这是Android系统中使用的内存分配器。而Linux系统中采用的是ptmalloc，ptmalloc在dlmalloc的基础上进行了改进，以更好适应多线程。dlmalloc采用两种方式申请内存，如果应用程序单次申请的内存量小于256kb，dlmalloc调用brk()扩展进程堆空间，但是dlmalloc向内核申请的内存量大于应用程序申请的内存量，申请到内存后dlmalloc将内存分成两块，一块返回给应用程序，另一块作为空闲内存先保留起来。下次应用程序申请内存时dlmalloc就不需要向内核申请内存了，从而加快内存分配效率。当应用程序调用free()释放内存时，如果内存块小于256kb，dlmalloc并不马上将内存块释放回内存，而是将内存块标记为空闲状态。这么做的原因有两个：一是内存块不一定能马上释放会内核（比如内存块不是位于堆顶端），二是供应用程序下次申请内存使用（这是主要原因）。当dlmalloc中空闲内存量达到一定值时dlmalloc才将空闲内存释放会内核。如果应用程序申请的内存大于256kb，dlmalloc调用mmap()向内核申请一块内存，返回返还给应用程序使用。如果应用程序释放的内存大于256kb，dlmalloc马上调用munmap()释放内存。dlmalloc不会缓存大于256kb的内存块，因为这样的内存块太大了，最好不要长期占用这么大的内存资源。

dlmalloc中，申请到的内存被分割成若干个内存块，dlmalloc采用两种不同的数据结构表示这些内存块。小内存块保存在链表中，用struct malloc_chunk表示；大内存块保存在树形结构中，用struct malloc_tree_chunk表示。struct malloc_chunk结构如下：

[cpp] view plain copy print ?

struct malloc_chunk {
size_t prev_foot; /* Size of previous chunk (if free). */
size_t head; /* Size and inuse bits. */
struct malloc_chunk* fd; /* double links -- used only if free. */
struct malloc_chunk* bk;
};

fd表示链表中后面一个malloc_chunk结构，bk表示链表中前一个malloc_chunk结构。head表示这个malloc_chunk代表内存块的大小，另外还包含了一些标志信息。prev_foot表示前一个malloc_chunk的大小，这里的"前一个"不是链表中的"前一个"，而是与这个malloc_chunk地址相邻的"前一个"。通过prev_foot和size两个字段dlmalloc就可以快速找到地址相邻的前一个和后一个malloc_chunk结构。

当内存块被分配给应用程序后，就会被从链表中摘除，这时malloc_chunk结构中的fd和bk两个字段就没有意义了，因此可以供应用程序使用。我们调用malloc()申请内存时，malloc()会返回一个指针，指向申请到的内存块的起始地址p，其实这个地址前还有一个malloc_chunk结构，我们可以通过p-8得到malloc_chunk结构的指针。反过来也可以通过malloc_chunk指针得到分配给应用程序的内存块的起始地址。为此dlmalloc定义了两个宏：

[cpp] view plain copy print ?

typedef struct malloc_chunk* mchunkptr;
// 32位Linux系统中，TWO_SIZE_T_SIZES的值是8
#define chunk2mem(p) ((void*)((char*)(p) + TWO_SIZE_T_SIZES))
#define mem2chunk(mem) ((mchunkptr)((char*)(mem) - TWO_SIZE_T_SIZES))

我们看下面这个例子：

上面这块内存区域中包括两个内存块，分别为chunk1和chunk2，紧接着malloc_chunk结构的就是供应用程序使用的内存。按照前面的分析，fd和bk两个字段也可以供应用程序使用。因此ptr1 = chunk1 + 8，ptr2 = chunk2 + 8。还有一点需要注意的是，只有当前面一个chunk空闲时malloc_chunk结构中的prev_foot才保存前一个chunk的大小；当前面一个chunk分配给应用程序后，prev_foot字段也可以供应用程序使用。上图中，当chunk1分配给应用程序后，chunk2中的prev_foot字段就没有意义了，可以供应用程序使用。dlmalloc返回给应用程序的地址是ptr1，这个内存块的大小是size1 + 8 + 4。因此，malloc_chunk结构中，只有head字段永远不会挪作他用，其他三个字段都可以供应用程序使用，通过这种复用最大限度地减少了dlmalloc本身占用的内存。

dlmalloc对应用程序申请的内存长度有限制，要求内存块长度（包括malloc_chunk结构占用的内存）必须是8字节的倍数。假如应用程序调用malloc(13)申请长度为13字节的内存块，dlmalloc最终分配内存块大小是24字节，除去malloc_chunk结构中head占用的4字节，分配给应用程序的内存块大小是20字节。当然，应用程序不要揣测内存块的实际大小，虽然dlmalloc分配了20字节，但是应用程序最好只使用13字节，不要使用剩余的7字节。否则有两方面后果：（1）应用程序显得混乱，其他人可能无法读懂你的代码。（2）返回多少字节与内存分配器的实现方式有关，换另外一种内存分配器可能返回的就不是20字节了，如果应用程序使用超过13个字节就可能覆盖其他数据了，程序移植性差。

malloc_chunk结构可以表示的最小内存块是16字节，最大内存块是248字节，因此malloc_chunk可以表示16、24、32、40、......、248共30种长度的内存块。dlmalloc定义了30条链表，相同长度的空闲内存块保存在一个链表中。

超过248字节的内存就属于大块内存了，大块内存用malloc_tree_chunk表示，这个数据结构定义如下：

[cpp] view plain copy print ?

struct malloc_tree_chunk {
/* The first four fields must be compatible with malloc_chunk */
size_t prev_foot;
size_t head;
struct malloc_tree_chunk* fd;
struct malloc_tree_chunk* bk;
struct malloc_tree_chunk* child[2];
struct malloc_tree_chunk* parent;
bindex_t index;
};

其中prev_foot和head的定义跟malloc_chunk中的定义完全相同。那么其他几个字段表示什么含义呢？dlmalloc中小内存块只有30种情况，可以用30条链表存储；但是大内存块有无数种情况（256、264、272、......），因此就不能用链表表示了，大内存块保存在树形结构中，dlmalloc定义了32棵树存储大内存块，每棵树中存储若干种长度的内存块，每棵树保存的内存块范围如下：

dlmalloc中根据内存块大小计算所在树的编号的宏如下：

[cpp] view plain copy print ?

#define compute_tree_index(S, I)\
{\
size_t X = S >> TREEBIN_SHIFT; /* TREEBIN_SHIFT的值是8 */ \
if (X == 0)\
I = 0;\
else if (X > 0xFFFF)\
I = NTREEBINS-1; /* NTREEBINS的值是32 */ \
else {\
unsigned int K;\
__asm__("bsrl %1,%0\n\t" : "=r" (K) : "rm" (X));\
I = (bindex_t)((K << 1) + ((S >> (K + (TREEBIN_SHIFT-1)) & 1)));\
}\
}

如果感兴趣可以采用这个宏计算一下。我们看一下单棵树中保存的空闲内存块，以编号为0的树为例，这棵树中内存块的范围是[256, 384)，按照前面规定内存块的大小必须是8的倍数，因此这棵树中保存的内存块长度分别为256, 264, 272, 280, 288, 296, 304, 312, 320, 328, 336, 344, 352, 360, 368, 376，共16种长度，每种长度的内存块作为树中一个节点。这棵树中可能保存了多个相同长度的内存块，这些相同长度的内存块构成了一棵链表，如下图所示：

现在回过头来看malloc_tree_chunk中各个字段的含义。

prev_foot表示前一个内存块的大小

head表示本内存块的大小

child表示两个子节点

parent表示父节点

index表示内存块所在树的索引号

fd表示链表中下一个内存块

bk表示链表中前面一个内存块

同样，这个结构中只有head字段保持不变，其他字段都可以供应用程序使用。

现在我们来看一个全局变量_gm_，这是struct malloc_state类型的变量，这个数据结构定义如下：

[cpp] view plain copy print ?

struct malloc_state {
binmap_t smallmap;
mchunkptr smallbins[(NSMALLBINS+1)*2];
binmap_t treemap;
tbinptr treebins[NTREEBINS];
mchunkptr dv;
size_t dvsize;
mchunkptr top;
size_t topsize;
char* least_addr;
size_t trim_check;
size_t magic;
size_t footprint;
#if USE_MAX_ALLOWED_FOOTPRINT
size_t max_allowed_footprint;
#endif
size_t max_footprint;
flag_t mflags;
#if USE_LOCKS
MLOCK_T mutex;
#endif /* USE_LOCKS */
msegment seg;
};
static struct malloc_state _gm_;

我们重点关注前8个字段。smallbins就是dlmalloc中定义的30条链表（加上长度为0和8的内存块，共32条链表）。smalbins[0]-smallbins[3]共16字节，表示一个malloc_chunk结构，对应长度为0的链表。smalbins[2]-smallbins[5]共16字节，表示一个malloc_chunk结构，对应长度为8的链表，以此类推。可以看到相邻两个malloc_chunk结构有重合，这是因为作为链表使用时，malloc_chunk结构中的prev_foot和head字段没有意义，因此可以重合使用。smallmap是smallbins的位图，某个比特置位表示对应的链表上有空闲内存块，比特清零表示对应的链表为空。treebins表示dlmalloc中32棵树，treemap是treebins的位图，置位表示对应树中有空闲内存块，清零表示对应树为空。dv是一个特殊的内存块，如果dlmalloc中找不到一个合适大小的内存块分配给应用程序，那么dlmalloc会将一个较大的内存块分割成两个较小的内存块，一块给应用程序使用，另外一块保存在dv中。下载再找不到合适大小的内存块时，如果dv大小大于应用程序请求的内存块，dlmalloc会将dv分割成两块，一块给应用程序，另一块仍保存在dv中；如果dv小于应用程序请求的内存块，dlmalloc首先将dv保存在链表或树中，然后挑选另外一个内存块分割，一块给应用程序，另一块保存在dv中。因此dlmalloc分配内存块的原则是先匹配大小，后匹配位置，尽量挑选合适大小的内存块给应用程序，实在找不到合适的内存块时就尽量从同一个位置分割内存块，以提高效率（程序执行的局部性原理）。dvsize就是dv表示内存块的大小。top是另外一个特殊的内存块，表示堆空间中对顶端的内存块。dlmalloc尽量不使用这个内存块，只有在_gm_中没有合适大小的内存块并且没有更大的内存块可供分割时才使用top中的内存。为什么尽量不要使用top呢？因为当top被占用时dlmalloc没办法释放其他空闲内存，dlmalloc收缩堆时必须从高地址向低地址收缩，所以主要高地址的内存被占用，即使堆中有再多的空闲内存也没办法释放。topsize表示top的大小。

[cpp] view plain copy print ?

void* dlmalloc(size_t bytes) {
/*
Basic algorithm: 算法描述
If a small request (< 256 bytes minus per-chunk overhead):
1. If one exists, use a remainderless chunk in associated smallbin.
(Remainderless means that there are too few excess bytes to
represent as a chunk.)
2. If it is big enough, use the dv chunk, which is normally the
chunk adjacent to the one used for the most recent small request.
3. If one exists, split the smallest available chunk in a bin,
saving remainder in dv.
4. If it is big enough, use the top chunk.
5. If available, get memory from system and use it
Otherwise, for a large request:
1. Find the smallest available binned chunk that fits, and use it
if it is better fitting than dv chunk, splitting if necessary.
2. If better fitting than any binned chunk, use the dv chunk.
3. If it is big enough, use the top chunk.
4. If request size >= mmap threshold, try to directly mmap this chunk.
5. If available, get memory from system and use it
The ugly goto's here ensure that postaction occurs along all paths.
*/
if (!PREACTION(gm)) {
void* mem;
size_t nb;
// 如果申请的内存量小于244字节，表示是小块内存.
if (bytes <= MAX_SMALL_REQUEST) { // 244字节
bindex_t idx;
binmap_t smallbits;
// 修改申请的内存量，考虑malloc_chunk占用的内存，考虑8字节对齐问题.
nb = (bytes < MIN_REQUEST)? MIN_CHUNK_SIZE : pad_request(bytes);
// 根据申请的内存大小计算在small bins中的索引号
idx = small_index(nb);
// 检查对应的链表或相邻链表中是否有空闲内存块
smallbits = gm->smallmap >> idx;
if ((smallbits & 0x3U) != 0) { /* Remainderless fit to a smallbin. */
mchunkptr b, p;
// 如果对应链表为空，就使用相邻链表中的内存块.
idx += ~smallbits & 1; /* Uses next bin if idx empty */
b = smallbin_at(gm, idx); // 取出这条链表
p = b->fd; // 这是链表中第一个空闲的内存块，也正是要分配给应用程序使用的内存块.
assert(chunksize(p) == small_index2size(idx));
unlink_first_small_chunk(gm, b, p, idx); // 将p从链表中摘除
// 对内存块做一些设置
set_inuse_and_pinuse(gm, p, small_index2size(idx));
mem = chunk2mem(p); // 这是返还给应用程序的内存块的指针
check_malloced_chunk(gm, mem, nb); // 这是一个检查函数
goto postaction; // 找到了，返回吧.
}
else if (nb > gm->dvsize) { // 申请的内存量比last remainder要大，那么就不能使用last remainder了.
// 但是其他链表中还有空闲内存块，从其他链表中分配.
if (smallbits != 0) { /* Use chunk in next nonempty smallbin */
// 首先需要做的事情就是在small bins中查找一条合适的链表，这条链表非空，并且与请求的内存量差距最小。
mchunkptr b, p, r;
size_t rsize;
bindex_t i;
binmap_t leftbits = (smallbits << idx) & left_bits(idx2bit(idx));
binmap_t leastbit = least_bit(leftbits);
compute_bit2idx(leastbit, i);
b = smallbin_at(gm, i); // b就是找到的链表
p = b->fd; // 这是链表中第一个节点，也就是要分配个应用程序的内存块。
assert(chunksize(p) == small_index2size(i));
unlink_first_small_chunk(gm, b, p, i); // 将这个节点从链表中摘除.
rsize = small_index2size(i) - nb; // 去除我们申请的内存后，这个chunk中剩余的空闲内存量.
/* Fit here cannot be remainderless if 4byte sizes */
if (SIZE_T_SIZE != 4 && rsize < MIN_CHUNK_SIZE)
set_inuse_and_pinuse(gm, p, small_index2size(i));
else { // chunk中剩余的内存量至少是8字节，因此可以继续作为一个独立的内存块使用.
set_size_and_pinuse_of_inuse_chunk(gm, p, nb);
r = chunk_plus_offset(p, nb); // 这就是分割nb后剩余的内存构成的新内存块.
set_size_and_pinuse_of_free_chunk(r, rsize);
replace_dv(gm, r, rsize); // 用这个内存块替换掉dv，原先的dv保存在合适的链表中.
}
mem = chunk2mem(p); // 这是返还给用户程序的缓冲区的指针.
check_malloced_chunk(gm, mem, nb);
goto postaction;
} // end if (smallbits != 0)
// small bins中没有空闲内存块了，因此使用tree bins中的内存块.
// 由于这个内存块大于我们请求的内存量，因此将这个内存块划分成两个内存块，
// 一个返回给用户程序使用，另一个设置成dv.
else if (gm->treemap != 0 && (mem = tmalloc_small(gm, nb)) != 0) {
check_malloced_chunk(gm, mem, nb);
goto postaction;
} // end else if (gm->treemap != 0 && (mem = tmalloc_small(gm, nb)) != 0)
} // end else if (nb > gm->dvsize)
} // end if (bytes <= MAX_SMALL_REQUEST)
else if (bytes >= MAX_REQUEST) // 这个值是0xffffffc0 用户申请的内存太大了，直接失败.
nb = MAX_SIZE_T; /* Too big to allocate. Force failure (in sys alloc) */ // #define MAX_SIZE_T (~(size_t)0)
else { // 申请的内存量超过248字节，需要从tree bins中分配内存.
nb = pad_request(bytes); // 修改申请的内存量，考虑8字节对齐，考虑malloc_tree_chunk本身占用的内存空间.
// 如果tree bins中有空闲的节点 && 成功从tree bins中分配到了内存，那么就使用这块内存.
if (gm->treemap != 0 && (mem = tmalloc_large(gm, nb)) != 0) {
check_malloced_chunk(gm, mem, nb);
goto postaction;
}
}
// 如果申请的内存量小于dv，那么就从dv中分割内存.
if (nb <= gm->dvsize) {
size_t rsize = gm->dvsize - nb; // 这是分割dv后剩余的内存量.
mchunkptr p = gm->dv;
if (rsize >= MIN_CHUNK_SIZE) { /* split dv */ // 剩余的内存还可以作为一个内存块使用
mchunkptr r = gm->dv = chunk_plus_offset(p, nb); // 这是新的dv
gm->dvsize = rsize; // 这是新dv的长度
// 进行一些设置
set_size_and_pinuse_of_free_chunk(r, rsize);
set_size_and_pinuse_of_inuse_chunk(gm, p, nb);
}
else { /* exhaust dv */ // 剩余的内存太小了，已经不能单独作为一个内存块使用了，那么就将dv全部分给用户程序
size_t dvs = gm->dvsize; // 这是分给用户程序的内存块的大小
gm->dvsize = 0;
gm->dv = 0; // 现在dv为空了
set_inuse_and_pinuse(gm, p, dvs); // 进行一些设置
}
mem = chunk2mem(p); // 这是返回给用户程序的内存区的指针
check_malloced_chunk(gm, mem, nb);
goto postaction;
}
// dv中内存不够了，那么看看top chunk中是否有足够的空闲内存.
else if (nb < gm->topsize) { /* Split top */ // 如果top chunk中有足够的空闲内存，那么就使用top chunk中的内存.
size_t rsize = gm->topsize -= nb; // 分配nb后top chunk中剩余的空闲内存.
mchunkptr p = gm->top;
mchunkptr r = gm->top = chunk_plus_offset(p, nb); // 这是新的top chunk.
r->head = rsize | PINUSE_BIT;
set_size_and_pinuse_of_inuse_chunk(gm, p, nb); // p是分配给用户程序使用的chunk，设置长度和标志.
mem = chunk2mem(p); // 这是返回给用户程序使用的内存块
check_top_chunk(gm, gm->top);
check_malloced_chunk(gm, mem, nb);
goto postaction;
}
mem = sys_alloc(gm, nb); // dlmalloc中已经没有足够的空闲内存了，向内核申请内存.
postaction:
POSTACTION(gm);
return mem; // 返回申请到的内存块
}
return 0;
}

这个分配过程还是很麻烦的，因为涉及到多种情况。分析代码流程时记住一个分配顺序就可以了：首选大小合适的内存块，其次分割dv（只有申请的内存量不超过248字节（包括malloc_chunk占用的内存）时才能使用dv），再其次分割一个大的内存块，再其次使用top chunk，最后向内核申请内存。现在分析代码，dlmalloc()首先根据申请的内存量区分了两种情况，因为small bins中内存块的最大长度是248，因此当应用程序请求的内存量不超过AX_SMALL_REQUEST（244字节，因为malloc_chunk结构要占用4字节）时可以从small bins中分配内存；如果超过了244字节那么就需要从tree bins中分配内存。

先看不超过244字节的情况。dlmalloc首先调整了申请的内存量nb = (bytes < MIN_REQUEST)? MIN_CHUNK_SIZE : pad_request(bytes);。pad_request()按照两个因素进行了调整，首先增加malloc_chunk结构占用的4字节，然后将长度按照8字节对齐，因此nb才是dlmalloc需要分配的内存块的大小。然后根据nb计算内存块所在的链表。dlmalloc按照如下顺序分配内存块：

（1）从对应的链表或相邻链表分配

从nb对应的链表中分配内存块是最理想的情况，这种情况下不需要对内存块进行任何操作，直接从链表中取一个内存块给应用程序使用就可以了。如果对应链表为空，可以考虑从相邻链表中分配内存块，相邻链表中内存块长度比对应链表大8个字节，但是dlmalloc中内存块的最小长度是16字节，因此多出来的8字节不能作为一个单独的内存块。这种情况下就没有必要对内存块进行分割了，直接将内存块给应用程序使用就可以了。

（2）从dv分配

如果nb小于dv中内存块大小，那么就将dv分割成两块，一块给应用程序使用，另一块继续作为dv。

（3）从其他链表分配

这种情况下dlmalloc将一个大的内存块分割成两块，一块给应用程序使用，另一块保存在dv中，而dv中原先的内存块保存在对应的链表中。由于内存块大于nb的链表不止一条，那么分割哪条链表中的内存块呢？dlmalloc挑选的是不为空且内存块长度与nb最接近的链表。

（4）从tree bins分配

如果前面三种情况均不能分配到内存，那么dlmalloc就使用tree bins中的内存块。由于tree bins中所有内存块长度都大于nb，因此dlmalloc从tree bins中挑选最小的内存块分割，然后将这个内存块分割成两块，一块给应用程序使用，另一块保存在dv中，而dv中原先的内存块保存在对应的链表中。这种情况是在函数tmalloc_small()中完成的。

（5）从top chunk分配

如果nb小于top chunk中的内存大小，dlmalloc就将top chunk分割成两块，一块给应用程序使用，另一块继续作为top chunk。

（6）向内核申请内存

这是最后一种情况。程序执行到这里说明dlmalloc中没有合适的内存块，只能向内核申请内存了。这是通过sys_alloc()完成的。

现在看超过244字节的情况，这种情况下也需要首先调整内存块大小。由于调整后的长度大于248字节，因此不可能从small bins中找到合适的内存块，并且dlmalloc规定不能使用dv。包含三种情况：

（1）从tree bins中分配内存

如果tree bins中正好包含长度是nb的内存块，那么直接给应用程序使用就行了。如果没有长度是nb的内存块，那么就需要将一块更大的内存块分割成两块，一块给应用程序使用，另一块保存在small bins中（如果长度不超过248字节）或tree bins中（长度超过248字节）。这是在函数tmalloc_large()中实现的。

（2）从top chunk分配内存

（3）向内核申请内存

这里就不进一步讲解tmalloc_small()和tmalloc_large()了，因为这两个函数原理很简单，就是从一棵树中挑选一个合适的内存块，然后分割成两块，一块给应用程序使用，另一块继续保存在dlmalloc中。下面详细分析dlmalloc向内核申请内存的过程。向内核申请内存时首先要考虑的问题是向内核申请多少内存？如果只满足本次需求，那么很可能应用程序下次调用malloc()时dlmalloc还需要向内核申请内存。由于系统调用效率比较低，因此比较好的办法是dlmalloc向内核多申请一些内存，这样下次就不必再向内核申请了。看下面一个数据结构：

[cpp] view plain copy print ?

struct malloc_params {
size_t magic; // 就是一个简单的魔数
size_t page_size; // 这是内存页大小
size_t granularity; // 每次向内核申请内存的最小量，一般情况下就是内存页的长度.
size_t mmap_threshold; // 这是一个阈值阈值，超过这个阈值的内存请求直接调用mmap().
size_t trim_threshold; // 这是收缩堆的阈值，top chunk的长度超过这个值时会收缩堆.
flag_t default_mflags; // 这是一些标志
};

这是dlmalloc向内核申请内存时使用的一个数据结构，我们注释了数据结构中各个字段的含义，因此dlmalloc每次至少向内核申请4kb内存。

[cpp] view plain copy print ?

static void* sys_alloc(mstate m, size_t nb) {
char* tbase = CMFAIL; // CMFAIL表示申请内存失败了.
size_t tsize = 0;
flag_t mmap_flag = 0;
init_mparams(); // 这是一个初始化函数，这个函数在初始化全局变量mparams.
/* Directly map large chunks */
// 应用程序申请的内存量超过了256kb，直接使用mmap(2)申请内存.
if (use_mmap(m) && nb >= mparams.mmap_threshold) {
void* mem = mmap_alloc(m, nb); // 使用mmap(2)向系统申请内存
if (mem != 0)
// 这种情况下dlmalloc不管理申请到的内存
return mem; // 直接返回申请到的内存
}
#if USE_MAX_ALLOWED_FOOTPRINT // 这个宏是0，跳过下面这段代码.
/* Make sure the footprint doesn't grow past max_allowed_footprint.
* This covers all cases except for where we need to page align, below.
*/
{
size_t new_footprint = m->footprint +
granularity_align(nb + TOP_FOOT_SIZE + SIZE_T_ONE);
if (new_footprint <= m->footprint || /* Check for wrap around 0 */
new_footprint > m->max_allowed_footprint)
return 0;
}
#endif
// 如果申请的内存不超过256kb，或者虽然超过256kb了但是mmap()失败了
// 会执行到下面的代码.
/*
Try getting memory in any of three ways (in most-preferred to
least-preferred order):
1. A call to MORECORE that can normally contiguously extend memory.
(disabled if not MORECORE_CONTIGUOUS or not HAVE_MORECORE or
or main space is mmapped or a previous contiguous call failed)
2. A call to MMAP new space (disabled if not HAVE_MMAP).
Note that under the default settings, if MORECORE is unable to
fulfill a request, and HAVE_MMAP is true, then mmap is
used as a noncontiguous system allocator. This is a useful backup
strategy for systems with holes in address spaces -- in this case
sbrk cannot contiguously expand the heap, but mmap may be able to
find space.
3. A call to MORECORE that cannot usually contiguously extend memory.
(disabled if not HAVE_MORECORE)
*/
#define is_mmapped_segment(S) ((S)->sflags & IS_MMAPPED_BIT)
#define is_extern_segment(S) ((S)->sflags & EXTERN_BIT)
// 通过brk()扩展内存，堆是连续的.
if (MORECORE_CONTIGUOUS && !use_noncontiguous(m)) {
char* br = CMFAIL;
// 查找包含top chunk的segment. segment到底是什么呢????
msegmentptr ss = (m->top == 0)? 0 : segment_holding(m, (char*)m->top);
size_t asize = 0;
ACQUIRE_MORECORE_LOCK();
// 如果还没有top chunk，或者top chunk不保存在任何segment中.
// 这是第一次执行brk操作，先看看这种情况.
if (ss == 0) { /* First time through or recovery */
// char* base = (char*)sbrk(0); 通过向sbrk()传入0可以获取进程中堆的结束地址
char* base = (char*)CALL_MORECORE(0);
if (base != CMFAIL) {
// 调整了向内核申请的内存量.
asize = granularity_align(nb + TOP_FOOT_SIZE + SIZE_T_ONE);
/* Adjust to end on a page boundary */
if (!is_page_aligned(base)) { // 而且堆结束地址需要按照内存页对齐
asize += (page_align((size_t)base) - (size_t)base);
#if USE_MAX_ALLOWED_FOOTPRINT
/* If the alignment pushes us over max_allowed_footprint,
* poison the upcoming call to MORECORE and continue.
*/
{
size_t new_footprint = m->footprint + asize;
if (new_footprint <= m->footprint || /* Check for wrap around 0 */
new_footprint > m->max_allowed_footprint) {
asize = HALF_MAX_SIZE_T;
}
}
#endif
} // end if (!is_page_aligned(base))
/* Can't call MORECORE if size is negative when treated as signed */
// 这里调用sbkr(2)向内核申请内存了.
if (asize < HALF_MAX_SIZE_T &&
// sbrk()返回修改前堆的结束地址.
(br = (char*)(CALL_MORECORE(asize))) == base) {
tbase = base; // 这是堆修改前的地址
tsize = asize; // 这是长度
}
} // end if (base != CMFAIL)
}
else { // 已经有top chunk了，除去top chunk中的空间，dl还需要申请这么多空间.
/* Subtract out existing available top space from MORECORE request. */
asize = granularity_align(nb - m->topsize + TOP_FOOT_SIZE + SIZE_T_ONE);
/* Use mem here only if it did continuously extend old space */
// 这里调用sbrk(2)向内核申请内存了.
if (asize < HALF_MAX_SIZE_T &&
(br = (char*)(CALL_MORECORE(asize))) == ss->base+ss->size) {
tbase = br;
tsize = asize;
}
} // end if (ss == 0)
// 内存分配过程中中间步骤失败了.
if (tbase == CMFAIL) { /* Cope with partial failure */
if (br != CMFAIL) { /* Try to use/extend the space we did get */
if (asize < HALF_MAX_SIZE_T &&
asize < nb + TOP_FOOT_SIZE + SIZE_T_ONE) {
size_t esize = granularity_align(nb + TOP_FOOT_SIZE + SIZE_T_ONE - asize);
if (esize < HALF_MAX_SIZE_T) {
char* end = (char*)CALL_MORECORE(esize); // 仍然在调用brk
if (end != CMFAIL)
asize += esize;
else { /* Can't use; try to release */
CALL_MORECORE(-asize);
br = CMFAIL;
}
}
}
}
if (br != CMFAIL) { /* Use the space we did get */
tbase = br;
tsize = asize;
}
else
disable_contiguous(m); /* Don't try contiguous path in the future */
} // end if (tbase == CMFAIL)
RELEASE_MORECORE_LOCK();
} // end if (MORECORE_CONTIGUOUS && !use_noncontiguous(m))
// 前面申请内存失败了
if (HAVE_MMAP && tbase == CMFAIL) { /* Try MMAP */
size_t req = nb + TOP_FOOT_SIZE + SIZE_T_ONE;
size_t rsize = granularity_align(req);
if (rsize > nb) { /* Fail if wraps around zero */
char* mp = (char*)(CALL_MMAP(rsize)); // 通过mmap(2)方式申请内存.
if (mp != CMFAIL) {
tbase = mp;
tsize = rsize;
mmap_flag = IS_MMAPPED_BIT;
}
}
} // end if (HAVE_MMAP && tbase == CMFAIL)
// 通过brk()申请非连续内存，Linux系统中堆应该是连续的，不存在不连续的堆.
if (HAVE_MORECORE && tbase == CMFAIL) { /* Try noncontiguous MORECORE */
size_t asize = granularity_align(nb + TOP_FOOT_SIZE + SIZE_T_ONE);
if (asize < HALF_MAX_SIZE_T) {
char* br = CMFAIL;
char* end = CMFAIL;
ACQUIRE_MORECORE_LOCK();
br = (char*)(CALL_MORECORE(asize));
end = (char*)(CALL_MORECORE(0));
RELEASE_MORECORE_LOCK();
if (br != CMFAIL && end != CMFAIL && br < end) {
size_t ssize = end - br;
if (ssize > nb + TOP_FOOT_SIZE) {
tbase = br;
tsize = ssize;
}
}
}
} // end if (HAVE_MORECORE && tbase == CMFAIL)
// tbase != CMFAIL 表示申请内存成功了，现在进行一些设置.
if (tbase != CMFAIL) {
if ((m->footprint += tsize) > m->max_footprint)
m->max_footprint = m->footprint;
// 如果malloc_state结构还没有初始化，那么先对malloc_state结构初始化.
if (!is_initialized(m)) { /* first-time initialization */
m->seg.base = m->least_addr = tbase; // 这是起始地址
m->seg.size = tsize; // 这是长度
m->seg.sflags = mmap_flag; // 标志，是否通过mmap()创建的.
m->magic = mparams.magic; // magic
init_bins(m); // 这个函数在初始化small bins
if (is_global(m))
init_top(m, (mchunkptr)tbase, tsize - TOP_FOOT_SIZE);
else {
/* Offset top by embedded malloc_state */
mchunkptr mn = next_chunk(mem2chunk(m));
init_top(m, mn, (size_t)((tbase + tsize) - (char*)mn) -TOP_FOOT_SIZE);
}
}
else { // 尝试合并
/* Try to merge with an existing segment */
msegmentptr sp = &m->seg; // 这是malloc_state中第一个segment.
while (sp != 0 && tbase != sp->base + sp->size)
sp = sp->next; // 查找连续的segment.
if (sp != 0 &&
!is_extern_segment(sp) &&
(sp->sflags & IS_MMAPPED_BIT) == mmap_flag &&
segment_holds(sp, m->top)) { /* append */ // 新申请的内存跟系统中某个segment连续.
sp->size += tsize; // 修改这个segment的长度
init_top(m, m->top, m->topsize + tsize);
}
else { // 新申请的内存跟系统中已经存在的segment不连续.
if (tbase < m->least_addr)
m->least_addr = tbase; // 设置新的least_addr，这个值只供数据检查使用.
sp = &m->seg; // 这是存放segment结构的链表头节点
while (sp != 0 && sp->base != tbase + tsize)
sp = sp->next; // 查找新申请的内存是否位于某个segment之前.
if (sp != 0 &&
!is_extern_segment(sp) &&
(sp->sflags & IS_MMAPPED_BIT) == mmap_flag) {
char* oldbase = sp->base; // 这是segment原先的起始地址
sp->base = tbase; // 重新设置新的起始地址和长度
sp->size += tsize;
return prepend_alloc(m, tbase, oldbase, nb);
}
else
add_segment(m, tbase, tsize, mmap_flag); // 将一个新的segment添加到链表中.
}
} // end if (!is_initialized(m)))
// 从top chunk中分配内存.
if (nb < m->topsize) { /* Allocate from new or extended top space */
size_t rsize = m->topsize -= nb; // 这是top chunk中剩余的空闲内存量
mchunkptr p = m->top; // 这是top chunk的起始地址
mchunkptr r = m->top = chunk_plus_offset(p, nb); // 将这里看作一个新的chunk，这是新的top chunk.
r->head = rsize | PINUSE_BIT; // 这是top chunk中的内存量
set_size_and_pinuse_of_inuse_chunk(m, p, nb); // 设置供用户程序使用的内存块
check_top_chunk(m, m->top);
check_malloced_chunk(m, chunk2mem(p), nb);
return chunk2mem(p); // 返回内存块的地址给应用程序.
}
} // end if (tbase != CMFAIL)
MALLOC_FAILURE_ACTION;
return 0;
}

这个函数也相当复杂，因为dlmalloc适用于各种操作系统，每种系统申请内存的方式不一定相同。Linux系统包含两种方式：（1）brk()扩展堆；（2）mmap()映射一块新的内存区。malloc_params结构中的mmap_threshold是一个阈值，默认值是256kb，当申请的内存量超过这个阈值时dlmalloc首先mmap()方式映射一块单独的内存区域，如果mmap()失败了dlmalloc尝试brk()方式扩展堆。如果申请的内存量没有超过这个阈值dlmalloc首先brk()方式，如果brk()失败了dlmalloc再尝试mmap()方式。

[cpp] view plain copy print ?

void* dlmalloc(size_t bytes) {
/*
Basic algorithm: 算法描述
If a small request (< 256 bytes minus per-chunk overhead):
1. If one exists, use a remainderless chunk in associated smallbin.
(Remainderless means that there are too few excess bytes to
represent as a chunk.)
2. If it is big enough, use the dv chunk, which is normally the
chunk adjacent to the one used for the most recent small request.
3. If one exists, split the smallest available chunk in a bin,
saving remainder in dv.
4. If it is big enough, use the top chunk.
5. If available, get memory from system and use it
Otherwise, for a large request:
1. Find the smallest available binned chunk that fits, and use it
if it is better fitting than dv chunk, splitting if necessary.
2. If better fitting than any binned chunk, use the dv chunk.
3. If it is big enough, use the top chunk.
4. If request size >= mmap threshold, try to directly mmap this chunk.
5. If available, get memory from system and use it
The ugly goto's here ensure that postaction occurs along all paths.
*/
if (!PREACTION(gm)) {
void* mem;
size_t nb;
// 如果申请的内存量小于244字节，表示是小块内存.
if (bytes <= MAX_SMALL_REQUEST) { // 244字节
bindex_t idx;
binmap_t smallbits;
// 修改申请的内存量，考虑malloc_chunk占用的内存，考虑8字节对齐问题.
nb = (bytes < MIN_REQUEST)? MIN_CHUNK_SIZE : pad_request(bytes);
// 根据申请的内存大小计算在small bins中的索引号
idx = small_index(nb);
// 检查对应的链表或相邻链表中是否有空闲内存块
smallbits = gm->smallmap >> idx;
if ((smallbits & 0x3U) != 0) { /* Remainderless fit to a smallbin. */
mchunkptr b, p;
// 如果对应链表为空，就使用相邻链表中的内存块.
idx += ~smallbits & 1; /* Uses next bin if idx empty */
b = smallbin_at(gm, idx); // 取出这条链表
p = b->fd; // 这是链表中第一个空闲的内存块，也正是要分配给应用程序使用的内存块.
assert(chunksize(p) == small_index2size(idx));
unlink_first_small_chunk(gm, b, p, idx); // 将p从链表中摘除
// 对内存块做一些设置
set_inuse_and_pinuse(gm, p, small_index2size(idx));
mem = chunk2mem(p); // 这是返还给应用程序的内存块的指针
check_malloced_chunk(gm, mem, nb); // 这是一个检查函数
goto postaction; // 找到了，返回吧.
}
else if (nb > gm->dvsize) { // 申请的内存量比last remainder要大，那么就不能使用last remainder了.
// 但是其他链表中还有空闲内存块，从其他链表中分配.
if (smallbits != 0) { /* Use chunk in next nonempty smallbin */
// 首先需要做的事情就是在small bins中查找一条合适的链表，这条链表非空，并且与请求的内存量差距最小。
mchunkptr b, p, r;
size_t rsize;
bindex_t i;
binmap_t leftbits = (smallbits << idx) & left_bits(idx2bit(idx));
binmap_t leastbit = least_bit(leftbits);
compute_bit2idx(leastbit, i);
b = smallbin_at(gm, i); // b就是找到的链表
p = b->fd; // 这是链表中第一个节点，也就是要分配个应用程序的内存块。
assert(chunksize(p) == small_index2size(i));
unlink_first_small_chunk(gm, b, p, i); // 将这个节点从链表中摘除.
rsize = small_index2size(i) - nb; // 去除我们申请的内存后，这个chunk中剩余的空闲内存量.
/* Fit here cannot be remainderless if 4byte sizes */
if (SIZE_T_SIZE != 4 && rsize < MIN_CHUNK_SIZE)
set_inuse_and_pinuse(gm, p, small_index2size(i));
else { // chunk中剩余的内存量至少是8字节，因此可以继续作为一个独立的内存块使用.
set_size_and_pinuse_of_inuse_chunk(gm, p, nb);
r = chunk_plus_offset(p, nb); // 这就是分割nb后剩余的内存构成的新内存块.
set_size_and_pinuse_of_free_chunk(r, rsize);
replace_dv(gm, r, rsize); // 用这个内存块替换掉dv，原先的dv保存在合适的链表中.
}
mem = chunk2mem(p); // 这是返还给用户程序的缓冲区的指针.
check_malloced_chunk(gm, mem, nb);
goto postaction;
} // end if (smallbits != 0)
// small bins中没有空闲内存块了，因此使用tree bins中的内存块.
// 由于这个内存块大于我们请求的内存量，因此将这个内存块划分成两个内存块，
// 一个返回给用户程序使用，另一个设置成dv.
else if (gm->treemap != 0 && (mem = tmalloc_small(gm, nb)) != 0) {
check_malloced_chunk(gm, mem, nb);
goto postaction;
} // end else if (gm->treemap != 0 && (mem = tmalloc_small(gm, nb)) != 0)
} // end else if (nb > gm->dvsize)
} // end if (bytes <= MAX_SMALL_REQUEST)
else if (bytes >= MAX_REQUEST) // 这个值是0xffffffc0 用户申请的内存太大了，直接失败.
nb = MAX_SIZE_T; /* Too big to allocate. Force failure (in sys alloc) */ // #define MAX_SIZE_T (~(size_t)0)
else { // 申请的内存量超过248字节，需要从tree bins中分配内存.
nb = pad_request(bytes); // 修改申请的内存量，考虑8字节对齐，考虑malloc_tree_chunk本身占用的内存空间.
// 如果tree bins中有空闲的节点 && 成功从tree bins中分配到了内存，那么就使用这块内存.
if (gm->treemap != 0 && (mem = tmalloc_large(gm, nb)) != 0) {
check_malloced_chunk(gm, mem, nb);
goto postaction;
}
}
// 如果申请的内存量小于dv，那么就从dv中分割内存.
if (nb <= gm->dvsize) {
size_t rsize = gm->dvsize - nb; // 这是分割dv后剩余的内存量.
mchunkptr p = gm->dv;
if (rsize >= MIN_CHUNK_SIZE) { /* split dv */ // 剩余的内存还可以作为一个内存块使用
mchunkptr r = gm->dv = chunk_plus_offset(p, nb); // 这是新的dv
gm->dvsize = rsize; // 这是新dv的长度
// 进行一些设置
set_size_and_pinuse_of_free_chunk(r, rsize);
set_size_and_pinuse_of_inuse_chunk(gm, p, nb);
}
else { /* exhaust dv */ // 剩余的内存太小了，已经不能单独作为一个内存块使用了，那么就将dv全部分给用户程序
size_t dvs = gm->dvsize; // 这是分给用户程序的内存块的大小
gm->dvsize = 0;
gm->dv = 0; // 现在dv为空了
set_inuse_and_pinuse(gm, p, dvs); // 进行一些设置
}
mem = chunk2mem(p); // 这是返回给用户程序的内存区的指针
check_malloced_chunk(gm, mem, nb);
goto postaction;
}
// dv中内存不够了，那么看看top chunk中是否有足够的空闲内存.
else if (nb < gm->topsize) { /* Split top */ // 如果top chunk中有足够的空闲内存，那么就使用top chunk中的内存.
size_t rsize = gm->topsize -= nb; // 分配nb后top chunk中剩余的空闲内存.
mchunkptr p = gm->top;
mchunkptr r = gm->top = chunk_plus_offset(p, nb); // 这是新的top chunk.
r->head = rsize | PINUSE_BIT;
set_size_and_pinuse_of_inuse_chunk(gm, p, nb); // p是分配给用户程序使用的chunk，设置长度和标志.
mem = chunk2mem(p); // 这是返回给用户程序使用的内存块
check_top_chunk(gm, gm->top);
check_malloced_chunk(gm, mem, nb);
goto postaction;
}
mem = sys_alloc(gm, nb); // dlmalloc中已经没有足够的空闲内存了，向内核申请内存.
postaction:
POSTACTION(gm);
return mem; // 返回申请到的内存块
}
return 0;
}

（1）从对应的链表或相邻链表分配

（2）从dv分配

如果nb小于dv中内存块大小，那么就将dv分割成两块，一块给应用程序使用，另一块继续作为dv。

（3）从其他链表分配

（4）从tree bins分配

（5）从top chunk分配

如果nb小于top chunk中的内存大小，dlmalloc就将top chunk分割成两块，一块给应用程序使用，另一块继续作为top chunk。

（6）向内核申请内存

这是最后一种情况。程序执行到这里说明dlmalloc中没有合适的内存块，只能向内核申请内存了。这是通过sys_alloc()完成的。

（1）从tree bins中分配内存

（2）从top chunk分配内存

（3）向内核申请内存

[cpp] view plain copy print ?

struct malloc_params {
size_t magic; // 就是一个简单的魔数
size_t page_size; // 这是内存页大小
size_t granularity; // 每次向内核申请内存的最小量，一般情况下就是内存页的长度.
size_t mmap_threshold; // 这是一个阈值阈值，超过这个阈值的内存请求直接调用mmap().
size_t trim_threshold; // 这是收缩堆的阈值，top chunk的长度超过这个值时会收缩堆.
flag_t default_mflags; // 这是一些标志
};

这是dlmalloc向内核申请内存时使用的一个数据结构，我们注释了数据结构中各个字段的含义，因此dlmalloc每次至少向内核申请4kb内存。

[cpp] view plain copy print ?

static void* sys_alloc(mstate m, size_t nb) {
char* tbase = CMFAIL; // CMFAIL表示申请内存失败了.
size_t tsize = 0;
flag_t mmap_flag = 0;
init_mparams(); // 这是一个初始化函数，这个函数在初始化全局变量mparams.
/* Directly map large chunks */
// 应用程序申请的内存量超过了256kb，直接使用mmap(2)申请内存.
if (use_mmap(m) && nb >= mparams.mmap_threshold) {
void* mem = mmap_alloc(m, nb); // 使用mmap(2)向系统申请内存
if (mem != 0)
// 这种情况下dlmalloc不管理申请到的内存
return mem; // 直接返回申请到的内存
}
#if USE_MAX_ALLOWED_FOOTPRINT // 这个宏是0，跳过下面这段代码.
/* Make sure the footprint doesn't grow past max_allowed_footprint.
* This covers all cases except for where we need to page align, below.
*/
{
size_t new_footprint = m->footprint +
granularity_align(nb + TOP_FOOT_SIZE + SIZE_T_ONE);
if (new_footprint <= m->footprint || /* Check for wrap around 0 */
new_footprint > m->max_allowed_footprint)
return 0;
}
#endif
// 如果申请的内存不超过256kb，或者虽然超过256kb了但是mmap()失败了
// 会执行到下面的代码.
/*
Try getting memory in any of three ways (in most-preferred to
least-preferred order):
1. A call to MORECORE that can normally contiguously extend memory.
(disabled if not MORECORE_CONTIGUOUS or not HAVE_MORECORE or
or main space is mmapped or a previous contiguous call failed)
2. A call to MMAP new space (disabled if not HAVE_MMAP).
Note that under the default settings, if MORECORE is unable to
fulfill a request, and HAVE_MMAP is true, then mmap is
used as a noncontiguous system allocator. This is a useful backup
strategy for systems with holes in address spaces -- in this case
sbrk cannot contiguously expand the heap, but mmap may be able to
find space.
3. A call to MORECORE that cannot usually contiguously extend memory.
(disabled if not HAVE_MORECORE)
*/
#define is_mmapped_segment(S) ((S)->sflags & IS_MMAPPED_BIT)
#define is_extern_segment(S) ((S)->sflags & EXTERN_BIT)
// 通过brk()扩展内存，堆是连续的.
if (MORECORE_CONTIGUOUS && !use_noncontiguous(m)) {
char* br = CMFAIL;
// 查找包含top chunk的segment. segment到底是什么呢????
msegmentptr ss = (m->top == 0)? 0 : segment_holding(m, (char*)m->top);
size_t asize = 0;
ACQUIRE_MORECORE_LOCK();
// 如果还没有top chunk，或者top chunk不保存在任何segment中.
// 这是第一次执行brk操作，先看看这种情况.
if (ss == 0) { /* First time through or recovery */
// char* base = (char*)sbrk(0); 通过向sbrk()传入0可以获取进程中堆的结束地址
char* base = (char*)CALL_MORECORE(0);
if (base != CMFAIL) {
// 调整了向内核申请的内存量.
asize = granularity_align(nb + TOP_FOOT_SIZE + SIZE_T_ONE);
/* Adjust to end on a page boundary */
if (!is_page_aligned(base)) { // 而且堆结束地址需要按照内存页对齐
asize += (page_align((size_t)base) - (size_t)base);
#if USE_MAX_ALLOWED_FOOTPRINT
/* If the alignment pushes us over max_allowed_footprint,
* poison the upcoming call to MORECORE and continue.
*/
{
size_t new_footprint = m->footprint + asize;
if (new_footprint <= m->footprint || /* Check for wrap around 0 */
new_footprint > m->max_allowed_footprint) {
asize = HALF_MAX_SIZE_T;
}
}
#endif
} // end if (!is_page_aligned(base))
/* Can't call MORECORE if size is negative when treated as signed */
// 这里调用sbkr(2)向内核申请内存了.
if (asize < HALF_MAX_SIZE_T &&
// sbrk()返回修改前堆的结束地址.
(br = (char*)(CALL_MORECORE(asize))) == base) {
tbase = base; // 这是堆修改前的地址
tsize = asize; // 这是长度
}
} // end if (base != CMFAIL)
}
else { // 已经有top chunk了，除去top chunk中的空间，dl还需要申请这么多空间.
/* Subtract out existing available top space from MORECORE request. */
asize = granularity_align(nb - m->topsize + TOP_FOOT_SIZE + SIZE_T_ONE);
/* Use mem here only if it did continuously extend old space */
// 这里调用sbrk(2)向内核申请内存了.
if (asize < HALF_MAX_SIZE_T &&
(br = (char*)(CALL_MORECORE(asize))) == ss->base+ss->size) {
tbase = br;
tsize = asize;
}
} // end if (ss == 0)
// 内存分配过程中中间步骤失败了.
if (tbase == CMFAIL) { /* Cope with partial failure */
if (br != CMFAIL) { /* Try to use/extend the space we did get */
if (asize < HALF_MAX_SIZE_T &&
asize < nb + TOP_FOOT_SIZE + SIZE_T_ONE) {
size_t esize = granularity_align(nb + TOP_FOOT_SIZE + SIZE_T_ONE - asize);
if (esize < HALF_MAX_SIZE_T) {
char* end = (char*)CALL_MORECORE(esize); // 仍然在调用brk
if (end != CMFAIL)
asize += esize;
else { /* Can't use; try to release */
CALL_MORECORE(-asize);
br = CMFAIL;
}
}
}
}
if (br != CMFAIL) { /* Use the space we did get */
tbase = br;
tsize = asize;
}
else
disable_contiguous(m); /* Don't try contiguous path in the future */
} // end if (tbase == CMFAIL)
RELEASE_MORECORE_LOCK();
} // end if (MORECORE_CONTIGUOUS && !use_noncontiguous(m))
// 前面申请内存失败了
if (HAVE_MMAP && tbase == CMFAIL) { /* Try MMAP */
size_t req = nb + TOP_FOOT_SIZE + SIZE_T_ONE;
size_t rsize = granularity_align(req);
if (rsize > nb) { /* Fail if wraps around zero */
char* mp = (char*)(CALL_MMAP(rsize)); // 通过mmap(2)方式申请内存.
if (mp != CMFAIL) {
tbase = mp;
tsize = rsize;
mmap_flag = IS_MMAPPED_BIT;
}
}
} // end if (HAVE_MMAP && tbase == CMFAIL)
// 通过brk()申请非连续内存，Linux系统中堆应该是连续的，不存在不连续的堆.
if (HAVE_MORECORE && tbase == CMFAIL) { /* Try noncontiguous MORECORE */
size_t asize = granularity_align(nb + TOP_FOOT_SIZE + SIZE_T_ONE);
if (asize < HALF_MAX_SIZE_T) {
char* br = CMFAIL;
char* end = CMFAIL;
ACQUIRE_MORECORE_LOCK();
br = (char*)(CALL_MORECORE(asize));
end = (char*)(CALL_MORECORE(0));
RELEASE_MORECORE_LOCK();
if (br != CMFAIL && end != CMFAIL && br < end) {
size_t ssize = end - br;
if (ssize > nb + TOP_FOOT_SIZE) {
tbase = br;
tsize = ssize;
}
}
}
} // end if (HAVE_MORECORE && tbase == CMFAIL)
// tbase != CMFAIL 表示申请内存成功了，现在进行一些设置.
if (tbase != CMFAIL) {
if ((m->footprint += tsize) > m->max_footprint)
m->max_footprint = m->footprint;
// 如果malloc_state结构还没有初始化，那么先对malloc_state结构初始化.
if (!is_initialized(m)) { /* first-time initialization */
m->seg.base = m->least_addr = tbase; // 这是起始地址
m->seg.size = tsize; // 这是长度
m->seg.sflags = mmap_flag; // 标志，是否通过mmap()创建的.
m->magic = mparams.magic; // magic
init_bins(m); // 这个函数在初始化small bins
if (is_global(m))
init_top(m, (mchunkptr)tbase, tsize - TOP_FOOT_SIZE);
else {
/* Offset top by embedded malloc_state */
mchunkptr mn = next_chunk(mem2chunk(m));
init_top(m, mn, (size_t)((tbase + tsize) - (char*)mn) -TOP_FOOT_SIZE);
}
}
else { // 尝试合并
/* Try to merge with an existing segment */
msegmentptr sp = &m->seg; // 这是malloc_state中第一个segment.
while (sp != 0 && tbase != sp->base + sp->size)
sp = sp->next; // 查找连续的segment.
if (sp != 0 &&
!is_extern_segment(sp) &&
(sp->sflags & IS_MMAPPED_BIT) == mmap_flag &&
segment_holds(sp, m->top)) { /* append */ // 新申请的内存跟系统中某个segment连续.
sp->size += tsize; // 修改这个segment的长度
init_top(m, m->top, m->topsize + tsize);
}
else { // 新申请的内存跟系统中已经存在的segment不连续.
if (tbase < m->least_addr)
m->least_addr = tbase; // 设置新的least_addr，这个值只供数据检查使用.
sp = &m->seg; // 这是存放segment结构的链表头节点
while (sp != 0 && sp->base != tbase + tsize)
sp = sp->next; // 查找新申请的内存是否位于某个segment之前.
if (sp != 0 &&
!is_extern_segment(sp) &&
(sp->sflags & IS_MMAPPED_BIT) == mmap_flag) {
char* oldbase = sp->base; // 这是segment原先的起始地址
sp->base = tbase; // 重新设置新的起始地址和长度
sp->size += tsize;
return prepend_alloc(m, tbase, oldbase, nb);
}
else
add_segment(m, tbase, tsize, mmap_flag); // 将一个新的segment添加到链表中.
}
} // end if (!is_initialized(m)))
// 从top chunk中分配内存.
if (nb < m->topsize) { /* Allocate from new or extended top space */
size_t rsize = m->topsize -= nb; // 这是top chunk中剩余的空闲内存量
mchunkptr p = m->top; // 这是top chunk的起始地址
mchunkptr r = m->top = chunk_plus_offset(p, nb); // 将这里看作一个新的chunk，这是新的top chunk.
r->head = rsize | PINUSE_BIT; // 这是top chunk中的内存量
set_size_and_pinuse_of_inuse_chunk(m, p, nb); // 设置供用户程序使用的内存块
check_top_chunk(m, m->top);
check_malloced_chunk(m, chunk2mem(p), nb);
return chunk2mem(p); // 返回内存块的地址给应用程序.
}
} // end if (tbase != CMFAIL)
MALLOC_FAILURE_ACTION;
return 0;
}

这篇文章我们来讲讲释放内存的过程，也就是free()的代码流程。对于应用程序来说释放内存很简单，直接调用free(ptr)就可以了，参数是要释放的内存块指针。那么，释放内存时dlmalloc做了哪些工作呢？

[cpp] view plain copy print ?

// 这是释放内存的函数，调用free()后执行到这里.
// 参数mem: 这是将要释放内存的指针
void dlfree(void* mem) {
/*
Consolidate freed chunks with preceeding or succeeding bordering
free chunks, if they exist, and then place in a bin. Intermixed
with special cases for top, dv, mmapped chunks, and usage errors.
*/
// 如果是空指针，那么就不需要处理了.
if (mem != 0) {
mchunkptr p = mem2chunk(mem); // 首先找到内存块的起始地址 p = mem - 8.
#if FOOTERS // 将这个宏看作是0就可以了
mstate fm = get_mstate_for(p);
if (!ok_magic(fm)) {
USAGE_ERROR_ACTION(fm, p);
return;
}
#else /* FOOTERS */
#define fm gm // 全局变量_gm_的地址
#endif /* FOOTERS */
if (!PREACTION(fm)) { // 先加锁
check_inuse_chunk(fm, p); // 检查这个chunk是否在使用中，这是一个检查函数.
if (RTCHECK(ok_address(fm, p) && ok_cinuse(p))) {
size_t psize = chunksize(p); // 计算这个内存块的大小.
mchunkptr next = chunk_plus_offset(p, psize); // 从这里开始是下一个内存块了.
if (!pinuse(p)) { // 如果前面一个内存块是空闲的，那么这个内存块释放后就可以跟前面一个内存块合并了.
size_t prevsize = p->prev_foot; // 前面一个内存块的大小
if ((prevsize & IS_MMAPPED_BIT) != 0) { // 如果是通过mmap方式创建的内存块
prevsize &= ~IS_MMAPPED_BIT;
psize += prevsize + MMAP_FOOT_PAD;
if (CALL_MUNMAP((char*)p - prevsize, psize) == 0)
fm->footprint -= psize;
goto postaction;
}
else { // 不是通过mmap方式创建的.
mchunkptr prev = chunk_minus_offset(p, prevsize); // 取出前面一个chunk的结构.
psize += prevsize; // 这是两个内存块的总长度
p = prev; // 这是内存块的起始地址
if (RTCHECK(ok_address(fm, prev))) { /* consolidate backward */
if (p != fm->dv) { // 如果不是dv
unlink_chunk(fm, p, prevsize); // 将这个内存块从malloc_state结构中删除.
}
// 如果是dv
else if ((next->head & INUSE_BITS) == INUSE_BITS) { // 后面一个内存块在使用中，那么就处理完毕了.
fm->dvsize = psize; // 修改这个chunk的长度.
set_free_with_pinuse(p, psize, next);
goto postaction; // 处理完毕
}
// 如果后面一个内存块也是空间的，那么还需要将后面一个内存块合并到dv中.
}
else
goto erroraction;
} // end if ((prevsize & IS_MMAPPED_BIT) != 0)
} // end if (!pinuse(p))
// 需要继续检查后面一个内存块是否空闲.
if (RTCHECK(ok_next(p, next) && ok_pinuse(next))) {
if (!cinuse(next)) { /* consolidate forward */ // 后面一个内存块也处于空闲状态，那么就可以合并了.
if (next == fm->top) { // 如果后面一个chunk是top chunk，那么直接将当前合并到top chunk中就可以了.
size_t tsize = fm->topsize += psize; // 这是合并后top chunk的大小
fm->top = p; // 这是合并后top chunk的起始地址
p->head = tsize | PINUSE_BIT;
if (p == fm->dv) { // 同时也是dv，那么就撤销dv.
fm->dv = 0;
fm->dvsize = 0;
}
// 现在检查是否需要收缩堆空间，当top chunk大于2mb时收缩堆空间.
if (should_trim(fm, tsize))
sys_trim(fm, 0); // 只有这种情况下执行到了sys_trim.
goto postaction;
}
else if (next == fm->dv) { // 如果后面一个chunk是dv，那么直接将本内存块合并到dv中就可以了.
size_t dsize = fm->dvsize += psize; // 这是合并后dv的大小
fm->dv = p; // 设置dv新的起始地址
set_size_and_pinuse_of_free_chunk(p, dsize); // 设置dv新的长度
goto postaction;
}
else { // 后面一个chunk是一个普通的chunk.
size_t nsize = chunksize(next);
psize += nsize;
unlink_chunk(fm, next, nsize); // 先将后面的chunk从malloc_state中摘除.
set_size_and_pinuse_of_free_chunk(p, psize);
if (p == fm->dv) {
fm->dvsize = psize;
goto postaction;
}
}
} // end if (!cinuse(next))
else // 后面一个chunk在使用中
set_free_with_pinuse(p, psize, next); // 修改一些标志信息
insert_chunk(fm, p, psize); // 将合并后内存块的大小将内存块添加到small bins或者tree bins中.
check_free_chunk(fm, p);
goto postaction;
} // end if (RTCHECK(ok_next(p, next) && ok_pinuse(next)))
}
erroraction:
USAGE_ERROR_ACTION(fm, p);
postaction:
POSTACTION(fm);
}
}
#if !FOOTERS
#undef fm
#endif /* FOOTERS */
}

又是很长一大段代码。这段代码首先将内存块标记为空闲，然后根据内存申请方式分别处理。如果内存块大于256kb，那么马上通过munmap()释放内存。如果内存块小于256kb，那么检查相邻的两个内存块是否空闲，如果空闲就跟相邻的内存块合并。然后还需要检查top chunk是否大于2mb。如果top chunk大于2mb，将top chunk释放回内核。

内存块大于256kb时释放内存的代码如下：

[cpp] view plain copy print ?

size_t prevsize = p->prev_foot; // 前面一个内存块的大小
if ((prevsize & IS_MMAPPED_BIT) != 0) { // 如果是通过mmap方式创建的内存块
prevsize &= ~IS_MMAPPED_BIT;
psize += prevsize + MMAP_FOOT_PAD;
if (CALL_MUNMAP((char*)p - prevsize, psize) == 0)
fm->footprint -= psize;
goto postaction;
}

p->prev_foot包含了两项信息：前一个内存块的长度和前一个内存块的创建方式（mmap还是brk）。当申请的内存块大于256kb时dlmalloc通过mmap()申请内存，并为这个内存块创建了一个malloc_chunk结构。由于只有一个malloc_chunk结构，没有相邻的malloc_chunk结构，因此malloc_chunk中的prev_foot字段就没有意义了。这时dlmalloc将prev_foot中比特0用作标志位IS_MMAPPED_BIT，表示这个内存块是通过mmap()方式创建的。因此，如果prev_foot中的IS_MMAPPED_BIT置位了，那么就调用munmap()释放内存（CALL_MUNMAP）。
最后来看看dlmalloc收缩top chunk的代码，这是在函数sys_trim()中实现的，代码如下：

[cpp] view plain copy print ?

static int sys_trim(mstate m, size_t pad) {
size_t released = 0;
if (pad < MAX_REQUEST && is_initialized(m)) {
pad += TOP_FOOT_SIZE; /* ensure enough room for segment overhead */
// 调整pad，pad表示需要保留的内存量.
if (m->topsize > pad) {
/* Shrink top space in granularity-size units, keeping at least one */
size_t unit = mparams.granularity; // 申请/释放内存需要是这个值的倍数.
// 这是需要释放的内存量.
size_t extra = ((m->topsize - pad + (unit - SIZE_T_ONE)) / unit -
SIZE_T_ONE) * unit;
// 取出包含top chunk的segment.
msegmentptr sp = segment_holding(m, (char*)m->top);
if (!is_extern_segment(sp)) {
// 这个segment是通过mmap方式创建的，那么就通过munmap()或者mremap()方式释放内存.
if (is_mmapped_segment(sp)) {
if (HAVE_MMAP &&
sp->size >= extra && // extra是将要释放的内存量
!has_segment_link(m, sp)) { /* can't shrink if pinned */
size_t newsize = sp->size - extra; // 计算释放后剩余的内存量
if ((CALL_MREMAP(sp->base, sp->size, newsize, 0) != MFAIL) ||
(CALL_MUNMAP(sp->base + newsize, extra) == 0)) {
released = extra;
}
}
}
// 这个segment是通过brk方式创建的，那么就通过brk()调整堆的结束位置.
else if (HAVE_MORECORE) {
if (extra >= HALF_MAX_SIZE_T) /* Avoid wrapping negative */
extra = (HALF_MAX_SIZE_T) + SIZE_T_ONE - unit;
ACQUIRE_MORECORE_LOCK();
{
/* Make sure end of memory is where we last set it. */
char* old_br = (char*)(CALL_MORECORE(0)); // 获取当前堆的结束地址.
if (old_br == sp->base + sp->size) {
// 开始收缩堆
char* rel_br = (char*)(CALL_MORECORE(-extra)); // sbrk()
char* new_br = (char*)(CALL_MORECORE(0));
if (rel_br != CMFAIL && new_br < old_br)
released = old_br - new_br;
}
}
RELEASE_MORECORE_LOCK();
}
}
if (released != 0) {
sp->size -= released;
m->footprint -= released;
init_top(m, m->top, m->topsize - released); // 重新初始化top chunk.
check_top_chunk(m, m->top);
}
} // end if (m->topsize > pad)
/* Unmap any unused mmapped segments */
if (HAVE_MMAP)
released += release_unused_segments(m);
/* On failure, disable autotrim to avoid repeated failed future calls */
if (released == 0)
m->trim_check = MAX_SIZE_T;
}
return (released != 0)? 1 : 0;
}

当申请的内存量小于256kb时，dlmalloc首先通过brk()方式扩展堆，如果失败了会尝试通过mmap()方式申请内存。因此，top chunk可能是通过brk()方式申请的，也可能是通过mmap()方式申请的。如果通过brk()方式申请的，那么就需要通过brk()收缩堆；如果通过mmap()方式申请的，那么就需要通过munmap()或mremap()释放内存。

你可能感兴趣的:(dlmalloc源码分析)

JVM源码分析之堆外内存完全解读 HeapDump性能社区
概述广义的堆外内存说到堆外内存，那大家肯定想到堆内内存，这也是我们大家接触最多的，我们在jvm参数里通常设置-Xmx来指定我们的堆的最大值，不过这还不是我们理解的Java堆，-Xmx的值是新生代和老生代的和的最大值，我们在jvm参数里通常还会加一个参数-XX:MaxPermSize来指定持久代的最大值，那么我们认识的Java堆的最大值其实是-Xmx和-XX:MaxPermSize的总和，在分代算法
Golang Channel PandaSkr golang
Channel解析1.Channel源码分析1.1Channel数据结构typehchanstruct{qcountuint//channel的元素数量dataqsizuint//channel循环队列长度bufunsafe.Pointer//指向循环队列的指针elemsizeuint16//元素大小closeduint32//channel是否关闭0-未关闭elemtype*_type//元素类
Java集合类框架源码分析之 RoleList源码解析【6】 yunzhonghefei Java集合类源码分析 RoleList源码解析
该类继承于ArrayList，针对Role进行了一些扩展。其他方法和ArrayList中基本相同，源码不做针对性分析：看一下类简介：/***代表了一个roles的列表，作为方法setRoles()的参数，去创建一个关联关系，并且尝试在同一个关系中设置多个角色。*ARoleListrepresentsalistofroles(Roleobjects).Itisusedas*parameterwhen
【鸿蒙OH-v5.0源码分析之 Linux Kernel 部分】004 - Kernel 启动引导代码head.S 源码逐行分析 "小夜猫&小懒虫&小财迷"的男人鸿蒙OH-v5.0源码分析之 Uboot+Kernel 部分 harmonyos linux 华为
【鸿蒙OH-v5.0源码分析之LinuxKernel部分】004-Kernel启动引导代码head.S源码逐行分析系列文章汇总：《鸿蒙OH-v5.0源码分析之Uboot+Kernel部分】000-文章链接汇总》本文链接：《【鸿蒙OH-v5.0源码分析之LinuxKernel部分】004-Kernel启动引导代码head.S源码逐行分析》head.S主要工作如下：保存内核启动参数,无效化处理器缓存(
Java高并发编程详解系列-深入理解Thread构造 nihui123 高并发 Java高并发 Java 高并发
上篇分享中主要是对线程的基本概念和基本操作做了一个分享，同时提出了两种常用的创建多线程的方法，当然在后期的分享中也会提及到更多的创建线程的方式，到后期的分享的时候再说。这次主要是深入的理解一下Thread的构造函数，通过构造函数对于Thread有一个更加深入的了解。这里首先提供一个JDK1.6的ThreadAPI截图线程命名规范从源码分析可以看到在Thread类中默认提供了线程的命名方式，这个
【QT教程】QT6硬件图形界面编程 QT硬件编程 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 c++QT教程
QT6硬件图形界面编程使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QT6硬件图形界面编程概述1.1QT6硬件图形界面编程简介1.1.1QT6硬件
Jetpack LiveData源码分析 xiangxiongfly915 #Android Jetpack系列 Jetpack LiveData 源码分析
文章目录JetpackLiveData源码分析前提源码分析注册订阅流程LiveData#observe()LifecycleRegistry#addObserver()ObserverWithState#dispatchEvent()LiveData#removeObserver()LiveData$LifecycleBoundObserver类LifecycleBoundObserver#sho
ExoPlayer架构详解与源码分析（17）——TrackSelector 山雨楼 ExoPlayer 架构 android 音视频 ExoPlayer Media3 源码
系列文章目录ExoPlayer架构详解与源码分析（1）——前言ExoPlayer架构详解与源码分析（2）——PlayerExoPlayer架构详解与源码分析（3）——TimelineExoPlayer架构详解与源码分析（4）——整体架构ExoPlayer架构详解与源码分析（5）——MediaSourceExoPlayer架构详解与源码分析（6）——MediaPeriodExoPlayer架构详解与
ExoPlayer架构详解与源码分析（12）——Cache 山雨楼 ExoPlayer 架构 android 音视频 ExoPlayer Media3 源码
系列文章目录ExoPlayer架构详解与源码分析（1）——前言ExoPlayer架构详解与源码分析（2）——PlayerExoPlayer架构详解与源码分析（3）——TimelineExoPlayer架构详解与源码分析（4）——整体架构ExoPlayer架构详解与源码分析（5）——MediaSourceExoPlayer架构详解与源码分析（6）——MediaPeriodExoPlayer架构详解与
ExoPlayer架构详解与源码分析（7）——SampleQueue(4) 2401_83740189 程序员架构
long[]newSourceIds=newlong[newCapacity];long[]newOffsets=newlong[newCapacity];long[]newTimesUs=newlong[newCapacity];int[]newFlags=newint[newCapacity];int[]newSizes=newint[newCapacity];CryptoData[]newC
【HarmonyOS】- 常见算法简单写法数的羊都睡了 HarmonyOS ArkTS 鸿蒙
文章目录知识回顾前言源码分析1.冒泡排序2.二分法查找拓展知识时间、空间复杂度总结知识回顾前言常见算法简单写法源码分析1.冒泡排序functionbubbleSort(arr:number[]):number[]{constn=arr.length;for(leti=0;iarr[j+1]){//交换元素consttemp=arr[j];arr[j]=arr[j+1];arr[j+1]=temp;
[ docker-ce源码分析系列 ] 修改resolv.conf文件被还原的原因 nangonghen docker docker
1概述：1.1环境版本信息如下：a、操作系统：centos7.6，amd64b、服务器docker版本：v18.09.22resolv.conf文件被还原的现象：容器中的/etc/resolv.conf文件，是由宿主机/var/lib/docker/containers/xxxx/resolv.conf文件挂载。在dockerrestart容器之前，手动修改了/var/lib/docker/con
dispatch_once源码分析福伟_Y
GCD里的单例函数dispatch_once是我们经常会用到的，今天我们来稍做深入分析一下。GCD的源码都在libdispatch.dylib库里，这个库在libSystem_initializer被初始化，可理解为在dyld里被加载和初始化的(之前的文章有分析过)。dispatch_once作为单例的使用入口，通过分析得到它是一个宏定义，_dispatch_once函数在libdispatch.
jQuery Easyui 源码分析之combo组件 90后北京程序员前端-easyui easyui之combobox
/***jQueryEasyUI1.3.1*该源码完全由压缩码翻译而来，并非网络上放出的源码，请勿索要。*/(function($){functionsetSize(target,width){varopts=$.data(target,"combo").options;varcombo=$.data(target,"combo").combo;varpanel=$.data(target,"co
html5carousel图片轮播,全面解析Bootstrap中Carousel轮播的使用方法 RemusrickCat
本文实例为大家全面的解析了Bootstrap中Carousel的使用方法，供大家参考，具体内容如下源码文件：Carousel.scssCarousel.js实现原理：隐藏所有要显示的元素，然后指定当前要显示的为block，宽、高自适应源码分析：1、Html结构：主要分为以四个部分1.1、容器：最外层div，需要一个data-ride=”carousel”来指定为轮播放插件，并且提供一个Id，方便圆
Java集合-----List接口及其实现类：ArrayList、LinkedList、Vector Colourful． Java集合 java 集合
文章目录List接口概述List接口的常用方法List接口的实现类ArrayList源码分析类继承关系ArrayList中的属性：ArrayList构造函数：ArrayList中常用方法添加操作：add()删除操作：remove()获取元素：get()ArrayList是如何实现序列化的？ArrayList的总结LinkedList源码分析类继承关系类成员属性类构造器LinkedList的List
React Native通讯原理 zbl_zbl android ReactNativ
之前写过一篇文章ReactNativeAndroid源码分析，在此文章的基础上分析和总结下RN与Native的通讯流程。本文基于Android代码分析，iOS实现原理类似。1.通讯框架图先来解析下各个模块的角色与作用：Java层，这块的实现在ReactAndroid中-ReactContext:Android上下文子类，包含一个CatalystInstance实例，用于获取NativeModule
[linux 驱动]增加一个文件节点控制led灯亮灭嵌入式成长家 linux内核的系统实战 linux驱动 linux驱动 led灯驱动
目录1修改设备树2修改驱动3驱动源码3.1驱动源码3.2设备树节点3.3驱动源码分析3.3.1##解释3.3.2class_create解释3.3.3class_create_file解释3.3.4of_get_named_gpio_flags解释3.3.5devm_gpio_request解释3.3.6platform_driver_register解释3.3.7platform_driver_
【QT教程】QT6对话框编程 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 c++QT教程
QT6对话框编程使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QT6对话框编程基础1.1QT6对话框简介1.1.1QT6对话框简介QT6对话框简介
鸿蒙轻内核M核源码分析系列十二事件Event OpenHarmony_小贾 OpenHarmony HarmonyOS 鸿蒙开发 harmonyos openharmony 鸿蒙内核鸿蒙开发移动开发嵌入式硬件驱动开发
事件（Event）是一种任务间通信的机制，可用于任务间的同步。多任务环境下，任务之间往往需要同步操作，一个等待即是一个同步。事件可以提供一对多、多对多的同步操作。本文通过分析鸿蒙轻内核事件模块的源码，深入掌握事件的使用。本文中所涉及的源码，以OpenHarmonyLiteOS-M内核为例，均可以在开源站点https://gitee.com/openharmony/kernel_liteos_m获取
鸿蒙轻内核M核源码分析系列四中断Hwi OpenHarmony_小贾鸿蒙开发 OpenHarmony HarmonyOS harmonyos 单片机 OpenHarmony 嵌入式硬件鸿蒙开发移动开发鸿蒙内核
在鸿蒙轻内核源码分析系列前几篇文章中，剖析了重要的数据结构。本文，我们讲述一下中断，会给读者介绍中断的概念，鸿蒙轻内核的中断模块的源代码。本文中所涉及的源码，以OpenHarmonyLiteOS-M内核为例。1、中断概念介绍中断是指出现需要时，CPU暂停执行当前程序，转而执行新程序的过程。当外设需要CPU时，将通过产生中断信号使CPU立即中断当前任务来响应中断请求。在剖析中断源代码之前，下面介绍些
鸿蒙轻内核M核源码分析系列五时间管理 OpenHarmony_小贾 HarmonyOS OpenHarmony 鸿蒙开发 harmonyos openharmony 鸿蒙开发 NAPI 鸿蒙内核移动开发嵌入式
在鸿蒙轻内核源码分析上一篇文章中，我们剖析了中断的源码，简单提到了Tick中断。本文会继续分析Tick和时间相关的源码，给读者介绍鸿蒙轻内核的时间管理模块。本文中所涉及的源码，以OpenHarmonyLiteOS-M内核为例，均可以在开源站点https://gitee.com/openharmony/kernel_liteos_m获取。时间管理模块以系统时钟为基础，可以分为2部分，一部分是SysT
鸿蒙轻内核M核源码分析系列六任务及任务调度（1）任务栈 OpenHarmony_小贾鸿蒙开发 OpenHarmony HarmonyOS HarmonyOS openharmony 鸿蒙开发移动开发鸿蒙内核驱动开发嵌入式硬件
继续分析鸿蒙轻内核源码，我们本文开始要分析下任务及任务调度模块。首先，我们介绍下任务栈的基础概念。任务栈是高地址向低地址生长的递减栈，栈指针指向即将入栈的元素位置。初始化后未使用过的栈空间初始化的内容为宏OS_TASK_STACK_INIT代表的数值0xCACACACA，栈顶初始化为宏OS_TASK_MAGIC_WORD代表的数值0xCCCCCCCC。一个任务栈的示意图如下，其中，栈底指针是栈的最
鸿蒙轻内核M核源码分析系列三数据结构-任务排序链表 OpenHarmony_小贾 HarmonyOS OpenHarmony 鸿蒙开发数据结构 harmonyos 移动开发 OpenHarmony 鸿蒙内核鸿蒙开发嵌入式硬件
在鸿蒙轻内核源码分析系列一和系列二，我们分析了双向循环链表、优先级就绪队列的源码。本文会继续给读者介绍鸿蒙轻内核源码中重要的数据结构：任务排序链表TaskSortLinkAttr。鸿蒙轻内核的任务排序链表，用于任务延迟到期/超时唤醒等业务场景，是一个非常重要、非常基础的数据结构。本文中所涉及的源码，以OpenHarmonyLiteOS-M内核为例。1任务排序链表我们先看下任务排序链接的数据结构。任
鸿蒙轻内核A核源码分析系列七进程管理 (2) OpenHarmony_小贾 HarmonyOS 鸿蒙开发 OpenHarmony harmonyos OpenHarmony 移动开发驱动开发鸿蒙内核 LiteOS-A内核进程通信
本文先熟悉下进程管理的文件kernel\base\core\los_process.c中的内部接口，读读代码，做些记录。1、LiteOS-A内核进程全局变量⑴是进程池，存放各个进程控制块LosProcessCB的信息。⑵处开始的g_freeProcess是空闲进程链表，挂载各个空闲进程控制块；g_processRecycleList是待回收进程控制块链表，挂载各个等待回收的进程控制块。⑶处开始的g
鸿蒙原生开发——轻内核A核源码分析系列三物理内存（2） OpenHarmony_小贾鸿蒙开发 HarmonyOS OpenHarmony harmonyos openharmony 移动开发程序人生鸿蒙开发
3.1.2.3函数OsVmPhysLargeAlloc当执行到这个函数时，说明空闲链表上的单个内存页节点的大小已经不能满足要求，超过了第9个链表上的内存页节点的大小了。⑴处计算需要申请的内存大小。⑵从最大的链表上进行遍历每一个内存页节点。⑶根据每个内存页的开始内存地址，计算需要的内存的结束地址，如果超过内存段的大小，则继续遍历下一个内存页节点。⑷处此时paStart表示当前内存页的结束地址，接下来
JsonCpp源码分析——Reader 哎呦，帅小伙哦 #jsoncpp json
1、与Writer模块功能相反，可以将Reader理解成一个反序列化的工具，Writer的作用主要是将Value对象转成string或者流式的结构，Reader的作用主要是将流式的结构转成Value类型的对象。Reader类的主要职责有3个，解析JSON字符串：将JSON格式的字符串读取并解析成相应的C++数据结构。处理不同的数据类型，支持解析JSON对象、数组、字符串、数字、布尔值和null。处
vue源码分析-挂载流程和模板编译 yyzzabc123 vue.js
前面几节我们从newVue创建实例开始，介绍了创建实例时执行初始化流程中的重要两步，配置选项的资源合并,以及响应式系统的核心思想，数据代理。在合并章节，我们对Vue丰富的选项合并策略有了基本的认知，在数据代理章节我们又对代理拦截的意义和使用场景有了深入的认识。按照Vue源码的设计思路，初始化过程还会进行很多操作，例如组件之间创建关联，初始化事件中心，初始化数据并建立响应式系统等，并最终将模板和数据
鸿蒙内核解析,鸿蒙内核源码分析(内存概念篇)|解读鸿蒙源码刘轩鸿鸿蒙内核解析
提示：本文基于开源鸿蒙内核分析，官方源码【kernel_liteos_a】官方文档【docs】参考文档【HuaweiLiteOS】本文作者：鸿蒙内核发烧友，用生活场景讲故事的方式去解构内核，一窥究竟，让神秘的内核栩栩如生，浮现眼前。博文全部原创，持续更新，敬请关注。内容仅代表个人观点，错误之处，欢迎大家指正完善。本系列全部文章进入鸿蒙源码分析(总目录)查看目录最难讲的章节坦白讲内存是整个系列里面最
鸿蒙轻内核A核源码分析系列七进程管理 (3) OpenHarmony_小贾 OpenHarmony 鸿蒙开发 HarmonyOS harmonyos 嵌入式硬件 OpenHarmony 鸿蒙嵌入式鸿蒙开发鸿蒙内核进程关联
本文记录下进程相关的初始化函数，如OsSystemProcessCreate、OsProcessInit、OsProcessCreateInit、OsUserInitProcess、OsDeInitPCB、OsUserInitProcessStart等。1、LiteOS-A内核进程创建初始化通用函数先看看一些内部函数，不管是初始化用户态进程还是内核态进程，都会使用这些函数，包含进程控制块初始化函数
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str