weixin_42590246

MySQL内存泄漏

MySQL多个版本中，包括5.7和8.0，均存在内存泄漏问题，内存持续飙高，目前尚无良好的解决方式，在线上一般安排低峰时切换后重启处理，目前可通过以下简单方式判断：

1.使用/top/free/ps在系统级确定是否有内存泄露。如有，可以从top输出确定哪一个process。

2.使用pmap工具确定process是否有memory leak。确定memory leak的原则：writeable/private (‘pmap –d’输出）如果在做重复的操作过程中一直保持稳定增长，那么一定有内存泄露。

目前暂无时间和精力详细分析内存分配相关源码，等待后续补上！

补充：

MySQL内存分配与管理（1）

MySQL的内存分配、使用、管理的模块较多，本篇文章主要针对InnoDB的内存管理、SQL层内存分配管理器MEM_ROOT和8028内存限制的新特性进行分析，同时对现阶段存在的部分问题和优化方案进行简单的描述。代码版本主要基于8025，第四部分内存限制新特性基于8028。

一、InnoDB基础内存申请

1.1 ut_allocator

在非UNIV_PFS_MEMORY模式下，UT_NEW等都是调用原始的new、delete、malloc、free等接口进行内存的申请和释放，在UNIV_PFS_MEMORY编译模式下，采用内部封装的ut_allocator分配器进行管理，加入了内存追踪等信息，可以通过PFS表进行展示。

ut_allocator可以作为std容器的内存分配（如std::map），让容器内部的内存通过innodb提供的**内存可追踪**的方式进行分配。下面分别就ut_allocator提供的不同内存分配方式作进一步介绍。

#ifdef UNIV_PFS_MEMORY#define UT_NEW(expr, key) ::new (ut_allocator(key).allocate(1, NULL, key, false, false)) expr...#define ut_malloc(n_bytes, key) static_cast(ut_allocator(key).allocate(n_bytes, NULL, UT_NEW_THIS_FILE_PSI_KEY, false, false))...#else/* UNIV_PFS_MEMORY */#define UT_NEW(expr, key) ::new (std::nothrow) expr...#define ut_malloc(n_bytes, key) ::malloc(n_bytes)...#endif

1.1.1 单块内存分配

allocate

内存申请时多分配了一块ut_new_pfx_t数据（开启PFS_MEMORY），其中保存了key、size、owner等信息

// 比实际申请多出一块pfx的内存
total_bytes+=sizeof(ut_new_pfx_t)
// 申请内存
...
// 返回实际内存开始的地址return (reinterpret_cast(pfx + 1));

加入了内存分配重试机制

for (size_t retries = 1;; retries++) {
  // 内存分配malloc/callocmalloc(); // calloc()...if (ptr != nullptr || retries >= alloc_max_retries) break;
    std::this_thread::sleep_for(std::chrono::seconds(1));
}

deallocate

先释放pfx、再释放实际内存数据

deallocate_trace(pfx);
free(pfx);

reallocate

类似allocate，重新计算size、换入新的ut_new_pfx_t（pfx_old–pfx_new）

1.1.2 large内存分配

allocate_large

申请大块内存（used in buf_chunk_init()）、添加pfx信息

mmap的方式没有消耗实际的物理内存，该部分的内存无法通过jemalloc等方式追踪

pointer ptr = reinterpret_cast(os_mem_alloc_large(&n_bytes));
    |->mmap()/shmget()、shmat()、shmctl()
...
allocate_trace(n_bytes, PSI_NOT_INSTRUMENTED, pfx);

deallocate_large

释放pfx指针，释放large内存

deallocate_trace(pfx);
os_mem_free_large(ptr, pfx->m_size);
  |->munmap()/shmdt()

1.1.3 aligned_memory分配

在代码中实际上aligned_memory系列（aligned_pointer、aligned_array_pointer、）是做了单独的封装的，但其底层依旧是ut_alloc和ut_free，此处就不展开了。例如在log_t结构的构建中采用此方法，对齐的内存方式在IO写操作时能够和sector size匹配，提高IO效率。

1.2 mem_heap_allocator

类似ut_allocator，mem_heap_allocator也可以作为stl的allocator来使用。但要要注意的是，该类型的分配器只提供mem_heap_alloc函数进行内存的申请，没有内存的释放、复用和合并等操作。

class mem_heap_allocator {
...
  pointer allocate(size_type n, const_pointer hint = nullptr){
    return (reinterpret_cast(mem_heap_alloc(m_heap, n * sizeof(T)))); // 内存申请调用mem_heap_alloc
  }
  voiddeallocate(pointer p, size_type n){}; // 内存释放等为空操作
...
}

1.2.1 mem_heap_t

数据结构

该结构结构是一个非空的内存块链表，由一个个的大小不一的mem_block_t线性连接。重点关注free_block和buf_block，某种程度上来说，这两个指针定义了实际数据存放的位置。根据申请类型的不同，数据存放在两者之一指向的内存。利用mem_heap_t进行内存分配的方式可以将多次的内存分配合并为单次进行，之后的内存请求就可以在InnoDB引擎内部进行，从而减小了频繁调用函数malloc和free带来的时间与性能的开销。

typedefstruct mem_block_info_t mem_block_t;
typedef mem_block_t mem_heap_t;

...
/** The info structure stored at the beginning of a heap block */struct mem_block_info_t {
...
  UT_LIST_BASE_NODE_T(mem_block_t) base; /* 链表基节点，只在第一个block定义 */
  UT_LIST_NODE_T(mem_block_t) list;   /* block链表 */
  ulint len;        /*!< 当前block大小 */
  ulint total_size; /*!< 所有block总大小 */
  ulint type;       /*!< 分配类型 */
  ulint free;       /*!< 当前block的可用位置 */
  ulint start;      /*!< block构建时free的起始位置（没看到较多的用途） */void *free_block; /* 包含有 MEM_HEAP_BTR_SEARCH 类型的heap中,
                      heap root挂着free_block用以申请更多的空间，其他类型该指针为空 */void *buf_block;  /* 内存从buffer pool申请，保存buf_block_t指针，否则为空 */
};

内存类型

根据申请的内存来源，mem_heap_t可以分为下面几种类型：

#define MEM_HEAP_DYNAMIC 0 /* 原始申请，调用innodb内存申请ut_allocator相关 */#define MEM_HEAP_BUFFER 1 /* 从buffer_pool获取内存 */#define MEM_HEAP_BTR_SEARCH 2/* 使用free_block中的内存 */

在此基础上，组合定义了更多的分配方式，让内存的分配更加灵活。

/** Different type of heaps in terms of which data structure is using them */#define MEM_HEAP_FOR_BTR_SEARCH (MEM_HEAP_BTR_SEARCH | MEM_HEAP_BUFFER)#define MEM_HEAP_FOR_PAGE_HASH (MEM_HEAP_DYNAMIC)#define MEM_HEAP_FOR_RECV_SYS (MEM_HEAP_BUFFER)#define MEM_HEAP_FOR_LOCK_HEAP (MEM_HEAP_BUFFER)

1.2.2 mem_heap_t的构建：mem_heap_create_func

根据传入的size和heap类型，构建一个memory heap结构，size最小为64。实际上在内部的构建逻辑中可以知道单个mem_block最大的size和定义的page_size相同（一般为16K）。

创建mem_heap_t首先需要构建一个root节点，即前文所提到的链表根节点。通过控制block创建函数 mem_heap_create_block传入的第一个参数heap=nullptr，表明该block为mem_heap_t中的第一个节点。在type包含MEM_HEAP_BTR_SEARCH操作位的情况下，可能会出现构建失败的情况，详细的逻辑和失败原因会在后文提出。

创建完第一个block后，将其置为base节点，同时更新链表信息，完成mem_heap_t （根结点）的创建。

mem_heap_t *mem_heap_create_func(ulint size, ulint type) {
  mem_block_t *block;

  if (!size) {
    size = MEM_BLOCK_START_SIZE;
  }
  // 创建mem_heap的第一个block，传入的第一个参数是nullptr
  block = mem_heap_create_block(nullptr, size, type, file_name, line);
  // 在MEM_HEAP_BTR_SEARCH模式下，存在构建失败的可能性，返回空指针if (block == nullptr) {
    return (nullptr);
  }

  // 由于BP resize的可能性，因此第一个block不能从BP中获取
  ut_ad(block->buf_block == nullptr);

  // 初始化链表基节点（base不为空，标志该节点为基节点）
  UT_LIST_INIT(block->base, &mem_block_t::list);
  UT_LIST_ADD_FIRST(block->base, block);
    
  return (block);
}

1.2.3 mem_heap_t的释放：mem_heap_free

前文提及，若type包含MEM_HEAP_BTR_SEARCH的操作位，则数据有可能保存在free_block对应的内存单元中。此时需要单独释放创建的free_block，然后由后往前，逐个释放mem_heap_t链表上的各个block。

voidmem_heap_free(mem_heap_t *heap){
  ...
// 获取链表中最后一个节点
  block = UT_LIST_GET_LAST(heap->base);
    
// 释放free_block节点（MEM_HEAP_BTR_SEARCH模式创建）if (heap->free_block) {
    mem_heap_free_block_free(heap);
  }
    
// 由后往前逐个释放blockwhile (block != nullptr) {
    /* Store the contents of info before freeing current block
    (it is erased in freeing) */
    prev_block = UT_LIST_GET_PREV(list, block);
    mem_heap_block_free(heap, block);
    block = prev_block;
  }
}

1.2.4 block的构建：mem_heap_create_block

1. block的申请

这个函数是整个mem_heap_t内存分配的核心，针对不同的type，实现了不同策略的内存分配。具体为：

case 1 - MEM_HEAP_DYNAMIC或是size较小时：使用ut_malloc_nokey

case 2 - 包含MEM_HEAP_BTR_SEARCH且当前block不为根block，从free_block指向的内存块分配

case 3 - 其他情况：使用buf_block，由buf_block_alloc从buffer pool中分配

// case 1if (type == MEM_HEAP_DYNAMIC || len < UNIV_PAGE_SIZE / 2) {
  ut_ad(type == MEM_HEAP_DYNAMIC || n <= MEM_MAX_ALLOC_IN_BUF);

  block = static_cast(ut_malloc_nokey(len));
} else {
  len = UNIV_PAGE_SIZE;
    
  // case 2if ((type & MEM_HEAP_BTR_SEARCH) && heap) {
    // 从heap root的free_block获取内存
    buf_block = static_cast(heap->free_block);
    heap->free_block = nullptr;

    if (UNIV_UNLIKELY(!buf_block)) {
      return (nullptr);
    }
  } else {
    // case 3
    buf_block = buf_block_alloc(nullptr);
  }

  block = (mem_block_t *)buf_block->frame;
}

这段代码做了以下几件事：

控制了单个block的上限值UNIV_PAGE_SIZE

heap->free_block = nullptr确保root节点的free_block不会再次被使用，同时也解释了为什么在type存在MEM_HEAP_BTR_SEARCH位的时候可能引起内存分配的失败，原因有两个：

当前block类型和mem_heap_t->base的类型不兼容：原始的根结点申请时若不包含MEM_HEAP_BTR_SEARCH位，则构建时free_block是nullptr，在line 12就会获得空指针而直接返回；

当前block依托的mem_heap_t->base对应的free_block已被使用：从line 13可以看到，只要是用过一次，free_block就会被标志为空，而真正的数据转移到了buf_block上。

2. block的初始化

这一步主要包括block几mem_heap_t节点对象中的各个参数的设置，简单的包括len、type、free的设置，重点分析一下buf_block、和free_block的设置，同样十分精妙。

UNIV_MEM_FREE(block, len);
UNIV_MEM_ALLOC(block, MEM_BLOCK_HEADER_SIZE);

block->buf_block = buf_block;
block->free_block = nullptr;

前面两句是将block对应的数据置为free状态，同时初始化头部的数据，为后面的len等数据的初始化做准备；后两句的设置分几种情况一一说明：

case 1 - type为MEM_HEAP_DYNAMIC：此时block->buf_block=nullptr，block->free_block=nullptr符合mem_heap_t对该类型的定义，此时block的内存结构如下（头部已经被初始化）。

case 2 - type为MEM_HEAP_BTR_SEARCH：block的内存从free_block中分配，此时free_block中的内存就转移到了buf_block中，并从buf_block构造了block所需的数据。

case 3 - type为MEM_HEAP_BUFFER：内存由buf_block_alloc从buffer pool中分配。

case 2/3内存结构最终形态是一致的，区别在于case2是从free_block转换得到buf_block，而case3是从BP中直接申请得到。其中free_block一般在构建mem_heap_t时由外部指定。

可以看到无论是case1、case2、case3或是多种case的组合，buf_block和free_block的修改都能达到正确设置数据的目的。

1.2.5 block的释放：mem_heap_block_free

获取buf_block（alloc方式获取的将会是nullptr）

从mem_heap_t链表移除、修改total_size

ut_alloc方式申请的block，则调用ut_free方式释放block；否则初始化block数据（因为在从bP/free_block获取之后，block除头部之外的部分可能是是free的状态）并用buf_block_free方式释放，使之成为BP中直接可用的free page。

1.2.6 从mem_heap_t申请内存：mem_heap_alloc

获取最后一个block，从最后一个block分配

申请给定大小的内存区域，不够则调用mem_heap_add_block添加新的block，MEM_HEAP_BTR_SEARCH下可能会失败，原因同上

更新free值（申请后可用空间变小了），初始化内存区域并返回数据指针buf（block+free偏移）

1.2.7 block添加策略：mem_heap_add_block

每次新添加的block size是上一个block的2倍，到达上限则保持不变

调用mem_heap_create_block并添加新的block到链表尾部

最后返回新的block

1.3 小结

ut_allocator在最新的80版本中已经删去，对应的内存申请和释放代码修改为模版函数。

ut_allocator在开启PFS_MEMORY下会引入多的内存，但可以控制该部分内存的使用，取决于监控这部分内存与否。

mem_heap_t有效减少了内存碎片，比较适用于短周期多次分配小内存的场景。但其在使用过程中不会free内存，当单个block出现空闲较大的情况时，会有一定程度的内存浪费。

二、InnnDB内存结构

图源：https://dev.mysql.com/doc/refman/8.0/en/innodb-architecture.html

2.1 Buffer Pool

Buffer Pool（BP）简单来说就是innodb主内存中的一块区域，主要用于缓存数据页和索引页，也包括undo页、自适应哈希索引、锁信息等。读取数据时，若数据存在BP中则可以直接读取，避免IO而提升性能；数据页面修改时，也是先修改BP中的数据页，再使用一定的频率进行刷脏。

一般来说，BP size会配置成机器可用物理内存的 50% 到 75%，数据库再启动时就会提前分配好这部分的虚拟内存，真正的物理内存映射会在实际使用中进行。BP的内存在数据库关闭时统一释放。

2.1.1 数据结构

在BP中主要的数据结构包括buf_pool_t、buf_chunk_t、buf_block_t等，各结构之间的主要关系如下图所示。一个BP可以设置多个buf_pool_t实例，即BP instance，减少缓冲池内部的资源竞争以提高引擎整体的性能；每个BP instance包含了一个以上的chunk，每个chunk在初始化时会划分出数据页控制体buf_block_t和实际的数据页帧frame。数据页由LRU、free、flush等链表进行管理。

buf_pool_t

该结构中包含了诸多的信息，如实例号、size、chunk列表、各个链表（free、LRU、flush）及其互斥锁、哈希表及其互斥锁等，还包括了zip_free这个链表数组，用于伙伴系统的内存分配。通过buf_pool_t可以直接获取各个链表的根结点。

此外，buf_pool_t中还包含了ut_alloctor，用于为chunks分配内存；xxx_old用来记录resize前的旧数据；风险指针用于标记链表位置。

struct buf_pool_t {
    ...
    ulint                           instance_no;       // 缓冲池实例编号
    ulint                           curr_pool_size;    // 缓冲池实例大小
    buf_chunk_t                     *chunks;           // 缓冲池实例的物理块列表
    hash_table_t                    *page_hash;        // 页哈希表
    hash_table_t 					*zip_hash;		   // 伙伴系统分配frame对应的block哈希表
    UT_LIST_BASE_NODE_T(buf_page_t) free;              // 空闲链表
    UT_LIST_BASE_NODE_T(buf_page_t) LRU;               // LRU 链表
    UT_LIST_BASE_NODE_T(buf_page_t) flush_list;        // Flush 链表
    UT_LIST_BASE_NODE_T(buf_buddy_free_t) zip_free[BUF_BUDDY_SIZES_MAX]; //伙伴分配系统空闲链表
    BufListMutex                    free_list_mutex;   // 空闲链表的互斥锁
    BufListMutex                    LRU_list_mutex;    // LRU 链表的互斥锁
    BufListMutex                    flush_state_mutex; // Flush 链表的互斥锁
    BufListMutex 					zip_free_mutex;    // 伙伴分配互斥锁
    BufListMutex 					zip_hash_mutex;
    BufListMutex 					chunks_mutex;	   // chunk mutex链表
    ...
}

buf_chunk_t

chunk是物理内存分配的基本单位，instance由一块一块的chunk组成。每个chunk被切分成block串和frame串，block串在前，frame串在后，两者之间可能存在不圆整的内存碎片。

struct buf_chunk_t {
  ulint 							size;           /*!< frames[]/blocks[]的数量 */unsignedchar 					*mem;   /*!< frame内存区域指针 */
  ut_new_pfx_t 						mem_pfx; /*!< 监控信息 */
  buf_block_t 						*blocks;  /*!< 控制块数组 */uint32_t 							chunk_no;    /*! chunk号 */
  UT_LIST_BASE_NODE_T(buf_page_t) 	chunk_page_list; /*!< chunk list根结点 */
  ...
};

buf_block_t

控制块，主要的数据包括buf_page_t格式的page，该数据必须为第一个字段以便进行指针的强转（例如buf_pool->page_hash可以访问到block/page信息）；还包括实际的数据帧frame，大小为UNIV_PAGE_SIZE；还有frame和block的mutex，需要注意的是，buf_page_t中的部分数据也是由block中的这个mutex进行保护的。

struct buf_block_t {
  buf_page_t 		page; //放在第一个位置，以便于block和page进行强制转换
  BPageLock 		lock; //frame的读写锁byte 				*frame; //实际数据
  ...
  BPageMutex 		mutex; // block锁：state、io_fix、buf_fix_count、accessed
};

buf_page_t

page包含了id、size、lsn等信息，io_fix和buf_fix_count用于控制并发状态，判断该page是否处于被访问的状态。此外，page中还包含了很多bool变量，主要用于判断该page是否处于对应链表或哈希表中。

struct buf_page_t {
    ...
    page_id_t      id;                  // page id
    page_size_t    size;                // page 大小
    ib_uint32_t    buf_fix_count;       // 用于并发控制
    buf_io_fix     io_fix;              // 用于并发控制
    buf_page_state state;               // 页状态
    lsn_t          newest_modification; // 最新 lsn，即最近修改的 lsn
    lsn_t          oldest_modification; // 最老 lsn，即第一条修改 lsn
    ...
}

2.1.2 初始化过程

step-1 buf_pool_init()：

这个过程主要做三件事，一是bp instance指针数组的初始化（没有分配实际的内存）；二是多线程并发使用buf_pool_create去构建实际的内存空间；三是在bp初始化完成后开启AHI的初始化。

// 构建bp instance指针数组
buf_pool_ptr =
    (buf_pool_t *)ut_zalloc_nokey(n_instances * sizeof *buf_pool_ptr);

// 多线程并发初始化for (ulint id = i; id < n; ++id) {
    threads.emplace_back(std::thread(buf_pool_create, &buf_pool_ptr[id], size,
                                      id, &m, std::ref(errs[id]))); }
// AHI的初始化
btr_search_sys_create(buf_pool_get_curr_size() / sizeof(void *) / 64);

在buf_pool_create函数中主要做了几件事：

初始化各个锁：包括chunks mutex链表、LRU链表锁、free链表锁、zip_free链表锁、哈希表锁等等

计算chunks数量，申请chunk指针数组

初始化上述的链表

调用buf_chunk_init初始化chunk

设置instances相关的参数（size、instance_no等）

构建哈希表和相关的锁

初始化flush相关数据，如hp指针、链表包含关系等

staticvoidbuf_pool_create(buf_pool_t *buf_pool, ulint buf_pool_size,
                            ulint instance_no, std::mutex *mutex,
                            dberr_t &err){
  ...
  mutex_create(LATCH_ID_BUF_POOL_CHUNKS, &buf_pool->chunks_mutex);
  mutex_create(LATCH_ID_BUF_POOL_LRU_LIST, &buf_pool->LRU_list_mutex);
  ...

  ...
  buf_pool->n_chunks = buf_pool_size / srv_buf_pool_chunk_unit;
  chunk_size = srv_buf_pool_chunk_unit;
  buf_pool->chunks = reinterpret_cast(
        ut_zalloc_nokey(buf_pool->n_chunks * sizeof(*chunk)));
  ...
  
  ...
  UT_LIST_INIT(buf_pool->LRU, &buf_page_t::LRU);
  UT_LIST_INIT(buf_pool->free, &buf_page_t::list)
  UT_LIST_INIT(buf_pool->flush_list, &buf_page_t::list);
  ...

  ...
    do {
      if (!buf_chunk_init(buf_pool, chunk, chunk_size, mutex)) {
        ...
    } while (++chunk < buf_pool->chunks + buf_pool->n_chunks);
  ...

  ...
    buf_pool->instance_no = instance_no;
    buf_pool->curr_pool_size = buf_pool->curr_size * UNIV_PAGE_SIZE;
  ...
    
      
  ...
    srv_n_page_hash_locks =
        static_cast(ut_2_power_up(srv_n_page_hash_locks));
    buf_pool->page_hash =
        ib_create(2 * buf_pool->curr_size, LATCH_ID_HASH_TABLE_RW_LOCK,
                  srv_n_page_hash_locks, MEM_HEAP_FOR_PAGE_HASH);
    buf_pool->zip_hash = hash_create(2 * buf_pool->curr_size);
  ...
      
  ...
  for (i = BUF_FLUSH_LRU; i < BUF_FLUSH_N_TYPES; i++) {
    buf_pool->no_flush[i] = os_event_create();
  }
  ...
  new (&buf_pool->flush_hp) FlushHp(buf_pool, &buf_pool->flush_list_mutex);
  ...
}

step-2 buf_chunk_init

该函数主要做了以下几件事：

alloc chunk需要的内存（通过large的方式）

分割chunk，将其分为blocks和frames

调用buf_block_init初始化block（初始化block/page中的变量，如state、chunk_no还有是否处于链表的各个标志位等，构建mutex和rwlock）并将其加入free链表

注册chunk

static buf_chunk_t *buf_chunk_init(...) 
{
// 1
...
  if (!buf_pool->allocate_chunk(mem_size, chunk)) {
    return (nullptr);
  }
...
// 2
...
  chunk->blocks = (buf_block_t *)chunk->mem;
  frame = (byte *)ut_align(chunk->mem, UNIV_PAGE_SIZE);
  chunk->size = chunk->mem_pfx.m_size / UNIV_PAGE_SIZE - (frame != chunk->mem);
  {
    ulint size = chunk->size;
    while (frame < (byte *)(chunk->blocks + size)) {
      frame += UNIV_PAGE_SIZE;
      size--;
    }
    chunk->size = size;
  }
...
// 3  
...
  for () {
    buf_block_init(buf_pool, block, frame, chunk, sync_init_nolock);
    UT_LIST_ADD_LAST(buf_pool->free, &block->page);
  }
// 4
...
  buf_pool_register_chunk(chunk);
...
}

step-3 page_hash初始化

    buf_pool->page_hash =
        ib_create(2 * buf_pool->curr_size, LATCH_ID_HASH_TABLE_RW_LOCK,
                  srv_n_page_hash_locks, MEM_HEAP_FOR_PAGE_HASH);

    buf_pool->page_hash_old = nullptr;

    buf_pool->zip_hash = hash_create(2 * buf_pool->curr_size);

这里可以看到page_hash和zip_hash的构建方式有所差异，page_hash在完成create后还对heap结构和对应的锁进行了初始化（ib_create函数相比hash_create还做了heaps和锁初始化的工作）。

2.1.3 页面管理链表

每个链表都是双向链表，节点都是buf_block_t，基节点中保存了首尾节点信息和链表长度等。buffer pool中的页面使用情况和双向链表结构如下所示。

free list

block初始化后会直接加入到free链表。缓冲池中如果需要使用数据页，直接从空闲链表中获取。当空闲节点不足时，将采用一定的策略从 LRU List 和 Flush List 中淘汰一定量的节点以补充库存。

LRU list

LRU List 是缓冲池中最重要的数据结构，基本所有读入的数据页都缓冲于其上。LRU 链表顾名思义根据最近最少使用算法 Least Recently Used 对节点进行淘汰。InnoDB对 LRU 算法进行了以下优化，解决“预读失效”与“缓冲池污染”的问题。

LRU优化

LRU分为了Old Sublist和New Sublist两段，加载数据首先会加载到Old位置，只有当满足一定的条件时，数据才会从Old段转移到New段。当发生类似全表扫描的操作时，LRU的淘汰就不会影响到真正的热点数据，从而保证缓存的热度。

图源：https://dev.mysql.com/doc/refman/8.0/en/innodb-buffer-pool.html

响应时间优化

先设定一个间隔时间innodb_old_blocks_time，然后将old区域数据页的第一次访问时间在其对应的控制块中记录下来。

如果后续的访问时间与第一次访问的时间小于innodb_old_blocks_time，则不将该缓存页从 Old区域移动到 New 区域。

如果后续的访问时间与第一次访问的时间大于innodb_old_blocks_time，才会将该缓存页移动到 New 区域的头部。

Flush List

缓冲池中所有脏页都会挂载在 Flush List 中，以等待数据落盘。在数据更改被刷入磁盘前，数据很有可能会被修改多次，在数据页控制体中记录了最新修改的 lsn（newset_modification）和最老修改的 lsn（newest_modification）。进入 Flush list 的节点按照进入的顺序进行排序，最新加入的数据页放在链表头部，刷数据时从链表尾开始写入。

zip_free

是由 5 个链表构成的二维数组，分别是 1K、2K、4K、8K 和 16K 的碎片链表，专门用于存储从磁盘读入的压缩页，引擎使用 Buddy 伙伴系统专门管理该结构。

2.2 Change buffer

change buffer是一颗通用B+树，当页面不在buffer pool中时将其对应的修改缓存在change buffer中可有效地减少磁盘的随机访问。索引页大小16k，内存使用buffer pool，可以通过参数来设置最大的大小占比（innodb_change_buffer_max_size），默认25%，最多50%。

图源：https://dev.mysql.com/doc/refman/8.0/en/innodb-change-buffer.html

其结构为ibuf_t，内包含的都是基本的size、max_size、free_list_len、merge操作次数等信息，全局只有一个ibuf_t结构体，在数据库启动的时候构建。

change buffer创建和初始化过程在ibuf_init_at_db_start完成，主要包括：

相关互斥量的构建

ibuf参数的初始化，包括max_size、index等相关的数据

root的获取

void ibuf_init_at_db_start(void) {
  ...
  // 1.互斥量操作
  mutex_create(LATCH_ID_IBUF, &ibuf_mutex);
  ...
    
  // 2.构建root
  {
    buf_block_t *block;
    // IBUF_SPACE_ID = 0 FSP_IBUF_TREE_ROOT_PAGE_NO = 4
    block = buf_page_get(page_id_t(IBUF_SPACE_ID, FSP_IBUF_TREE_ROOT_PAGE_NO),
                          univ_page_size, RW_X_LATCH, &mtr);
    buf_block_dbg_add_level(block, SYNC_IBUF_TREE_NODE);
    // 对应的frame作为change buffer B+树的root
    root = buf_block_get_frame(block);
  }
  ...
  // 3. 参数设置// CHANGE_BUFFER_DEFAULT_SIZE默认是25
  ibuf->max_size = ((buf_pool_get_curr_size() / UNIV_PAGE_SIZE) *
                    CHANGE_BUFFER_DEFAULT_SIZE) /
                    100;
  ibuf->index =
      dict_mem_index_create("innodb_change_buffer", "CLUST_IND", IBUF_SPACE_ID,
                            DICT_CLUSTERED | DICT_IBUF, 1);
  ibuf->index->id = DICT_IBUF_ID_MIN + IBUF_SPACE_ID;
  ibuf->index->table = dict_mem_table_create("innodb_change_buffer",
                                              IBUF_SPACE_ID, 1, 0, 0, 0, 0);
  ...
}

ibuf_insert操作底层调用了ibuf_insert_low，主要做了以下几件事：

根据数据构建，在数据记录的基础上增加page.no等信息

选择合适的block插入（数据插入在rec中，而block则包含有rec的数据）

视情况进行merge

staticMY_ATTRIBUTE((warn_unused_result)) dberr_t
    ibuf_insert_low(ulint mode, ibuf_op_t op, ibool no_counter,
                    const dtuple_t *entry, ulint entry_size,
                    dict_index_t *index, const page_id_t &page_id,
                    const page_size_t &page_size, que_thr_t *thr){
  ...
  // 1. 构建entry
  ibuf_entry =
      ibuf_entry_build(op, index, entry, page_id.space(), page_id.page_no(),
                        no_counter ? ULINT_UNDEFINED : 0xFFFF, heap);
  ...
  // 初始化游标
  btr_pcur_open(ibuf->index, ibuf_entry, PAGE_CUR_LE, mode, &pcur, &mtr);
  ...
        
  // 2. 插入操作
  err = btr_cur_optimistic_insert(...);// 也可能是btr_cur_pessimistic_insert
  block = btr_cur_get_block(cursor);
  ...
  // pcur收尾工作，包括rec、block的清空等
  btr_pcur_close(&pcur);
        
  // 3. 视情况进行merge
}

change buffer本身没有很多额外的内存申请，依赖buffer pool中的block进行操作。大部分都是申请了一些临时的heap，使用完毕后立即释放，不会在内存中长时间驻留。

2.3 AHI

innodb的索引组织结构为btree，当查询的时候会根据条件一直索引到叶子节点，为了减少寻路的开销，AHI使用索引键的前缀建立了一个哈希索引表，在实现上就是多个hash_tables(分片)。哈希索引是为那些频繁被访问的索引页而建立的，可以理解为btree上的索引。初始创建的数组大小为buf_pool_get_curr_size() / sizeof(void *) / 64，使用malloc分配。数组大小最终对应了hash_table的cell/bucket总数，这个数量实际上还要进行一个质数化的处理。

2.3.1 数据结构

struct hash_cell_t {
  void *node; /*!< 哈希链 */
};

/* The hash table structure */struct hash_table_t {
  enum hash_table_sync_t type; /*!< MUTEX/RW_LOCK/NONE. */
  ibool adaptive;     
  ulint n_cells;      /* 哈希桶数量 */
  hash_cell_t *cells; /*!< bucket数组 */
  ulint n_sync_obj; /* 互斥量、锁的数量 */union {
    ib_mutex_t *mutexes; 
    rw_lock_t *rw_locks; 
  } sync_obj;

  mem_heap_t **heaps; // 多个part时，用于分配哈希链的内存数组，个数和n_sync_obj相关，如在page_hash中用到
  mem_heap_t *heap; // 分配哈希链的内存堆
};

2.3.2 内存初始化

在AHI构建的时候，分成了8个part，每个part负责不同的bucket，拥有各自部分的锁。构建和初始化主要分为以下几个步骤：

锁的初始化，锁的数量和part数量挂钩

hash_table的初始化，底层调用ib_create，注意这里传入的type是MEM_HEAP_FOR_BTR_SEARCH，这直接决定了hash_table中heap的类型，即其后内存的来源。其中table->type在这里是HASH_TABLE_SYNC_NONE。

voidbtr_search_sys_create(ulint hash_size){
  /* Step-1: Allocate latches (1 per part). */
  btr_search_latches = reinterpret_cast(
      ut_malloc(sizeof(rw_lock_t *) * btr_ahi_parts, mem_key_ahi));

  for (ulint i = 0; i < btr_ahi_parts; ++i) {
    btr_search_latches[i] = reinterpret_cast(
        ut_malloc(sizeof(rw_lock_t), mem_key_ahi));
    rw_lock_create(btr_search_latch_key, btr_search_latches[i],
                    SYNC_SEARCH_SYS);
  }

  /* Step-2: Allocate hash tablees. */
  btr_search_sys = reinterpret_cast(
      ut_malloc(sizeof(btr_search_sys_t), mem_key_ahi));

  btr_search_sys->hash_tables = reinterpret_cast(
      ut_malloc(sizeof(hash_table_t *) * btr_ahi_parts, mem_key_ahi));

  for (ulint i = 0; i < btr_ahi_parts; ++i) {
    btr_search_sys->hash_tables[i] =
        ib_create((hash_size / btr_ahi_parts), LATCH_ID_HASH_TABLE_MUTEX, 0,
                  MEM_HEAP_FOR_BTR_SEARCH);
  ...
}

进一步地，ib_create中主要做2件事：

调用hash_create创建hash_table

hash_table函数主要做的事将大部分hash table结构中的参数初始化为0/nullptr，最最重要的是构建hash_table->cells，即哈希桶。哈希桶通过malloc & memset方式进行构建，这也是AHI耗时最久的步骤。

初始化table->heap

这里初始化type选择MEM_HEAP_FOR_BTR_SEARCH类型，heap的构建为后续的哈希桶指向的哈希链的内存分配做准备。

2.5 log buffer

log buffer是日志未写到磁盘的缓存，大小由参数innodb_log_buffer_size指定，一般来说这块内存都比较小，默认是16M，有max和min的限制。

log buffer的内存申请/释放底层调用的是ut_allocate/ut_free，参数srv_log_buffer_size就是所需的大小。

// 内存申请staticvoidlog_allocate_buffer(log_t &log){
  ...
  log.buf.create(srv_log_buffer_size);
}
//内存释放staticvoidlog_deallocate_buffer(log_t &log){ log.buf.destroy(); }

2.6 table cache

MySQL中对内存中打开表的数量和表结构数量做了限制。open_table的过程涉及到sever层和引擎层，这里针对innodb中涉及的动作。

InnoDB层的开表动作从函数ha_innobase::open开始，主要包括了dict_table_t的构建和row_prebuilt_t这个结构的建立。ib_table的获取顺序是session_cache、dict_sys->hash_table、dd_open_table

int ha_innobase::open(constchar *name, int, uint open_flags,
                      const dd::Table *table_def) {
  ...
  ib_table = thd_to_innodb_session(thd)->lookup_table_handler(norm_name);
  
  ...
  ib_table = dict_table_check_if_in_cache_low(norm_name);
  
  ...  
  ib_table = dd_open_table(client, table, norm_name, table_def, thd);
  
  ...
  m_prebuilt = row_create_prebuilt(ib_table, table->s->reclength);

  ...
}

下面分别就ib_table的来源内存进行说明

session_table_cache

每个THD内部保存了thread_local的数据，通过该数据可以获取session下的m_open_tables映射表。该表的插入删除查找都是基于std::map进行。

classinnodb_session_t {
  table_cache_t m_open_tables;
  ...
};

dict_sys->table_hash

dicy_sys中table_hash的构造实际上是在数据字典初始化的时候完成的，主要包括：lock的构建、table_LRU链表的构建、table_hash的构建，也是通过hash_create这个结构进行构建，这部分内存是在dict_init中完成分配的。

void dict_init(void) {
  ...
  dict_sys->table_hash = hash_create(
      buf_pool_get_curr_size() / (DICT_POOL_PER_TABLE_HASH * UNIV_WORD_SIZE));
  dict_sys->table_id_hash = hash_create(
      buf_pool_get_curr_size() / (DICT_POOL_PER_TABLE_HASH * UNIV_WORD_SIZE));
  ...
}

dd_open_table

在试图获取缓存表失败后，最终会通过dd_open_table接口构造dict_table_t，底层的调用是dict_mem_table_create，通过heap的方式对dict_table_t的所有结构进行构造，构造完成后，会把最新的table保存在dict的hash_table中。

dd_open_table
    |->dd_open_table_one
    |    |->dd_fill_dict_table //create dict_table_t
    |        |->dict_mem_table_create // create
    |           {
    |               // dict_table_t和内部的col、locks等内存都从这个heap上面分配，DICT_HEAP_SIZE=100
    |               heap = mem_heap_create(DICT_HEAP_SIZE);
    |        	   ...
    |               table = static_cast(mem_heap_zalloc(heap, sizeof(*table)));
    |               ...
    |               table->heap = heap
    |               table->cols = static_cast(
    |               mem_heap_alloc(heap, table->n_cols * sizeof(dict_col_t)));
    |               table->v_cols = static_cast(
    |                  mem_heap_alloc(heap, n_v_cols * sizeof(*table->v_cols)));
    |               table->autoinc_lock =
    |                      static_cast(mem_heap_alloc(heap, lock_get_size()));
    |               ...
    |           }
    |->dict_table_add_to_cache(m_table, TRUE, heap);

server层中的总的table cache和打开表数量、字段长度都有关系，每个table cache占据的内存从几十k ～几百k不等，可以参考这篇文章。

2.7 lock_sys_t

锁系统也是在innodb start/create的时候构建的，主要的数据内容包括行锁哈希表、Predicate Locks哈希表、predicate page locks哈希表等，主要的构建和销毁操作如下。

void lock_sys_create(ulint n_cells)
{
  ...
  lock_sys->rec_hash = hash_create(n_cells);
  lock_sys->prdt_hash = hash_create(n_cells);
  lock_sys->prdt_page_hash = hash_create(n_cells);
  ...
}

void lock_sys_close(void) {
  ...
  hash_table_free(lock_sys->rec_hash);
  hash_table_free(lock_sys->prdt_hash);
  hash_table_free(lock_sys->prdt_page_hash);
  ...
}

主要的内存消耗都是在三个hash_table的构造上，并且是“裸”构造，没有涉及heap/heaps的初始化，所有的内存都是通过malloc的方式去构造。各个hash_table的需要的内存和srv_lock_table_size相关，其值在innodb启动时被指定（srv_lock_table_size = 5 * (srv_buf_pool_size / UNIV_PAGE_SIZE)）。

2.8 os_event_t

大多数锁、互斥量的构建和初始化最终都会相应到os_event_t的构造，但是零散的、临时的mutex等并不会造成很大的内存压力。在前文提到的在buf_block_t的初始化中就有mutex和rw_lock的初始化，其生命周期和bp相当，数量和buf_block_t相等，会占据很大一部分内存。

buf_block_init：

/** Initializes a buffer control block when the buf_pool is created. */staticvoidbuf_block_init(
    buf_pool_t *buf_pool, /*!< in: buffer pool instance */
    buf_block_t *block,   /*!< in: pointer to control block */byte *frame,          /*!< in: pointer to buffer frame */
    buf_chunk_t *chunk,   /*!< in: pointer to chunk */bool sync_init_nolock){
  ...
  mutex_create(LATCH_ID_BUF_BLOCK_MUTEX, &block->mutex); // or mutex_create_nolock
  ...
  rw_lock_create(PFS_NOT_INSTRUMENTED, &block->lock, SYNC_LEVEL_VARYING); // or rw_lock_create_nolock
  ...
}

mutex_create

mutex_create()
    |->mutex_init()
        |->TTASEventMutex::init()
          |->os_event_create()

rw_lock_create

rw_lock_create()
    |->pfs_rw_lock_create_func()
    |->rw_lock_create_func()
        |->os_event_create()

os_event_create的底层实现是调用了malloc的方式，最终由系统分配这部分的内存。

os_event_t os_event_create() {
  os_event_t ret = (UT_NEW_NOKEY(os_event()));
  return ret;
}

2.9 内存占用

对象	来源	详细	大小	分配方式
Buffer Pool	buf_pool_create	chunk	BP + BP/16k * 440 (round)	ut_allocator.allocate_large
	buf_pool_create	page_hash	2 * BP/16k * 8 (prime)	ut_allocator.allocate
	buf_pool_create	zip_hash	2 * BP/16k * 8 (prime)	ut_allocator.allocate
AHI	buf_pool_init	hash_tables	BP / 8 / 64 * 8 (prime)	ut_allocator.allocate mem_heap_allocator (from BP)
log buffer	log_allocate_buffer	buf	srv_log_buffer_size	ut_allocator.allocate
DD cache	dict_init	table_hash	BP / 4096 * 8 (prime)	ut_allocator.allocate
		table_id_hash	BP / 4096 * 8 (prime)	ut_allocator.allocate
lock system	lock_sys_create	rec_hash	5 * BP / 16k * 8 (prime)	ut_allocator.allocate
		rec_hash	5 * BP / 16k * 8 (prime)	ut_allocator.allocate
		rec_hash	5 * BP / 16k * 8 (prime)	ut_allocator.allocate
osevent	buf_block_init	mutex	112 * BP / 16k (round)	ut_allocator.allocate
		rw_lock	2 * 112 * BP / 16k (round)	ut_allocator.allocate

round代表分配的大小需要做圆整对齐处理、prime代表需要做质数化处理。

2.10 小结

bp指定的size最终体现了chunk的内存中，实际内存和指定的size可能存在差异。

AHI结构中采用malloc的方式申请了cells，但实际的数据都保存在heap中，该部分内存从bp中获取。在AHI中存在多个hash_table，目前是采用loop方式构建，可以考虑并行初始化；减少哈希冲突进而减少mem_heap的内存使用。

很多内存结构都和hash_table相关，hash_table实际的内存占用需要做质数化处理。

绝大多数的os_event_t在buf_block_t的初始化中产生，该部分的内存占用也是比较大的。

在实际的内存分配中，除了指定的bp大小之外，系统还会产生额外的内存，本节只是列举了一部分。Oracle的分配内存的方式对用户更加友好，指定固定的内存，具体的分配在内部完成，可以很好控制内存总量。

三、SQL层内存分配管理器MEM_ROOT

sql层的内存分配管理除了基础的alloc/free的形式外，主要应用了MEM_ROOT这一结构，降低了内存操作的时间和资源的损耗。本文中主要针对MEM_ROOT的相关内容进行介绍。

MEM_ROOT作为一种通用的内存管理对象，大量使用于sql层，如在THD、TABLE_SHARE等结构中都包含了其作为内存分配器。事实上，MEM_ROOT只是负责管理内存，实际分配的内存来源是其结构成员Block，MEM_ROOT中只包含一块Block且只对当前唯一的Block负责，Block则是含有指向前一Block节点的指针，串成一条链表。

和1.2.1小结提到的mem_heap_t不同，MEM_ROOT主要负责sql层相关的内存分配，mem_heap_t在innodb中单独实现，负责innodb相关的内存分配，但两者的结构和实现模式上是类似的。

3.1 MEM_ROOT数据结构

Block是其核心结构，所有的内存分配都源自于此。Block中包含了指向前1Block的指针prev，同时保留了end作为地址范围的标志，表明Block所管理的内存范围。

m_block_size记录了MEM_ROOT下一次要分配和管理的Block内存块的总大小，当申请新的Block块时，该值都会更新为原值的1.5倍。

m_allocated_size记录了MEM_ROOT从OS分配出的内存总量，每次分配新的Block时该值也会进行更新。

m_current_block、m_current_free_start、m_current_free_end分别记录了当前管理block的起始地址、空闲地址和结束地址。

m_max_capacity定义了MEM_ROOT的管理的最大内存，m_error_for_capacity_exceeded是内存超出最大限制的控制开关，m_error_handler是内存超出的错误处理函数指针；m_psi_key是PFS内存监测点。

3.2 MEM_ROOT关键接口

3.2.1 构造函数 && 赋值操作

MEM_ROOT的原始构造方式内容很简单，只对m_block_size、m_orig_block和m_psi_key进行赋值，同时MEM_ROOT采用了移动构造和移动赋值的方式，对持有的MEM_ROOT进行接管，主要逻辑如下：

// 移动构造函数MEM_ROOT(MEM_ROOT&&other)noexcept:m_xxx(other.m_cxxx),...{other.m_xxx=nullptr/0/origin_value;...}// 移动赋值MEM_ROOT&operator=(MEM_ROOT&&other)noexcept{Clear();::new(this)MEM_ROOT(std::move(other));return*this;}

3.2.2 Alloc

该函数是根据传入的所需内存空间大小从当前所管理的、已有的Block块上返回一块新的起始地址，同时对内存使用信息进行更新。当MEM_ROOT所管理的Block大小不满足要求时，则会调用AllocSlow函数进行新Block的分配和管理。同时需要注意的是，返回的地址总是8-aligned。

3.2.3 AllocSlow

该函数用于申请新的Block，根据使用场景的差异，底层调用了两种分配模式，返回的内存地址同样是对齐的。

当所需的内存很大时或是有独占一块内存的需求时，在申请完新的内存块后，并不会将新生请的Block置为当前所管理的Block（除非是MEM_ROOT首次申请），而是将其置为链表中的倒数第2块（即current_block的前一节点）。设计者不希望大内存申请和独占内存的形式对后续的内存分配造成干扰，大内存的申请会导致后续分配Block时x1.5的基数变大，难以控制内存申请量的增长；同时，若后续的内存分配和有独占内存需求的内存块相接，会导致内存的控制复杂。通过保持原有的current_block的方式，能够很好地避免上述问题的发生。

在非上述的情况下，优先使用追加内存块到current_block尾部并更新current_block的方式进行分配。

void *MEM_ROOT::AllocSlow(size_t length) {
  // 本次申请的内存很大或是要求是独占一块内存的形式if (length >= m_block_size || MEM_ROOT_SINGLE_CHUNKS) {
    Block *new_block =
        AllocBlock(/*wanted_length=*/length, /*minimum_length=*/length);
    if (new_block == nullptr) returnnullptr;
    if (m_current_block == nullptr) {
      new_block->prev = nullptr;
      m_current_block = new_block;
      m_current_free_end = new_block->end;
      m_current_free_start = m_current_free_end;
    } else {
      // Insert the new block in the second-to-last position.
      new_block->prev = m_current_block->prev;
      m_current_block->prev = new_block;
    }
    return pointer_cast(new_block) + ALIGN_SIZE(sizeof(*new_block));
  } else { // 常规情况if (ForceNewBlock(/*minimum_length=*/length)) {
      returnnullptr;
    }
    char *new_mem = m_current_free_start;
    m_current_free_start += length;
    return new_mem;
  }
}

3.2.4 AllocBlock

该函数是Block分配的基础函数，底层是调用my_malloc函数进行内存的申请，根据PSI的信息和PFS开关等会对数据进行统计。my_malloc和my_free函数在后续会做简单的介绍，此处不再赘述。

在设置了内存超出限制的错误标志下，大内存的申请可能会导致失败。同时AllocBlock支持传入wanted_length和minium_length参数，在某些情况下能够分配出minium_length的内存大小。在每次分配完毕后，m_block_size都会调整为当前的1.5倍，避免后续频繁的调用alloc。

3.2.5 ForceNewBlock

该函数对应上文AllocSlow的第二种内存分配方式，直接调用AllockBlock进行内存块的申请，然后将其挂在Block链表的尾部，并设置其为MEM_ROOT所管理的当前Block。

3.2.6 Clear

Clear函数执行的逻辑较为简单，主要做了两件事：

将MEM_ROOT的所有状态置为初始状态

遍历Block链表节点并释放

3.2.7 ClearForReuse

当此前使用的内存不再需要试图释放，但又不想再MEM_ROOT再次被使用时重新走一遍Alloc…的流程时，ClearForReuse起了很大的作用。和Clear函数free所有Block不同，ClearForReuse会保持当前的Block，，而释放其他节点。换言之，经过ClearForReuse操作后，Block链表中只留下了最后的节点。但是在独占内存的场景下，代码逻辑依旧会走到Clear()。

3.2.8 其他

MEM_ROOT的内存分配方式都是字节对齐的，处理方式是在上层的Alloc等接口中对所需要的内存length进行圆整操作。但同时MEM_ROOT提供了“非标”操作的接口，提供了Peek、RawCommit等函数，支持直接对底层的Block进行操作，需要注意的是，这类操作的发生频率不高，并且下一次使用Alloc等操作时，会重新将内存做圆整处理。

3.3 MEM_ROOT在THD中的应用

MEM_ROOT在sql层的使用十分频繁，常用在THD、THD::transactions、Prepared_statement:、TABLE_SHARE、sp_head、sp_head、table_mapping等结构中，下面以最常见的使用场景THD为例，简要介绍MEM_ROOT在sql层中的应用。

THD中包括了三个MEM_ROOT（包括对象和指针），main_mem_root，user_var_events_alloc和mem_root。

3.3.1 main_mem_root

MEM_ROOT对象，随THD结构析构，主要用于执行sql过程中涉及的解析、运行时数据的存储。

This memory root is used for two purposes: - for conventional queries, to allocate structures stored in main_lex during parsing, and allocate runtime data (execution plan, etc.) during execution. - for prepared queries, only to allocate runtime data. The parsed tree itself is reused between executions and thus is stored elsewhere.
THD::THD(bool enable_plugins) : Query_arena(&main_mem_root, STMT_REGULAR_EXECUTION), ... lex_returning(new im::Lex_returning(false, &main_mem_root)), ... { main_lex->reset(); set_psi(nullptr); mdl_context.init(this); init_sql_alloc(key_memory_thd_main_mem_root, &main_mem_root, global_system_variables.query_alloc_block_size, global_system_variables.query_prealloc_size); ... }
3.3.2 mem_root

当前mem_root的指针，在THD初始化时指向main_mem_root，但在实际应用时会发生变化，通过临时改变mem_root指向的方式使用其他对象的MEM_ROOT来申请内存，使用完毕后再将mem_root指向初始内存地址(main_mem_root)。

问：为什么要把mem_root设计成可变动的对象？为什么要把mem_root的内存指针嵌入到THD？

答：方便控制内存大小，若thd->mem_root始终指向main_mem_root，相应的内存会一直存在直到THD析构，改变mem_root指向可以更好地控制内存生存周期，让临时的内存占用得以释放，和长期存在的内存分离。嵌入到THD（实际上是其父类Query_arena）中，可以让THD占用的内存统计信息更清晰、管理过程更简洁，即尽管该部分内存不是直接由THD产生，而是在执行语句的过程中产生的，同样需要把“责任”归属在THD上。简化函数传参，减少一个MEM_ROOT的参数，传入THD即可。 ```CPP THD::THD(bool enable_plugins) : Query_arena(&main_mem_root, STMT_REGULAR_EXECUTION), …

MEM_ROOT* old_mem_root = thd->mem_root; // 保存原来的mem_root(main_mem_root) thd->mem_root = xxx_mem_root; // mem_root大多是临时性的MEM_ROOT // do something using memory … thd->mem_root = old_mem_root; // 恢复成原来的mem_root(main_mem_root)

mem_root临时置换的操作发生在以下的几个位置，但由于MEM_ROOT本身的设计（移动构造等），会让内存资源的统计继续使用之前的PSI_MEMORY_KEY而不至于造成统计数据的复杂和混乱。
```CPP
// sql/dd_table_share.cc
open_table_def() 

// sql/sp_head.cc
sp_parser_data::start_parsing_sp_body() &&
sp_parser_data::finish_parsing_sp_body()

// sql/sp_instr.cc PSI_NOT_INSTRUMENTED
LEX *sp_lex_instr::parse_expr() 

// sql/sql_cursor.cc
Query_result_materialize::start_execution()

// sql/sql_table.cc
rm_table_do_discovery_and_lock_fk_tables()
drop_base_table()
lock_check_constraint_names()

// sql/thd_raii.h 该类及其调用之处(sql/auth/sql_auth_cache.cc:grant_load())class Swap_mem_root_guard; 

// sql/auth/sql_authorization.cc
mysql_table_grant() // 存储表级、行级权限
mysql_routine_grant() // 存储routine级权限/* sql/dd/upgrade_57/global.h  storage/ndb/pligin/ndb_dd_upgrade_table.cc 
    该类及其调用之处 */class Thd_mem_root_guard

3.3.3 user_var_events_alloc

memroot指针，用于分配THD中的Binlog_user_var_event数组元素，通常和thd->mem_root指向相同。

3.4 小结

MEM_ROOT是MySQL-sql层中使用最多的内存分配器，类似mem_heap_t，其同样存在Block碎片问题，但其在设计时提供了ClearForReuse这样的接口，可以及时释放前面所占用的内存；此外，MEM_ROOT在设计中考虑了独占内存和大内存的场景，降低了一次后续申请的内存大小。同时在THD结构中，MEM_ROOT指针的灵活使用给内存的运用提供了新的思路，值得借鉴。

四、8028新特性 - Global and session memory allocation limits

4.1 功能改动

8028引入，该WL主要对session和global级别的内存申请做了限制，降低出现OOM的风险。

4.1.1 添加variables

MySQL[(none)]>showvariableswherevariable_namein('global_connection_memory_limit','connection_memory_limit','connection_memory_chunk_size','global_connection_memory_tracking');+-----------------------------------+----------------------+|Variable_name|Value|+-----------------------------------+----------------------+|connection_memory_chunk_size|8912||connection_memory_limit|18446744073709551615||global_connection_memory_limit|18446744073709551615||global_connection_memory_tracking|OFF|+-----------------------------------+----------------------+MySQL[(none)]>showstatuslike"Global_connection_memory";+--------------------------+-------+|Variable_name|Value|+--------------------------+-------+|Global_connection_memory|0|+--------------------------+-------+

4.1.2 修改PFS_thread、PSI_thread_service_v5、THD

classPFS_thread {
...
+ THD *m_cnt_thd // 用于更新内存计数器的THD
...
};

// ------------------------------------------------------------- //struct PSI_thread_service_v5 {
...
+ set_mem_cnt_THD_v1_t set_mem_cnt_THD;
};
typedef void(*set_mem_cnt_THD_v1_t)(THD *thd, THD **backup_thd);

// ------------------------------------------------------------- //classTHD {
...
+ Thd_mem_cnt *mem_cnt;    // 内存计数器对象
+ boolenable_mem_cnt();   // 启用内存计数器
+ voiddisable_mem_cnt();  // 关闭内存计数器
...
};

m_cnt_thd是负责更新内存计数信息的THD，在组提交等操作中会存在THD转换的问题，该成员可以确保转换时内存统计信息的正确性。

接口set_mem_cnt_THD是协助完成THD转换的函数，分别对m_thd和m_cnt_thd进行设置，大部分情况下两者是相同的。

THD结构中新增的mem_cnt在初始化时为Thd_mem_cnt_noop（空操作计数器），在connnection的prepare阶段通过调用enable_mem_cnt创建为Thd_mem_cnt_conn（真正具备计数功能）；在THD析构阶段调用disable_mem_cnt释放该计数器。

// Thd_mem_cnt_conn创建
thd_prepare_connection()
|   thd->enable_mem_cnt() {
|   | Thd_mem_cnt *tmp_mem_cnt = new Thd_mem_cnt_conn(this);
|   | mem_cnt = tmp_mem_cnt;
|   }
// Thd_mem_cnt_conn释放
～THD()
|	THD::release_resources()
|   |	disable_mem_cnt() {
|   |   |  mem_cnt->flush(); // 清空当前THD的内存计数信息并扣除对应的gloabl数据
|   |   |  delete mem_cnt;
|   |   }

4.1.3 添加class Thd_mem_cnt_conn

数据结构

在介绍类之前，首先需要知道引入的计数模式，通过位运算可以实现多种模式的组合。

enum enum_mem_cnt_mode {
  MEM_CNT_DEFAULT = 0U, // 不计数
  MEM_CNT_UPDATE_GLOBAL_COUNTER = (1U << 0), //更新global信息
  MEM_CNT_GENERATE_ERROR = (1U << 1), // 产生OOM错误信息
  MEM_CNT_GENERATE_LOG_ERROR = (1U << 2) // 产生OOM错误信息写入日志
};

Thd_mem_cnt_conn的关键数据结构如下:

mem_count、max_conn_mem、glob_mem_counter分别对应已申请的内存、最大内存（该值并不是一个指定值，会随mem_count变化）和传递给global计数的值。

问：为什么还需要一个glob_mem_counter呢，直接将当前的mem_count累加到全局内存计数器不可以吗?

答：每次对全局计数器进行操作会影响并发度。还记得参数connection_memory_chunk_size吗，这个参数的意义是每次汇总到总内存计数的size是chunk_size的整数倍，也就是说glob_mem_counter = connection_memory_chunk_size * n。提前汇总足够多数量的内存计数到global中可以避免每次增加零散内存数量带来的全局数据的频繁改动，只有mem_count > glob_mem_counter时才对global数据进行写入，同时将glob_mem_counter加上m * connection_memory_chunk_size。因此说， connection_memory_chunk_size能够控制全局计数器更新的频率。同时，这个操作也会引发提前OOM的发生，因此connection_memory_chunk_size不宜设置的太大。

mode参数枚举类型enum_mem_cnt_mode中的组合，例如SUPER用户在连接建立时的mode是MEM_CNT_UPDATE_GLOBAL_COUNTER，而普通的用户的mode则是MEM_CNT_UPDATE_GLOBAL_COUNTER ｜ MEM_CNT_GENERATE_ERROR ｜ MEM_CNT_GENERATE_LOG_ERROR。在进行内存计数时会使用这个判断位，决定是否产生错误并kill connection。换言之，SUPER用户在执行查询等操作时是不会受到limit参数的限制的，而普通用户则会收到varibales的影响。

staticvoidprepare_new_connection_state(THD *thd){
    ...
    thd->mem_cnt->set_orig_mode(is_admin_conn ? MEM_CNT_UPDATE_GLOBAL_COUNTER
                                                : (MEM_CNT_UPDATE_GLOBAL_COUNTER |
                                                   MEM_CNT_GENERATE_ERROR |
                                                   MEM_CNT_GENERATE_LOG_ERROR));
    ...
}

关键接口

alloc_cnt

该函数的功能是对thd和global级别的内存计数信息进行更新。主要做了以下几件事：

修改mem_counter、max_conn_mem、glob_mem_counter，这里可以看出max值是随mem_counter更新的，glob_mem_counter也是lazy添加到全局内存计数器中的，只有满足（max_conn_mem > glob_mem_counter）才会重新插值delta到全局计数器。由于访问全局计数器需要加锁，因此这样的操作可以避免每次的访问都加锁。

产生错误信息，包括connection级别的和global级别的错误信息。generate_error会报错传入的错误信息给thd赋予 THD::KILL_CONNECTION，随后连接会因此而killed

bool Thd_mem_cnt_conn::alloc_cnt(size_t size) {
  mem_counter += size;
  max_conn_mem = std::max(max_conn_mem, mem_counter);

  // connection级别的报错if (mem_counter > m_thd->variables.conn_mem_limit) {
      (void)generate_error(ER_DA_CONN_LIMIT, m_thd->variables.conn_mem_limit,
                            mem_counter);
  }
  // 三个条件分别指代：开启全局更新、开启内存追踪、存量大于提前量if ((curr_mode & MEM_CNT_UPDATE_GLOBAL_COUNTER) &&
      m_thd->variables.conn_global_mem_tracking &&
      max_conn_mem > glob_mem_counter) {
    // 控制全局计数器更新频率const ulonglong curr_mem =
        (max_conn_mem / m_thd->variables.conn_mem_chunk_size + 1) *
        m_thd->variables.conn_mem_chunk_size;
    ulonglong delta = curr_mem - glob_mem_counter;
    ulonglong global_conn_mem_counter_save;
    ulonglong global_conn_mem_limit_save;
    {
      MUTEX_LOCK(lock, &LOCK_global_conn_mem_limit);
      global_conn_mem_counter += delta;
      global_conn_mem_counter_save = global_conn_mem_counter;
      global_conn_mem_limit_save = global_conn_mem_limit;
    }
    glob_mem_counter = curr_mem;
    max_conn_mem = std::max(max_conn_mem, glob_mem_counter);
      
    // global级别的报错if (global_conn_mem_counter_save > global_conn_mem_limit_save) {
      (void)generate_error(ER_DA_GLOBAL_CONN_LIMIT, global_conn_mem_limit_save,
                            global_conn_mem_counter_save);
    }
  }
  returntrue;
}

free_cnt

该函数的功能单一，只对connection级别的mem_counter做减法，全局数据的修改在reset函数中完成，目的同样是为了减少全局资源的竞用。

voidThd_mem_cnt_conn::free_cnt(size_t size) {
  mem_counter -= size;
}

reset

free_cnt操作只是减去了thd级别的内存计数，全局的计数数据更新在reset函数中完成，该函数保证了当前的thd和global处于最新的状态。主要做了以下几件事：

重置mode，此前的一些操作可能会将计数器的mode进行修改（例如在prepare connection阶段），这里要确保更新前counter处于正确的模式，避免出现不同权限操作出错（如此前的super和普通用户等）。

更新三个计数数据，当glob_mem_counter > mem_counter时，表明此前有free_cnt操作减少了mem_counter，此处对glob_mem_counter和全局数据进行更新；反之表明存在未加入全局内存的thd级别内存，也需要将差值补全。在reset过程中也可能出现内存不足的情况，同样需要调用错误产生函数对错误信息进行报告，设置kill标志。

int Thd_mem_cnt_conn::reset() {
  // 重置mode
  restore_mode();
  max_conn_mem = mem_counter;

  // 更新计数数据信息
  if (m_thd->variables.conn_global_mem_tracking &&
      (curr_mode & MEM_CNT_UPDATE_GLOBAL_COUNTER)) {
    ulonglong delta;
    ulonglong global_conn_mem_counter_save;
    ulonglong global_conn_mem_limit_save;
    if (glob_mem_counter > mem_counter) {
      delta = glob_mem_counter - mem_counter;
      MUTEX_LOCK(lock, &LOCK_global_conn_mem_limit);
      assert(global_conn_mem_counter >= delta);
      global_conn_mem_counter -= delta;
      global_conn_mem_counter_save = global_conn_mem_counter;
      global_conn_mem_limit_save = global_conn_mem_limit;
    } else {
      delta = mem_counter - glob_mem_counter;
      MUTEX_LOCK(lock, &LOCK_global_conn_mem_limit);
      global_conn_mem_counter += delta;
      global_conn_mem_counter_save = global_conn_mem_counter;
      global_conn_mem_limit_save = global_conn_mem_limit;
    }
    glob_mem_counter = mem_counter;
    if (is_connection_stage &&
        (global_conn_mem_counter_save > global_conn_mem_limit_save))
      return generate_error(ER_DA_GLOBAL_CONN_LIMIT, global_conn_mem_limit_save,
                            global_conn_mem_counter_save);
  }
  if (is_connection_stage && (mem_counter > m_thd->variables.conn_mem_limit))
    return generate_error(ER_DA_CONN_LIMIT, m_thd->variables.conn_mem_limit,
                          mem_counter);
  is_connection_stage = false;
  return0;
}

flush

该函数清空当前连接的内存计数，同时扣除全局的内存计数。在删除计数器对象前，必须要先调用此函数，确保计数正确。

void Thd_mem_cnt_conn::flush() {
  max_conn_mem = mem_counter = 0;
  if (glob_mem_counter > 0) {
    MUTEX_LOCK(lock, &LOCK_global_conn_mem_limit);
    global_conn_mem_counter -= glob_mem_counter;
  }
  glob_mem_counter = 0;
}

4.2 内存限制过程

4.2.1 执行流程

以最简单的handle_connection为例（非线程池模型），连接建立到执行语句到连接关闭过程对应的内存限制操作如下图所示：

...
if (thd_prepare_connection(thd))
  handler_manager->inc_aborted_connects();
else {
  while (thd_connection_alive(thd)) {
    if (do_command(thd)) break;
  }
  end_connection(thd);
}
close_connection(thd, 0, false, false);
...

4.2.2 关键函数

计数器的构建、销毁、计数信息的加减更新等操作在3.1中做了说明，此处针对内存申请时添加计数器的处理逻辑进行说明。

在connection建立和query执行的过程涉及的内存基本通过my_malloc（结构数据、sort buffer等）和allocate_from（临时表）这两个接口进行，对应的释放函数为my_free和deallocate_from。两种内存申请方式中对于计数器的处理是相同的逻辑，这里以my_malloc/my_free为例对其中涉及的计数器操作逻辑做进一步说明。

my_malloc

my_malloc中主要做了两件事：

构建内存块头部，其中保存了size、magic、psi_memory_key等信息

调用PSI_thread_service_v5服务中的pfs_memory_alloc_vc接口对key进行赋值，实际的计数器更新就在这个接口中进行。

void *my_malloc(PSI_memory_key key, size_t size, myf flags) {
  // malloc出一块包含header信息的内存块
  my_memory_header *mh;
  size_t raw_size;
  raw_size = PSI_HEADER_SIZE + size;
  mh = (my_memory_header *)my_raw_malloc(raw_size, flags);

  // 对header数据结构初始化，调用pfs_memory_alloc_vc对head->key进行赋值if (likely(mh != nullptr)) {
    void *user_ptr;
    mh->m_magic = PSI_MEMORY_MAGIC;
    mh->m_size = size;
    // 调用服务
    mh->m_key = PSI_MEMORY_CALL(memory_alloc)(key, raw_size, &mh->m_owner);
    user_ptr = HEADER_TO_USER(mh);
    MEM_MALLOCLIKE_BLOCK(user_ptr, size, 0, (flags & MY_ZEROFILL));
    return user_ptr;
  }
  returnnullptr;
}

pfs_memory_alloc_vc

这个函数是计数数据增加的入口，主要工作如下：

根据key找到对应的PFS_memory_class

获取PFS_thread，在启用了计数器的情况下，对统计数据进行更新。PFS_memory_key类型只要执行了注册memory_class逻辑（register_memory_class），就会启用计数器对象。

返回key值，若启用计数器，此时的key值是经过PSI_MEM_CNT_BIT（1 « 31）标记的。

PSI_memory_key pfs_memory_alloc_vc(PSI_memory_key key, size_t size,
                                    PSI_thread **owner) {
  // 获取key对应的PFS_memory_class
  PSI_memory_key result_key = key;
  ...
  PFS_memory_class *klass = find_memory_class(key);

  // 启动thread监控维度、非全局监控模式if (flag_thread_instrumentation && !klass->is_global()) {
    PFS_thread *pfs_thread = my_thread_get_THR_PFS();
    // 判断是否启用计数器，在PFS_memory_class初始化阶段if (klass->has_memory_cnt()) {
      if (pfs_thread->m_cnt_thd != nullptr && pfs_thread->mem_cnt_alloc(size))
        // 标志位，标记key是否经过计数器的处理
        result_key |= PSI_MEM_CNT_BIT;
    }
    // 统计信息更新
    ...
    *owner_thread = pfs_thread;
  } else {
    // 统计信息更新
    ...
    *owner_thread = nullptr;
  }
  return result_key;
}

my_free && pfs_memory_free_vc

和上述的两个函数功能相反，my_free中首先调用pfs_memory_free_vc对key进行释放，包括了计数器的信息的扣除更新等，然后对包含header在内的整块内存区域进行释放。

问：那些内存会被计数器进行统计呢？

答：在psi_memory_key.cc中，新特性引入的PSI_FLAG_MEM_COLLECT标志位，对all_server_memory数组中需要进行限制的内存打上了标签。

4.3 简单测试

4.3.1 测试准备

创建普通用户RDS_test

构建大数据记录

设置较小的connection_memory_limit

create user RDS_test identified by 'RDS_test';grant select on test.* to RDS_test;use test;create table t(id int primary key, c longtext);insert t values (1, lpad('RDS', 6000000, 'test'));set global connection_memory_limit=1024 * 1024 * 2;set connection_memory_limit=1024 * 1024 * 2;

4.3.2 测试

普通用户执行

# $mysql -uRDS_test -h127.0.0.1 -P3017 -pMySQL[test]>showvariableslike"connection_memory_limit";+-------------------------+---------+|Variable_name|Value|+-------------------------+---------+|connection_memory_limit|2097152|+-------------------------+---------+MySQL[test]>selectcount(c)fromtgroupbyc;ERROR4082(HY000):Connectionclosed.Connectionmemorylimit2097152bytesexceeded.Consumed7079568bytes.

SUPER用户执行

MySQL[test]>showvariableslike"connection_memory_limit";+-------------------------+---------+|Variable_name|Value|+-------------------------+---------+|connection_memory_limit|2097152|+-------------------------+---------+MySQL[test]>selectcount(c)fromtgroupbyc;+----------+|count(c)|+----------+|1|+----------+

4.3.3 测试结果

引入了这个功能后，对普通用户的内存使用被限制，直接被kill，但super用户还是不受限制的。

4.4 小结

对于SUPER用户和普通用户，内存限制有差别，前者不做限制。

connection_memory_chunk_size的引入能够控制全局计数器的更新频率，减少锁的争用，但在该变量值设置的较大的情况下，容易提前报告OOM错误导致connection被kill。

计数器数据操作中session和global数据减少是分离的，global数据的更新总是滞后于session，这同样也可以减少锁的争用，但存在单个do_command操作多次的alloc_cnt和free_cnt导致提前报告OOM错误的可能性（只执行free_cnt，但没有其他session做reset操作）。

OOM仍旧有可能在connnecion操作中产生，my_malloc/allocate_from阶段提前映射很小部分的物理内存，也可能刚好触发OOM。此外，super用户的操作没有做内存限制，可能也会引发OOM。

内存统计和限制操作依赖于PFS_thread，计数器数据的更新首先通过该对象传递。

五、总结展望

MySQL/InnoDB在内存的分配、使用、管理上做了很多工作和优化，各模块单独抽离出来也是一套内存分配管理系统，其设计方式和使用策略都有值得学习的地方。

不难发现，在InnoDB中内存实际上还是基本可控的，因为大多数的内存都由指定的size进行控制，额外产生的内存也能粗略的推断出。在MySQL服务工作工程中，特别是在sql层，还有许多无法准确估量的内存损耗，如果没有很好地对其进行控制，可能就会引发OOM。官方引入的connection/global的内存使用限制对这个情况进行了优化，降低了实例发生OOM的风险，但与此同时，OOM的问题还无法完全避免，有待进一步优化。

sql层中其它内存的使用如net_buffer、join_buffer、sort_buffer等也会在运行中占据不小内存，同时在Server启动的阶段也会产生许多临时性的内存如recovery、初始化等所需的内存等等，相关的内容会在后续的文章中介绍。

你可能感兴趣的:(数据库,mysql,数据库,database,sql)

mysql禁用远程登录 igotyback mysql
去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
SpringBlade dict-biz/list 接口 SQL 注入漏洞文章永久免费只为良心 oracle 数据库
SpringBladedict-biz/list接口SQL注入漏洞POC:构造请求包查看返回包你的网址/api/blade-system/dict-biz/list?updatexml(1,concat(0x7e,md5(1),0x7e),1)=1漏洞概述在SpringBlade框架中，如果dict-biz/list接口的后台处理逻辑没有正确地对用户输入进行过滤或参数化查询（PreparedSta
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
MyBatis 详解阿贾克斯的黎明 java mybatis
目录目录一、MyBatis是什么二、为什么使用MyBatis（一）灵活性高（二）性能优化（三）易于维护三、怎么用MyBatis（一）添加依赖（二）配置MyBatis（三）创建实体类和接口（四）使用MyBatis一、MyBatis是什么MyBatis是一个优秀的持久层框架，它支持自定义SQL、存储过程以及高级映射。MyBatis免除了几乎所有的JDBC代码以及设置参数和获取结果集的工作。它可以通过简
3.增删改查--连接查询问女何所忆
关系型数据库的一个特点就是，多张表之间存在关系，以致于我们可以连接多张表进行查询操作，所以连接查询会是关系型数据库中最常见的操作。连接查询主要分为三种，交叉连接、内连接和外连接，我们一个个说。1、交叉连接交叉连接其实连接查询的第一个阶段，它简单表现为两张表的笛卡尔积形式，具体例子：如果你没学过数学中的笛卡尔积概念，你可以这样简单的理解这里的交叉连接：两张表的交叉连接就是一个连接合并的过程，T1表中
You have an error in your SQL syntax； check the manual that corresponds to your MySQL server version 努力的菜鸟~ sql 数据库
YouhaveanerrorinyourSQLsyntax;checkthemanualthatcorrespondstoyourMySQLserverversionfortherightsyntaxtousenear‘IDENTIFIEDBY‘123456’WITHGRANTOPTION’atline1在mysql5.7之前GRANTALLPRIVILEGESON*.*TO'root'@'%'I
docker from指令的含义_多个FROM-含义 weixin_39722188 docker from指令的含义
小编典典什么是基本图片？一组文件，加上EXPOSE端口ENTRYPOINT和CMD。您可以添加文件并基于该基础图像构建新图像，Dockerfile并以FROM指令开头：后面提到的图像FROM是新图像的“基础图像”。这是否意味着如果我neo4j/neo4j在FROM指令中声明，则在运行映像时，neo数据库将自动运行并且可在端口7474的容器中使用？仅当您不覆盖CMD和时ENTRYPOINT。但是图像
Redis:缓存击穿我的程序快快跑啊缓存 redis java
缓存击穿(热点key)：部分key(被高并发访问且缓存重建业务复杂的)失效,无数请求会直接到数据库，造成巨大压力1.互斥锁：可以保证强一致性线程一：未命中之后，获取互斥锁，再查询数据库重建缓存，写入缓存，释放锁线程二：查询未命中，未获得锁(已由线程一获得)，等待一会，缓存命中互斥锁实现方式：redis中setnxkeyvalue:改变对应key的value,仅当value不存在时执行，以此来实现互
mysql学习教程，从入门到精通，TOP 和MySQL LIMIT 子句（15）知识分享小能手大数据数据库 MySQL mysql 学习 oracle 数据库开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中，不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中，而LIMIT子句则主要用于MySQL、PostgreSQL（通过LIMIT/OFFSET语法）、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句（SQLServer和Access）1.1
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your †徐先森® Oracle数据库 Web相关错误集
createtablestudents(idintunsignedprimarykeyauto_increment,namevarchar(50)notnull,ageintunsigned,highdecimal(3,2),genderenum('男','女','中性','保密','妖')default'保密',cls_idintunsigned);在对数据库插入如上带有中文带有默认值的字段的时
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa