ANTHON523

tcmalloc（google开源项目核心部分模拟实现）

TcMalloc项目实现--高并发内存池（google开源项目核心部分模拟实现）

一.项目介绍
二.什么是内存池
- - 2.1 池化技术
  - 2.2 内存池
  - 2.3 内存池
三.定长内存池
四.整体框架设计
- - ThreadCache
  - Central Cache
  - Page Cache
五.Thread Cache整体设计
- - 5.1thread cache结构设计
  - 5.2thread cache的内存申请和释放
六.Central Cache
- - 6.1central cache的结构
  - 6.2span结构
七.Page Cache整体设计
- - 7.1PageCache实现
  - - - 1.构建一个PageCache.h与PageCache.cpp
      - 2.NewSpan函数
      - 3.ReleaseSpanToPageCache()
八.回收内存
- - 8.1 threadcache 回收内存
  - 8.2 centralcache内存回收
  - - - 1.ReleaseListToSpans()
  - 8.3总：
九.大于256KB内存申请问题
- - 9.1申请内存
  - 9.2释放内存时
十.项目总结
- - 与malloc比较

一.项目介绍

当前项目是实现一个高并发的内存池，他的原型是google的一个开源项目tcmalloc，tcmalloc全称Thread-Caching Malloc，即线程缓存的malloc，实现了高效的多线程内存管理，用于替代系统的内存分配相关的函数（malloc，free）
我只是把tcmalloc最核心的框架简化拿出来，模拟实现了一个自己的高并发内存池。

二.什么是内存池

2.1 池化技术

所谓“池化技术”，就是程序先向系统申请过量的资源，然后自己管理，以备不时之需，之所以要申请过量的资源，是因为每次申请该资源都有较大的开销，不如提前申好了，这样使用时就会变得非常快捷，大大提高程序的运行效率

在计算机中，有很多使用“池”这种技术的地方，除了内存池，还有连接池，线程池，对象池等。以上服务器上的线程池为例，它的主要思想是：先启动若干数量的线程，让它们处于睡眠状态，当接收到客户端的请求时，唤醒池中某个睡眠的线程，让它来处理客户端的请求，当处理完这个请求，线程又处于睡眠状态。

2.2 内存池

内存池是指程序预先从操作系统申请一大块足够大内存，此后，当程序中需要申请内存的时候，不是直接向操作系统申请，而是直接从内存池中获取；同理，当程序释放内存的时候，并不真正将内存返回给操作系统，而是返回内存池。当程序退出（或者特定时间）时，内存池才将之前申请的内存真正释放。

2.3 内存池

内存池主要解决的当然是效率的问题，其次如果作为系统的内存分配器的角度，还需要解决一下内存碎片的问题。

还需要补充说明一点：
内存碎片分为内碎片和外碎片
外碎片是一些连续空闲的连续内存区太小，以至于虽然合计的内存空间足够，但是因为其不连续，不能满足一些内存分配申请需求（就如上图，虽然有384byte的空间，但是却没有大于256byte的连续空间，以至于我们申请超过256byte的连续空间则申请不出来）
内碎片我们后面具体遇到再讲解

三.定长内存池

下面我们先来设计一个定长内存池，设计该定长内存池主要有以下两个作用：

1.熟悉一下内存池是如何实现的
2.其会作为我们后面高并发内存池的一个基础组件

由此图可以发现，在不同的场景下，我们需要使用不同的定长内存池，
这正是因为定长内存池就如它的名字一样，只能分配定长的内存空间，
对于不同的内存大小需求，我们就需要定义分配不同内存大小的定长内存池

这张图则展示了定长内存池给程序分配内存的过程

1.当程序第一次申请空间时，先申请一大块内存空间，用_memory记录其初始位置
2.当程序需要使用size大小的内存时，将大块内存切分成size的小块内存（实际就是将_memory给程序）。然后_memory的指向向后移size大小
3.当程序后面申请空间时，如果_freeList（自由链表）上挂的有内存块，则从自由链表上将内存块分配给程序。
4.当程序释放内存时，不是将内存释放给系统，而是将内存块归还给内存池，内存池将释放的空间挂入自由链表_freeList，可供下次申请使用。

注：_freeList不是构建了一个链表结构，用_next去指向下一个内存块。
而是用前一个空间的前4个字节（32位）或者前8个字节（64位）记录下一个内存块的起始地址进行抽象链接的

具体代码实现如下：

#pragma once

//直接去堆上按页申请空间
inline static void* SystemAlloc(size_t kpage) {
#ifdef _WIN32
	void* ptr = VirtualAlloc(0, kpage << 13, MEM_COMMIT | MEM_RESERVE, PAGE_READWRITE);
#else
#endif
	if (ptr == nullptr) {
		throw std::bad_alloc();
	}
	return ptr;
}
//定长内存池
//template
//class ObjectPoll{
//};


template<class T>
class ObjectPool {
private:
	//C++11特性，用默认构造函数即可将其初始化
	char* _memory = nullptr; //指向一大块内存空间的指针
	void* _freeList = nullptr; //自由指针，指向还回来空间组成的链表
	size_t _remainBytes = 0; //_memory中还剩余的字节数
public:
	T* New(){
		T* obj = nullptr;
		//当_freeList对象不为空时，去重新利用该部分空间
		if (_freeList) {
			//去前面指向下一个节点的空间
			void* next = *(void**)_freeList;
			obj = (T*)_freeList;
			_freeList = next;
		}
		else {
			//剩余内存不够时，重新去申请一个大空间
			if (_remainBytes < sizeof(T)) {
				_remainBytes = 128 * 1024;
				_memory = (char*)SystemAlloc(_remainBytes >> 13);
				//_memory = (char*)malloc(_remainBytes);
				if (_memory == nullptr) {
					throw std::bad_alloc();
				}
			}
			obj = (T*)_memory;
			//如果T对象的大小小于指针大小，那么无法在_freeList中存储下一个节点的地址
			//或者存储nullptr
			//所以在T对象的大小小于指针大小时，让其大小为指针大小
			size_t objsize = sizeof(T) < sizeof(void*) ? sizeof(void*) : sizeof(T);
			_memory += objsize;
			_remainBytes -= objsize;
		}
		//定位new，显示调用构造函数初始化对象
		new(obj)T;

		return obj;
	}

	void Delete(T* obj) {
		//将释放的空间挂接在自由链表下
		*(void**)obj = _freeList;
		_freeList = obj;

		//显示的调用析构函数清理对象
		obj->~T();
	}
};

对于定长内存池的实现，我们得掌握以下两个知识点：
1.因为我们实现了一个自己的内存池，去帮助程序申请空间，释放空间，
以此用于取代malloc，所以我们内存池申请内存不再调用malloc，而是
直接用windows下的VirtualAlloc直接向堆申请内存空间。
2.实现自由链表的抽象链接
具体实现为：将内存块指针obj强转为(void**)类型，再进行解引用，此时其类型还应该为void*类型，在32位下位四字节，在64位下为八字节，我们再给其赋值下一个内存块的起始地址。

四.整体框架设计

现在的很多开发环境都是多核多线程，在申请内存的场景下，必然存在激烈的锁竞争问题，malloc本身其实已经很优秀了，但我们的项目tcmalloc之所以称为高并发，就是因为其在多线程高并发的场景下更胜一筹，所以我们实现时就要考虑以下的问题：

性能问题
多线程环境下，锁竞争问题
内存碎片问题

为什么要提及这些问题呢，就是因为tcmalloc解决了这些问题，可以比malloc更快更稳定的在高并发场景下运行。

下面我们来看看其的整体框架吧

该内存池主要由三部分组成，分别为thread cache，central cache，page cache。
我先分别阐述一下三个部分：

ThreadCache

线程缓存是每个线程独有的（运用了线程局部缓存TLS技术），用于小于256KB的内存的分配（注意：不是thread cache只有256KB的内存空间哦，而是小于等于256KB的内存申请都是去找thread cache申请），**线程从这里申请内存不需要加锁，因为每个线程独享一个cache，这也就是这个并发线程池高效的地方。

Central Cache

中心缓存是所有线程共享，thread cache按需从thread cache获取的对象，而Central Cache在合适的时机回收thread cache中的对象，避免一个线程占用了太多的内存，而其他线程的内存吃紧。让内存分配在多个线程中更均衡的按需调度central cache中是存在锁的竞争的，因为每个thread cache都会去找同一个central cache要内存，在central cache用的是桶锁（后面具体讲central cache的结构时会进行说明。因为只有在thread cache中没有内存对象时才会找central cache要内存，所以这里的竞争不会很激烈

Page Cache

页缓存是在central cache缓存上面的一层缓存，存储的内存是以页为单位存储及分配的，central cache没有内存对象时，会从page cache分配出一定数量的page，并切割成定长大小的小块内存，分配给page cache。（怎么切割后面具体讲解page cache时会讲到），当一个span 的几个跨度页的对象都回收以后，page cache会回收central cache满足条件的span对象，并且合并相邻的页，组成更大的页，缓解内存碎片的问题。

五.Thread Cache整体设计

5.1thread cache结构设计

在定长内存池时，我们是开辟了一大块内存空间，然后用自由链表接收释放回来的内存块，在这里，如果我们对每一个空间大小都创建一个自由链表，则需要256*1024个自由链表（因为小于等于256KB的内存都向thread cache申请）。这样设计的话需要的自由链表太多了。

基于上面的问题，我们可以设计出一个thread cache哈希桶结构，每个桶是一个按桶位置映射大小的内存块对象的自由链表。每个线程都会有一个thread cache对象，这样每个线程在这里获取对象和释放对象是无锁的

由上图的映射规则可知，我们的前128byte是按8byte对齐的，什么意思呢？
就是其中有以8byte大小的自由链表，有以16byte大小的自由链表。也就是说其前128byte是按8的倍数定义自由链表，一共有16个自由链表

在129到1024byte，是按16byte对齐的，什么意思呢？
跟前128byte类似，也就是按16的倍速+128去定义自由链表，一共有56个自由链表

后面的分配跟前面规则类似。
最后将这些自由链表封装成一个哈希桶结构就完成了对thread cache基础结构的构建

而哈希桶结构我们可用一个自由链表的数组来实现

这样我们不仅可以用208个自由链表完成对thread cache结构的建立，整体还控制在最多只有10%的内存碎片。

注：这个时候的内存碎片是内碎片，那内碎片是什么意思呢？
比如我们需要申请5字节的内存空间，但我们哈希桶中最小空间的自由链表为8byte，此时我们还要3字节的空间都用不了了，这些没用的空间相当于碎片化了，叫内碎片

5.2thread cache的内存申请和释放

既然我们thread cache的基础结构构建好了，那我们怎么去申请和释放内存空间呢？

1.申请空间
我们在项目构建时，会建立一个Common.h类，在其中我们会定义一个名为SizeClass的类，在类中会定义两个函数Roundup和Index分别去计算对齐数（申请多大的空间）和去哪个桶中申请。

Roundup函数如下：

static inline size_t _RoundUp(size_t bytes, size_t alignNum) {
		return ((bytes + alignNum - 1) & ~(alignNum - 1));
	}

	//计算其对齐数，总共要给他多少空间
	static size_t RoundUp(size_t size) {
		assert(size <= MAX_BYTES);

		if (size <= 128) {
			return _RoundUp(size, 8);
		}
		else if (size <= 1024) {
			return _RoundUp(size, 16);
		}
		else if (size <= 8 * 1024) {
			return _RoundUp(size, 128);
		}
		else if (size <= 64 * 1024) {
			return _RoundUp(size, 1024);
		}
		else if (size <= 256 * 1024) {
			return _RoundUp(size, 8 * 1024);
		}
		else {
			//1 << PAGE_SHIFT为对齐数
			return _RoundUp(size, 1 << PAGE_SHIFT);
		}
	}

Index函数如下：

static inline size_t _Index(size_t bytes, size_t align_shift) {
		return ((bytes + (1 << align_shift) - 1) >> align_shift) - 1;
	}

	static size_t Index(size_t size) {
		assert(size <= MAX_BYTES);
		
		static int group_array[4] = { 16,56,56,56 };
		if (size <= 128) {
			//8为2^3,传入次方数
			return _Index(size, 3);
		}
		else if (size <= 1024) {
			//16为2^4
			//得加上前128byte所占的16个桶
			return _Index(size-128, 4) + group_array[0];
		}
		else if (size <= 8 * 1024) {
			//128为2^7
			//类似的加上之前
			return _Index(size - 1024, 7) + group_array[0] + group_array[1];
		}
		else if (size <= 64 * 1024) {
			//1024为2^10
			return _Index(size - 8 * 1024, 10) + group_array[0] + group_array[1]+ group_array[2];
		}
		else if (size <= 256 * 1024) {
			//8*1024为2^13
			return _Index(size - 64 * 1024, 13) + group_array[0] + group_array[1] + group_array[2] + group_array[3];
		}
		else {
			assert(false);
			
		}
		return -1;
	}

两个函数的构建也是按照上面图片的映射规则构建的，对上面函数不理解的，可以看看注释和对上面映射规则的讲解。

有些人还会问为什么上面的计算规则要用内联函数，因为我们申请和释放内存时会频繁调用这两个函数。

2.线程局部存储TLS
在创建线程时，怎么让其与thread cache对应联系起来呢？并且怎么创建其才是每个线程独有的呢？

为了让thread cache 为每个线程独有，我们得用到TLS（线程局部存储）
线程局部存储（TLS），是一种变量的存储方法，这个变量在它所在的线程内是全局可访问的，但是不能被其他的线程访问到，这样就保证了数据的线程独立性
这样的好处就是，每个线程独一份thread cache，小于256KB的内存申请不用再加锁申请，大大提高了效率

那怎么定义TLS呢
定义TLS特别简单，只用在ThreadCache结构中加一段这样的代码

//TLS(thread local storage)
static _declspec(thread) ThreadCache* pTLSThreadCache = nullptr;

这样只要我们的线程创建好，就会有这样的指针，对线程内是全局的，其他线程无法访问。（第一次访问时，做个判断，先创建一个ThreadCache即可）

因为申请内存时，不可能让线程自己来获取自己的pTLSThreadCache对象，所以我们在Thread Cache结构之上在封装一个ConcurrentAlloc来管理内存分配即可。这样后面大于256KB的内存申请，也可以直接经过ConcurrentAlloc的结构去申请了。

3.申请和释放
申请和释放就没多少说的，大家看一下代码应该就能理解。
部分解释放在了注释里
唯一需要说明的点，就是Deallocate释放内存连同上层封装的ConcurrentAlloc释放内存还需要传入内存大小，这个后面会进行优化

void* ThreadCache::Allocate(size_t size) {
	assert(size <= MAX_BYTES);
	size_t alignSize = SizeClass::RoundUp(size);
	size_t index = SizeClass::Index(size);

	if (!_freeLists[index].Empty()) {
		return _freeLists[index].Pop();
	}
	else {
	    //该函数作用是去向Central Cache申请内存
		return FetchFromCentralCache(index, alignSize);
	}
}

void ThreadCache::Deallocate(void* ptr, size_t size) {
	assert(ptr);
	assert(size <= MAX_BYTES);

	//找到对应空间的桶位置，将其放入
	size_t index = SizeClass::Index(size);
	_freeLists[index].Push(ptr);

	//大于一次批量的，即开始向central cache归还内存
	if (_freeLists[index].Size() >= _freeLists[index].MaxSize()) {
		ListTooLong(_freeLists[index], size);
	}
}

4.与central cache联系
当我们程序申请内存空间时，先去计算其要申请哪个桶，如果该桶的自由链表下挂的有空间，就取下来分配给程序
如果没有，则去向Central cache要空间

六.Central Cache

6.1central cache的结构

central cache也是一个哈希桶结构，他的哈希桶的映射关系跟thread cache是一样的。不同的是他的哈希桶位置挂的是SpanList链表结构，不过每个映射桶下面的span中的大内存块被按映射切成了一个个小内存块对象挂在span的自由链表中。

1.thread cache是每个线程独享一个，而central cache是所有线程没有内存都会找它，所以其需要给每个桶加锁
正是因为是桶锁，所以两个线程去申请不同桶的空间时，不会存在竞争

怎样实现所有线程都去找同一个thread cache呢？
将thread cache类定义为单例模式即可

2.thread cache去要一个X空间，central cache不一定给它一个，而是给它几个，因为线程再需要X空间时，直接去找thread cache要了，而不是再来找central cache（这里具体给多少有个类似于网络tcp协议拥塞控制的慢开始算法，后面会讲解）

3.每个span的页数，在不同大小的内存桶下不一样，桶中的内存块大小越大，可能span页数越多越大

6.2span结构

看了上面的，突然冒出了span和SpanList那又是什么东西啊

1.span --管理多个连续页大块内存的跨度结构

我们先来看一下span的代码

//定义在Common.h，因为其不仅要给central cache用，还要给page cache用
class Span {
public:
	PAGE_ID _pageId = 0; //页号
	size_t _n = 0; //页的数量
	Span* _prev = nullptr; //指向前一个节点
	Span* _next = nullptr; //指向后一个节点
	size_t _useCount = 0; //计数，记录分配了多少个对象出去，
	void* _freeList = nullptr; //自由指针
	bool _isUse = false;
	size_t _objSize = 0; //去记录该span一个小对象的大小，方便释放对象时可以不用传入对象大小 
};

//双向带头循环链表
class SpanList {
private:
	Span* _head;     //头节点
//设置为公有，不然不好设置锁去拿取资源
public:
	std::mutex _mtx; //桶锁
public:
	SpanList() {
		_head = new Span;
		_head->_prev = _head;
		_head->_next = _head;
	}

	Span* Begin() {
		return _head->_next;
	}

	Span* End() {
		return _head;
	}

	bool Empty() {
		return _head->_next == _head;
	}

	void PushFront(Span* newspan) {
		Insert(_head->_next, newspan);
	}

	Span* PopFront() {
		Span* front = _head->_next;
		Erase(front);
		return front;
	}

	void Insert(Span* pos, Span* newSpan) {
		assert(pos);
		assert(newSpan);

		Span* pre = pos->_prev;
		pre->_next = newSpan;
		newSpan->_prev = pre;
		newSpan->_next = pos;
		pos->_prev = newSpan;
	}

	void Erase(Span* pos) {
		assert(pos);
		assert(pos != _head);

		//条件断点+查看栈帧
		/*if (pos != _head) {
			int x = 0;
		}*/
		Span* pre = pos->_prev;
		pre->_next = pos->_next;
		pos->_next->_prev = pre;
	}
};

从上面的代码结构我们发现，span是一个双向链表结构，其中还有一些东西我们一一解释

1.PAGE_ID _pageId; 页号，其算是代表该页在内存中的位置，

2.size_t n; 表示页的数量，就是该span有几页的内存空间，相当于表示该span的内存大小。
对于后面页的合并，切分也有作用

3.size_t _usecount=0; 计数，分配一个内存对象出去则++,
还回来一个内存对象则--，
当span减到0表示所有对象都回到了span，
则将span释放回page cache，page cache会对前后相邻页进行合并

4._freeList表示span这个大内存空间切分成一个个小的内存块对象挂在该自由链表上

5._isUse 表示该span是否使用，用来区分，刚从page cache 获取的span和因为归还
空间_usecount减为0的span，此时该span因为_usecount减为0，将要释放给page cache
而刚才page cache获取的span对象其_usecount也为0
所以_isUse是为了区分他们

对page_id的理解
page_id相当于就是一个内存的起始地址除以页数
也就是说，有了内存的起始地址，那么用一个循环对地址进行对齐数大小的整数加减，就可以切割内存了；
例如：假设一页的大小为1KB，那么page_id和地址与数量之间的关系就如下图：

假设我的span只有中间的阴影部分的页内存，那么我的span结构中重要的数据为：

struct Span{
	PAGE_ID _pageId = 2; //大块内存起始页号
	size_t _n = 2; //页的数量
}

所以其内存大小就为页的数量一页的大小，该内存块的起始地址就为页号一页的大小

对于SpanList的一些解释

1.在central cache的哈希桶中，一个桶中可能有多个span，所以在我们去找
内存对象时，得再spanList中去遍历，
一个span用完了才能用下一个span
2.存在多个span都有一部分被申请出去的情况，因为thread cache可能还回
来再用完的span中，因为该span之前用完了，所以我们用了下一个span
3.为什么SpanList要设计为双向链表结构，因为如果有一个span全部回来了，
我们要将该span归还给page cache，如果单向链表不方便找到那个span，
也不方便进行删除。
所以我们运用双向链表，即简单又高效，插入删除为O(1);

2.页号
现在我们继续对页号进行细节处理

假设一页为2的13次方也就是8KB
那么在32位程序下，2^32 / 2 ^ 13=2 ^ 19个页，也就是大概五十万个页
在64位程序下，2 ^ 64 / 2 ^ 13 = 2 ^ 51个页，如果我们继续用size_t来记录页号，那么在32位下，size_t显然够用，但在64位下，size_t显然就不够用了
所以我们用条件编译那处理此情况：

#ifdef _WIN64
    typedef unsigned long long PAGE_ID;
#elif _WIN32
    typedef size_t PAGE_ID;
#else
#endif

这里有个小细节，就是我们得先对_WIN64进行判断，再对_WIN32进行判断
因为在_WIN32配置下，_WIN32有定义，_WIN64没有定义
在x64配置下，_WIN32和_WIN64都有定义

3.慢开始反馈调节
thread cache来要空间时，具体给多少？
我们采用慢开始反馈调节算法
具体实现如下：

//thread cache 去 central cache中去拿对象的规则
	static size_t NumMoveSize(size_t size) {
		assert(size > 0);
		//[2,512]一次批量移动多少个对象的上下限
		//小对象一次批量上限高
		//大对象一次批量上限低

		//batch ...批量
		size_t batchNum = MAX_BYTES / size;
		//限制下限
		if (batchNum < 2) {
			batchNum = 2;
		}

		//限制上限
		if (batchNum > 512) {
			batchNum = 512;
		}

		return batchNum;
	}

在该函数实现中，其定义了一个上限和下限，
上限主要是限制小空间，在去拿空间时，不要超过512
下限主要是要求大空间至少都得拿两个走

那有人问了，这里哪里体现了慢开始反馈调节，因为这个代码还有一部分在这：
该代码是thread cache去向central cache要空间的函数实现

void* ThreadCache::FetchFromCentralCache(size_t index, size_t size) {
	//慢开始反馈调节算法
	//最开始不会向central cache一次批量太多，因为太多用不完
	//如果你不断有这个size大小内存需求，那么batchNum就不会增长，直到上限
	//size越大，一次向central cache要的batchNum就越小
	//size越小，一次central cache要的batchNum就越大
	size_t batchNum = min(_freeLists[index].MaxSize(),SizeClass::NumMoveSize(size));
	if (batchNum == _freeLists[index].MaxSize()) {
		//如果觉得1增长的太慢，用2，3也可以
		_freeLists[index].MaxSize() += 1;
	}
	void* start = nullptr;
	void* end = nullptr;
	//实际获取的数量
	int actualNum = CentralCache::GetInstance()->FetchRangeObj(start, end, batchNum, size);
	assert(actualNum > 0);
	if (actualNum == 1) {
		assert(start == end);
		return start;
	}
	else {
		//start要返回，给线程运用
		//start之后的挂在thread cache中
		_freeLists[index].PushRange(NextObj(start), end,actualNum-1);
		return start;
	}
}

下面代码是_freeList中的一部分代码，这三部分协调作用，共同完成了慢开始反馈调节

class FreeList {
private:
	void* _freeList = nullptr;
	//限制向central cache要空间的数量
	size_t _maxSize = 1;
	size_t _size = 0;
public:
	size_t& MaxSize() {
		return _maxSize;
	}
};

总的来说，就是先开始取的空间数量为1，然后为2，慢慢的，一直增长，直到与SizeClass中的NumMoveSize(size)一样大，将以其为上限，取的数量不会再增大
所以：

1.最开始不会向central cache一次批量要太多，因为要太多了用不完
2.如果你不断有这个size大小的内存需求，那么batchNum就不会断增长，直到上限
3.size越小，一次向central cache要的batchNum就越大
4.size越大，一次向central cache要的batchNum就越小

4.central cache中的一些函数接口简单介绍
就简单说明一下一些接口函数，方便后续总表理解整个过程

1.FetchRangeObj() 从中心缓存获取一定数量的对象给thread cache
2.GetOneSpan() 先判断central cache中的桶中有没有，有的话就直接取出，没有的话调用page cache中的NewSpan()获取一个span
3.RealeaseListToSpans() 将thread cache中的一部分空间对象归还给central cache中的span，如果central cache中的span中的_usecount==0,将该span归还给page cache

七.Page Cache整体设计

page cache结构

可看出page cache虽然也是哈希桶结构，但明显与central cache和thread cache明显不一样了，因为他是以每页为为单位划分一个桶，一共有128个桶
在每个桶下面还是挂的span，每个span的内存大小与桶划分的大小对于。其也是一个SpanList结构。只不过每个span下面没有划分了小空间的自由链表。

申请内存
1.central cache向page cache申请内存时，page cache先检查对应位置有没有span，如果没有则向更大页寻找一个span，如果找到则分裂成两个
比如：申请的是4页page，4页page后面没有挂span，则向后面寻找更大的span，假设在10页page位置找到一个span，则将10页page span分裂为一个4页page span和一个6页page span。
2.如果找到_spanList[128]都没有合适的span，则向系统使用mmap、brk、或者是VirtualAlloc等方式申请128页page span挂在自由链表中，再重复1的过程
3.需要注意central cache和page cache的核心结构都是SpanList _spanLists的哈希桶，但他们有本质区别，central cache中哈希桶，是按跟thread cache一样的大小对齐关系映射的，他的_spanLists中挂的span中的内存都按映射关系切好链接成小块内存的自由链表，而page cache中的_spanLists则是按下标桶号映射的，也就是说第i号桶中挂的span都是i页内存。
释放内存
如果central cache释放回一个span，则依次寻找span的前后page id的没有在使用的空闲span，看是否可以合并，如果合并继续向前寻找，这样就可以将切小的内存合并收缩成大的span，减少内存碎片。

为什么这里要用128页为最大页呢
没有为什么，根据自己需求去选择，如果用256页为最大页也可以

7.1PageCache实现

1.构建一个PageCache.h与PageCache.cpp

在PageCache.h中构建PageCache结构并且定义会使用的接口函数
在PageCache.cpp中实现那些接口函数

//单例模式
class PageCache {
public:
	static PageCache* GetInstance() {
		return &_sInstance;
	}

	Span* NewSpan(size_t k);

	//返回一个该PAGE_ID对应的Span*
	Span* MapObjectToSpan(void* obj);

	//释放空闲span回到PageCache，并合并相邻的Span
	void ReleaseSpanToPageCache(Span* span);

public:

	//全局锁，避免在一个位置没有找到span，继续向后找span时，用桶锁会频繁加锁解锁
	std::mutex _pageMtx;

private:
	PageCache(){}
	PageCache(const PageCache&) = delete;
private:
	//与CentralCache中的_spanLists不一样，
	//CentralCache中的_spanLists是按照对象大小划分桶，每个桶下链接一个span链表，
	//          每个span有划分为对象空间的自由链表
	//PageCache中的_spanLists是按照页数划分为桶，代表span的大小，同时span下没有
	//          划分的自由链表
	SpanList _spanLists[NPAGES];
	ObjectPool<Span> _spanPool;

	//声明
	static PageCache _sInstance;

	//PAGE_ID与Span*的映射关系
	std::unordered_map<PAGE_ID, Span*> _idSpanMap;
	
};

PageCache类的设计成单例模式，因为central cache去访问page cache也应该访问的是同一个page caceh。

page cache的锁还是桶锁吗
page cache中对哈希桶的锁不能再是桶锁了，得是全局锁**std::mutex _pageMtx;
所以在去PageCache要空间时，可以将CentralCache的桶锁解掉，用全局锁加锁，这样其他去访问CentralCache的即可访问，再拿到空间返回时，我们再重新申请锁即可

因为如果申请4页的span，而4页的桶下已经没有剩余的span了。那么我们会继续向更大页的桶中去寻找span，
所以如果是桶锁，我们去向后找，会不断加锁解锁，消耗很大，效率降低

总：

所以对于PageCache它会在一个范围进行索引访问，并且多个线程访问同一个桶的概率大大提升，
使用桶锁就会导致频繁加锁解锁，导致效率降低，相反，使用整体锁，每个线程就只需加解一次

对于CentralCache，不同线程访问的大概率不是一个位置的桶，所以这个时候加桶锁就非常合适
如果加整体锁，反而会造成大量线程等待，降低效率

2.NewSpan函数

这里就不贴源代码了，讲一下实现，

过程

获取K页的span，但在PageCache中的_spanLists中没有，那么去找大一点span，去分成小的span
如果到128page还没有可用的span，那么就会去找堆要。

注意

1.分成的小页span在后面CentraCache释放空间时会进行合并为大页span，以缓解内存碎片问题
2.找堆要时，堆也不会给小的span，而是给一块128page的空间，去切成各种空间的span，后面把这些切小的span可以合并。

如：需要2页的span，就把该128页的span分为2页的span和126页的span，2页的span返回给CentralCache用，126页的span挂在PageCache的第126号桶下

切分过程
因为我们PageCache将span给CentralCache时，还需要将span切分成小对象，挂在自由链表下面，因为CentralCache的哈希桶下的span下面存在切分好的小对象

计算起始地址

之前讲过页号的作用，起始地址=页号*页的大小，页的大小我们定义为2^13
所以 起始地址=页号 << 13

所占字节数=页的数量*一页的大小
所以 所占字节数=页的数量  << 13

知道span的起始地址了，知道所占字节数了
就可以将其拆分为小对象了

大块内存的链接
跟之前的自由链表链接方法一样，用前一个内存块的前四个字节或前八个字节指向下一个内存块即可

3.ReleaseSpanToPageCache()

该函数将CentralCache的span回收回PageCache。
在回收CentralCache的内存时，注意要看其前后相邻也是否空闲，如果空闲与前后相邻页进行合并，以此减少内存碎片

合并过程
由图可知，假如此时回收回来的span页号为100，页的数量为x。
我们合并时，得找前后相邻页。
先找前面相邻页99是否空闲，通过前面在span中新增的_isUse去判断其是否被使用，如果没有被使用，则合并，如果被使用了，即结束向前合并。同时如果在合并时合并后的span总页数会大于128或者等于128则结束合并
再向后寻找100+x页是否空闲，如果空闲继续往后寻找。

所以那我们怎么实现去查找前后相邻页是否空闲呢？
可构建一个unordered _idSpanMap结构，
然后在PageCache给CentralCache内存时，将那些span，全部加 _idSpanMap,并且将PageCache空闲的Span全部加入 _idSpanMap结构，这样可以快速判断回收回来的页前后是否空闲
我们加入_idSpanMap建立映射关系时，只用加这个span的前后页号与其建立关系即可，因为我们合并时，也只是找一个Span的前后页号（前页号为span中的页号，后页号为span中的页号+页的数量-1）
合并后需要把其合并前页的映射从_idSpanMap中删去，然后建立合并后span与页号的映射

八.回收内存

前面讲ThreadCache与CentralCache时并没有讲其怎么回收内存，而讲PageCache时，但讲解了回收内存与合并前后页减少内存碎片

8.1 threadcache 回收内存

threadcache回收内存非常简单

1.某个线程这块内存不用了，调Dealloc将内存回收释放给threadcache，threadcache算好该内存
  映射的哪个桶，将该内存插入到对应的桶里去
2.如果对应的桶太长了，会向centralcache去归还内存（不一定要全部归还）

代码实现

void ThreadCache::Deallocate(void* ptr, size_t size) {
   assert(ptr);
   assert(size <= MAX_BYTES);

   //找到对应空间的桶位置，将其放入
   size_t index = SizeClass::Index(size);
   _freeLists[index].Push(ptr);

   //大于一次批量的，即开始向central cache归还内存
   if (_freeLists[index].Size() >= _freeLists[index].MaxSize()) {
   	ListTooLong(_freeLists[index], size);
   }
}

void ThreadCache::ListTooLong(FreeList& list, size_t size) {
   void* start = nullptr;
   void* end = nullptr;
   //取出需要释放回central cache的内存对象
   list.PopRange(start, end, list.MaxSize());

   //调用CentralCache的接口去将该对象释放回Span
   CentralCache::GetInstance()->RealeaseListToSpans(start, size);
}

注：ListTooLong()函数将内存对象释放回centralcache

8.2 centralcache内存回收

1.ReleaseListToSpans()

该函数将从threadcache回收的内存挂回span

我们怎么知道该小对象属于哪个span

页号 = 内存地址数 / 2^13
所以在x到x+2^13这个内存范围内的值除以2^13次方还是等于2000

找到页号后，根据_idSpanMap结构即可找到与页号对应的Span

但是我们span只有前后页在_idSpanMap有映射关系。所以我们在切分小对象时，传入Span中每一页的页号与Span的映射关系

所以我只要用对象的内存首地址除以2^13次方即可算出其是哪个span下分出去的对象

8.3总：

总的来说整个回收过程就是：
如果CentralCache中的span _usecount等于0，则说明切分给threadcache的小块内存全都回来了，则CentralCache把这个span还给PageCache，PageCache通过页号，查看前后的相邻页是否空闲，是的话就合并，合并出更大的页，解决内存碎片问题

九.大于256KB内存申请问题

9.1申请内存

1.<=256KB
通过三层缓存去申请内存，通过threadcache->centralcache->pagecache
2.>256KB
分为两种情况
当32*8k < size <= 128 * 8K则去找pagecache要页空间
当size>128*8K时，直接去找系统要空间

9.2释放内存时

当32*8k < size <= 128 * 8K则将空间归还给pagecache
当size>128*8K时，则直接将内存空间归还给系统

十.项目总结

在后续继续进行了一些优化
有：

1. 定长内存池去配合脱离new的使用，因为我们之前申请内存还在用malloc，
   当然不用定长内存池也行，直接调用系统调用接口申请内存，但是定长内存池
   相当于也减少了反复找系统要内存的开销
2. 释放对象时不传入内存大小
   加入一个unordered_map<PAGE_ID,size_t>去存储页号和大小即可解决
3. 因为锁的消耗和unordered_map查找的消耗非常大，所以可以引入基数树来
   替代unordered_map，以此来优化unordered_map内的查找消耗和锁的竞争
   消耗

以上的优化跟我们学习tcmalloc的基本架构没有太大关系，优化了代码和效率提升

我实现tcmalloc的核心代码思路主要是要了解ThreadCache、CentralCache
、PageCache的内存申请和释放，了解它是如何做到在多线程高并发场景下比malloc更胜一筹

与malloc比较

在项目中，构建了一个Benchmark.cpp去比较与malloc的效率

#define _CRT_SECURE_NO_WARNINGS
#include"ConcurrentAlloc.h"

// ntimes 一轮申请和释放内存的次数
// rounds 轮次
void BenchmarkMalloc(size_t ntimes, size_t nworks, size_t rounds)
{
	std::vector<std::thread> vthread(nworks);
	std::atomic<size_t> malloc_costtime = 0;
	std::atomic<size_t> free_costtime = 0;

	for (size_t k = 0; k < nworks; ++k)
	{
		vthread[k] = std::thread([&, k]() {
			std::vector<void*> v;
			v.reserve(ntimes);

			for (size_t j = 0; j < rounds; ++j)
			{
				size_t begin1 = clock();
				for (size_t i = 0; i < ntimes; i++)
				{
					//v.push_back(malloc(16));
					v.push_back(malloc((16 + i) % 8192 + 1));
				}
				size_t end1 = clock();

				size_t begin2 = clock();
				for (size_t i = 0; i < ntimes; i++)
				{
					free(v[i]);
				}
				size_t end2 = clock();
				v.clear();

				malloc_costtime += (end1 - begin1);
				free_costtime += (end2 - begin2);
			}
			});
	}

	for (auto& t : vthread)
	{
		t.join();
	}

	printf("%u个线程并发执行%u轮次，每轮次malloc %u次: 花费：%u ms\n",
		nworks, rounds, ntimes, malloc_costtime.load());

	printf("%u个线程并发执行%u轮次，每轮次free %u次: 花费：%u ms\n",
		nworks, rounds, ntimes, free_costtime.load());

	printf("%u个线程并发malloc&free %u次，总计花费：%u ms\n",
		nworks, nworks * rounds * ntimes, malloc_costtime.load() + free_costtime.load());
}


// 单轮次申请释放次数 线程数 轮次
void BenchmarkConcurrentMalloc(size_t ntimes, size_t nworks, size_t rounds)
{
	std::vector<std::thread> vthread(nworks);
	std::atomic<size_t> malloc_costtime = 0;
	std::atomic<size_t> free_costtime = 0;

	for (size_t k = 0; k < nworks; ++k)
	{
		vthread[k] = std::thread([&]() {
			std::vector<void*> v;
			v.reserve(ntimes);

			for (size_t j = 0; j < rounds; ++j)
			{
				size_t begin1 = clock();
				for (size_t i = 0; i < ntimes; i++)
				{
					//v.push_back(ConcurrentAlloc(16));
					v.push_back(ConcurrentAlloc((16 + i) % 8192 + 1));
				}
				size_t end1 = clock();

				size_t begin2 = clock();
				for (size_t i = 0; i < ntimes; i++)
				{
					ConcurrentFree(v[i]);
				}
				size_t end2 = clock();
				v.clear();

				malloc_costtime += (end1 - begin1);
				free_costtime += (end2 - begin2);
			}
			});
	}

	for (auto& t : vthread)
	{
		t.join();
	}

	printf("%u个线程并发执行%u轮次，每轮次concurrent alloc %u次: 花费：%u ms\n",
		nworks, rounds, ntimes, malloc_costtime.load());

	printf("%u个线程并发执行%u轮次，每轮次concurrent dealloc %u次: 花费：%u ms\n",
		nworks, rounds, ntimes, free_costtime.load());

	printf("%u个线程并发concurrent alloc&dealloc %u次，总计花费：%u ms\n",
		nworks, nworks * rounds * ntimes, malloc_costtime.load() + free_costtime.load());
}

int main()
{
	size_t n = 10000;
	std::cout << "==========================================================" << std::endl;
	BenchmarkConcurrentMalloc(n, 4, 10);
	std::cout << std::endl << std::endl;

	BenchmarkMalloc(n, 4, 10);
	std::cout << "==========================================================" << std::endl;

	return 0;
}

**这是在最大申请空间为8K时的对比

这是在最大申请为256KB的内存申请对比

可见当申请内存空间小于256KB时，tcmalloc的效率明显优于malloc

你可能感兴趣的:(C++,c++)

c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
【JS】执行时长(100分) |思路参考+代码解析（C++） l939035548 JS 算法数据结构 c++
题目为了充分发挥GPU算力，需要尽可能多的将任务交给GPU执行，现在有一个任务数组，数组元素表示在这1秒内新增的任务个数且每秒都有新增任务。假设GPU最多一次执行n个任务，一次执行耗时1秒，在保证GPU不空闲情况下，最少需要多长时间执行完成。题目输入第一个参数为GPU一次最多执行的任务个数，取值范围[1,10000]第二个参数为任务数组长度，取值范围[1,10000]第三个参数为任务数组，数字范围
基于CODESYS的多轴运动控制程序框架：逻辑与运动控制分离，快速开发灵活操作 GPJnCrbBdl python 开发语言
基于codesys开发的多轴运动控制程序框架，将逻辑与运动控制分离，将单轴控制封装成功能块，对该功能块的操作包含了所有的单轴控制（归零、点动、相对定位、绝对定位、设置当前位置、伺服模式切换等等）。程序框架由主程序按照状态调用分归零模式、手动模式、自动模式、故障模式，程序状态的跳转都已完成，只需要根据不同的工艺要求完成所需的动作即可。变量的声明、地址的规划都严格按照C++的标准定义，能帮助开发者快速
C++ | Leetcode C++题解之第409题最长回文串 Ddddddd_158 经验分享 C++Leetcode 题解
题目：题解：classSolution{public:intlongestPalindrome(strings){unordered_mapcount;intans=0;for(charc:s)++count[c];for(autop:count){intv=p.second;ans+=v/2*2;if(v%2==1andans%2==0)++ans;}returnans;}};
C++菜鸟教程 - 从入门到精通第二节 DreamByte c++
一.上节课的补充(数据类型)1.前言继上节课,我们主要讲解了输入,输出和运算符,我们现在来补充一下数据类型的知识上节课遗漏了这个知识点,非常的抱歉顺便说一下,博主要上高中了,更新会慢,2-4周更新一次对了,正好赶上中秋节,小编跟大家说一句:中秋节快乐!2.int类型上节课,我们其实只用了int类型int类型,是整数类型,它们存贮的是整数,不能存小数(浮点数)定义变量的方式很简单inta;//定义一
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
C++ lambda闭包消除类成员变量 barbyQAQ c++c++java 算法
原文链接：https://blog.csdn.net/qq_51470638/article/details/142151502一、背景在面向对象编程时，常常要添加类成员变量。然而类成员一旦多了之后，也会带来干扰。拿到一个类，一看成员变量好几十个，就问你怕不怕？二、解决思路可以借助函数式编程思想，来消除一些不必要的类成员变量。三、实例举个例子：classClassA{public:...intfu
2021 CCF 非专业级别软件能力认证第一轮（CSP-J1）入门级C++语言试题（第三大题：完善程序代码） mmz1207 c++csp
最近有一段时间没更新了，在准备CSP考试，请大家见谅。（1）有n个人围成一个圈，依次标号0到n-1。从0号开始，依次0，1，0，1...交替报数，报到一的人离开，直至圈中剩最后一个人。求最后剩下的人的编号。#includeusingnamespacestd;intf[1000010];intmain(){intn;cin>>n;inti=0,cnt=0,p=0;while(cnt#includeu
《 C++ 修炼全景指南：九》打破编程瓶颈！掌握二叉搜索树的高效实现与技巧 Lenyiin C++修炼全景指南技术指南 c++算法 stl
摘要本文详细探讨了二叉搜索树（BinarySearchTree,BST）的核心概念和技术细节，包括插入、查找、删除、遍历等基本操作，并结合实际代码演示了如何实现这些功能。文章深入分析了二叉搜索树的性能优势及其时间复杂度，同时介绍了前驱、后继的查找方法等高级功能。通过自定义实现的二叉搜索树类，读者能够掌握其实际应用，此外，文章还建议进一步扩展为平衡树（如AVL树、红黑树）以优化极端情况下的性能退化。
20个新手学习c++必会的程序输出*三角形、杨辉三角等（附代码） X_StarX c++学习算法大学生开发语言数据结构
示例1:HelloWorld#includeusingnamespacestd;intmain(){coutusingnamespacestd;intmain(){inta=5;intb=10;intsum=a+b;coutusingnamespacestd;intfactorial(intn){if(nusingnamespacestd;voidprintFibonacci(intn){intt
C++八股 Petrichorzncu 八股总结 c++开发语言
这里写目录标题C++内存管理C++的构造函数，复制构造函数，和析构函数深复制与浅复制：构造函数和析构函数哪个能写成虚函数，为什么？C++数据结构内存排列结构体和类占用的内存：==虚函数和虚表的原理==虚函数虚表（Vtable）虚函数和虚表的实现细节==内存泄漏==指针的工作原理函数的传值和传址new和delete与malloc和freeC++内存区域划分C++11新特性C++常见新特性==智能指针
【2022 CCF 非专业级别软件能力认证第一轮（CSP-J1）入门级 C++语言试题及解析】汉子萌萌哒 CCF noi 算法数据结构 c++
一、单项选择题(共15题，每题2分，共计30分；每题有且仅有一个正确选项)1.以下哪种功能没有涉及C++语言的面向对象特性支持：()。A.C++中调用printf函数B.C++中调用用户定义的类成员函数C.C++中构造一个class或structD.C++中构造来源于同一基类的多个派生类题目解析【解析】正确答案:AC++基础知识，面向对象和类有关，类又涉及父类、子类、继承、派生等关系，printf
《 C++ 修炼全景指南：十》自平衡的艺术：深入了解 AVL 树的核心原理与实现 Lenyiin C++修炼全景指南技术指南 c++数据结构 stl
摘要本文深入探讨了AVL树（自平衡二叉搜索树）的概念、特点以及实现细节。我们首先介绍了AVL树的基本原理，并详细分析了其四种旋转操作，包括左旋、右旋、左右双旋和右左双旋，阐述了它们在保持树平衡中的重要作用。接着，本文从头到尾详细描述了AVL树的插入、删除和查找操作，配合完整的代码实现和详尽的注释，使读者能够全面理解这些操作的执行过程。此外，我们还提供了AVL树的遍历方法，包括中序、前序和后序遍历，
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
c++ opencv4.3 sift匹配图像处理大大大大大牛啊图像处理 opencv实战代码讲解 opencv sift c++opencv4 特征点
c++opencv4.3sift匹配main.cppintmain(){vectorkeypoints1,keypoints2;Matimg1,img2,descriptors1,descriptors2;intnumF
《 C++ 修炼全景指南：四》揭秘 C++ List 容器背后的实现原理，带你构建自己的双向链表 Lenyiin 技术指南 C++修炼全景指南 c++list 链表 stl
本篇博客，我们将详细讲解如何从头实现一个功能齐全且强大的C++List容器，并深入到各个细节。这篇博客将包括每一步的代码实现、解释以及扩展功能的探讨，目标是让初学者也能轻松理解。一、简介1.1、背景介绍在C++中，std::list是一个基于双向链表的容器，允许高效的插入和删除操作，适用于频繁插入和删除操作的场景。与动态数组不同，list允许常数时间内的插入和删除操作，支持双向遍历。这篇文章将详细
c++ 内存处理函数 heeheeai c++开发语言
在C语言的头文件中，memcpy和memmove函数都用于复制内存块，但它们在处理内存重叠方面存在关键区别：内存重叠:memcpy函数不保证在源内存和目标内存区域重叠时能够正确复制数据。如果内存区域重叠，memcpy的行为是未定义的，可能会导致数据损坏或程序崩溃。memmove函数能够安全地处理源内存和目标内存区域重叠的情况。它会确保在复制过程中不会覆盖尚未复制的数据，从而保证数据的完整性。效率:
【c++基础概念深度理解——堆和栈的区别，并实现堆溢出和栈溢出】 XWWW668899 C++基本概念 c++c语言开发语言青少年编程
文章目录概要技术名词解释栈溢出和堆溢出小结概要学习C++语言，避免不了要好好理解一下堆（Heap）和栈（Stack），有助于更好地管理内存，以及如何写出一段程序“成功实现”堆溢出和栈溢出。技术名词解释理解东西最快的方式是根据自己目前能理解的词语去关联新的概念，不断的纠正，向正确的深度理解靠近，当无限接近的时候也就理解了想要理解的概念。我们经常说堆栈，把这两个名词放到一起。其实，堆是堆，栈是栈，两种
C++常见知识掌握 nfgo c++开发语言
1.Linux软件开发、调试与维护内核与系统结构Linux内核是操作系统的核心，负责管理硬件资源，提供系统服务，它是系统软件与硬件之间的桥梁。主要组成部分包括：进程管理：内核通过调度器分配CPU时间给各个进程，实现进程的创建、调度、终止等操作。使用进程描述符（task_struct）来存储进程信息，包括状态（就绪、运行、阻塞等）、优先级、内存映射等。内存管理：包括物理内存和虚拟内存管理。通过页表映
metaRTC5.0 API编程指南(一) metaRTC metaRTC c++c语言 webrtc
概述metaRTC5.0版本API进行了重构，本篇文章将介绍webrtc传输调用流程和例子。metaRTC5.0版本提供了C++和纯C两种接口。纯C接口YangPeerConnection头文件:include/yangrtc/YangPeerConnection.htypedefstruct{void*conn;YangAVInfo*avinfo;YangStreamConfigstreamco
sublime个人设置 bawangtianzun sublime text 编辑器
如何拥有jiangly蒋老师同款编译器(sublimec++配置竞赛向）_哔哩哔哩_bilibiliSublimeText4的安装教程（新手竞赛向）-知乎(zhihu.com)创建文件自动保存为c++打开SublimeText软件。转到"Tools"（工具）>"Developer"（开发者）>"NewPlugin"（新建插件）。在打开的新文件中，粘贴以下代码：importsublimeimport
Rust是否会取代C/C++？Rust与C/C++的较量 AI与编程之窗源码编译与开发 rust c语言 c++内存安全并发编程代码安全性能优化
目录引言第一部分：Rust语言的优势内存安全性并发性性能社区和生态系统的成长第二部分：C/C++语言的优势和地位历史积淀和成熟度广泛的库和工具支持性能优化和硬件控制丰富的行业应用社区和行业支持第三部分：挑战和阻碍学习曲线现有代码库的迁移成本生态系统和工具链的完善度社区和人才培养行业应用和推广法规和标准化第四部分：未来趋势和可能性行业趋势教育和人才培养兼容和共存行业标准化企业支持和应用开源社区和生态
python可以制作大型游戏_python能做游戏吗-python能开发游戏吗靖dede python可以制作大型游戏
python可以写游戏，但不适合。下面我们来分析一下具体原因。用锤子能造汽车吗？谁也没法说不能吧？历史上也确实曾经有些汽车，是用锤子造出来的。但一般来说，还是用工业机器人更合适对吗？比较大型的，使用Python的游戏有两个，一个是《EVE》，还有一个是《文明》。但这仅仅是个例，没有广泛意义。一般来说，用来做游戏的语言，有两种。一是C++。。一是C#。。Python理论上，不仅不适合做游戏，而是只要
Python开发游戏？也太好用了吧七步编程工具 Github python python 游戏开发语言
程序员宝藏库：https://gitee.com/sharetech_lee/CS-Books-Store当然可以啦！现在日常能够用到和想到的场景，绝大多数都可以用Python实现。效果怎么样暂且不提，但是得益于丰富的第三方工具包，的确让Python能够很容易处理各种各样的场景。对于游戏开发也是这样，如果真的要想商业化，Python在游戏开发方面肯定没办法和C++相提并论，但是如果用于日常学习和自
Go编程语言前景怎么样？参加培训好就业吗 QFdongdong
Go语言专门针对多处理器系统应用程序的编程进行了优化，使用Go编译的程序可以媲美C或C++代码的速度，而且更加安全、支持并行进程。不仅可以开发web,可以开发底层，目前知乎就是用golang开发。区块链首选语言就是go,以-太坊，超级账本都是基于go语言，还有go语言版本的btcd.Go的目标是希望提升现有编程语言对程序库等依赖性(dependency)的管理，这些软件元素会被应用程序反复调用。由
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
linux gcc 格式,Linux下gcc与gdb简介神奇的战士 linux gcc 格式
gcc编译器可以将C、C++等语言源程序、汇编程序编译、链接成可执行程序。gdb是GNU开发的一个Unix/Linux下强大的程序调试工具。linux下没有后缀名的概念。但gcc根据文件的后缀来区别输入文件的类别：.cC语言源代码文件.a由目标文件构成的库文件.C、.cc、.cppC++源码文件.h头文件.i经过预处理之后的C语言文件.ii经过预处理之后的C++文件.o编译后的目标文件.s汇编源码
浅谈openresty 爱编码的钓鱼佬 nginx openresty 运维
熟悉了nginx后再来看openresty，不得不说openresty是比较优秀的。对nginx和openresty的历史等在这此就不介绍了。首先对标nginx，自然有优劣一、开发难度nginx：毫无疑问nginx的开发难度比较高，需要扎实的c/c++基础，而且还需要对nginx源码比较熟悉，开发效率慢，比如实现一个类似echo的功能，至少要上百行代码。而openresty只需要一句ngx.say
Lua 与 C#交互 z2014z lua c#开发语言
Lua与C#交互前提Lua是一种嵌入式脚本语言，Lua的解释器是用C编写的，因此可以方便的与C/C++进行相互调用。轻量级Lua语言的官方版本只包括一个精简的核心和最基本的库，这使得Lua体积小、启动速度快，也适合嵌入在别的程序里。交互过程C#调用Lua:由C#文件调用Lua解析器底层dll库（由C语言编写），再由dll文件执行相应的Lua文件。Lua调用C#：1、Wrap方式：首先生成C#源文件
Java【泛型】 SkyrimCitadelValinor Java基础 java
Java泛型的概述不同类的数据如果封装方法相同，不必为每一种类单独定义一个类，只需定义一个泛型类，减少类的声明，提高编程效率。通过准确定义泛型类，可避免对象类型转换时产生的错误。泛型又提供了一种类型安全检测机制，只有数据类型相匹配的变量才能正常的赋值，否则编译器就不通过。Java中的泛型与C++类模板的作用相同，但是编译方式不同，Java泛型类只会生成一部分目标代码，牺牲运行速度，而C++的类模板
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb