一致性哈希算法---负载均衡

目录

    • 场景一:业务服务器
    • 场景二:缓存服务器
    • 一致性哈希算法
    • MD5算法
    • 一致性哈希算法代码实现

场景一:业务服务器

负载的概念就是希望把不同区域的用户(客户端)分发到不同的服务器上,让每个服务器都尽量均衡的接受同等数量的客户端请求,把压力分散于不同的服务器中,所以前面就需要有一台反向代理服务器,也叫负载均衡器。像我们用的nginx、lvs都是非常强大的负载均衡器,有反向代理功能。负载均衡算法就属于一致性哈希算法
一致性哈希算法---负载均衡_第1张图片
轮询算法:第一个请求给server1,第二个请求给server2,第三个请求给server3,按权重比配置权重,基于这种权重的负载算法,有四个请求到来,其中会给server1和server3分别分配一个,其中两个会分配到server2。
一致性哈希算法---负载均衡_第2张图片
最少连接算法:负载均衡器里面要记录和每一台服务器创建的连接,每次在分发请求的时候和哪台服务器创建的连接越少则先分发给哪台服务器,因为和哪台服务器创建的连接越少,就说明这台服务器对应的压力是最小的,那么新来的请求就给到压力最小的服务器。

普通的哈希算法:和前面学的哈希表的除留余数法一样,比如里面有3台服务器,来一个请求就给它模上3,就得到0,1,2其中的一个值,对应哪个服务器的下标就把这个请求给到哪台服务器。

这些算法虽然简单,但是在我们大规模分布式集群环境中,有致命的缺陷,比如要求:
在这里插入图片描述
如果用普通哈希算法,不同的客户端ip地址不一样,或者在同一台机器上操作的话端口号不一样。哈希算法得有一个输入参数和输出参数,这里输入参数就选的是ip地址+端口号。客户端的请求过来以后,我们可以从它的传输层TCP报文里面取出来ip地址和端口号,在这里我们普通的哈希做的是除留余数法,采用md5哈希函数处理完后得到一个整数,再模上服务器个数N就得到了0~N-1其中一个整数,得到哪个数字就意味着客户端请求分发到哪台服务器上。
一致性哈希算法---负载均衡_第3张图片
比如一个ip地址+端口号经过md5处理后得到的是22,22%3=1,就意味着这个客户端发来的请求永远被映射到1号机器上。
一致性哈希算法---负载均衡_第4张图片
同一个客户端永远被映射到一台指定的server上。因为客户端的IP地址和端口号不变,经过md5哈希以后,得到的都是同一个整数。有效地解决会话共享的问题

会话共享问题:比如两个客户端zhangsan和lisi。zhangsan的ip地址和端口号作为md5函数的输入参数,处理完再模上服务器个数永远是一个固定的数(比如1),那么zhangsan从刚开始登录的时候就登录到1号服务器上,会写一些它的用户名和密码来验证客户端是否登录成功,在1号服务器上就会记录zhangsan所有的会话session,会话里面就包含了zhangsan的登录状态、connection连接信息等等,比如我们消息聊天就必须保证是常连接,因为客户端不仅仅会给服务端发送消息,服务端还会给客户端主动推送消息,这就需要保持这种常连接。lisi这个客户端经过处理后比如是2,那么它的会话就存储在2号服务器上,这台服务器也包含了lisi的登录状态、connection连接信息等等都是和客户端相关的信息,存储的是业务上实现相关功能需要的信息。

假如说客户端每一次的请求没有被映射到一台指定的server上,而是每一次发来的请求都跳到不同的服务器上,可能会出现zhangsan第一次的请求被映射到1号服务器上,那么在1号服务器做业务处理以后,判断zhangsan输入的id号、用户名、密码都是正确的,则登录成功,在这台服务端就记录了它的session,下一次zhangsan重新发了一个请求,这个请求没有被映射到1号服务器,被映射到0号服务器了,但是zhangsan的session在服务器1上记录的,0号服务器并没有记录。当然每一次请求被映射到不同的服务器端也不是不可以,我们需要相应的办法来解决这个问题,那就是把不同服务器上所有的会话都放在统一的redis里面,每一次根据用户的id取当前用户的状态,不要从当前用户的内存取,而是从远程的缓存服务器去取。

登录成功以后,客户端和这个服务器还有一些连接,我们希望后续它所做的所有的请求都是在这台服务器上,因为这台服务器保持了和这个客户端的常连接。

这种普通哈希算法的设计,我们有效的解决了会话共享的问题,也就保证了客户端永远落在一台服务器上。

我们考虑这么一个问题:假如说1号机器挂掉了,按理来说只影响1号机器上登录成功的用户,而不应该影响0和2号机器上登录的用户,但是实际上影响了,为什么?

因为现在后续所有客户端发来的请求,经过md5处理以后,在nginx或者lvs都是可以动态识别后端服务器的故障的,那么识别故障以后就不是模3而是模2了,原来模上3到达0和2号服务器的客户端,现在由于1号服务器挂掉了,再去发后续请求的话,经过md5哈希函数处理以后,现在不是模3而是模2,原来模上3达到0和2服务器,现在模上2不可能再到达0和2服务器了,肯定会变的。

用普通的哈希算法遇到的问题是:当我们一个机器挂掉了后,原本在其他机器上正常登录的客户端,后续的请求就不一定达到原先的服务器。

或者是增加了1台服务器,3号服务器,可以让后续新登录的用户给这个3号服务器上负载一些。原来登录在0,1,2上的服务器的用户就不用变,后续的请求就还是登录到之前的0,1,2号服务器,那么现在不是这样,动态增加1台服务器后,nginx(lvs)会感知到,同样的客户端,同样的IP地址端口号经过md5哈希函数后模上4了!!!就全乱了!!!

场景二:缓存服务器

一致性哈希算法---负载均衡_第5张图片
服务端要增删改查数据,能不能直接操作数据库,可以是可以,但是做不到高并发,因为数据库本身是受限于磁盘操作的,磁盘IO速度是非常慢的,虽然可以通过索引做一些优化,但是索引如果大了,索引本身也是要在磁盘上存储的,读索引也是要花费磁盘IO的,永远没有从内存上来的快。所以我们做后台开发的,要把一些热点数据储存在缓存上,我们拿用户的ID(key),先在缓存上(Redis,memcache)查,查不到再去DB数据库上查,查完了,先把数据往缓存上放,然后返回给服务层,服务器处理完业务把结果返回给用户。

其次,在高并发大流量的场景下,缓存服务器本身也要集群。
一致性哈希算法---负载均衡_第6张图片
根据普通哈希算法,把用户ID传入md5哈希函数,1个用户永远到1台memcach服务器上。
此时,memcach3挂掉了,按照普通的哈希算法,模上的数字改了,原来用户的后续请求落在了不同的memcach服务器上了,导致查询不到,然后到DB上找,DB上找来了以后又存到了不同的memcach上,导致有多台memcach服务器存储了同一个用户的信息。
假如memcach1上存储了10万用户的ID信息。这10万用户经过模数的更改,找不到缓存,然后都从DB上查,DB一下子就懵了,然后又重新落在了其他的memcach服务器上。
同样的再增加1台memcach服务器,模数也改了,结果也是不能接受的。

原本有100万数据,90万从缓存读取,10万由于缓存没查到落到DB,如果因为一台服务器的挂掉或者增加,模数改变,然后没查到,把90万数据都转到了DB,就严重了。

挂掉了服务器3,我们的理想是,得让原来落在服务器1和服务器2的用户,永远落在他们最初落在的服务器上,其他的新用户的请求进行新的模数取余负载分发。
在这里插入图片描述
这个是普通的哈希算法无法解决的。这就需要我们的一致性哈希算法,会弥补普通的哈希算法这些问题。

一致性哈希算法

在这里插入图片描述
一致性哈希算法描述:
一致性哈希算法---负载均衡_第7张图片
这个环就是一堆整数的取值方位,代表的数字。
一致性哈希算法---负载均衡_第8张图片
A,B,C落在3个不同的地方,代表md5算出的3个不同的数字

假设现在有4个客户请求进来了,这4个客户都有自己的IP和端口,我们把IP+端口作为输入值,经过md5处理后得到4个整数,分别落在了一致性哈希环上的4个位置。
在这个一致性哈希环上,沿着顺时针,遇到的第一台服务器就是最终负载到的服务器。
一致性哈希算法---负载均衡_第9张图片
假如现在客户端的请求来了(zhangsan的请求来了),zhangsan的IP地址+端口号作为输入值,进行md5的哈希,算出的哈希值,位于一致性哈希环上的1号位置,那么zhangsan请求最终落在了A服务器上。
客户2和客户3的请求就落在C服务器上。
客户4的请求就落在B服务器上。

这样到底有没有解决普通哈希算法存在的问题?
一致性哈希算法---负载均衡_第10张图片
假如服务器3挂掉了,那么原来在1和2上工作的客户端依然在1和2上,由于3宕机了,原来在3上工作的客户被重新分发到1和2上就可以了。
另外如果又增加了一台服务器,原来在1、2和3上的客户端依然在1、2和3上,只不过后期我们负载均衡器负载算法就会把后续的新的请求落在4上。
一致性哈希算法---负载均衡_第11张图片
不管是增加还是减少节点,服务器请求、负载的变化、重新哈希的结果应该做到最少的改动,有利于服务端业务运行的稳定。
一致性哈希算法---负载均衡_第12张图片
假如说现在A挂了,不会影响原来在B和C上的客户端,因为根据一致性哈希算法的处理,2和3最终沿着在哈希环上的顺序访问还是落在C机器上,4最终还是落在B机器上,只会影响A服务器上的客户端。
一致性哈希算法---负载均衡_第13张图片
如果现在增加一个D服务器,首先把D服务器的IP地址作为输入参数,传给md5哈希函数,得出整数值,就是落在一致性哈希环上的位置。
增加一个服务器节点,只影响这个服务器节点按逆时针遇到的上一台服务器的之间的请求。做到最少的改动。
一致性哈希算法---负载均衡_第14张图片
这个确实可以达到
在这里插入图片描述
可以用一个set,底层是红黑树,只存key来实现这个环
一致性哈希算法---负载均衡_第15张图片
为了达到每一个服务器的负载能力都比较均衡,尽量让它们分散一些,收到的客户的请求就均衡一些,趋于平均。
下面这个图就不好
一致性哈希算法---负载均衡_第16张图片
可以用虚拟节点来解决。虚拟节点:把一个机器虚拟的看成很多台机器
一致性哈希算法---负载均衡_第17张图片
ip虽然相同,但是后面的#数字不同,我们就可以在哈希环上得到不同位置的散列值。md5算法特点:哪怕输入参数值比较近似,md5算法处理后,结果也是非常离散的。

在实际中,我们给真实的主机放100-200个虚拟节点,A和B在md5计算后的结果非常近,但是我们把物理主机想象成各自有100-200个虚拟主机,在环上就相对离散。
一致性哈希算法---负载均衡_第18张图片

虚拟节点保存其对应的物理节点的主机的信息,请求是落在虚拟节点对应的物理主机上。
一致性哈希算法---负载均衡_第19张图片
一致性哈希算法有哪些需要我们在代码上表示的
一致性哈希算法---负载均衡_第20张图片

MD5算法

MD5的应用:加密、哈希、验证、云盘项目中的大文件实现秒传功能。

MD5可以加密原始的数据,得到一个加密后的子串,可以处理16位或32位,默认32位。

(1)
在这里插入图片描述

演示:
一致性哈希算法---负载均衡_第21张图片
一致性哈希算法---负载均衡_第22张图片
可以看出数字差别还是很大的,非常离散!

(2)
在这里插入图片描述

一致性哈希算法---负载均衡_第23张图片
getMD5得到的是经过处理的整型数据。

演示:
一致性哈希算法---负载均衡_第24张图片
(3)
在这里插入图片描述
如果文件没有被改动的话,原始的文件计算出的MD5加密串是一模一样的。哪怕文件多了一个空格或者符号等任意改动,计算出的MD5加密串都是不一样的。

应用场景:secret.dat文件要通过网络从FileClient传输到FileServer,怎么保证这个文件没有在网络的中间节点上被人拦截并把这个文件做了修改?

我们就可以用MD5来防止,在上传文件之前,先发送
一致性哈希算法---负载均衡_第25张图片
如果服务器同意可以上传,就可以传输文件,服务端接收完文件以后,服务端也计算以下该文件的MD5值,如果文件内容和原始一样,那么最后FileServer接收完的MD5值应该和FileClient最开始文件上传请求时包含的MD5值是一样的,如果不一样证明文件的内容被改动,可以做文件的有效性验证,另外传到文件服务器上的这些文件,它们的MD5值都可以在表里面存下来,如果后续用户可能又发起了同样的secret.dat文件的上传请求,先发送uploadfile和文件信息,发送完后服务器发现这里面想上传的MD5值库里面已经存在,那么可以直接给客户端响应文件传输成功,实际上没有传输,只做了一个MD5验证,因为已经存在,所以在该目录下建立了一个指向该文件的软链接。

MD5.h

#pragma once


/* typedef a 32 bit type */
typedef unsigned long int UINT4;

/* Data structure for MD5 (Message Digest) computation */
typedef struct {
	UINT4 i[2];                   /* number of _bits_ handled mod 2^64 */
	UINT4 buf[4];                                    /* scratch buffer */
	unsigned char in[64];                              /* input buffer */
	unsigned char digest[16];     /* actual digest after MD5Final call */
} MD5_CTX;

void MD5Init(MD5_CTX* mdContext);
void MD5Update(MD5_CTX* mdContext, unsigned char* inBuf, unsigned int inLen);
void MD5Final(MD5_CTX* mdContext);
static void Transform(UINT4* buf, UINT4* in);
//指定一个文件的路径path,根据文件内容计算出一个md5加密串
//这个文件内容有一点点任何改动,生成的加密串都是不一样的
char* MD5_file(const char* path, int md5_len=32);
//从原始的字符串,得到加密后的md5串
char* MD5(const char* buf, int md5_len = 32);
//把32位的md5串,处理成unsigned int返回
unsigned int getMD5(const char* buf);

MD5.cc

#include "md5.h"
#include 
#include 
#include 


/* forward declaration */
static void Transform();

static unsigned char PADDING[64] = {
	0x80, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00,
	0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00,
	0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00,
	0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00,
	0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00,
	0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00,
	0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00,
	0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00
};

/* F, G and H are basic MD5 functions: selection, majority, parity */
#define F(x, y, z) (((x) & (y)) | ((~x) & (z)))
#define G(x, y, z) (((x) & (z)) | ((y) & (~z)))
#define H(x, y, z) ((x) ^ (y) ^ (z))
#define I(x, y, z) ((y) ^ ((x) | (~z))) 

/* ROTATE_LEFT rotates x left n bits */
#define ROTATE_LEFT(x, n) (((x) << (n)) | ((x) >> (32-(n))))

/* FF, GG, HH, and II transformations for rounds 1, 2, 3, and 4 */
/* Rotation is separate from addition to prevent recomputation */
#define FF(a, b, c, d, x, s, ac) \
  {(a) += F ((b), (c), (d)) + (x) + (UINT4)(ac); \
   (a) = ROTATE_LEFT ((a), (s)); \
   (a) += (b); \
  }
#define GG(a, b, c, d, x, s, ac) \
	  {(a) += G ((b), (c), (d)) + (x) + (UINT4)(ac); \
   (a) = ROTATE_LEFT ((a), (s)); \
   (a) += (b); \
	  }
#define HH(a, b, c, d, x, s, ac) \
	  {(a) += H ((b), (c), (d)) + (x) + (UINT4)(ac); \
   (a) = ROTATE_LEFT ((a), (s)); \
   (a) += (b); \
	  }
#define II(a, b, c, d, x, s, ac) \
	  {(a) += I ((b), (c), (d)) + (x) + (UINT4)(ac); \
   (a) = ROTATE_LEFT ((a), (s)); \
   (a) += (b); \
	  }

void MD5Init(MD5_CTX* mdContext)
{
	mdContext->i[0] = mdContext->i[1] = (UINT4)0;

	/* Load magic initialization constants.
	*/
	mdContext->buf[0] = (UINT4)0x67452301;
	mdContext->buf[1] = (UINT4)0xefcdab89;
	mdContext->buf[2] = (UINT4)0x98badcfe;
	mdContext->buf[3] = (UINT4)0x10325476;
}

void MD5Update(MD5_CTX* mdContext, unsigned char* inBuf, unsigned int inLen)
{
	UINT4 in[16];
	int mdi;
	unsigned int i, ii;

	/* compute number of bytes mod 64 */
	mdi = (int)((mdContext->i[0] >> 3) & 0x3F);

	/* update number of bits */
	if ((mdContext->i[0] + ((UINT4)inLen << 3)) < mdContext->i[0])
		mdContext->i[1]++;
	mdContext->i[0] += ((UINT4)inLen << 3);
	mdContext->i[1] += ((UINT4)inLen >> 29);

	while (inLen--) {
		/* add new character to buffer, increment mdi */
		mdContext->in[mdi++] = *inBuf++;

		/* transform if necessary */
		if (mdi == 0x40) {
			for (i = 0, ii = 0; i < 16; i++, ii += 4)
				in[i] = (((UINT4)mdContext->in[ii + 3]) << 24) |
				(((UINT4)mdContext->in[ii + 2]) << 16) |
				(((UINT4)mdContext->in[ii + 1]) << 8) |
				((UINT4)mdContext->in[ii]);
			Transform(mdContext->buf, in);
			mdi = 0;
		}
	}
}

void MD5Final(MD5_CTX* mdContext)

{
	UINT4 in[16];
	int mdi;
	unsigned int i, ii;
	unsigned int padLen;

	/* save number of bits */
	in[14] = mdContext->i[0];
	in[15] = mdContext->i[1];

	/* compute number of bytes mod 64 */
	mdi = (int)((mdContext->i[0] >> 3) & 0x3F);

	/* pad out to 56 mod 64 */
	padLen = (mdi < 56) ? (56 - mdi) : (120 - mdi);
	MD5Update(mdContext, PADDING, padLen);
	/* append length in bits and transform */
	for (i = 0, ii = 0; i < 14; i++, ii += 4)
		in[i] = (((UINT4)mdContext->in[ii + 3]) << 24) |
		(((UINT4)mdContext->in[ii + 2]) << 16) |
		(((UINT4)mdContext->in[ii + 1]) << 8) |
		((UINT4)mdContext->in[ii]);
	Transform(mdContext->buf, in);

	/* store buffer in digest */
	for (i = 0, ii = 0; i < 4; i++, ii += 4) {
		mdContext->digest[ii] = (unsigned char)(mdContext->buf[i] & 0xFF);
		mdContext->digest[ii + 1] =
			(unsigned char)((mdContext->buf[i] >> 8) & 0xFF);
		mdContext->digest[ii + 2] =
			(unsigned char)((mdContext->buf[i] >> 16) & 0xFF);
		mdContext->digest[ii + 3] =
			(unsigned char)((mdContext->buf[i] >> 24) & 0xFF);
	}
}

/* Basic MD5 step. Transform buf based on in.
*/
static void Transform(UINT4* buf, UINT4* in)
{
	UINT4 a = buf[0], b = buf[1], c = buf[2], d = buf[3];

	/* Round 1 */
#define S11 7
#define S12 12
#define S13 17
#define S14 22
	FF(a, b, c, d, in[0], S11, 3614090360); /* 1 */
	FF(d, a, b, c, in[1], S12, 3905402710); /* 2 */
	FF(c, d, a, b, in[2], S13, 606105819); /* 3 */
	FF(b, c, d, a, in[3], S14, 3250441966); /* 4 */
	FF(a, b, c, d, in[4], S11, 4118548399); /* 5 */
	FF(d, a, b, c, in[5], S12, 1200080426); /* 6 */
	FF(c, d, a, b, in[6], S13, 2821735955); /* 7 */
	FF(b, c, d, a, in[7], S14, 4249261313); /* 8 */
	FF(a, b, c, d, in[8], S11, 1770035416); /* 9 */
	FF(d, a, b, c, in[9], S12, 2336552879); /* 10 */
	FF(c, d, a, b, in[10], S13, 4294925233); /* 11 */
	FF(b, c, d, a, in[11], S14, 2304563134); /* 12 */
	FF(a, b, c, d, in[12], S11, 1804603682); /* 13 */
	FF(d, a, b, c, in[13], S12, 4254626195); /* 14 */
	FF(c, d, a, b, in[14], S13, 2792965006); /* 15 */
	FF(b, c, d, a, in[15], S14, 1236535329); /* 16 */

	/* Round 2 */
#define S21 5
#define S22 9
#define S23 14
#define S24 20
	GG(a, b, c, d, in[1], S21, 4129170786); /* 17 */
	GG(d, a, b, c, in[6], S22, 3225465664); /* 18 */
	GG(c, d, a, b, in[11], S23, 643717713); /* 19 */
	GG(b, c, d, a, in[0], S24, 3921069994); /* 20 */
	GG(a, b, c, d, in[5], S21, 3593408605); /* 21 */
	GG(d, a, b, c, in[10], S22, 38016083); /* 22 */
	GG(c, d, a, b, in[15], S23, 3634488961); /* 23 */
	GG(b, c, d, a, in[4], S24, 3889429448); /* 24 */
	GG(a, b, c, d, in[9], S21, 568446438); /* 25 */
	GG(d, a, b, c, in[14], S22, 3275163606); /* 26 */
	GG(c, d, a, b, in[3], S23, 4107603335); /* 27 */
	GG(b, c, d, a, in[8], S24, 1163531501); /* 28 */
	GG(a, b, c, d, in[13], S21, 2850285829); /* 29 */
	GG(d, a, b, c, in[2], S22, 4243563512); /* 30 */
	GG(c, d, a, b, in[7], S23, 1735328473); /* 31 */
	GG(b, c, d, a, in[12], S24, 2368359562); /* 32 */

	/* Round 3 */
#define S31 4
#define S32 11
#define S33 16
#define S34 23
	HH(a, b, c, d, in[5], S31, 4294588738); /* 33 */
	HH(d, a, b, c, in[8], S32, 2272392833); /* 34 */
	HH(c, d, a, b, in[11], S33, 1839030562); /* 35 */
	HH(b, c, d, a, in[14], S34, 4259657740); /* 36 */
	HH(a, b, c, d, in[1], S31, 2763975236); /* 37 */
	HH(d, a, b, c, in[4], S32, 1272893353); /* 38 */
	HH(c, d, a, b, in[7], S33, 4139469664); /* 39 */
	HH(b, c, d, a, in[10], S34, 3200236656); /* 40 */
	HH(a, b, c, d, in[13], S31, 681279174); /* 41 */
	HH(d, a, b, c, in[0], S32, 3936430074); /* 42 */
	HH(c, d, a, b, in[3], S33, 3572445317); /* 43 */
	HH(b, c, d, a, in[6], S34, 76029189); /* 44 */
	HH(a, b, c, d, in[9], S31, 3654602809); /* 45 */
	HH(d, a, b, c, in[12], S32, 3873151461); /* 46 */
	HH(c, d, a, b, in[15], S33, 530742520); /* 47 */
	HH(b, c, d, a, in[2], S34, 3299628645); /* 48 */

	/* Round 4 */
#define S41 6
#define S42 10
#define S43 15
#define S44 21
	II(a, b, c, d, in[0], S41, 4096336452); /* 49 */
	II(d, a, b, c, in[7], S42, 1126891415); /* 50 */
	II(c, d, a, b, in[14], S43, 2878612391); /* 51 */
	II(b, c, d, a, in[5], S44, 4237533241); /* 52 */
	II(a, b, c, d, in[12], S41, 1700485571); /* 53 */
	II(d, a, b, c, in[3], S42, 2399980690); /* 54 */
	II(c, d, a, b, in[10], S43, 4293915773); /* 55 */
	II(b, c, d, a, in[1], S44, 2240044497); /* 56 */
	II(a, b, c, d, in[8], S41, 1873313359); /* 57 */
	II(d, a, b, c, in[15], S42, 4264355552); /* 58 */
	II(c, d, a, b, in[6], S43, 2734768916); /* 59 */
	II(b, c, d, a, in[13], S44, 1309151649); /* 60 */
	II(a, b, c, d, in[4], S41, 4149444226); /* 61 */
	II(d, a, b, c, in[11], S42, 3174756917); /* 62 */
	II(c, d, a, b, in[2], S43, 718787259); /* 63 */
	II(b, c, d, a, in[9], S44, 3951481745); /* 64 */

	buf[0] += a;
	buf[1] += b;
	buf[2] += c;
	buf[3] += d;
}


char* MD5_file(const char* path, int md5_len)
{
	FILE* fp = fopen(path, "rb");
	MD5_CTX mdContext;
	int bytes;
	unsigned char data[1024];
	char* file_md5;
	int i;

	if (fp == NULL) {
		fprintf(stderr, "fopen %s failed\n", path);
		return NULL;
	}

	MD5Init(&mdContext);
	while ((bytes = fread(data, 1, 1024, fp)) != 0)
	{
		MD5Update(&mdContext, data, bytes);
	}
	MD5Final(&mdContext);

	file_md5 = (char*)malloc((md5_len + 1) * sizeof(char));
	if (file_md5 == NULL)
	{
		fprintf(stderr, "malloc failed.\n");
		return NULL;
	}
	memset(file_md5, 0, (md5_len + 1));

	if (md5_len == 16)
	{
		for (i = 4; i < 12; i++)
		{
			sprintf(&file_md5[(i - 4) * 2], "%02x", mdContext.digest[i]);
		}
	}
	else if (md5_len == 32)
	{
		for (i = 0; i < 16; i++)
		{
			sprintf(&file_md5[i * 2], "%02x", mdContext.digest[i]);
		}
	}
	else
	{
		fclose(fp);
		free(file_md5);
		return NULL;
	}
	fclose(fp);
	return file_md5;
}

char* MD5(const char* buf, int md5_len)
{
	MD5_CTX mdContext;
	int bytes;
	unsigned char data[1024];
	char* file_md5;
	int i;

	MD5Init(&mdContext);
	MD5Update(&mdContext, (unsigned char*)buf, strlen(buf));
	MD5Final(&mdContext);

	file_md5 = (char*)malloc((md5_len + 1) * sizeof(char));
	if (file_md5 == NULL)
	{
		fprintf(stderr, "malloc failed.\n");
		return NULL;
	}
	memset(file_md5, 0, (md5_len + 1));

	if (md5_len == 16)
	{
		for (i = 4; i < 12; i++)
		{
			sprintf(&file_md5[(i - 4) * 2], "%02x", mdContext.digest[i]);
		}
	}
	else if (md5_len == 32)
	{
		for (i = 0; i < 16; i++)
		{
			sprintf(&file_md5[i * 2], "%02x", mdContext.digest[i]);
		}
	}
	else
	{
		free(file_md5);
		return NULL;
	}
	return file_md5;
}

unsigned int getMD5(const char* buf)
{
	char* b = MD5(buf);
	unsigned int hash = 0;

	// 共32位的加密串 8个字符  4组
	// 5f93f983524def3dca464469d2cf9f3e
	for (int i = 0; i < 8; i++)
	{
		hash += ((int)(b[i * 4 + 3] & 0xFF) << 24)
			| ((int)(b[i * 4 + 2] & 0xFF) << 16)
			| ((int)(b[i * 4 + 1] & 0xFF) << 8)
			| ((int)(b[i * 4 + 0] & 0xFF));
	}

	return hash;
}

一致性哈希算法代码实现

一致性哈希算法---负载均衡_第26张图片

#include
#include
#include
#include
#include
#include"md5.h"

using namespace std;
//一致性哈希环的取值类型
using uint = unsigned int;
//前置声明物理节点主机类型
class PhysicalHost;
//虚拟节点
class VirtualHost {
public:
	VirtualHost(string ip, PhysicalHost* phy_host_ptr) 
	: ip_(ip)
	, phy_host_ptr_(phy_host_ptr)
	{
		md5_ = getMD5(ip_.c_str());
	}

	// 虚拟节点存放到set的时候,需要排序,默认less,需要提供operator<
	bool operator<(const VirtualHost& vir_host) const {
		// 根据md5值排序
		return md5_ < vir_host.md5_;
	}

	// 删除哈希环上的虚拟节点时,需要查找,重载operator==
	bool operator==(const VirtualHost& vir_host) const {
		return ip_ == vir_host.ip_;
	}

	const uint get_md5() const {
		return md5_;
	}

	const PhysicalHost* get_phy_host() const {
		return phy_host_ptr_;
	}
private:
	string ip_;                   // 虚拟节点记录的ip信息
	uint md5_;                    // 根据物理节点的ip计算的ip值得到的MD5,这是32位加密串运算得到的uint
	PhysicalHost* phy_host_ptr_;  // 指向实际的物理节点
};

//物理节点
class PhysicalHost {
public:
	// 物理节点的ip,创建虚拟节点的个数
	PhysicalHost(string ip, int v_number)
	: ip_(ip)
	{
		for (int i = 0; i < v_number; i++) {
			// 虚拟节点需要记录ip以及对应的物理节点
			virtual_hosts_.push_back(VirtualHost(ip_ + "#" + ::to_string(i), this));
		}
	}

	const string get_ip() const{
		return ip_;
	}

	const list<VirtualHost>& get_virtual_hosts() const {
		return virtual_hosts_;
	}

private:
	string ip_;//物理机器的ip地址
	list<VirtualHost> virtual_hosts_;  // 双向循环链表,存储虚拟节点的链表
};

//一致性哈希	
class ConsistentHash {
public:
	// 添加物理主机的虚拟节点到一致性哈希环
	void add_host(PhysicalHost& phy_host) {
		auto vir_list = phy_host.get_virtual_hosts();
		for (auto vir_host : vir_list) {
			hash_circle_.insert(vir_host);
		}
	}

	// 删除哈希环物理节点所有的虚拟节点
	void del_host(PhysicalHost& phy_host) {
		//获取物理主机所有的虚拟节点列表
		auto vir_list = phy_host.get_virtual_hosts();
		for (auto vir_host : vir_list) {
			// 红黑树查找,O(log2n)
			auto iter = hash_circle_.find(vir_host);
			if (iter != hash_circle_.end()) {
				hash_circle_.erase(iter);
			}
		}
	}

	// 根据客户的ip,计算其对应的虚拟主机,然后根据虚拟主机返回真是的物理主机的ip
	string get_client_host(string client_ip) const{
		uint client_md5 = getMD5(client_ip.c_str());
		// 找第一个比客户ip的md5大的虚拟主机
		for (VirtualHost vir_host : hash_circle_) {
			if (vir_host.get_md5() > client_md5) {
				return vir_host.get_phy_host()->get_ip();
			}
		}
		// 客户的ip得到的md5过大,无法找到更大的md5,那直接分配第一个虚拟节点
		return hash_circle_.begin()->get_phy_host()->get_ip();
	}

private:
    // 由于需要顺时针查找,需要排序,所以一致性哈希算法底层用到红黑树
	set<VirtualHost> hash_circle_;
};

void show_consistent_hash(const ConsistentHash& hash_circle) {
	list<string> client_ip_list{
		"192.168.1.100",
		"192.168.1.101",
		"192.168.1.102",
		"192.168.1.103",
		"192.168.1.104",
		"192.168.1.105",
		"192.168.1.106",
		"192.168.1.107",
		"192.168.1.108",
		"192.168.1.109",
		"192.168.1.110",
		"192.168.1.111",
		"192.168.1.112",
		"192.168.1.113",
	};

	// 物理服务器ip  所服务的客户端ip
	map<string, list<string>> ip_map;
	for (string client_ip : client_ip_list) {
		// 根据客户端的ip,计算哈希环上的虚拟主机,从而拿到对应物理主机的ip
		string phy_host_ip = hash_circle.get_client_host(client_ip);  
		ip_map[phy_host_ip].push_back(client_ip);
	}
	for (auto pair : ip_map) {
		cout << "server ip :" << pair.first << endl;
		cout << "该服务器服务的客户端有" << pair.second.size() << "个" << endl;
		cout << "client ip :" << endl;
		for (string client_ip : pair.second) {
			cout << client_ip << endl;
		}
		cout << "-----------------------------" << endl;
	}
}

int main() {
	PhysicalHost phy_host1("10.117.121.66", 200);
	PhysicalHost phy_host2("10.117.121.67", 200);
	PhysicalHost phy_host3("10.117.121.68", 200);
	
	ConsistentHash hash_circle;
	hash_circle.add_host(phy_host1);
	hash_circle.add_host(phy_host2);
	hash_circle.add_host(phy_host3);
	
	show_consistent_hash(hash_circle);
	hash_circle.del_host(phy_host2);
	cout << "*********主机2宕机*********" << endl;
	show_consistent_hash(hash_circle);

	return 0;
}

你可能感兴趣的:(数据结构,哈希算法,负载均衡,算法,c++)