负载均衡下如何保持session(一)

一,什么负载均衡

一个新网站是不要做负载均衡的,因为访问量不大,流量也不大,所以没有必要搞这些东西。但是随着网站访问量和流量的快速增长,单台服务器受自身硬件条件的限制,很难承受这么大的访问量。在这种情况下,有二种方案可以选择: 
1,对单台服务器的硬件进行更新,由双核的变成四核的,内存加大等 
.2,增加服务器的台数,来分担服务器的负担。以实现增加网络带宽,增加服务器的处理能力的目的。

 

第一种方法可以理解为纵向发展,这种方法总是有限。 
第二种方法才是解决问题的正确选择 
实现负载均衡的方法,大至分为二个方向,一种是用软件来实现负载均衡,另一种是硬件实现负载均衡(包括结合硬件和软件)用软件来实现负载均衡,实现负载均衡的过程,自身也要消耗一些系统资源,响应时间增加例如:LVS,nginx的,HAProxy的,阿帕奇等这些基于应用层的负载均衡软件,适合那些访问量不是特别大的网站。如果像新浪,163这样大访量的网站,用硬件来实现负载均衡是最明志的选择

负载均衡的算法很多,有根据请求数来进行负载均衡的,有根IP来负载均衡的,有根据流量的等等。我经常会用的二种算法。

一个是根据请求数 
a,可以实现各台服务器都能比较平均分担客户的请求,其中一台服务器下降的话也不会造成不好的影响 
.b,服务器间的状态要同步,如会,需要其他手段来同步这些状态。

一个是根据IP 
a,ip_hash算法可以把一个ip映射到一台服务器上,这样可以解决会话
同步的问题  b,ip_hash也有不好的地方就是,假如其中的一台服务器down down的话,映射到这台的服务器的用户就郁闷了 
.c,ip_hash容易导致负载不均衡的情况,现在河蟹政府对谷歌的搜索关键词进行过滤,你会经常发现google打不开,但是过一会就好了。这让那些google的爱好者们郁闷不已,很多用户都到国外找代理去了,狗急跳墙,人急帆樯。如果这样的话,这些代理会被分到同一个服务器,会导致负载不均衡,甚至失效。

二,什么是会话保持,有什么作用

会话保持是指在负载均衡器上有一种机制,在作负载均衡的同时,还保证同一用户相关连的访问请求会被分配到同一台服务器上。

会话保持有什么作用呢,举例说明一下 
如果有一个用户访问请求被分配到服务器A,并且在服务器甲登录了,并且在很短的时间,这个用户又发出了一个请求,如果没有会话保持功能的话,这个用户的请求很有可能会被分配到服务器乙去,这个时候在服务器乙上是没有登录的,所以你要重新登录,但是用户并不知道自己的请求被分配到了哪里,用户的感觉就是登录了,怎么又要登录,用户体验很不好。 
还有你在淘宝上面买东西,从登录=“拍得东西=”添加地址=“付款,这是一个一系列的过程,也可以理解成一次操作过程,所有这一系列的操作过程都应当由一台服务器完成,而不能被负载均衡器分配到不同的服务器上

会话保持都会有时间的限制(映射到固定某一台的服务器除外,如:ip_hash),各种负载均衡工具都会提供这种会话保持时间的设置,LVS,apache的等连PHP的语言都提供了会话保持时间的设定的session.gc_maxlifetime会话保持时间的设定要大于会话生存时间的设定,这样可以减少需要同步会话的情况,但是不能杜绝。所以同步会话还是要做的。

三,会议同步

为什么要进行会话同步,说会话保持的时候已经提到了。具体方法请参考网站集群时会同步的3种方法

网络集群时会同步的3种方法

在做了网络集群后,你肯定会首先考虑会话同步问题,因为通过负载均衡后,同一个IP访问同一个页面会被分配到不同的服务器上,如果会话不同步的话,一个登录用户,一会是登录状态,一会又不是登录状态。所以本文就根据这种情况给出三种不同的方法来解决这个问题: 
1,利用数据库同步会话 
在做多服务器会话同步时我没有用这种方法,如果非要用这种方法的话,我想过二种方法: 
a,用一个低端电脑建个数据库专门存放web服务器的会话,或者,把这个专门的数据库建在文件服务器上,用户访问web服务器时,会去这个专门的数据库检查一下会话的情况,以达到会同步的目的 
.b,这种方法是把存放会话的表和其他数据库表放在一起,如果mysql也做了集群了话,每个MySQL的节点都要有这张表,并且这张会话表的数据表要实时同步。 
说明:用数 库来同步会话,会加大数据库的负担,数据库本来就是容易产生瓶颈的地方,如果把会议还放到数据库里面,无疑是雪上加霜。上面的二种方法,第一点方法较好,把放会话的表独立开来,减轻了真正数据库的负担

2,利用cookie 
同步会话是文件的形势存放在服务器端的,cookie是文件的形势存在客户端的,怎么实现同步呢?方法很简单,就是把用户访问页面产生的会话放到cookie里面,就是以cookie为中转站。你访问网络服务器A,产生了会话把它放到饼干里面了,你访问被分配到网页服务器B,这个时候,网络服务器乙先判断服务器有没有这个会话,如果没有,在去看看客户端的饼干里面有没有这个会议上,如果也没有,说明会议真的不存,如果饼干里面有,就把饼干里面的sessoin同步到网络服务器B,这样就可以实现会话的同步了。

说明:这种方法实现起来简单,方便,也不会加大数据库的负担,但是如果客户端把饼干禁掉了的话,那么会议就无从同步了,这样会给网站带来损失;饼干的安全性不高,虽然它已经加了密,但是还是可以伪造的。

3,利用memcache同步会话 
memcache可以做分布式,如果没有这功能,他也不能用来做会话同步。他可以把web服务器中的内存组合起来,成为一个“内存池”,不管是哪个服务器产生的sessoin都可以放到这个“内存池”中,其他的都可以使用。

优点:以这种方式来同步会话,不会加大数据库的负担,并且安全性比用饼干大大的提高,把会议放到内存里面,比从文件中读取要快很多。 
缺点:内存缓存把内存分成很多种规格的存储块,有块就有大小,这种方式也就决定了,内存缓存不能完全利用内存,会产生内存碎片,如果存储块不足,还会产生内存溢出。

四,总结

三种上面方法都是可行的 
第一种方法,最影响系统速度的那种,不推荐使用; 
第二种方法,效果不错,不过安全隐患一样的存在; 
第三种方法,个人觉得第三种方法是最好的,推荐大家使用;

负载均衡下如何保持会话

你可能感兴趣的:(Apache)