分布式:一个业务分拆多个子业务,部署在不同的服务器上
集群:同一个业务,部署在多个服务器上
集群
集群模式在程序猿界有各种装逼解释,有的让你根本无法理解,其实就是一个很简单的玩意儿,且听我一一道来。
单机处理到达瓶颈的时候,你就把单机复制几份,这样就构成了一个“集群”。集群中每台服务器就叫做这个集群的一个“节点”,所有节点构成了一个集群。每个节点都提供相同的服务,那么这样系统的处理能力就相当于提升了好几倍(有几个节点就相当于提升了这么多倍)。
但问题是用户的请求究竟由哪个节点来处理呢?最好能够让此时此刻负载较小的节点来处理,这样使得每个节点的压力都比较平均。要实现这个功能,就需要在所有节点之前增加一个“调度者”的角色,用户的所有请求都先交给它,然后它根据当前所有节点的负载情况,决定将这个请求交给哪个节点处理。这个“调度者”有个牛逼了名字——负载均衡服务器。
集群结构的好处就是系统扩展非常容易。如果随着你们系统业务的发展,当前的系统又支撑不住了,那么给这个集群再增加节点就行了。但是,当你的业务发展到一定程度的时候,你会发现一个问题——无论怎么增加节点,貌似整个集群性能的提升效果并不明显了。这时候,你就需要使用微服务结构了。
分布式结构
先来对前面的知识点做个总结。
从单机结构到集群结构,你的代码基本无需要作任何修改,你要做的仅仅是多部署几台服务器,每台服务器上运行相同的代码就行了。但是,当你要从集群结构演进到微服务结构的时候,之前的那套代码就需要发生较大的改动了。所以对于新系统我们建议,系统设计之初就采用微服务架构,这样后期运维的成本更低。但如果一套老系统需要升级成微服务结构的话,那就得对代码大动干戈了。所以,对于老系统而言,究竟是继续保持集群模式,还是升级成微服务架构,这需要你们的架构师深思熟虑、权衡投入产出比。
OK,下面开始介绍所谓的分布式结构。
分布式结构就是将一个完整的系统,按照业务功能,拆分成一个个独立的子系统,在分布式结构中,每个子系统就被称为“服务”。这些子系统能够独立运行在web容器中,它们之间通过RPC方式通信。
举个例子,假设需要开发一个在线商城。按照微服务的思想,我们需要按照功能模块拆分成多个独立的服务,如:用户服务、产品服务、订单服务、后台管理服务、数据分析服务等等。这一个个服务都是一个个独立的项目,可以独立运行。如果服务之间有依赖关系,那么通过RPC方式调用。
这样的好处有很多:
1. 系统之间的耦合度大大降低,可以独立开发、独立部署、独立测试,系统与系统之间的边界非常明确,排错也变得相当容易,开发效率大大提升。
2. 系统之间的耦合度降低,从而系统更易于扩展。我们可以针对性地扩展某些服务。假设这个商城要搞一次大促,下单量可能会大大提升,因此我们可以针对性地提升订单系统、产品系统的节点数量,而对于后台管理系统、数据分析系统而言,节点数量维持原有水平即可。
3. 服务的复用性更高。比如,当我们将用户系统作为单独的服务后,该公司所有的产品都可以使用该系统作为用户系统,无需重复开发。
分布式缺点
1.分布式意味着服务器调用必须经过网络,这可能会对性能造成严重性的影响。
2.服务器越多,服务器宕机的概率就越大,一台服务器宕机造成的服务器不可用可能会导致很多应用不可访问,使网站可用性降低。
3.数据库在分布式的环境中保持数据性的一致性也非常困难,分布式事务难以保证。这对网站业务正确性和业务流程有可能造成很大影响。
4.分布式还导致网络依赖错综复杂,开发管理维护困难。因此切莫为了分布式而分布式。
常用的分布式方案
1.分布式应用和服务:将分层和分割后的应用和服务器模块分布式部署,除了可以改善网站性能和并发性,加快开发和发布速度,减少数据库连接消耗外;还可以使不同应用复用共同的服务。
2.分布式静态资源:网站的静态资源如js,css,logo图片等资源独立分布式部署,并采用独立的域名,即人们常说的动静分离。静态资源分布式部署可以减轻服务器的负载压力;通过使用独立域名加快浏览器并发加载的速度;由负责用户体验的团队进行开发维护有利于网站分工合作,使不同技术工种技术有专攻。
3.分布式数据和存储:大型网站需要处理以P为单位的海量数据,单台计算机无法提供如此大的存储空间,这些数据需要分布式存储。除了对传统的关系数据库进行分布式部署外,为网站应用而生的各种NoSQL产品基本都是分布式的。
4.分布式计算:严格来说,应用,服务,实时数据处理都是计算,网站除了需要处理这些在线业务,还有很大一部分用户用户没有直观的后台业务要处理,包括搜索引擎的索引构建,数据仓库的数据分析统计等。这些业务计算规模非常庞大,目前网站普遍使用Hadoop以及MapReduce分布式计算框进行此类批处理计算,其特点是移动计算而不是移动数据,将计算机程序分发到数据所在的位置以加速计算和分布式计算。、
集群
使用分布式虽然已经将分层和分割后的模块独立部署,但是对于用户集中访问集中的模块(比如网站首页),还需要将独立部署的服务器集群化,即多台服务器部署相同构成一个集群,通过负载均衡设备共同对外提供服务。
因为服务器集群有更多服务器提供相同服务,因此可以提供更好的并发特性,当有更多用户访问的时候,只需要向集群中加入新机器即可。同时因为一个应用由多台服务器提供,当某台服务器发生故障的时候,负载均衡设备的失效转移机制会将请求转发到集群中其他服务器上,使服务器故障不影响用户使用。所以在网站应用中,即使是访问量很小的分布式应用和服务,也至少需要部署两台服务器构成一个小的集群,目的就是提高系统的可用性。