关注者
1,561
被浏览
449,153
关注问题写回答
邀请回答
1 条评论
分享
举报
53 个回答
默认排序
大闲人柴毛毛
渴求Java开发!内推蚂蚁金服
673 人赞同了该回答
画了一上午,麻烦点个赞~
下面就正经解释下三种结构的区别吧~
我想大家最最最熟悉的就是单机结构,一个系统业务量很小的时候所有的代码都放在一个项目中就好了,然后这个项目部署在一台服务器上就好了。整个项目所有的服务都由这台服务器提供。这就是单机结构。
那么,单机结构有啥缺点呢?我想缺点是显而易见的,单机的处理能力毕竟是有限的,当你的业务增长到一定程度的时候,单机的硬件资源将无法满足你的业务需求。此时便出现了集群模式,往下接着看。
集群模式在程序猿界有各种装逼解释,有的让你根本无法理解,其实就是一个很简单的玩意儿,且听我一一道来。
单机处理到达瓶颈的时候,你就把单机复制几份,这样就构成了一个“集群”。集群中每台服务器就叫做这个集群的一个“节点”,所有节点构成了一个集群。每个节点都提供相同的服务,那么这样系统的处理能力就相当于提升了好几倍(有几个节点就相当于提升了这么多倍)。
但问题是用户的请求究竟由哪个节点来处理呢?最好能够让此时此刻负载较小的节点来处理,这样使得每个节点的压力都比较平均。要实现这个功能,就需要在所有节点之前增加一个“调度者”的角色,用户的所有请求都先交给它,然后它根据当前所有节点的负载情况,决定将这个请求交给哪个节点处理。这个“调度者”有个牛逼了名字——负载均衡服务器。
集群结构的好处就是系统扩展非常容易。如果随着你们系统业务的发展,当前的系统又支撑不住了,那么给这个集群再增加节点就行了。但是,当你的业务发展到一定程度的时候,你会发现一个问题——无论怎么增加节点,貌似整个集群性能的提升效果并不明显了。这时候,你就需要使用微服务结构了。
先来对前面的知识点做个总结。
从单机结构到集群结构,你的代码基本无需要作任何修改,你要做的仅仅是多部署几台服务器,每台服务器上运行相同的代码就行了。但是,当你要从集群结构演进到微服务结构的时候,之前的那套代码就需要发生较大的改动了。所以对于新系统我们建议,系统设计之初就采用微服务架构,这样后期运维的成本更低。但如果一套老系统需要升级成微服务结构的话,那就得对代码大动干戈了。所以,对于老系统而言,究竟是继续保持集群模式,还是升级成微服务架构,这需要你们的架构师深思熟虑、权衡投入产出比。
OK,下面开始介绍所谓的分布式结构。
分布式结构就是将一个完整的系统,按照业务功能,拆分成一个个独立的子系统,在分布式结构中,每个子系统就被称为“服务”。这些子系统能够独立运行在web容器中,它们之间通过RPC方式通信。
举个例子,假设需要开发一个在线商城。按照微服务的思想,我们需要按照功能模块拆分成多个独立的服务,如:用户服务、产品服务、订单服务、后台管理服务、数据分析服务等等。这一个个服务都是一个个独立的项目,可以独立运行。如果服务之间有依赖关系,那么通过RPC方式调用。
这样的好处有很多:
编辑于 2017-12-24
赞同 67342 条评论
分享
收藏感谢
收起
张鹏飞
架构,运维,分布式架构
823 人赞同了该回答
小饭店原来只有一个厨师,切菜洗菜备料炒菜全干。后来客人多了,厨房一个厨师忙不过来,又请了个厨师,两个厨师都能炒一样的菜,这两个厨师的关系是集群。为了让厨师专心炒菜,把菜做到极致,又请了个配菜师负责切菜,备菜,备料,厨师和配菜师的关系是分布式,一个配菜师也忙不过来了,又请了个配菜师,两个配菜师关系是集群
发布于 2016-07-20
已赞同 82342 条评论
分享
收藏感谢
预流
一蓑烟雨任平生
952 人赞同了该回答
分布式:一个业务分拆多个子业务,部署在不同的服务器上
集群:同一个业务,部署在多个服务器上
发布于 2014-05-26
赞同 95247 条评论
分享
收藏感谢
Wang Xu
Kata AC member
261 人赞同了该回答
集群是个物理形态,分布式是个工作方式。
只要是一堆机器,就可以叫集群,他们是不是一起协作着干活,这个谁也不知道;一个程序或系统,只要运行在不同的机器上,就可以叫分布式,嗯,C/S架构也可以叫分布式。
集群一般是物理集中、统一管理的,而分布式系统则不强调这一点。
所以,集群可能运行着一个或多个分布式系统,也可能根本没有运行分布式系统;分布式系统可能运行在一个集群上,也可能运行在不属于一个集群的多台(2台也算多台)机器上。
发布于 2012-01-04
赞同 26118 条评论
分享
收藏感谢
wistbean
非主流程序员,个人公众号:「肯定会」
95 人赞同了该回答
有一天,隔壁小王睡前突然有一个大胆的插法,哦不~ 大胆的想法,他要做一个在线B2C的美女网站,突然发现接下来要发了,可以赢取白富美了,不过他又想到了一个问题:
“想法都有了,就差一个程序员了”!
翻了一会通讯录后发现了楼下的小明就是个程序员啊!于是也不管几点就直接从床上跳起来,穿着拖鞋跑到楼下猛敲小明的房门。
小明这时候正在写代码,被连续的敲门声吓得写了一个bug后就去开门了。
“什么事啊?”
“呀,我是你楼上的小王啊,你还没睡啊?有事找你有事找你”
小王不管不顾的走进去,小明一阵错愕!
“小明”,小王放低了声音,“我有一个项目,绝对能发,现在就差开发了,听说你的技术很牛逼!”
“什么项目?”,小明被小王的神秘语气和一种不知哪来的自信引起了兴趣!
“一个B2C的美女网站,用户可以购买美女的时间,比如买11月15号的下午14:00-16:00,然后下订单,美女可以在这两个钟陪用户读书学习 :) ……” 小王绘声绘色,小明却一脸无奈。。
小王知道小明的意思,就继续吹:“到时一定赚钱的,你就是我的合伙人啊,你拿30%”。
小明不为所动…
这时候小王冒出了些许冷汗,转念一想,做出了猥琐的表情说道:“我可是楼上小王哦!”
…
总之,在小王的威逼利诱下,小明勉强答应了!
小明跟小王聊了5个晚上的需求,有时候聊着聊着就一起睡着了,慢慢理清了思路,就开始干了。
他像以前的开发那样,建立一个web工程,不断往web里边添加功能,比如订单功能,用户管理功能,商品信息管理功能等都丢到web工程里边。
在小王的催促和监督下,经过两个多月,小明终于搞完第一个初始版本!
小明和小王都测试了一遍发现没什么问题,就打算弄个服务器,然后把web项目和数据库都扔到一个tomcat里去。
上线了!!!
小王很开心,看到了自己的想法实现了,并且已经在网上可以找到!
过了好几天,网站的用户量是2,也就是只有他们2个。小王开始急了 - -
小王发现推广很重要,于是去跟他爸爸拿了几百万投放广告,他爸爸刚开始不肯,说不懂互联网,于是小王把网站发给他爸看,他爸就同意了。
小王有钱之后,就去找广告商了,于是慢慢的电视上的综艺节目有了他的美女网站的广告了!
理所当然的用户量开始越来越高了,小明发现,服务器崩了!!
并发量太大,小明觉得一个tomcat已经不行了,于是小明就告诉小王,咱们用户量越来越多了,一个服务器不行,买多两台服务器吧,小王听到用户量增加,开心的答应了。
小明把项目在每个服务器里边都放了一份,然后用nginx代理转发。
就这样可以顶了一段时间…
最近小王在后台上架了一个非常漂亮的美女,导致太多用户访问,服务器又崩了…
小明对小王说:“我们得加强一下服务器配置了,把带宽,内存和cpu都升级吧!”
于是,又顶了一段时间…
过不久又崩了!
小王开始不爽了,对小明说:“怎么搞的?怎么服务器老是不行??”
小明说:“我他妈怎么知道你是个富二代?一开始以为你是闹着玩的,谁知道用户量会增多?”
小王发现小明有点生气了,他想着不能得罪程序员,于是轻声说:“那怎么办?”
“我得重构了!每个tomcat都放着整个web工程,后台访问也就我们两个,没有并发的问题,浪费资源了。模块之间耦合度太高了,其中一个功能升级其他的也都得升级,系统扩展性也差,不能够灵活的去部署”,小明如是说!
小王有点似懂非懂的问:“那怎么重构呢?”
“用分布式!我们把整个项目工程拆分成多个子项目,每个子项目负责自己的功能,例如订单这个功能就是一个单独的系统项目,会员系统也是一个单独的系统。” 小明边说边在纸上画了一张图:
小王依然似懂非懂的问:“这样比之前有多好?”
“这样的话,我们把每个模块都拆分出来,可以灵活的部署了,比如美女商品信息这个模块被访问的量比较大,那么我们就可以单独对这个模块进行服务性能的提升,不用全部都一起提升。也降低了代码的耦合度,模块之间互不影响,这样如果以后有人加入开发,他只要负责他的模块去开发就可以了,合作也高效!” 小明说道。
“那有什么缺点没?”
“有吧,就是各个模块之间需要通信,这时候需要开发接口,增加了些工作量!不过这是值得,总比花钱去买更多服务器配置好吧!”
“恩,有道理有道理!”
于是小明就这样开始重构了他的项目,慢慢的项目的稳定性比之前的好多了。
过了6个月,项目开始盈利了,于是小王开始招兵买马,把小明踢出去。
(哈哈,没有啦,开玩笑的,最后他们在一起了!)
来我的公众号看好玩的文章:【肯定会】
最后,给你个福利:
https://zhuanlan.zhihu.com/p/34656213
编辑于 2018-04-04
赞同 9526 条评论
分享
收藏感谢
收起
灵剑
编程 话题的优秀回答者
44 人赞同了该回答
前面的答案说的不太准确,其实分布式不一定就是不同的组件,同一个组件也可以,关键在于是否通过交换信息的方式进行协作。比如说Zookeeper的节点都是对等的,但它自己就构成一个分布式系统。
也就是说,分布式是指通过网络连接的多个组件,通过交换信息协作而形成的系统。而集群,是指同一种组件的多个实例,形成的逻辑上的整体。
可以看出这两个概念并不完全冲突,分布式系统也可以是一个集群,例子就是前面说的zookeeper等,它的特征是服务之间会互相通信协作。是分布式系统不是集群的情况,就是多个不同组件构成的系统;是集群不是分布式系统的情况,比如多个经过负载均衡的HTTP服务器,它们之间不会互相通信,如果不带上负载均衡的部分的话,一般不叫做分布式系统。
发布于 2019-01-07
赞同 447 条评论
分享
收藏感谢
冷夜
98 人赞同了该回答
分布式是指将不同的业务分布在不同的地方。 而集群指的是将几台服务器集中在一起,实现同一业务
编辑于 2017-08-15
赞同 9812 条评论
分享
收藏感谢
柳树
微信公众号 Bridge4You
68 人赞同了该回答
哈哈,大家打了好多有意思的比方,不过好像没有看到用实际案例进行解释的,我补充一个吧~
不得不说,分布式和集群都是为了解决两个问题:
那既然他们俩都能解决这两个问题,那择其一为我所用就好啦,可为什么我们的架构通常既是分布式,又是集群呢?这不矛盾了吗?
且听老朽慢慢道来。
首先聊聊集群
什么是集群,就是我开饭店,雇了好多个水平一模一样的厨师,既可以同时帮我做菜(高吞吐量),而且万一有一个厨师回家娶媳妇了,我饭店里还有别的厨师(他们可能会比平时忙),不至于要关门停业(高可用)
我们常用的缓存服务器,比如Memcached和Redis,都是集群架构,以Memcached为例,一开始我们只有一个Memcached节点:
Client把一些数据放到Memcached中,省的每次都是数据库查,如果只有一个Memcached,那一旦请求压力大了,Memcached很快就忙不过来(虽然Memcached是多线程),而且一旦Memcached挂了,那就没有缓存可以用了,全部请求都会走数据库,数据库的压力会骤然增加!
所以我们加多了两个Memcached节点,形成Memcached集群:
Memcached集群实现了开头提到的两个特性:
有人说,请求会被分布到各个Memcached节点,这不就是分布式吗?
严格来说,这只能算是“分布的”(distributed),正如Memcached官网的介绍说的:
memcached is a high-performance, distributed memory object caching system
那什么才算是分布式呢?(承上启下,自然而然的引出下面对分布式的介绍,加5分 —— 语文老师评)
还是我开饭店的例子,饭店不能只有厨师啊,总不能让客人来了直接跑到后厨跟厨师说他要吃什么吧?所以还要前台负责接待,要服务员负责送菜,还要收银员负责结账...... 这样一个各司其职,最后共同完成一件大事的系统,就形成了分布式。
还是上面那张图,换个角度去看,就是分布式了,之前我们只看到了三台Memcached节点,上面说了,这只是集群,那要怎么看才是分布式呢?把眼睛睁大!看整张图!
为什么说整张图就是分布式了?因为这些节点各司其职,有专门负责数据持久化存储的(Database),有对外提供业务访问的(Client,姑且认为是一个商品查询服务吧),也有负责数据缓存的(Memcached)
什么?你说这样还不够分布式?那就这样吧(画的有点ugly...):
够分布式了吧 ( ̄▽ ̄)~*
分布式同样实现了开头提到的两个特性:
可能有同学觉得这样的分布式,和之前提到的Memcached将请求分散给各个节点进行处理,不都一样吗?Memcached集群也是每个节点各司其职,每个节点负责一小部分请求,共同实现缓存这个功能,这不也是分布式吗?
再啰嗦一句你们就清楚了。
我们常说的分布式,或者说分布式(Distribution)这个术语,指的是各个异构的节点形成的系统,所谓异构,就是结构不同、功能不同的节点。
而Memcached集群的各个节点呢?他们是同构的,一个缓存的请求过来,比如说Set xxKey xxValue,那这个请求最终只会被一个Memcached节点处理,不会需要多个节点来共同完成这个请求。
而分布式呢,假设我有一个下单的请求,请求发给了OrderService,OrderService需要根据请求里头的userId补充用户信息,那就需要调用UserService提供的接口,然后我还要查询这比订单里头的商品信息,所以又得去调用GoodService接口,最后,才能完成下单这个操作。
OrderService、UserService和GoodService共同完成了下单这件事,这才是分布式(Distribution),而Memcached集群最多只能算是“分布的”(Distributed)。
以上,希望对你有所帮助。
编辑于 2018-05-17
赞同 687 条评论
分享
收藏感谢
收起
心笑峰
混在新疆
42 人赞同了该回答
我个人理解:集群强调的是任务的同一性,分布式强调的是差异性。例如同样是负责文件传输的服务器,对终端用户而言它只知道文件传到服务器上了,不在乎后台是几台服务器,分布在那些机房。对于后台管理人员而言,同样是文件上传我可以在上海放置服务器处理上海地区的请求,北京放置服务器处理北京的请求,最终实现全部地区用户可上传文件的任务,所以从这个角度来看是分布式的。另一方面,上海的服务器可能有多台,同时处理上海来的请求,只是前端做了负载均衡,其内部运行逻辑什么的完全是另外一台的clone,有一台挂掉了对整体业务无影响,所以从这个角度看是集群。如果北京的服务器全挂了,那么北京的用户就没得玩了,从分布式的角度看对此是无能为力的,如果在此情况下我将北京的请求转到上海,实现城市间的集群概念,那么就可handle 这个问题了。不过目前好像集群的概念用的比较范了,你对用户说他的文件上传到了服务器集群也是ok的,至于内部是怎么个架构怎么个分布都无所谓了。
编辑于 2012-01-11
赞同 427 条评论
分享
收藏感谢
萝魏紫
春暖花开,知乎有你,滴-
32 人赞同了该回答
IT术语,尤其是国外先发明的概念,看英文更清楚点
分布式 主要的提法是 distributed
集群主要的提法是cluster
IT的术语,很多都是来自于自然概念的借鉴,cluster本来什么意思?
distributed, 本来什么意思?
所以,你可以看到,集群主要描述了一个集合,一些相似的东西,提供相似的功能,这个就叫做集群。而分布式,主要是将一个东西,分发给一堆相似的内容或东西。集群描述了受众的状态,也就是处理机不是单一体,是一个相似的个体组成的群体。分布式描述了源头的处理方式,是将单一源分发给多个处理机,而非单一处理机进行处理。
当我们讲一个集群,我们着重描述这个处理机的静态状态,强调个体和群体之间的联系。
当我们讲分布式系统,我们着重讲这个处理机的动态状态,强调请求和处理直接的分发状况。
编辑于 2018-01-03
赞同 326 条评论
分享
收藏感谢
收起
老码农
45 人赞同了该回答
分布式是相对中心化而来,强调的是任务在多个物理隔离的节点上进行。中心化带来的主要问题是可靠性,若中心节点宕机则整个系统不可用,分布式除了解决部分中心化问题,也倾向于分散负载,但分布式会带来很多的其他问题,最主要的就是一致性。
集群就是逻辑上处理同一任务的机器集合,可以属于同一机房,也可分属不同的机房。分布式这个概念可以运行在某个集群里面,某个集群也可作为分布式概念的一个节点。
一句话,就是:“分头做事”与“一堆人”的区别
发布于 2014-06-08
赞同 454 条评论
分享
收藏感谢
小兴
39 人赞同了该回答
按照我的理解,集群是解决高可用的,而分布式是解决高性能、高并发的
编辑于 2013-11-16
赞同 394 条评论
分享
收藏感谢
李永亮
热爱生活,追求完美!
14 人赞同了该回答
我发现一般的案例都可以用饭店的场景类比
发布于 2016-08-22
赞同 14添加评论
分享
收藏感谢
十里春天不如你
明确目标,独立思考
22 人赞同了该回答
分布式 强调 机器间的协作,其重点是任务可拆分, 如 某个任务需要一个机器运行10个小时, 将该该任务用10台机器的分布式跑,可能2个小时就跑完了。(子任务之间有依赖关系)。
集群偏重干同一样一件事的 一组机器。 如 某个任务需要一个机器运行10个小时,那任务放到 处理该任务的集群上 还是需要10个小时。 假如有10个这样的任务, 放到同一个集群上, 仍然需要10个小时。
发布于 2016-06-15
赞同 223 条评论
分享
收藏感谢
廖马儿
勤学习可以找到适合自己好的学习方法
7 人赞同了该回答
可以简单理解为:
集群:Cluster 一组机器做相同类型任务。
分布式:Distributed 一组机器协同做一个任务。
发布于 2017-06-29
赞同 7添加评论
分享
收藏感谢
meepo
how2j.cn 以实例驱动学习 Java
6 人赞同了该回答
单体架构
家里生小宝宝啦,由于自己没有照顾小宝宝的经验,所以请了位经验丰富的月嫂。 这位月嫂从买菜,到做饭,洗衣,拖地,喂奶,哄睡,洗澡,换纸尿裤,擦屁股,做排气操,夜间陪护,给奶妈做月子餐等等,全部都做。 这种叫做单体架构。
集群:
什么都做,一个月嫂怎么够呢,肯定忙不过来呀,那就请两个月嫂吧,这叫做集群。
高可用:
有一个月嫂过生日,想请假回去和亲戚打一天麻将。如果只有一个月嫂,她走了,就叫做服务中断了。 但是因为做了集群,有两个月嫂,走了一个,另一个还是能用,虽然相比较吃力一些,但是毕竟还是能用的,这个现象叫做高可用。
分布式:
一个月嫂,一个月的费用基本上都要1万多,还有房贷,还有车贷,生活费用还高,实在是请不起两位啊,那就还是请一位吧。 可是事情那么多,她实在忙不过来,怎么办呢? 那就把爷爷请过来买菜,把奶奶请过来做饭。 这样服务本来仅仅是由月嫂一人提供的,变成了和宝宝相关的由月嫂负责,采购由爷爷负责,餐饮由奶奶负责。 这就叫做分布式了。
低耦合:
做宝宝服务的月嫂去打麻将了,不影响做饭的奶奶。 做采购的爷爷去喝酒了,也不影响月嫂的宝宝服务,这叫做低耦合。
高内聚:
和宝宝相关的事情都是月嫂在做,月嫂兑奶方式快慢,只会影响自己,对爷爷和奶奶的服务没影响. 这叫做高内聚。
集群+分布式:
奶奶一个人做饭,做久了也烦啊,也累啊,也想打麻将呀。 那么就把姥姥也请过来吧。 这样做饭这个服务,就由奶奶和姥姥这个集群来承担啦。她们俩,谁想去汗蒸了,都有另一位继续提供做饭服务。 这就叫做集群+分布式。
编辑于 2019-04-05
赞同 6添加评论
分享
收藏感谢
收起
李博
7 人赞同了该回答
看了半天各位大神的文章,鄙人有一些拙见,在此表达一下,如果有不足之处,请各位不吝赐教。分布式和集群可以用学校食堂来比喻。
学校刚开始规模小,学生比较少,学校食堂只有一个厨师A,负责洗菜、切菜、炒菜(假设只有这三样工作)。这就是单机服务。其缺点就是人多的时候忙不过来,学生需要排队等待。厨师A因故无法上班则学生就没饭吃了。
学校规模逐渐增大,学生越来越多,一个厨师A忙不过来,学校又聘请了两人B和C。
这样有两种选择:
其一如果B和C都擅长炒菜,那么让B和C都去炒菜。改善点是提高了效率,任何一个厨师辞职都不会影响学生就餐。缺点就是精力不能完全用在专业的领域,因为他们都还需要洗菜、切菜。这样就是单一的集群。
其二如果B擅长洗菜,C擅长切菜,那么让B负责洗菜,C负责切菜,A只负责炒菜。改善点是提高了效率,能专一做一件事。(假设每个人只做自己的事情)缺点是任何一个人因故不能上班则学生还是没饭吃了。这就是分布式
后来学校规模再次增加,学生人数再次增多,这三人又忙不过来了,学校再次聘请六个人分别是A2、A3、B2、B3、C2、C3。(假设让之前的B负责洗菜、C负责切菜)让A2、A3负责和A一起炒菜,B2、B3和B一起洗菜,C2、C3和C一起切菜。炒菜组、洗菜组、切菜组分别再任命一组长(此组长不负责干活)只负责看谁比较清闲就把任务分给他,让每个人都有事可做,此组长的作用就是负载均衡。这样规划之后既提升了效率,又避免了以上的问题。此模式整体上是分布式的,但是分别在洗菜、切菜、炒菜的工作上,各自都是集群的。无论哪个岗位因故缺席一人,也不会影响学生就餐。此模式有大神叫做微结构的。
微结构比单一集群优点在,如果学校发现一个更加好的炒菜工,可以随时换掉一个炒菜工。单一集群不但要考虑应聘人员的炒菜能力,还得考虑其的其他能力。
发布于 2018-02-12
赞同 71 条评论
分享
收藏感谢
云腾
只是一个学计算机的学生
3 人赞同了该回答
分布式是对业务的纵向拆分,目的是为了降低维护成本,方便后期点对点的纠错或者优化;
集群是对服务的横向扩展,目的是增强服务能力,降低服务压力
发布于 2017-11-14
赞同 3添加评论
分享
收藏感谢
spraith
10 人赞同了该回答
普通的软件是运行在一台物理机器上的,比如一个app或一个操作系统(如linux);
而分布式系统则是这样一种软件系统:它运行在网络上,网络对于分布式系统就如同单台计算机对于普通软件。
集群则是一组物理计算机的组合,组合起来的目标得看具体场合,比如有的是为了提高可用性,有的是为了提高性能,有的是为了应对高并发。集群内的计算机之间使用什么方式进行协作,得看它们用的是什么软件系统:既可能是分布式的系统也可能是普通的软件系统。
编辑于 2016-01-07
赞同 10添加评论
分享
收藏感谢
Young Ro
IT从业者/文艺爱好者/喜欢着小白的男孩
11 人赞同了该回答
根据所查资料,分布式是不同的服务器节点完成不同的任务,集群是不同的服务器对外提供一致的服务
发布于 2016-06-15
赞同 11添加评论
分享
收藏感谢
张建国
资深程序猿,有问题欢迎加QQ群460570824讨论学习
9 人赞同了该回答
回答这个问题前,首先我们先了解一下分布式和集群的由来。在开始的时候,网站都是一个简单的架构,例如LAMP的架构,就在一台服务器上部署了各种应用程序,访问的人少,服务器能轻松应对。当请求量增大的时候,服务器的资源已经扛不住这种压力了,从而将相关的应用放在不同的服务器上,提供更好的性能,当请求量进一步增大的时候,应用jboss和mysql可能都不能抗住这种请求压力了,从而也就引出了集群的由来。
集群主要的使用场景是为了分担请求的压力,也就是在几个服务器上部署相同的应用程序,来分担客户端请求,当压力进一步增大的时候,可能在需要存储的部分,mysql无法面对很多的写压力,因为在mysql做成集群之后,主要的写压力还是在master的机器上面,其他slave机器无法分担写压力,从而这个时候,也就引出来分布式。
分布式的主要应用场景是单台机器已经无法满足这种性能的要求,必须要融合多个节点,并且节点之间是相关之间有交互的,相当于在写mysql的时候,每个节点存储部分数据,也就是分布式存储的由来,在存储一些非结构化数据,例如静态文件,图片,pdf,小视频,这些也就是分布式文件系统的由来。
废话了那么多,那么到底分布式和集群有啥区别呢?
集群和分布式都是由多个节点组成,但是集群之间的通信协调基本不需要,而分布式各个节点的通信协调必不可少。
集群主要是为了应对请求压力的分担,从而有了LB,负载均衡集群;为了应对可用性,从而有了HA,高可用性集群;为了更强的性能,从而有了HP,高性能集群;为了高并发大规模性能,从而有分布式系统集群。
发布于 2017-09-11
赞同 9添加评论
分享
收藏感谢
收起
匿名用户
10 人赞同了该回答
Google是个好东西,维基百科也是个好东西。要考究的话,当然是正儿八经的论文实在,但是要弄明白个大概,Google足矣。
先搬维基百科的定义:
在计算机科学中,分布式计算(英语:Distributed computing),又译为分散式運算。这个研究领域,主要研究分布式系统(Distributed system)如何进行计算。分布式系统是一组电脑(computer),通过网络相互链接传递消息与通信后并协调它们的行为而形成的系统。组件之间彼此进行交互以实现一个共同的目标。把需要进行大量计算的工程数据分区成小块,由多台计算机分别计算,再上传运算结果后,将结果统一合并得出数据结论的科学。
--------
计算机集群简称集群是一种计算机系统,它通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作。在某种意义上,他们可以被看作是一台计算机。集群系统中的单个计算机通常称为节点,通常通过局域网连接,但也有其它的可能连接方式。集群计算机通常用来改进单个计算机的计算速度和/或可靠性。一般情况下集群计算机比单个计算机,比如工作站或超级计算机性能价格比要高得多。 计算机集群的特点: 1. 通过多台计算机完成同一个工作。达到更高的效率。 2. 两机或多机内容、工作过程等完全一样。如果一台死机,另一台可以起作用。
所以,据此可以认为(只是据此),分布式就是将一个任务分摊到不同的节点共同完成,这几个节点是协同工作的,存在互相依赖的关系,其中一个挂掉了有可能使得其他节点都不能工作;而集群就是多个节点执行相同的任务,互不干扰,就像饭堂的窗口,每个窗口的职能都是一样的,在哪个窗口都能达到目的,随便关了哪个窗口都可以,只要还有窗口可用,客人就能排队打饭。
正如上文的引文,集群要解决的是可靠性,而分布式的主要工作是分解任务,将职能拆解。
编辑于 2017-08-25
赞同 101 条评论
分享
收藏感谢
Alex Guo
专业计算机, 喜欢篮球,摄影,游泳, 旅行。
6 人赞同了该回答
Distributed是针对用户/终端来讲的,把Job送到地理上分散的sever(i.e. 网格类)上协同作业,然后合并计算结果。
Cluster是把很多的server捆绑串并,以infiniband实现高速内部互联网络,组成HPC. 从而支持多用户的并行计算。
发布于 2012-02-20
赞同 6添加评论
分享
收藏感谢
老王
突然感觉没什么说的
9 人赞同了该回答
在这里我也发表一下自己的一些拙见,看到大家这么多的回复,我思考,加入一个企业用一套体量很大的系统,需要高效率处理任务的目标时,我觉得采用分布式+集群的模式 是不是应该是最佳的。也就是说,先用分布式把这套系统进行负载均衡,即把各个功能模块进行拆分(也就是分布式概念),然后在拆分的基础上增加集群。
发布于 2016-04-21
赞同 92 条评论
分享
收藏感谢
Jerry
4 人赞同了该回答
分布式是分任务并发处理;集群是同一个任务一起处理。
发布于 2016-10-19
赞同 4添加评论
分享
收藏感谢
Lasse
软件设计师
5 人赞同了该回答
分布式:不同的业务模块部署在不同的服务器上或者同一个业务模块分拆多个子业务,部署在不同的服务器上,解决高并发的问题
集群:同一个业务部署在多台机器上,提高系统可用性
编辑于 2016-07-20
赞同 53 条评论
分享
收藏感谢
聚散不由我丶
3 人赞同了该回答
个人觉得:分布式是个思维,集群是使用服务器的一种方式。集群里的负载均衡集群用了分布式的思维而已。
编辑于 2017-06-29
赞同 3添加评论
分享
收藏感谢
峰宇後
项目经理
3 人赞同了该回答
集群与分布式的区别,主要是其协作模式不同,任务分工合作的方式不同,集群强调的是多件事情交由多个系统来处理,其各个系统所承担的角色和任务基本是相同的,这就相当于早期的社会分工,很多人都做的是同质化的事情,对各个系统的要求相对应的就很高,但是随着社会的不断发展,其系统越来越复杂,要一个人来处理整套工序流程,其已经不能够满足这个时代的需求了,从而出现了分工的进一步细分,这就是分布式,比如,我做一件衣服,其实,从原材料到成品,其工序还是很复杂,丈量、设计、原料采购、裁剪、缝纫等等,需求规模大了之后,让每个人都要从事所有的工序显然是不合理的,因为对每个人的要求太高了,根本适应不了市场的需求,而且做出来的衣服在市场上也没有竟争力,因此,交由专业的人来做专业的事情,专做设计、专做采购、专做裁剪、专做缝纫等等,把这些人组织起来,形成一个专业化强、执行效率高的协作模式,这就在分布式,从系统方面来讲,其需要一个大的调度中心,需要组织整个流程,需要很强的设计、分工、组织、协作能力,是一个挑战,但从各个分布式系统来讲,其各个子系统只需要对自己的事情做专、做好,也降低了对分系统的压力和难度,因此,对于一个大型复杂的联机交易系统或者分析系统,其由集群向分布式转变是一个必然的趋势,希望对你的理解有所帮助。
编辑于 2017-05-07
赞同 3添加评论
分享
收藏感谢
石成珂
Linux系统运维人员 轨道交通爱好者
3 人赞同了该回答
集群一般被分为三种类型,高可用集群如RHCS、LifeKeeper等,负载均衡集群如LVS等、高性能运算集群;分布式应该是高性能运算集群范畴内。
发布于 2012-02-27
赞同 32 条评论
分享
收藏感谢
一首歌
3 人赞同了该回答
菜鸟说一下我的看法:
一道算术题(12+12)x 9 ÷(5-2)=
分布式:加法、减法、除法分别由不同的服务器来处理
集群:如果计算量很大,比如(12+12+12+12+12+12+12+12+12+12+12+12+)一台服务器计算不了,就需要很加几台,这几台就是集群关系
发布于 2016-11-04
赞同 31 条评论
分享
收藏感谢
老牛
大数据工程师
2 人赞同了该回答
集群:物理形态、每个机器=完整任务
分布式:工作方式、每个机器=部分任务
发布于 2017-12-19
赞同 2添加评论
分享
收藏感谢
app定制开发
乙丙丁软件 A P P 专业定制 QQ:1013349554
1 人赞同了该回答
分布式就是一个业务要很多人完成
编辑于 2017-09-22
赞同 1添加评论
分享
收藏感谢
陈凌海
对人和宇宙都感兴趣的常人
看了那么多大佬的回答,自己试着用现实中的例子总结一下!也算温故知新了
分布式:一个团队内十个人干十件不同的事!但是这十件事合到一起这个项目才完整!
集群:一个团队内十个人干同一件事!
把每个人都理解成一个服务器
发布于 2018-05-04
赞同添加评论
分享
收藏感谢
长安落雪
前端web
分布式是分工,集群是一群
发布于 2018-04-27
赞同添加评论
分享
收藏感谢
遥远的乔
工程师
分布式是指在物理层面上多个主机通过网络构成的环境
集群是在逻辑层面的划分,集群成员可以存在于单个主机或多个分布式主机。
集群划分通常要参考系统的非功能性需求,比如集群成员间的负载平衡,故障转移,以提高系统可用性。
编辑于 2018-03-19
赞同添加评论
分享
收藏感谢
一岁阿册
程序员
分布式是一种策略,集群是一种解决高并发的手段。分布式分布二字的标准更多是由业务主导,将高频业务和低频业务区分开来,将集中作业模块化,从策略上先进行优化;集群是将高频请求分流,避免请求阻塞的一种手段,nginx做负载是一种集群,数据库的主从设计也是一种集群,集群说白了就是堆硬件,一台机器搞不定,那就用十台,简单粗暴。
发布于 2017-12-06
赞同添加评论
分享
收藏感谢
离沐
IT产业太空观察员,十八维数据流萌妹控
分布式:分开布置的模式
集群:集中起来群策群力
发布于 2017-08-05
赞同添加评论
分享
收藏感谢
白菜
一个汽车有很多配件组成,配件由不同的厂商生产,最后组装而成,这是分布式;配件可以由一个厂商里面的多条流水线生产,这是集群。
发布于 2017-07-17
赞同添加评论
分享
收藏感谢
匿名用户
集群是机器的概念 分布式偏系统 负载均衡 读写 一致 高可用 网络分区
编辑于 2017-04-04
赞同添加评论
分享
收藏感谢
小超超
程序员
分布式是可以再多台服务器上安装memcache服务,以便达到集群,每台服务器只能管理属于它的服务。集群是一群服务器完成工作,一台服务器
发布于 2016-10-08
赞同添加评论
分享
收藏感谢
稻草男人
稻草男人
分布式是一中逻辑上的分隔。针对任务来做划分,把不同的任务分布在不同的服务器上。
集群式一种物理上概念,前文已经有很多介绍了。
两个是不同维度的概念。
发布于 2016-08-11
赞同1 条评论
分享
收藏感谢
谢宇杰
集群和分布式都是整体对外提供服务的,集群可以使用分布式,也可以是简单复制,但分布式比简单复制复杂的多。很多答案拿厨房的举例,但有错误。继续厨房的例子,当业务量过多,单机服务忙不过来,那么多请几个厨师,这是简单的复制,增加人手,可以理解为一群人做事,是集群,但只是简单复制。简单复制的话,一个厨师请假,服务不会fail,厨师长可以做负载均衡工作。但如果情况更恶劣一些,简单复制的集群就有问题了。如果厨房断水断电,再多厨师也白搭。分布式并不是将业务切分为买菜,洗菜,切菜,配菜,做菜,这叫微服务,不是分布式。而每一个工序都可以是分布式的,如果有必要的话。为了满足更恶劣的条件,断水断电,厨师罢工,服务仍然可用,对厨房进行分布式改造,在多个地点设置厨房,每个厨房不需要包含所有工序,但不允许一个工序只在一个厨房,即分区容错性。同时,付出的代价是一道菜可能有多个副本,防止突发事件使得一道菜的原料丢失。简单复制的集群当然具有分区容错性,因为都一样。微服务可以使厨师专注于自己的工序,为了让微服务能够顶住恶劣的生存环境,需要分布式和集群,整个厨房是分布式的,但其中的一个工序既可以是简单复制负载平衡,也可以是一个小的,独立的分布式。
发布于 2019-02-03
赞同添加评论
分享
收藏感谢
枫亦
程序员
从物理计算机的角度看:
1.共同点:都是利用多个物理计算机或多个计算单元。
2.不同点:一般而言分布式计算单元架构通常通过网络连接在一起,分散在世界各地。而集群计算单元一般在一个机房也许通过网络连接,也许通过总线,或者其他特殊形式连接。比如超级计算机就可能是一种设计复杂精妙的集群连接(纯猜测)。其实对于计算单元如何组合在一起这个话题太大了,分布式架构和集群架构也分不太清楚,或者说这两个词都不是用来描述这方面的。这两个词更多的是描述业务架构的。
从业务角度看:
1.分布式强调的是“拆分业务”,想办法把一个功能上的大业务拆分成几个小业务,不同类型的服务器运行不同的小业务。
2.集群强调的是“集中力量做好一个业务”,比如上一步说的某些小业务特别繁忙,一台服务器可能难以胜任,这时就需要2台或多台服务器跑这个小业务,这时也引出了另一个概念:“负载均衡”,解决的就是让这些跑同样小业务的服务器负载平衡,也就是不能忙的忙死,闲的闲死,而是你cpu负载了80%,我也不能少于60%。
编辑于 2019-01-28
赞同添加评论
分享
收藏感谢
DarrenChan陈驰
CS研究僧
简单理解一下,集群部署的东西都一样,分布式不一样。
发布于 2019-01-08
真诚赞赏,手留余香
赞赏
还没有人赞赏,快来当第一个赞赏的人吧!
赞同添加评论
分享
收藏感谢
enen
农民工
◆集群(cluster):通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作。他们可以被看作是一台计算机,多台计算机完成同一个工作(我认为 软件集群可理解为 数据并行)
◆分布式(distributed):布式系统可能运行在一个集群上,也可能运行在不属于一个集群的多台(2台及以上)机器上。由多台计算机分别计算(我理解为 任务并行)
◆去中心化(decentralized):没有主从的分布式
发布于 2018-12-28
赞同添加评论
分享
收藏感谢
寡人
zz鉴定机
分布式就是爸爸住北京妈妈住上海,集群就是两个爸爸一个住北京一个住上海
发布于 2018-10-31
赞同添加评论
分享
收藏感谢
Holmofy
爱唱歌的程序猿
集群是纵向扩展,每台机器部署的程序是一样的。
分布式是横向拆分,每台机器部署了应用中的不同模块。
集群提供了高可用的功能:
因为每台机器部署的程序一样,其中一台挂掉对整个应用影响不大。集群也加大了应用的服务能力,原来一台机器最多能服务一万个用户,多部署两台就能多服务两万个用户。如果机器性能不一样可以在负载均衡服务器上配置权重。
分布式提高了系统的整体性能,为大型网站提高可维护性(小网站用不到分布式,单体架构更简单,容易部署,看日志也方便):
系统中每个功能的用户访问量以及功能消耗的机器性能都是不一样的,比如电商网站中商品模块肯定比订单模块访问量大,毕竟很多人搜索浏览商品并不下单。如果每个机器都部署一个完整的项目代码,就会产生短板效应,一个模块访问量大或者某个模块代码没写好就会影响整个应用。代码改好了必须把整个项目重新部署。如果我们把功能合理拆分成多个模块,一个模块性能顶不住了可以为这个模块单独加机器,每个模块可以进行集群部署;一个模块功能有改动只需重新部署这一个模块。
编辑于 2019-02-08
赞同添加评论
分享
收藏感谢
黄小明
戎码一生。
分布式:一个业务分拆多个子业务,部署在不同的服务器上。每个服务器任务不一样,解决大项目臃肿问题;如反向代理服务器下的分布式服务器,每个服务器的任务和可以提供的资源可能是不一样的。
集群:同一个业务,部署在多个服务器上。每个服务器上的任务是一样的,解决压力集中问题。如客服系统,每个客服的任务都是一样的回答顾客问题,如果客服就一个人那压力太大了。
编辑于 2018-10-13
赞同添加评论
分享
收藏感谢
朱时兴
计算机 金融 分布式系统 职业规划咨询 企业解决方案咨询
Wang Xu回答虽然不详细,但是正确的,排第一的完全是扯蛋,不要误人子弟。