MongoDB集群(Mongodb集群如何工作)

使用分片优势:

  1. MongoDB自带了一个叫做Mongos的专有路由进程,mongos就是掌握统一路口的路由器,它会将客户端发来的请求准确无误的路由到集群中的一个或者一组服务器上,同时会把接收到的响应拼装起来发回到客户端。
  2. MongoDB通过多种途径来确保集群的可用性和可靠性,将MongoDB的分片和复制功能结合使用,在确保数据分片到多台服务器的同时,也确保了每份数据都有相应的备份,这样就可以确保有服务器换掉,坏死时,其他的从库可以立即接替坏掉的部分继续工作。

     3.当系统需要更多的空间和资源的时候,MongoDB使我们可以按需方便的扩充系统容量。

分片架构节点:

  1. Config Server:存储集群中所有节点,分片数据路由信息。必须要配置3个configServer节点。
  2. Mongos:对外提供访问服务,所以CRUD操作全部经过Mongos。可以配置多个mongos节点。
  3. Mongod:存储数据记录,一般有多个Mongod节点,达到分片的目的。

MongoDB集群(Mongodb集群如何工作)_第1张图片

Mongos:跟客户端打交道,本身没有任何数据,也不知道怎么处理数据,有任何操作他就会去找Config Server.

ConfigServer:他就是用来配置所有的Shard节点信息的,存取数据的方式,分片功能的配置。(元数据)

Shard:真正的存储位置,以chunk为存储单位。

 

Chunk:在shard server内部,MongoDB会把数据分为chunks,每个chunk代表这个shard server内部的一部分数据。Chunk的产生,会有两个用途。

Splitting:当一个chunk的大小超过配置中的chunk的大小时,MongoDB后台进程会把这个chunk切分(分裂)成更小的chunk,避免chunk过大。

Balancer:在MongoDB中,balancer是一个后台的进程,负责chunk迁移,从而均衡每个Shard的负载,系统初始1个chunk,chunk大小默认值64M,生成库上选择合适业务的chunk大小。MongoDB会自动拆分和迁移chunk。(目的:均衡每个shard的负载)

分片集群节点的数据分配。

  1. 使用chunk来存储数据。
  2. 集群搭建完成之后,默认开启一个chunk,大小是64M。
  3. 存储需求超过64M,chunk会自动进行分裂。(如果业务中存储单位很大,请设置更大的chunk)
  4. Chunk会被自动均衡迁移。(什么意思呢?就是说在后台中开启Balancing,并且配置一个平衡时间,它会对当前所有的Shard做大小判断,并进行均衡迁移。)

 

注意:进行数据查询时,是不会chunk分裂的。只有插入和更新会分裂。

随着数据的增长,你会发现数据量越来越大,并超过了默认的64m。例:数据大小65M,这时chunk会分裂成两个32.5m的chunk。并存入A Shard和B Shard,这个时候C Shard就没有chunk存入,会导致每个Shard不均衡。这个时候MongoDB中的balancer组件就会执行自动平衡。把chunk数量最多的shard节点挪动到最少的节点。(自动平衡)

 

Chunk大小对分裂及迁移的影响

  1. MongoDB默认的chunkSize为64M,如无特殊要求,建议保持默认值,chunkSize大小会直接影响到chunk的分裂,迁移行为。
  2. chunkSize越小,chunk分裂及迁移越多,数据分布就越均衡,反之。
  3. Chunk分裂只会在写入时分裂,如果改变大小,系统需要时间将chunk分裂成指定的大小。
  4. Chunk只会分裂不会合并。

 

设计分片策略(key):

  1. 自增片键:劣势:对于数据分布均匀不是特别友好,因为自增的片键总在一个分片上写入,当这个分片达到了某个阈值的时候才会写入到另一个分片,

 优势:他对于范围查询会比较高效,因为插入数据比较集中。

  1. 随机片键:优势:对于数据分布特别均匀。

    劣势:避免进行多个分片的查询,因为会在所有分片上查询,并进行归并排序。

基于范围分片:比如3个chunk,90万条数据,他会将前30万数据分到chunk1,依次内推。

基于哈希分片:可以保证节点分配相对均匀,数据1落到chunk1,数据2落到chunk2,依次内推。

哈希分片跟范围分片相互补。

 

后面更新搭建详细步骤!

你可能感兴趣的:(MongoDB,设计)