malin002

mongodb分片+副本集总览

由于51cto的编辑不太好用，这是有道上的文档http://note.youdao.com/noteshare?id=aedd53c99b4a97aebbe9af136104113a

在 MongoDB 中,有两种数据冗余方式,一种 是 Master-Slave 模式（主从复制）,一种是 Replica Sets 模式（副本集）。
三种集群：

1、主从集群（目前已经不推荐使用）
2、副本集
3、分片集群
分片集群是三种模式中最复杂的一种，副本集其实一种互为主从的关系，可理解为主主。
副本集指将数据复制，多份保存，不同服务器保存同一份数据，在出现故障时自动切换。对应的是数据冗余、备份、镜像、读写分离、高可用性等关键词；
而分片则指为处理大量数据，将数据分开存储，不同服务器保存不同的数据，它们的数据总和即为整个数据集。追求的是高性能。
在生产环境中，通常是这两种技术结合使用，分片+副本集。

下面的内容将介绍mongodb副本集、分片集群、拆分gridfs上传的文件、利用nginx-gridfs结合mongodb分片集群，并且在浏览器显示拆分的文件，四大类。
第1章 Mongodb副本集集群介绍
1.1 简介
为什么介绍副本集，因为在3.6版本后，分片集群搭建和副本集一起使用。
副本集实现了mongodb集群的高可用。
副本集是一种在多台机器同步数据的进程，副本集体提供了数据冗余，扩展了数据可用性。在多台服务器保存数据可以避免因为一台服务器导致的数据丢失。
也可以从硬件故障或服务中断解脱出来，利用额外的数据副本，可以从一台机器致力于灾难恢复或者备份。
在一些场景，可以使用副本集来扩展读性能，客户端有能力发送读写操作给不同的服务器。也可以在不同的数据中心获取不同的副本来扩展分布式应用的能力。
mongodb副本集是一组拥有相同数据的mongodb实例，主mongodb接受所有的写操作，所有的其他实例可以接受主实例的操作以保持数据同步。
主实例接受客户的写操作，副本集只能有一个主实例，因为为了维持数据一致性，只有一个实例可写，主实例的日志保存在oplog。
1.2 原理
MongoDB 的副本集不同于以往的主从模式。
在集群Master故障的时候,副本集可以自动投票,选举出新的Master,并引导其余的Slave服务器连接新的Master,而这个过程对于应用是透明的。可以说MongoDB的副本集是自带故障转移功能的主从复制。
相对于传统主从模式的优势
传统的主从模式,需要手工指定集群中的 Master。如果 Master 发生故障,一般都是人工介入,指定新的 Master。这个过程对于应用一般不是透明的,往往伴随着应用重
新修改配置文件,重启应用服务器等。而 MongoDB 副本集,集群中的任何节点都可能成为 Master 节点。一旦 Master 节点故障,则会在其余节点中选举出一个新的 Master 节点。并引导剩余节点连接到新的 Master 节点。这个过程对于应用是透明的。

一个副本集即为服务于同一数据集的多个MongoDB实例,其中一个为主节点,其余的都为从节点。主节点上能够完成读写操作,从节点仅能用于读操作。主节点需要记录所有改变数据库状态的操作,这些记录保存在oplog中,这个文件存储在local数据库,各个从节点通过此oplog来复制数据并应用于本地,保持本地的数据与主节点的一致。oplog具有幂等性,即无论执行几次其结果一致,这个比mysql的二进制日志更好用。集群中的各节点还会通过传递心跳信息来检测各自的健康状况。
当主节点故障时,多个从节点会触发一次新的选举操作,并选举其中的一个成为新的主节点(通常谁的优先级更高,谁就是新的主节点),心跳信息默认每2秒传递一次。客户端连接到副本集后，不关心具体哪一台机器是否挂掉。主服务器负责整个副本集的读写，副本集定期同步数据备份。一旦主节点挂掉，副本节点就会选举一个新的主服务器。这一切对于应用服务器不需要关心。

副本集中的副本节点在主节点挂掉后通过心跳机制检测到后，就会在集群内发起主节点的选举机制，自动选举出一位新的主服务器。

1.3 节点
副本集拥有三种节点：主节点、从节点、仲裁节点
1）主节点负责处理客户端请求,读、写数据, 记录在其上所有操作的oplog;
2）从节点定期轮询主节点获取这些操作,然后对自己的数据副本执行这些操作,从而保证从节点的数据与主节点一致。默认情况下,从节点不支持外部读取,但可以设置;副本集的机制在于主节点出现故障的时候,余下的节点会选举出一个新的主节点,从而保证系统可以正常运行。
3）仲裁节点不复制数据,仅参与投票。由于它没有访问的压力,比较空闲,因此不容易出故障。由于副本集出现故障的时候,存活的节点必须大于副本集节点总数的一半,否则无法选举主节点,或者主节点会自动降级为从节点,整个副本集变为只读。因此,增加一个不容易出故障的仲裁节点,可以增加有效选票,降低整个副本集不可用的风险。仲裁节点可多于一个。也就是说只参与投票，不接收复制的数据，也不能成为活跃节点。
注意：
官方推荐MongoDB副本节点最少为3台，建议副本集成员为奇数，最多12个副本节点,最多7个节点参与选举。限制副本节点的数量,主要是因为一个集群中过多的副本节点,增加了复制的成本,反而拖累了集群的整体性能。太多的副本节点参与选举,也会增加选举的时间。而官方建议奇数的节点,是为了避免脑裂的发生。
1.4 工作流程
在MongoDB副本集中,主节点负责处理客户端的读写请求,备份节点则负责映射主节点的数据。备份节点的工作原理过程可以大致描述为,备份节点定期轮询主节点上的数据操作,从而保证跟主节点的数据同步。至于主节点上的所有数据库状态改变的操作,都会存放在一张特定的系统表中。备份节点则是根据这些数据进行自己的数据更新。
1.4.1 Oplog
上面提到的数据库状态改变的操作,称为 oplog(operationlog,主节点操作记录。oplog 存储在local数据库的"oplog.rs"表中。副本集中备份节点异步的从主节点同步oplog,然后重新执行它记录的操作,以此达到了数据同步的作用。
关于 oplog 有几个注意的地方:
1）oplog 只记录改变数据库状态的操作
2）存储在oplog 中的操作并不是和主节点执行的操作完全一样,例如"$inc"操作就会转化为"$set"操作
3）oplog 存储在固定集合中(capped collection),当oplog的数量超过oplogSize,新的操作就会覆盖旧的操作
1.4.2 数据同步
在副本集中，有两种数据同步的方式：
1）initial sync(初始化):这个过程发生在当副本集中创建一个新的数据库或其中某个节点刚从宕机中恢复,或者向副本集中添加新的成员的时候,默认的,副本集中的节点会从离它最近的节点复制oplog来同步数据,这个最近的节点可以是primary也可以是拥有最新oplog副本的 secondary节点。该操作一般会重新初始化备份节点,开销较大。
2）replication(复制):在初始化后这个操作会一直持续的进行着,以保持各个secondary节点之间的数据同步。
当遇到无法同步的问题时,只能使用以下两种方式进行initial sync了
1）第一种方式就是停止该节点,然后删除目录中的文件,重新启动该节点。这样,这个节点就会执行 initial sync
注意:通过这种方式,sync的时间是根据数据量大小的,如果数据量过大,sync时间就会很长同时会有很多网络传输,可能会影响其他节点的工作
2）第二种方式,停止该节点,然后删除目录中的文件,找一个比较新的节点,然后把该节点目录中的文件拷贝到要 sync 的节点目录中
1.5 副本集选举过程
Mongodb副本集选举采用的是Bully算法，这是一种协调者(主节点)竞选算法,主要思想是集群的每个成员都可以声明它是主节点并通知其他节点。别的节点可以选择接受这个声称或是拒绝并进入主节点竞争，被其他所有节点接受的节点才能成为主节点。
节点按照一些属性来判断谁应该胜出，这个属性可以是一个静态ID,也可以是更新的度量像最近一次事务ID(最新的节点会胜出)
1.5.1 副本集的选举过程
1）得到每个服务器节点的最后操作时间戳。每个 mongodb 都有 oplog 机制会记录本机的操作,方便和主服务器进行对比数据是否同步还可以用于错误恢复。
2）如果集群中大部分服务器 down 机了,保留活着的节点都为 secondary 状态并停止,不选举了。
3）如果集群中选举出来的主节点或者所有从节点最后一次同步时间看起来很旧了,停止选举等待人来操作。
4）如果上面都没有问题就选择最后操作时间戳最新(保证数据是最新的)的服务器节点作为主节点。
1.5.2 副本集选举的特点
选举还有个前提条件,参与选举的节点数量必须大于副本集总节点数量的一半（建议副本集成员为奇数。最多12个副本节点,最多7个节点参与选举）如果已经小于一半了所有节点保持只读状态。集合中的成员一定要有大部分成员(即超过一半数量)是保持正常在线状态,3个成员的副本集,需要至少2个从属节点是正常状态。
如果一个从属节点挂掉,那么当主节点down掉产生故障切换时,由于副本集中只有一个节点是正常的,少于一半,则选举失败。
4个成员的副本集,则需要3个成员是正常状态(先关闭一个从属节点,然后再关闭主节点,产生故障切换,此时副本集中只有2个节点正常,则无法成功选举出新主节点)。
1.6 MongoDB 同步延迟问题
当你的用户抱怨修改过的信息不改变,删除掉的数据还在显示,你掐指一算,估计是数据库主从不同步。与其他提供数据同步的数据库一样,MongoDB 也会遇到同步延迟的问题,在MongoDB的Replica Sets模式中,同步延迟也经常是困扰使用者的一个大问题。

1.6.1 什么是同步延迟
首先,要出现同步延迟,必然是在有数据同步的场合,在 MongoDB 中,有两种数据冗余方式,一种是Master-Slave 模式,一种是Replica Sets模式。这两个模式本质上都是在一个节点上执行写操作, 另外的节点将主节点上的写操作同步到自己这边再进行执行。在MongoDB中,所有写操作都会产生 oplog,oplog是每修改一条数据都会生成一条,如果你采用一个批量 update 命令更新了 N 多条数据, 那么,oplog会有很多条,而不是一条。所以同步延迟就是写操作在主节点上执行完后,从节点还没有把 oplog拿过来再执行一次。而这个写操作的量越大,主节点与从节点的差别也就越大,同步延迟也就越大了。
1.6.2 同步延迟带来的问题
首先,同步操作通常有两个效果,一是读写分离,将读操作放到从节点上来执行,从而减少主节点的压力。对于大多数场景来说,读多写少是基本特性,所以这一点是很有用的。
另一个作用是数据备份, 同一个写操作除了在主节点执行之外,在从节点上也同样执行,这样我们就有多份同样的数据,一旦主节点的数据因为各种天灾人祸无法恢复的时候,我们至少还有从节点可以依赖。但是主从延迟问题可能会对上面两个效果都产生不好的影响。
如果主从延迟过大,主节点上会有很多数据更改没有同步到从节点上。这时候如果主节点故障,就有两种情况:
1）主节点故障并且无法恢复,如果应用上又无法忍受这部分数据的丢失,我们就得想各种办法将这部数据更改找回来,再写入到从节点中去。可以想象,即使是有可能,那这也绝对是一件非常恶心的活。
2）主节点能够恢复,但是需要花的时间比较长,这种情况如果应用能忍受,我们可以直接让从节点提供服务,只是对用户来说,有一段时间的数据丢失了,而如果应用不能接受数据的不一致,那么就只能下线整个业务,等主节点恢复后再提供服务了。
如果你只有一个从节点,当主从延迟过大时,由于主节点只保存最近的一部分 oplog,可能会导致从节点青黄不接,不得不进行 resync 操作,全量从主节点同步数据。
带来的问题是：当从节点全量同步的时候,实际只有主节点保存了完整的数据,这时候如果主节点故障,很可能全部数据都丢掉了。
1.7 副本集搭建过程
1.7.1 环境准备

Centos7  64位系统
Mongodb 4.0版本
三台虚拟机
192.168.1.182:27017
192.168.1.186:27017
192.168.1.122:27017

安装包（三台一样）
下载地址

https://www.mongodb.com/download-center?jmp=nav#community
https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-4.0.2.tgz

解压到/usr/local/mongodb/目录下
1.7.2 搭建过程
1、创建数据目录（三台创建）
mkdir /data/mongodb/27017/ -p
2、创建配置文件（三台配置一样）

systemLog:
  destination: file
  logAppend: true
  path: /data/mongodb/27017/mongodb.log
storage:
  dbPath: /data/mongodb/27017/
  journal:
    enabled: true
processManagement:
  fork: true
net:
  port: 27017
  bindIp: 0.0.0.0

#副本集标志，三台name要一样，才能加入到副本集。

replication:
  replSetName: data

3、启动
启动三台实例
/usr/local/mongodb/bin/mongod -f /data/mongodb/27017/mongodb.conf
4、初始化
登录任意一台实例，进行初始化sql语句，三大步sql。

config = { _id:"data", members:[
  {_id:0,host:"192.168.1.182:27017"},
  {_id:1,host:"192.168.1.186:27017"},
  {_id:2,host:"192.168.1.122:27017"}]
}

进入到admin，进行初始化
use admin
初始化需要时间
rs.initiate( config )
查看状态
rs.status() #副本集状态，一个primary，其它SECONDARY。primary是主，只有primary能写入。
注意：-id，为副本集配置文件里面的name一致。
1.7.3 优先级设置
primary的选举依赖于各个实例的优先权重，默认权重都是1
复本集的主挑选权重最高的，权重一样的无法控制谁为主
设置各个实例的优先权重，挑选自己想要的实例为主，只有primary可以更改权重配置

conf = rs.config()   #获取副本集的配置，默认权重都是1
conf.members[0].priority = 10 #索引号从0开始，每次递增1，类似数组
conf.members[1].priority = 5
conf.members[2].priority = 2
rs.reconfig(conf)   #更新mongodb副本集的配置，优先权重最高的提升为primary。

关闭启动后也为主
至此，副本集搭建介绍完成

第2章 Mongodb分片集群介绍
Sharding cluster是一种可以水平扩展的模式,在数据量很大时特给力,实际大规模应用一般会采用这种架构去构建。sharding分片很好的解决了单台服务器磁盘空间、内存、cpu等硬件资源的限制问题，把数据水平拆分出去，降低单节点的访问压力。每个分片都是一个独立的数据库，所有的分片组合起来构成一个逻辑上的完整的数据库。因此，分片机制降低了每个分片的数据操作量及需要存储的数据量，达到多台服务器来应对不断增加的负载和数据的效果。
2.1 Sharding分区概念
将数据分散到不同的机器上,不需要功能强大的服务器就可以存储更多的数据和处理更大的负载。
2.1.1 分片的基本思想
将集合切成小块,这些块分散到若干片里,每个片只负责总数据的一部分。通过一个名为mongos的路由进程进行操作,mongos知道数据和片的对应关系(通过配置服务器)。大部分使用场景都是解决磁盘空间的问题,对于写入有可能会变差(+++里面的说明+++),查询则尽量避免跨分片查询。
2.1.2 使用分片的时机
1）机器的磁盘不够用了。使用分片解决磁盘空间的问题。
2）单个mongod已经不能满足写数据的性能要求。通过分片让写压力分散到各个分片上面,使用分片服务器自身的资源。
3）想把大量数据放到内存里提高性能。和上面一样,通过分片使用分片服务器自身的资源。

2.1.3 三种角色
1）分片服务器（Shard Server）
mongod实例,用于存储实际的数据块,实际生产环境中一个 shard server 角色可由几台机器组个一个 relica set 承担,防止主机单点故障。
这是一个独立普通的mongod进程,保存数据信息。可以是一个副本集也可以是单独的一台服务器（生产环境都是副本集）。
2）配置服务器（Config Server）
mongod 实例,存储了整个 Cluster Metadata,其中包括 chunk 信息。
这是一个独立的mongod进程,保存集群和分片的元数据,即各分片包含了哪些数据的信息。最先开始建立,启用日志功能。像启动普通的 mongod 一样启动。
配置服务器,指定configsvr 选项。不需要太多的空间和资源,配置服务器的 1KB 空间相当于真是数据的 200MB。保存的只是数据的分布表。
3）路由服务器（Route Server）
mongos实例,前端路由,客户端由此接入,且让整个集群看上去像单一数据库,前端应用
起到一个路由的功能,供程序连接。本身不保存数据,在启动时从配置服务器加载集群信息,开启 mongos 进程需要知道配置服务器的地址,指定configdb选项。
2.1.4 片键的意义
一个好的片键对分片至关重要。片键必须是一个索引,通过sh.shardCollection 加会自动创建索引。一个自增的片键对写入和数据均匀分布就不是很好, 因为自增的片键总会在一个分片上写入,后续达到某个阀值可能会写到别的分片。但是按照片键查询会非常高效。随机片键对数据的均匀分布效果很好。注意尽量避免在多个分片上进行查询。
在所有分片上查询,mongos 会对结果进行归并排序

2.1.5 分片的原理
分片,是指将数据拆分,将其分散到不同的机器上。这样的好处就是,不需要功能强大的大型计算机也可以存储更多的数据,处理更大的负载。mongoDB 的分片,是将collection 的数据进行分割,然后将不同的部分分别存储到不同的机器上。当 collection 所占空间过大时,我们需要增加一台新的机器,分片会自动将 collection 的数据分发到新的机器上。
2.1.6 分片集群的构造

2.2 分片集群的搭建
2.2.1 环境准备
Centos7 64位系统
Mongodb 4.0版本
三台虚拟机

##三台路由服务器
192.168.1.182:20000
192.168.1.186:20000
192.168.1.122:20000
##三台配置服务器
192.168.1.182:21000
192.168.1.186:21000
192.168.1.122:21000
##九个分片数据服务器（测试复用三台），三组分片数据，各组为副本集。
192.168.1.182:27001
192.168.1.186:27001
192.168.1.122:27001
192.168.1.182:27002
192.168.1.186:27002
192.168.1.122:27002
192.168.1.182:27003
192.168.1.186:27003
192.168.1.122:27003

###创建数据目录

#三台服务器，创建路由配置目录
mkdir /data/mongodb/20000 –p
#三台服务器，创建配置服务器目录
mkdir /data/mongodb/21000 –p
#三台服务器，创建shard目录
mkdir /data/mongodb/27001 –p
mkdir /data/mongodb/27002 –p
mkdir /data/mongodb/27003 –p

安装包
三台服务下载安装包，解压到/usr/local/mongodb目录

https://www.mongodb.com/download-center?jmp=nav#community
https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-4.0.2.tgz

解压到/usr/local/mongodb/目录下
2.2.2 配置角色搭建（configsvr）
1、编辑文件vim /usr/local/mongodb/conf/config.conf，三台服务器配置一样。

systemLog:
  destination: file
  logAppend: true
  path: /data/mongodb/21000/mongodb.log
storage:
  dbPath: /data/mongodb/21000/
  journal:
    enabled: true
processManagement:
  fork: true
net:
  port: 21000
  bindIp: 127.0.0.1
replication:
  replSetName: conf
sharding:
  clusterRole: configsvr

2、启动跟单例的启动方式一致，都是使用mongod
3、配置角色副本集搭建，配置角色也是副本集，达到高可用

config = { _id:"conf ", 
  configsvr: true,
  members:[
    {_id:0,host:"192.168.1.182:21000"},
    {_id:1,host:"192.168.1.186:21000"},
    {_id:2,host:"192.168.1.122:21000"}
  ]
}
rs.initiate(config)
rs.status() #查看状态

2.2.3 路由角色搭建（mongos）
1、编辑配置文件vim /usr/local/mongodb/conf/mongos.conf，三台一样配置，配置多个router，任何一个都能正常的获取数据

systemLog:
  destination: file
  logAppend: true
  path: /data/mongodb/20000/mongodb.log
processManagement:
  fork: true
net:
  port: 20000
  bindIp: 0.0.0.0
sharding:
  configDB: config/192.168.1.182:21000,192.168.1.186:21000,192.168.1.122:21000

##文件最后指定，配置角色的ip+端口。
2、启动
/usr/local/mongodb/bin/mongos -f /usr/local/mongodb/conf/mongos.conf
#路由服务器的启动和其他角色不一样。
2.2.4 数据角色搭建（shard）
三个shard，共有三个副本集。
##shard1
1、编辑配置文件vim /usr/local/mongodb/conf/shard1.conf，三台shard1，配置一样。

systemLog:
  destination: file
  logAppend: true
  path: /data/mongodb/27001/mongodb.log
storage:
  dbPath: /data/mongodb/27001/
  journal:
    enabled: true
processManagement:
  fork: true
net:
  port: 27001
  bindIp: 0.0.0.0
replication:
  replSetName: data1
#name三台一致，副本集。不同的shard名称不同，如：data2、data3
sharding:
  clusterRole: shardsvr
2、  启动

3、配置副本集

config = { _id:"data1", 
  members:[
    {_id:0,host:"192.168.1.182:27001"},
    {_id:1,host:"192.168.1.186:27001"},
    {_id:2,host:"192.168.1.122:27001"}
  ]
}
#初始化
rs.initiate(config)
rs.status() #查看状态
至此搭建完成。

2.3 验证
2.3.1 分片集群添加数据角色

#连接路由角色
sh.addShard("data1/192.168.1.182:27001,192.168.1.186:27001,192.168.1.122:27001");
sh.addShard("data2/192.168.1.182:27002,192.168.1.186:27002,192.168.1.122:27002");
sh.addShard("data3/192.168.1.182:27003,192.168.1.186:27003,192.168.1.122:27003");
sh.status()

2.3.2 分片策略设置
默认添加数据没有分片存储，操作都是在路由角色里面
针对某个数据库的某个表使用hash分片存储，分片存储就会同一个colloection分配两个数据角色

use admin
db.runCommand( { enablesharding :"malin"});
db.runCommand( { shardcollection : "malin.myuser",key : {_id: "hashed"} } )

2.3.3 插入数据进行分片

use malin
for(i=1; i<=500;i++){
  db.myuser.insert( {name:'mytest'+i, age:i} )
}

查看三个shard是否有数据。
第3章 Mongodb gridfs介绍
GridFS是用于存储和检索超过 BSON -文档大小限制为16 MB的文件的规范。

GridFS不是将文件存储在单个文档中，而是将文件分成多个部分或块[1]，并将每个块存储为单独的文档。默认情况下，GridFS使用默认的块大小255 kB; 也就是说，GridFS将文件分成255 kB的块，但最后一个块除外。最后一个块只有必要的大小。同样，不大于块大小的文件只有最终的块，只使用所需的空间和一些额外的元数据。
GridFS使用两个集合来存储文件。一个集合存储文件块（chunks），另一个存储文件元数据（files）。
GridFS不仅可用于存储超过16 MB的文件，还可用于存储您想要访问的任何文件，而无需将整个文件加载到内存中。
3.1 使用时机
1、如果文件系统限制目录中的文件数，则可以使用GridFS根据需要存储任意数量的文件。
2、如果要从大型文件的各个部分访问信息而无需将整个文件加载到内存中，可以使用GridFS调用文件的各个部分，而无需将整个文件读入内存。
3、如果要保持文件和元数据在多个系统和工具中自动同步和部署，可以使用GridFS。使用地理位置分散的副本集时，MongoDB可以自动将文件及其元数据分发到多个 mongod实例和工具中。
3.2 Gridfs集合
chunks存储二进制块。默认是fs.chunks
#字段

{ 
  “  _ id ” ： < ObjectId > ，
  “files_id”  ： < ObjectId > ，
  “n”  ： < num > ，
  “data”  ： < binary > 
}

files存储文件的元数据。默认是fs.files
#字段
{
"_id" : ,
"length" : ,
"chunkSize" : ,
"uploadDate" : ,
"md5" : ,
"filename" : ,
"contentType" : ,
"aliases" : ,
"metadata" : ,
}

3.3 拆分GridFS
3.3.1 拆分chunks
对chunks集合进行分片，使用files_id字段，利用哈希进行分片
3.3.2 拆分files
对files集合进行分片，使用_id字段，利用哈希进行分片
3.4 实例
1、配置分片策略

#进入到路由服务器
use admin
#指定拆分的数据库test
db.runCommand( { enablesharding :"test"});
#指定拆分的files，test数据库中的test-file.files集合，利用_id字段
db.runCommand( { shardcollection : "test.test-file.files",key : {_id: "hashed"} } )
#指定拆分的chunks，test数据库中的test.test-file.chunks集合，利用files_id,字段
db.runCommand( { shardcollection : "test.test-file.chunks",key : {files_id: "hashed"}})

2、上传文件到test库中的test-file集合
命令行

mongofiles -d test1 -h 127.0.0.1 --port 20000 --prefix test-file put 1553.png
-d指定数据库
-h主机
--port端口（路由角色）
--prefix 指定集合
Put 上传

第4章 Nginx GridFS介绍
mongodb分片已经搭建完成，利用nginx的GridFS模块，实现nginx直接连接到mongodb数据库读取文件、图片。
4.1 下载nginx
1、安装 nginx 需要的依赖
yum install -y zlib zlib-devel gcc-c++ pcre pcre-devel zlib zlib-devel openssl openssl-devel
注意：编译nginx过程中，如在出现问题，自行安装依赖。
2、下载nginx
wget -c https://nginx.org/download/nginx-1.12.1.tar.gz
tar -zxvf nginx-1.12.1.tar.gz -C /usr/local/nginx
4.2 下载nginx-gridfs模块
nginx通过该模块和mongodb的gridfs进行整合
wget -c https://github.com/mdirolf/nginx-gridfs/archive/v0.8.tar.gz -O nginx-gridfs-0.8.tar.gz
tar -xzvf ./nginx-gridfs-0.8.tar.gz
4.3 下载nginx的mongodb驱动
将这个驱动下的所有移动到nginx-gridfs模块目录下的mongo-c-driver目录，为了后期编译
wget https://github.com/mongodb/mongo-c-driver/archive/v0.3.1.tar.gz
tar -zxvf v0.3.1.tar.gz
cd /root/mongo-c-driver-0.3.1
#将驱动下的所有移动到nginx-gridfs目录下的mongo-c-driver目录下。
mv ./* /root/nginx-gridfs-0.8/mongo-c-driver/
[root@hadoop-namenode mongo-c-driver]# ll
total 36
-rw-rw-r-- 1 root root 11358 May 13 2011 APACHE-2.0.txt
drwxrwxr-x 2 root root 40 May 13 2011 buildscripts
drwxrwxr-x 2 root root 41 May 13 2011 docs
-rw-rw-r-- 1 root root 10760 May 13 2011 doxygenConfig
-rw-rw-r-- 1 root root 363 May 13 2011 HISTORY.md
-rw-rw-r-- 1 root root 3024 May 13 2011 README.md
-rw-rw-r-- 1 root root 4090 May 13 2011 SConstruct
drwxrwxr-x 2 root root 185 May 13 2011 src
drwxrwxr-x 2 root root 282 May 13 2011 test
4.4 编译安装
#进入到nginx包目录下

cd nginx-1.12.0  
#开始编译，--add-module=/root/nginx-gridfs-0.8。这个目录就是nginx-gridfs模块的位置。
./configure --user=nginx --group=nginx --prefix=/usr/local/nginx/ --with-http_v2_module --with-http_ssl_module --with-http_sub_module --with-http_stub_status_module --with-http_gzip_static_module --with-pcre --add-module=/root/nginx-gridfs-0.8/
make && make install

4.5 问题处理
1、在make && make install的时候报错:
ngx_http_gridfs_module.c:684:16: 错误:变量‘chunksize’被设定但未被使用
处理方法：进入nginx包目录 vi nginx-1.12.0/objs/Makefile修改一个小错误，把第3行的-Werror错误去掉。
2、not exist /root/nginx-gridfs-0.8/mongo-c-driver/src/*.h，表示nginx的mongodb驱动没有安装。
处理方法：安装驱动，下载nginx的mongodb驱动。
至此nginx和nginx-gridfs模块编译成功，下面是配置文件的修改。
4.6 nginx-gridfs配置文件
#进入安装好的nginx配置文件conf目录下

 server{
        listen       80;
        server_name  192.168.60.235;

        #charset koi8-r;

        #access_log  logs/host.access.log  main;
        location /pics/ {
        gridfs  test
        field=_id
        type=objectid;
         mongo  192.168.xx.2x7:27017;
       }
     }

4.7 配置文件参数详解
gridfs：nginx识别插件的关键字
edusns：db名
[root_collection]: 选择collection，如root_collection=blog， mongod就会去找blog.files与blog.chunks两个块，默认是fs
[field]: 查询字段，保证mongdb里有这个字段名，支持_id, filename, 可省略, 默认是_id
[type]: 解释field的数据类型，支持objectid, int, string, 可省略, 默认是int
[user]: 用户名, 可省略
[pass]: 密码, 可省略
mongo: mongodb 路由地址（集群中）
4.8 测试
1、上传文件到mongodb，然后进行浏览器测试。
#命令行mongodb上传文件
mongofiles put 1234.jpg --local ~/1234.jpg --host 172.0.0.1 --port 27017 --db testdb --type jpg
2、浏览器访问
ip/pics/1234.jpg
#nginx地址
第5章总结
5.1 分片集群搭建
5.1.1 Config角色
配置文件（三台都配置）

systemLog:
  destination: file
  logAppend: true
  path: /data/mongodb/21000/mongodb.log
storage:
  dbPath: /data/mongodb/21000/
  journal:
    enabled: true
processManagement:
  fork: true
net:
  port: 21000
  bindIp: 127.0.0.1
replication:
  replSetName: conf
sharding:
  clusterRole: configsvr
#只需修改端口即可，三台一致。

配置副本集
启动进入到任意一台实例进行配置

config = { _id:"conf ", 
  configsvr: true,
  members:[
    {_id:0,host:"192.168.1.182:21000"},
    {_id:1,host:"192.168.1.186:21000"},
    {_id:2,host:"192.168.1.122:21000"}
  ]
}
rs.initiate(config)
rs.status() #查看状态
#注意：_id为副本集名称

5.1.2 mongos角色
配置文件（三台一样配置文件）

systemLog:
  destination: file
  logAppend: true
  path: /data/mongodb/20000/mongodb.log
processManagement:
  fork: true
net:
  port: 20000
  bindIp: 0.0.0.0
sharding:
  configDB: config/192.168.1.182:21000,192.168.1.186:21000,192.168.1.122:21000
#指定配置角色位置

5.1.3 shard角色
配置文件（九个实例，三个为一组副本集），只需修改端口和副本集名称

systemLog:
  destination: file
  logAppend: true
  path: /data/mongodb/27001/mongodb.log
storage:
  dbPath: /data/mongodb/27001/
  journal:
    enabled: true
processManagement:
  fork: true
net:
  port: 27001
  bindIp: 0.0.0.0
replication:
  replSetName: data1
#name三台一致，副本集。不同的shard名称不同，如：data2、data3
sharding:
  clusterRole: shardsvr
#配置副本集
启动，进入到任意一台分片实例，进行副本集配置。
config = { _id:"data1", 
  members:[
    {_id:0,host:"192.168.1.182:27001"},
    {_id:1,host:"192.168.1.186:27001"},
    {_id:2,host:"192.168.1.122:27001"}
  ]
}
rs.initiate(config)
rs.status() #查看状态
#注意：_id为副本集名称

5.1.4 将数据角色添加到分片集群中
进入到路由角色实例

sh.addShard("data1/192.168.1.182:27001,192.168.1.186:27001,192.168.1.122:27001");
sh.addShard("data2/192.168.1.182:27002,192.168.1.186:27002,192.168.1.122:27002");
sh.addShard("data3/192.168.1.182:27003,192.168.1.186:27003,192.168.1.122:27003");
sh.status()
#三个shard分片。

5.1.5 拆分Gridfs上传的文件
#进入到路由服务器
use admin
#指定拆分的数据库test
db.runCommand( { enablesharding :"test"});
#指定拆分的files，test数据库中的test-file.files集合，利用_id字段
db.runCommand( { shardcollection : "test.test-file.files",key : {_id: "hashed"} } )
#指定拆分的chunks，test数据库中的test.test-file.chunks集合，利用files_id,字段
db.runCommand( { shardcollection : "test.test-file.chunks",key : {files_id: "hashed"}})
#命令行上传测试
mongofiles -d test1 -h 127.0.0.1 --port 20000 --prefix test-file put 1553.png
5.2 Nginx-gridfs搭建
5.2.1 下载nginx包及依赖
yum install -y zlib zlib-devel gcc-c++ pcre pcre-devel zlib zlib-devel openssl openssl-devel
wget -c https://nginx.org/download/nginx-1.12.1.tar.gz
tar -zxvf nginx-1.12.1.tar.gz -C /usr/local/nginx
5.2.2 下载nginx-gridfs模块
wget -c https://github.com/mdirolf/nginx-gridfs/archive/v0.8.tar.gz -O nginx-gridfs-0.8.tar.gz
tar -xzvf ./nginx-gridfs-0.8.tar.gz
5.2.3 下载nginx的mongodb驱动，并移动到nginx-gridfs模块下
wget https://github.com/mongodb/mongo-c-driver/archive/v0.3.1.tar.gz
tar -zxvf v0.3.1.tar.gz
cd /root/mongo-c-driver-0.3.1
mv ./* /root/nginx-gridfs-0.8/mongo-c-driver/
5.2.4 编译安装nginx
./configure --user=nginx --group=nginx --prefix=/usr/local/nginx/ --with-http_v2_module --with-http_ssl_module --with-http_sub_module --with-http_stub_status_module --with-http_gzip_static_module --with-pcre --add-module=/root/nginx-gridfs-0.8/
5.2.5 配置文件

server{
        listen       80;
        server_name  192.168.60.235;

        #charset koi8-r;

        #access_log  logs/host.access.log  main;
        location /pics/ {
        gridfs  test
        field=_id
        type=objectid;
         mongo  192.168.xx.2x7:27017;
       }
     }

5.2.6 命令行测试。上传文件
mongofiles put 1234.jpg --local ~/1234.jpg --host 172.0.0.1 --port 27017 --db testdb --type jpg

你可能感兴趣的:(mongodb,分片,mongodb)

高并发计数器LongAdder 实现原理与使用场景详解
LongAdder原理与应用详解一、设计背景与核心思想1.传统原子类的性能瓶颈AtomicInteger/AtomicLong基于CAS实现高并发场景缺陷：CAS失败率随竞争加剧指数上升CPU空转消耗大量资源缓存一致性流量（MESI协议）导致总线风暴2.LongAdder设计目标降低竞争：通过数据分片分散写压力空间换时间：牺牲部分内存换取更高吞吐最终一致性：允许读取结果存在短暂误差二、实现原理剖析
Cloudflare D1 + Drizzle组合拳前端编辑器
秒杀传统数据库！CloudflareD1+Drizzle组合拳，高并发高可用，让我们的成本爆降10倍-D1想象一下：我们的应用用户量稳步增长，传统数据库的成本和维护压力也随之上升。而在这个时代，有没有更高效、更经济的数据库解决方案？CloudflareD1结合DrizzleORM的组合，正在为众多出海应用开发提供一条全新的技术路径。传统数据库方案在高并发场景下往往需要复杂的扩容、分片和负载均衡，成
Rust之从零开始构建分布式事务数据库莲华君 rust 分布式数据库
目录第一部分：Rust基础与数据库基础Rust语言基础Rust的特点与优势Rust的内存安全与并发模型Rust工具链与开发环境搭建数据库基本原理关系型数据库与非关系型数据库数据库的事务管理原理ACID与BASE理论分布式系统与数据库的挑战第二部分：分布式数据库核心架构分布式数据库的设计原则CAP理论与BASE理论数据分片与复制数据一致性与可用性的权衡数据持久化与恢复策略分布式事务的基础事务的ACI
一文讲清楚React Fiber 许先森森 React react.js javascript 前端 React Fiber
文章目录一文讲清楚ReactFiber1.基础概念1.1浏览器刷新率（帧）1.2JS执行栈1.3时间分片1.4链表2.ReactFiber是如何实现更新过程控制2.1任务拆分2.2挂起、恢复、终止2.2.1挂起2.2.2恢复2.2.3终止2.3任务具备优先级一文讲清楚ReactFiber1.基础概念1.1浏览器刷新率（帧）页面都是一帧一帧绘制出来的，浏览器大多是60Hz（60帧/s），每一帧耗时1
Java研学-MongoDB(三) 泰勒疯狂展开 #Java研学 java mongodb 开发语言
三文档相关7文档统计查询 ①语法：//精确统计文档数慢准dahuang>db.xiaohuang.countDocuments({条件})4//粗略统计文档数快大致准dahuang>db.xiaohuang.estimatedDocumentCount({条件})4 ②例子：//精确统计文档数name为奔波儿灞dahuang>db.xiaohuang.countDocuments({name:
MongoDB入门操作汇总，java开发从入门到实战pdf 阿里自研院程序员面试后端 java
options是可选参数,包括内存及索引的配置展示库下所有集合showcollections向集合插入一条数据db.[collection_name].insertOne({“key”:“value”})db.[collection_name].insert({“key”:“value”})向集合插入多条数据db.[collection_name].insertMany([{“key”:“valu
Spring Data REST极速构建REST API 代码的余温 spring java 后端 spring boot
SpringDataREST是SpringData项目家族中的一个子项目，它构建在SpringDataRepositories（如SpringDataJPA、SpringDataMongoDB等）之上，旨在自动将你的数据模型（实体）和SpringDataRepository暴露为超媒体驱动的RESTfulWeb服务。它的核心目标是极大简化构建围绕数据的RESTAPI的过程。核心思想：约定优于配置：
2024-2025 贡献的开源项目总结 dotNET跨平台开源
盘点2024-2025贡献的开源项目总结Intro借着统计贡献的时候盘点一下自己过去一年对别的开源项目合并的pullrequest，统计时间：从2024-04-01到2025-03-31，按PR合并的时间算PR总计:184,去掉自己仓库的PR对其他开源项目的PR总计:100,仓库数量:51，详细列表如下AllPRcontributions0xced/ChiselupdateMongoDbdrive
Redis集群部署指南：高可用与分布式实践东窗西篱梦 redis 分布式数据库
目录1.原理与理论2.背景与目的3.详细部署步骤（手动操作）步骤1：安装Redis5.0.4步骤2：配置Redis服务步骤3：修改关键配置步骤4：启动所有节点步骤5：构建集群步骤6：验证集群状态4.常见问题与解决方案节点无法加入集群集群槽位未完全分配主从切换失败客户端重定向错误5.总结与心得1.原理与理论Redis集群通过分片（Sharding）实现数据分布式存储，核心机制包括：槽位分配（Slot
MongoDB Rust驱动代码架构深度解析倪俪珍Phineas
MongoDBRust驱动代码架构深度解析mongo-rust-driverTheofficialMongoDBRustDriver项目地址:https://gitcode.com/gh_mirrors/mo/mongo-rust-driver前言本文将对MongoDB官方Rust驱动(mongo-rust-driver)的核心架构进行深入解析，帮助开发者理解其设计哲学和实现细节。我们将从客户端构
【mongodb】mongodb数据备份与恢复向往风的男子运维日常 DBA mongodb 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
MongoDB数据库备份及恢复策略详解魑魅丶小鬼
本文还有配套的精品资源，点击获取简介：MongoDB，作为流行的开源NoSQL数据库，提供灵活、高性能和易用性的特点。为了保证数据安全和业务连续性，进行有效的备份和恢复策略至关重要。本文将介绍MongoDB的备份工具和方法，包括mongodump和mongorestore命令行工具，以及更复杂的云备份解决方案。同时，将通过一个中等规模的数据集实例来详细说明备份流程，强调备份前停止写入、执行备份、检
Redis GEO vs MongoDB 地理空间关键指标对比
方案对比：RedisGEO：优点：性能极快（微秒级）简单易用，支持距离计算缺点：仅支持位置查询，无法直接关联其他属性（如商家类型）需要额外存储详细信息（需要二次查询MySQL或MongoDB）数据同步：需要维护数据一致性（当商家位置更新时，需要同步更新Redis）MongoDB地理空间索引：优点：支持地理位置+属性联合查询（如查找附近且类型为“餐饮”的商家）数据与业务模型存储在一起，避免二次查询提
MongoDB 数据库的备份与恢复 qq_33928223 数据库管理数据库 mongodb oracle
以下是MongoDB中使用mongodump和mongorestore进行数据库逻辑备份与恢复的完整指南：一、mongodump备份工具1.核心功能逻辑备份：将MongoDB中的数据以BSON/JSON格式导出到本地文件。灵活性：支持按数据库、集合、条件过滤备份。低影响：默认在后台运行，对线上服务影响较小。2.常用命令及参数mongodump\--host\#目标实例地址（默认localhost:
“Payload document size is larger than maximum of 16793600.“问题解决（MongoDB）阿宇来了 mongodb 数据库
遇到的错误：Payloaddocumentsizeislargerthanmaximumof16793600.表示尝试插入或更新的MongoDB文档大小超过了最大限制（16MB）。错误原因MongoDB对单个文档（document）的大小有硬性限制：最大为16MB。这是为了保证性能和内存使用效率。你当前操作的数据大小已超过这个限制（如提示中的16,793,600bytes≈16MB），因此Mong
行业案例| MongoDB在腾讯零售优码中的应用 MongoDB中文社区 MongoDB 数据库 mongodb
本文主要分享腾讯智慧零售团队优码业务在MongoDB中的应用，采用腾讯云MongoDB作为主存储服务给业务带来了较大收益，主要包括：高性能、快捷的DDL操作、低存储成本、超大存储容量等收益，极大的降低了业务存储成本，并提高了业务迭代开发效率。一.业务场景腾讯优码从连接消费者到连接渠道终端，实现以货的数字化为基础的企业数字化升级，包含营销能力升级和动销能力升级。腾讯优码由正品通、门店通和会员通三个子
ShardingSphere-JDBC 详解 csdn_tom_168 Apache ShardingSphere 数据库 ShardingSphere JDBC 学习
ShardingSphere-JDBC（原Sharding-JDBC）是ApacheShardingSphere的核心模块之一，定位为轻量级Java框架，在Java的JDBC层提供分库分表、读写分离、数据加密、影子库等分布式数据库增强能力。它直接操作JDBC接口，对应用透明，集成成本极低。以下是ShardingSphere-JDBC的详解：一、核心功能数据分片：分库分表：将逻辑上的大表（库）拆分成
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
MapReduce数据处理过程2万字保姆级教程大模型大数据攻城狮 mapreduce 大数据 yarn cdh hadoop 大数据面试 shuffle
目录1.MapReduce的核心思想：分而治之的艺术2.HadoopMapReduce的架构：从宏观到微观3.WordCount实例：从代码到执行的完整旅程4.源码剖析：Job.submit的魔法5.Map任务的执行：从分片到键值对6.Shuffle阶段：MapReduce的幕后英雄7.Reduce任务的执行：从数据聚合到最终输出8.Combiner的魔法：提前聚合的性能利器9.Partition
在 Node.js 中如何使用 MongoDB 创建多个关联模型
在Node.js中使用MongoDB创建多个关联模型，通常是通过Mongoose来实现。Mongoose是一个基于Node.js的MongoDBODM（对象数据建模）库，它可以简化MongoDB数据库的操作，并且支持定义模型之间的关系，例如一对多（`one-to-many`）或多对多（`many-to-many`）关系。以下是如何在Node.js中使用Mongoose创建多个关联模型的示例：###
Redis分片集群原理
1.为何需要分片集群？让我们先快速回顾一下Redis扩展的演进过程：单机Redis：最简单，但也最受限于服务器的物理资源（CPU、内存、网络带宽）。一旦宕机，服务完全中断。主从复制：通过设置一个主节点和多个从节点，实现了读写分离，提高了读并发能力，并提供了数据冗余以应对主节点故障。但所有数据仍存储在主节点上，内存容量和写性能依然受限于单个服务器，无法无限扩展。当业务数据量达到数十GB甚至TB级别，
docker-compose 启动MongoDB后导入json数据观梦 docker-compose mongodb python docker shell
docker-compose启动MongoDB后导入json数据compose目录具体方法Dockerfilesetup.shdocker-compose.ymlcompose目录├──app│├──blueprints││├──common…│├──config.py│├──Dockerfile│├──main.py│├──requirements.txt│├──templates││├──…│
备份远程主机上mysql，mongodb上数据，在docker容器中导入酒千殇数据备份 docker mongodb mysql 数据备份 ubuntu
将远程机器中的mysql，mongodb数据备份到Ubuntu20.04中前提：一定要明确数据库的版本。已知：远程机器ip，mysql账号，密码。说明：以下命令均在Ubuntu20.04中执行查看远程mysql的版本：用mysqlworkbench连接上远程数据库。点击Query菜单，在空白框输入selectversion();在点击菜单栏中第二个闪电符号，执行这条命令。就可以在下面的输出中看到m
Amazon S3的分段上传，大文件上传，上传进度条，列出分段上传，中止分段上传，重启续传功能实现你熬夜了吗？开发语言 java spring boot spring 前端 vue vue.js
我们在上传大文件的时候往往需要采用分片的方式，Amazon虽然提供了这种方式，但是不能实现我们后端在（宕机/重启）之后导致的文件丢失，大文件上传到一半可能会丢失数据的问题。本文将利用本地线程池加数据库记录的方式，实现后端（宕机/重启）后恢复之前正在上传的文件，顺便利用SSE（ServerSendEvent）实现（宕机/重启）后进度条的还原。首先引入maven，我用的是下面这个，目前最新版本1.12
Redis 的特性、工作机制与性能优化全解（含搭建实战教程）
文章目录二、Redis的核心特性三、Redis的工作机制解析单线程模型（性能为何强大？）数据结构是性能的关键持久化机制（数据如何存下来？）四、Redis性能优化实战1.优化内存使用2.提升并发性能3.使用分片/集群机制4.异步处理五、Redis搭建流程（Linux环境）1.下载与解压2.编译并安装3.修改配置文件（推荐复制一份）4.启动Redis5.客户端连接测试六、Redis运维技巧与监控命令七
ElasticSearch中的分片是什么? java1234_小锋 java elasticsearch 大数据搜索引擎
大家好，我是锋哥。今天分享关于【ElasticSearch中的分片是什么?】面试题。希望对大家有帮助；ElasticSearch中的分片是什么?超硬核AI学习资料，现在永久免费了！在Elasticsearch中，分片（Shard）是将数据拆分成更小的部分，允许在分布式环境中并行处理和存储数据的机制。它是Elasticsearch在水平扩展时用于管理大量数据的关键概念。主要概念：主分片（Primar
ClickHouse【理论篇】02：ClickHouse架构和组件做一个有趣的人Zz ClickHouse clickhouse 架构
ClickHouse的架构设计深度适配OLAP（在线分析处理）场景，通过列式存储、向量化执行、分布式分片与副本等核心技术，实现了对海量数据的高效分析与实时查询。以下从核心存储引擎、查询处理流程、分布式架构、元数据管理、复制与分片等维度详细解析其内部架构与关键组件。一、核心存储引擎：MergeTree系列ClickHouse的存储引擎是其性能的核心，其中MergeTree系列引擎（如MergeTre
2025年的前后端一体化CMS框架优选方案 skywalk8163 多媒体 web cms
以下是结合技术生态、开发效率和商业落地验证，整理的2025年前后端一体化CMS框架优选方案：一、‌主流成熟框架组合‌1.‌React+Node.js(Express/Next.js)‌‌前端‌：React生态成熟，配合Redux状态管理，适合复杂后台界面开发‌78。‌后端‌：Express轻量灵活，Next.js支持SSR优化SEO，无缝对接MongoDB/PostgreSQL‌810。‌案例‌：
Python 爬虫入门（九）：Scrapy安装及使用「详细介绍」 blues_C Python爬虫实战 python 爬虫 scrapy
Python爬虫入门（九）：Scrapy安装及使用「详细介绍」前言1.Scrapy简介2.Scrapy的安装2.1环境准备2.2安装Scrapy3.创建Scrapy项目3.1创建项目3.2项目结构简介4.编写爬虫4.1创建爬虫4.2解析数据4.3运行爬虫5.存储数据5.1存储为JSON文件5.2存储到数据库5.2.1MongoDB6.处理请求和响应6.1请求头设置6.2处理响应7.高级功能7.1使
亿级电商搜索引擎基石：Elasticsearch分片、副本与性能调优实战 lingRJ777 Java技术栈应用 java backend elasticsearch springboot microservices searchengine
亿级电商搜索引擎基石：Elasticsearch分片、副本与性能调优实战引言每年的“双十一”大促，海量用户涌入电商平台，搜索请求量瞬时可达平时的数十甚至上百倍。同时，数百万商品的库存、价格、促销信息也在以极高的频率更新。这种“读写混合”的超高并发场景，对商品搜索引擎提出了两大核心挑战：高可用与可扩展性：如何在流量洪峰下保证搜索服务7x24小时不间断，并且能够随着业务增长而平滑扩容？极致的查询性能：
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不