CAP的核心理论:一个分布式系统不可能很好的满足一致性,可用性和分区容错性这三个需求,最多只能同时较好的满足两个,即CAP原则只能三选二 ;
因此根据CAP原理将NoSql数据库分成了满足CA原则\满足CP原则和满足AP原则三大类
CAP理论是说在分布式系统中的最多只能实现上面的两点,由于当前的网络硬件肯定会出现延迟丢包等问题,所以
分区容错性是必须要实现的,所以我们要在一致性和可用性之间进行权衡,没有NoSql系统能同时保证这三点
CA-传统Oracle数据库
AP-大多数网站架构的选择
CP-Reds Mongodb
分布式架构时必须做出取舍
Base就是为了解决关系数据库强一致性引起的问题而引起的可用性降低而提出的解决方案
Basically Available:基本可用
Soft state:软状态
Eventually consistent:最终一致
思想:通过让系统放松对某一时刻数据一致性上的要求来换取系统整体伸缩性和性能上改观。缘由就在于大型分布式系统往往由于地域分布和极高的性能要求,不可能采用分布式事务来解决这一问题。
Redis:REmote DIctionary Server 远程字典服务器
开源免费、C语言编写、遵守BSD协议,高性能key-value分布式内存数据库
被人们称为数据结构服务器
Redis特点:
查看redis是否启动:ps -ef|grep redis
连接redis:redis-cli -p 6379
其余三种:Bitmaps-位图、HyperLogLog、GEO-地理信息定位
Redis命令参考大全 :http://redisdoc.com/
keys * #查看所有key
exists key #判断某个key是否存在
move key db #例如 move k1 1 移动k1到下标为1的数据库 要想获取k1 要到下标为1的数据库 get k1
expire key 秒 #为指定的key设置过期时间
ttl key #查看还有多少秒过期 -1表示永不过期 -2表示已过期 过期后,就不存在设置的key了
type key #查看你的key是什么类型
del key #删除key
dump key #序列化key,并返回序列化的值
如果存在键值对 k1-v1,现在执行指令set k1 v2,v2会将v1覆盖
set、get、del方法不变
单值多value
这里我把List理解为一个栈,先进后出,后进先出
list性能总结:
单值多value
sadd key value1 value 2… 想集合中添加元素
scard 获取集合里面的元素个数
srem key value 删除集合中的元素
srandmember key 某个整数(随机出几个数)
spop key 随机出栈
smove key1 key2 在key1中的某个值 做用是将key1中的某个值赋值给key2 (前提是key2要存在)
set集合中的数学集合类(交叉 补 并)—差集sdiff —交集sinter —并集sunion
KV模式不变,但V是一个键值对!拿下面的user举例 ,key是user,value是(id,001)这个键值对
hset/hget/hmset/hmget/hgetall/hdel/hkeys/hvals 这几个指令重点掌握
在set的基础上,加了一个score值;之前set是k1,v1,v2,v3…,现在zset是k1 score1 v1 score2 v2 …
key是一个整体,score和v是一个整体
包含访问密码的查看、设置和取消
缓存过期策略有6种:
Redis默认不是以守护进程的方式进行,可以通过配置项修改,使用yes启用守护进程 daemonize no
当Redis以守护进程方式进行时,Redis默认把pid写如/var/run/rdis.pid文件,可以通过pidfile指定 pidfile /var/run/redis.pid
指定redis监听端口,默认端口6379
绑定的主机地址 bind 127.0.0.1
当客户端闲置多长时间后关闭连接,如果指定为0,表示关闭该功能 timeout 300
指定日志记录级别,Redis共支持四个级别:debug verbose notice warning 默认值verbose
日志记录方式,默认为标准输出,如果配置Redis为守护进程的方式运行,而这里又配置日志记录方式为标准输出,则日志将会发送给/dev/null logfile stdout
设置数据库的数量,默认数据库为0号数据库,可以使用select 命令连接上指定数据库id 最大支持16个
指定多长时间内,有多少次更新操作,就将数据同步到数据文件,可以多个条件配合 save Redis默认配置文件中提供了三个条件save 900 1 save 300 10 save 60 10000
指定存储本地数据库时是否被压缩,默认为yes,Redis采用LZF压缩,如果为了节省CPU时间,可以关闭该选项,但是会导致数据库文件变得巨大, rdbcompression yes
指定本地数据库文件名,默认值为dump.rdb dbfilename dump.rdb
指定本地数据库存放目录 dir ./
设置本机为slav服务时,设置master服务的IP地址及端口号,在Redis启动时,他会自动从master进行数据同步,slaveof
当master服务设置了密码保护时,slav服务连接master的密码 master
设置Redis连接密码,如果配置了连接密码,客户端在连接redis时需要通过auth命令提供密码,默认关闭 requirepass foobared
设置同一时间最大客户端连接数,默认无限制,Redis可以同时打开的连接数为Redis进程可以打开的最大文件描述符数量,如果设置maxclients 0,表示不做限制。当客户端连接数达到限制时,Redis会关闭新的连接,并向客户端返回mac number of clients reached 信息 maxclients 128
指定Redist最大内存限制,Redis在启动时会把数据加载到内存中,达到最大内存后,Redis会尝试已到期或即将到期的key,当此方法处理后,仍然达到最大内存设置,将无法在进行写入操作,但仍然可以进行读取操作。Redis新的vm机制,会把key存放内存,value存放在swap区 maxmemory
指定是否每次跟新操作后进行日志记录,Redis在默认情况下是异步的把数据写入磁盘,如果不开启,可能会在断电时,导致一段时间内的数据丢失。因为Redis本身同步数据文件时按照上面的slav条件来同步的,所有的数据会在一段时间内存在与内存中。默认为no appendonly no
指定更新日志文件名,默认为appendonly.aof appendfilename appendonly.aof
指定更新日志条件,共有三个可选值
appendfsync everysec
指定是否启用虚拟内存机制,默认值为no,简单的介绍一下,VM机制将数据分页存放,由Redis将访问量较少的页即冷数据swap到磁盘上,访问多的页面由磁盘自动换出到内存中(在后面的文章我会仔细分析Redis的VM机制)
vm-enabled no
虚拟内存文件路径,默认值为/tmp/redis.swap,不可多个Redis实例共享
vm-swap-file /tmp/redis.swap
将所有大于vm-max-memory的数据存入虚拟内存,无论vm-max-memory设置多小,所有索引数据都是内存存储的(Redis的索引数据 就是keys),也就是说,当vm-max-memory设置为0的时候,其实是所有value都存在于磁盘。默认值为0
vm-max-memory 0
Redis swap文件分成了很多的page,一个对象可以保存在多个page上面,但一个page上不能被多个对象共享,vm-page-size是要根据存储的 数据大小来设定的,作者建议如果存储很多小对象,page大小最好设置为32或者64bytes;如果存储很大大对象,则可以使用更大的page,如果不 确定,就使用默认值
vm-page-size 32
设置swap文件中的page数量,由于页表(一种表示页面空闲或使用的bitmap)是在放在内存中的,,在磁盘上每8个pages将消耗1byte的内存。
vm-pages 134217728
vm-max-threads 4
glueoutputbuf yes
hash-max-zipmap-entries 64
hash-max-zipmap-value 512
activerehashing yes
include /path/to/local.conf
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就输行话讲的Snapshot快照,它恢复时是将快照文件直接读取到内存中。
Redis会单独创建(fork)一个进程来持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何IO操作的,这就确保了极高的性能。如果要进行大规模的数据恢复,且对于数据恢复的完整性不是特别敏感(数据精确度不高),那RDB方式要比AOF方式更加高效。RDB的缺点是最后一次持久化后的数据可能丢失
fork:fork的作用是赋值一个与当前进程一样的进程。新进程的所有数据(变量,化境变量、程序计数器等)数值和原进程一致,但是是一个全新的过程,并作为原进程的子进程
RDB默认保存的是dump.rdb文件,可以进入配置文件进行修改
RDB是整个内存的压缩过的Snapshot,RDB的数据结构可以配置复合的快照出发条件,RDB的默认出发条件是:
这些默认值都可以修改;如果想禁用RDB持久化的策略,只要不设置任何save指令,或者给save传入一个空字符串参数也可以,这样redis会立即进行持久化
Stop-writes-on-bgsave-error:后台在保存数据时,如果发生了错误,前台要停写入,该值默认时开启的,也就意味着出错了就刹车,如果 配置成了no,表示你不在乎数据不一致或者你有其他的手段发现和控制
rdbcompression:对于存储到磁盘中的快照,可以设置是否进行压缩存储。如果是的话(默认yes),redis会采用LZF算法进行压缩。如果你不想消耗CPU来进行压缩的话,可以设置关闭此功能 (妈的,就这一点内存占用率,你节约个屁啊)
rdbchecksum:在存储快照后,还可以让redis使用CRC64算法来进行数据校验但是这样做会增加大约10%的性能消耗,如果希望获取到最大性能的提升,可以关闭此功能 默认值yes
dbfilename:即RDB的默认保存文件名称
配置文件中默认的快照配置
冷拷贝后重新使用(即从主机拷贝到备机上使用),cp dump.rdb dump_new,rdb
命令save或者bgsave
执行flushall命令,也会产生dump.rdb问价,但是里面是空的,无意义
将备份文件(dump.rdb)移动到Redis安装目录并且冲洗启动Redis服务即可,config get dir获取目录
动态停止RDB保存规则的方法:redis-cli config set save “”
AOF的出现是为了解决RDB在一定时间间隔内做一次备份,所以如果Redis意外挂了,就会丢失最后一次快照后的所有修改,相对而言数据的丢失风险较大
以日志的形式来记录每个写操作,将Redis执行过的所有指令记录下拉(flushall操作会记录,读取操作不记录),只许追加问价但不允许改写文件,Redis启动之初会读取改文件重新构建数据,换言之,Redis重启的话就根据日文文件的内容将写指令从前到后执行一次来完成数据的恢复工作
AOF默认保存的是appendonly.aof文件
appendonly no 该算法默认是关闭的
如果rdb文件和aof文件两者同时出现,默认会去找aof文件,如果aof文件错误,启动不起来Redis;但是会有一个redis-cheak-aof文件,执行指令redis-cheak-aof --fix appendonly.aof(这里是要修复的aof文件名)将文件修复
Appendfsync(同步机制):
no-appendfsync-on-rewrite:重写是是否可以运用appendfsync,用默认no即可,保证数据安全性
auto-aof-rewrite-min-size:设置重写的基准值,默认是64M
auto-aof-rewrite-percentage:设置重写的基准值,这里是百分比值,默认是100(100%)
AOF的重写概念:AOF采用文件追加的方式,文件会越来越大,为了避免这种情况,新增了重写机制,当AOF文件的大小超过了所设定的阈值的时候,Redis会启动AOF文件内容的压缩机制,只保留可以恢复数据的最小指令集,可以使用命令bgrewriteaof
重写原理:Aof文件持续增长而过大时,会fork出一条新进程来将文件重写(也是先写临时文件最后再rename),遍历新进程的内存中数据,每条记录有一条的set语句。重写aof文件的操作,并没有读取旧的aof文件,而是将整个内存中的数据库内容用命令的方式重写了一个新的aof文件,这点和快照有点类似
触发机制:Redis会记录上次重写时AOF的大小,默认配置是当AOF文件大小是上次rewrite后大小的一倍(100%)且文件大于64M时触发(对应上方相关属性的两个值)
RDB持久化方式能够再指定时间间隔内对对数据惊醒快照存储
AOF持久化方式记录每次服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以Redis协议追加保存每次写的操作到文件末尾,Redis还能对AOF文件进行后台重写,是的AOF文件的体积不至于过大
因为RDB文件只用作后备用途,建议只在Salve上持久化RDB文件,而且只要15分钟备份一次就够了,只保留save 900 1 这条规则。
如果Enable AOF,好处时在最恶劣情况下也只会丢失不超过两秒钟数据,启动脚本较简单,只load自己的AOF文件就可以了。代价以是带来了持续的IO,二是AOF rewrite 的最后将rewrite过程中产生的新数据写入到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少AOF rewrite的频率,AOF重写的基础大小默认值64M太小了,可以设定到5G以上。默认超过原大小100%大小时重写。
如果不Enable AOF,仅靠Master_Slave Replication 实现高可用性也可以。能省掉一大笔IO,也减少了rewrite时带来的系统波动。代价时如果Master/Slave同时挂了,会丢失十几分钟数据,启动脚本也要比较两个Master/Slave中的RDB文件,载入较新的那个。新浪微博就选用了这种架构
事务的理解就是我们认知的事务
那么redis的事务能干什么呢?一个队列中,一次性、顺序性、排他性的执行一系列命令
深刻理解这几个指令!!!!
mutil
set k1 v1 --->queued
set k2 v2 --->queued
set k3 v3 --->queued
get k3 v3 --->queued
exec(在这可以使用discard取消该事务) --->结果开始
OK
OK
OK
v3
mutil
set k1 v1 --->queued
set k2 v2 --->queued
set k3 v3 --->queued
getset k3 v3 --->error
set k4 v4 --->queued
exec --->error
get k4 --->nil #证明事务内发生错误,导致命令全部失效
keys *
1)k1(实际值v1)
2)k2(实际值v2)
3)k3(实际值v3)
mutlti
incr k1
set k2 22
set k3 33
set k3 33
set k4 v4
get k4
exec
1)error
2)ok
3)ok
4)ok
5)ok
6)v4
全体连坐和冤头债主的区别在哪?
全体连坐是执行命令报错了,导致整体进行错误;冤头债主时执行的命令没有错误,但是执行格式不正确!
unwatch
一旦执行了exec之前加密的监控锁都会被取消掉了
开启:以MUTIL开启一个事务
入队:将多个命令入队到事务中,接到这些命令并不会立即执行,而是放到等待执行的事务队列里面
执行:由exec命令触发事务
小结
进程间的一种消息通信模式:发布者(pub)发送模式,订阅者(sub)接收消息 (实际上的开发并不会用redis做消息中间件)
命令:
先订阅后发布才能接受到消息
订阅一个或多个频道的信息,subscribe c1 c2 c3 假设c1 c2 c3分别代表频道教育、财经、股票 ; 消息发布,publish c1 hello:
# 这是终端1
subscribe c1 c2 c3 #订阅三个频道频道
"message" #终端2向频道1发送消息,此处会接受到消息
"c1"
"hello"
# 这是终端2
publish c1 hello #向频道c1发布消息
publish c4 hello #此时,由于终端1并没有订阅终端4,所以不会接受到消息
psubscribe new1 hello #在终端3号订阅后2号终端向新闻1号频道发布消息
订阅多个,通配符 *,psubscribe new *(new和星号之间没有空格);收取消息,publish new1 redis2015:
#终端3
含义讲解:new代表新闻,假设有新闻1-20这20个频道,通过通配符的形式可以匹配多个频道
psubscribe new* #订阅所有以"new"开头的频道
"message"
"new*"
"new1"
"redis2015"
视频中说:知道是这么回事就行了,实际工作中并不会用redis来做消息中间件
主机数据更新后,根据配置和策略,自动的同步到备机的master/slaver机制,master以写为主,slaver以读为主
能做的功能有很多,主要有两个:读写分离、容灾恢复
下面情况是模拟的一主二仆,即一台主机,两台从机(主机,从机1号,从机2号);主机上预先设定五个键,k1 k2 k3 k4 k5,分别对应五个值,v1 v2 v3 v4 v5,设定后,在指定从机
总结一主二仆:只要有从机,从机会保存主机上的所有数据
即,一台主机,从机1号是主机的从机,从机2号是从机1号的从机(主–从爹–从儿子)
恢复到一主二仆
假设主机1号挂了,现在从机1号输入指令:slaveof no one ,那么从机1号会变成主机,当真正的主机活过来以后,已经没他啥事了,原来的从机1号和从机2号变成了一套新的系统,活过来的主机自己是另一套系统
总结反客为主:slaveof no one指令—>使当前的数据库停止与其他数据库的同步,转变成主数据库
这三招都不怎么用了,真正企业中用的是哨兵模式
slave启动成功连接到master后会发送一个sync命令,master连接到命令启动后台的存盘进程,同时收集所有接受到的用于用于修改数据集的命令,在后台进程执行完毕之后,master将传送整个数据文件到slave,以完成一次完全同步
全量复制:slave服务在接受到数据库文件数据后,将其存盘并加载到内存张中
增量复制:master继续将新的所有收集到的修改命令一次传给slave,完成同步
但是只要是重新连接master,一次完全同步(全量复制)将被自动执行
恢复到一主二仆
自己的理解:什么叫哨兵模式呢?有一个哨兵,一直在巡逻,监控有没有主机挂了,如果主机挂了,会一句一定的规则,依据一定的规则从剩余的从机中选择选择一台主机出来
视频讲解:反客为主的自动版,能够后台监控主机是否故障,如果故障了根据票数自动将从库转换为主库
配置哨兵,填写内容:
由于所有的写操作都是先在master上操作然后同步更新到slave上,所以从master同步到slave机器有一定的延迟,当系统很繁忙的时候,延迟问题会更加严重,slave机器数量的增加也会使这个问题更加严重
//前提导入jedis的jar包
public class Test{
public static void main(String[] args){
Jedis jedis = new Jedis("127.0.0.1","6379");//参数指定ip和端口号
sout(jedis.ping());//jedis中封装了很多操作redis的方法
}
}
jedis.set("k1","v1");
sout(jedis.get("k1"));
Set set = jedis.keys("*");
还有很多命令,自己去学吧
//事务的通用操作
public class TestTx{
public static void main(String[] args){
Jedis jedis = new Jedis("127.0.0.1","6379");//参数指定ip和端口号
Transaction transaction = jedis.mutil();//这里的Transaction是jedis包的引用
transaction.set("k1","v1");
transaction.set("k2","v2");
transaction.exec();
//transaction.discard();取消事务
}
}
//加锁
public class TestTx{
public boolean transMethod(){
Jedis jedis = new Jedis("127.0.0.1","6379");
int balance;//可用余额
int debt;//欠额
int amtToSubstract = 10;
jedis.watch("balance");
//jedis.set("balance","5");模拟其他程序已经修改了该条目
balance = Integer.parseInt(jedis.get("balance"));
if(balance<amtToSubstract){
jedis.unwatch();
sout("modify");
return false;
}else{
sout("事务开始");
Transaction tx = jedis.mutil();
tx.decrBy("balance",amtToSubstract);
tx.incryBy("debt",amtToSubstract);
tx.exec();
balance = Integer.parseInt(jedis.get("balance"));
debt = Integer.parseInt(jedis.get("debt"));
sout(balance);
sout(debt);
return true;
}
}
/*
*通俗点讲,watch命令就是标记一个键,如果标记了一个键,在提交事务前如果这个键被别人改过,那事务就会失败,这种情况通常可以在程序中重新在尝试一次。
*首先标记了键balance,然后检查余额是否足够,不足就取消标记,并且不做扣减;足够的话,就启动事务进行进行更新操作,
*如果在此期间balance被其他人修改过,那在提交事务(执行exec)的时候就会报错,程序中通常可以捕获这类错误再重新执行一次,直达成功
*/
public static void main(String[] args){
TestTX test = new TestTx();
boolean retValue = test.transMethod();
}
}
模拟两台redis主机,各自独立,是写主写从读
public static void main(String[] args){
Jedis jedisFather = new Jedis("127.0.0.1","6379");
Jedis jedisSon = new Jedis("127.0.0.1","6380");
jedisSon.slaveof("127.0.0.1","6379");
}
连接池
使用单例模式双重校验锁
public class JedisPoolUtil(){
private static volatile JedisPool jedisPool = null;
private JedisPoolUtil(){
}
public static JedisPool getJedisPool(){
if(jedisPool == null){
synchronized(JedisPoolUtil.class){
if(jedisPool == null){
JedisPoolConfig poolConfig = new JedisPoolConfig();
poolConfig.setMaxActive(1000);
poolConfig.setMaxTdle(32);
poolConfig.setMaxWait(10*1000);
poolConfig.setTestOnBorrow(true);
jedisPool = new JedisPool(poolConfig,"127.0.0.1","6379");
}
}
}
return jedisPool;
}
public static void close(JedisPool jedisPool,Jedis jedis){
if(jedis != null){
jedisPool.returnResourceObject(jedis);
}
}
}
JedisPool的配置参数大部分是由JedisPoolConfig的对应项来赋值的。
maxActive: 控制一个pool可以分配多少个jedis实例,通过pool.getResource()来获取,如果赋值未-1,则表示不限制;如果pool已经分配了maxActive个实例,则此时pool的状态为exhausted。
maxIdle: 控制一个pool最多有多少个状态为idle(空闲)的Jedi是实例。
whenExhaustedAction:表示当pool中的Jedis实例都被allocated完时,pool要采取的操作,默认有三种:
WHEN_EXHAUSTED_FAIL:表示无jeis实例时,直接抛出NoSuchElementException;
WHEN_EXHAUSTED_BLOCK:表示阻塞住,或者达到maxWait时抛出JedisConnectionException;
WHEN_EXHAUSTED_GROW:表示新建一个jedis实例,也就是说设置的maxActive无用。
maxWait: 表示当borrow一个jedis实例的时,最大的等待时间,如果超过等待时间,则直接抛出JedisConnectionException。
testOnBorrow: 获得一个jedis实例的时候,检查连接可用性(ping());如果为true,则得到的jedis实例均是可用的。
testOnReturn: return 一个jedis实例给pool时,是否检查连接可用性(ping())
自己编写测试类测试就够了