Redis 是我们在互联网应用中使用最广泛的一个 NoSQL 数据库,基于 C 开发的键值对存储数据库,
Redis 这个名字是 Remote Dictionary Service 字母缩写。
很多人想到 Redis,就想到缓存。但实际上 Redis 除了缓存之外,还有许多更加丰富的使用场景。比如
分布式锁,限流。
特点:
支持数据持久化
支持多种不同的数据结构类型之间的映射
支持主从模式的数据备份
自带了发布订阅系统
定时器、计数器
四种方式获取一个 Redis:
提前准备好 gcc 环境。
接下来下载并安装 Redis:
安装完成后,启动 Redis:
提前准备好 Docker
yum install gcc-c++
wget http://download.redis.io/releases/redis-5.0.7.tar.gz
tar -zxvf redis-5.0.7.tar.gz
cd redis-5.0.7/
make
make install
redis-server redis.conf
Docker 安装好之后,启动 Docker ,直接运行安装命令即可:
docker run --name javaboy-redis -d -p 6379:6379 redis --requirepass 123
Docker 上的 Redis 启动成功之后,可以从宿主机上连接(前提是宿主机上存在 redis-cli):
redis-cli -a 123
如果宿主机上没有安装 Redis,那么也可以进入到 Docker 容器种去操作 Redis:
docker exec -it javaboy-redis redis-cli -a 123
CentOS:yum install redis
Ubuntu: apt-get install redis
Mac: brew install redis
http://try.redis.io/
配置完成后,保存退出,再次通过 redis-server redis.conf 命令启动 Redis,此时,就是在后台启动了。
String 是 Redis 里边最最简单的一种数据结构。在 Redis 中,所以的 key 都是字符串,但是,不同的key 对应的 value 则具备不同的数据结构,我们所说的五种不同的数据类型,主要是指 value 的数据类型不同。
Redis 中的字符串是动态字符串,内部是可以修改的,像 Java 中的 StringBuffer,它采用分配冗余空间的方式来减少内存的频繁分配。在 Redis 内部结构中,一般实际分配的内存会大于需要的内存,当字符串小于 1M 的时候,扩容都是在现有的空间基础上加倍,扩容每次扩 1M 空间,最大 512M。
set 就是给一个 key 赋值的。
使用 append 命令时,如果 key 已经存在,则直接在对应的 value 后追加值,否则就创建新的键值对。
可以实现对 value 的减 1 操作**(前提是 value 是一个数字)**,如果 value 不是数字,会报错,如果
value 不存在,则会给一个默认的值为 0 ,在默认值的基础上减一。
和 decr 类似,但是可以自己设置步长,该命令第二个参数就是步长。
get 用来获取一个 key 的 value。
getrange 可以用来返回 key 对应的 value 的子串,这有点类似于 Java 里边的 substring。这个命令第
二个和第三个参数就是截取的起始和终止位置,其中,-1 表示最后一个字符串,-2 表示倒数第二个字符
串,以此类推…
获取并更新某一个 key。
给某一个 key 的 value 自增。
给某一个 key 的 value 自增,同时还可以设置步长。
和 incrby 类似,但是自增的步长可以设置为浮点数。
批量获取和批量存储
查看 key 的有效期
在给 key 设置 value 的同时,还设置过期时间。
和 setex 类似,只不过这里的时间单位是毫秒。
默认情况下, set 命令会覆盖已经存在的 key,setnx 则不会。存在key就不会修改
批量设置。
覆盖一个已经存在的 key 的value。
查看字符串长度
在 Redis 中,字符串都是以二进制的方式来存储的。例如 set k1 a,a 对应的 ASCII 码是 97 , 97 转为二进制是 01100001 ,BIT 相关的命令就是对二进制进行操作的。
key 对应的 value 在 offset 处的 bit 值。
修改 key 对应的 value 在 offset 处的 bit 值
统计二进制数据中 1 的个数。
将所有指定的值插入到存于 key 的列表的头部。如果 key 不存在,那么在进行 push 操作前会创建一个空列表。 如果 key 对应的值不是一个 list 的话,那么会返回一个错误。
返回列表指定区间内的元素。
向存于 key 的列表的尾部插入所有指定的值。
移除并返回列表的尾元素。
移除并返回列表的头元素。
返回列表中,下标为 index 的元素。
ltrim 可以对一个列表进行修 剪。
阻塞式的弹出,相当于 lpop 的阻塞版。
添加元素到一个 key 中
获取一个 key 下的所有元素
移除指定的元素
返回某一个成员是否在集合中
返回集合的数量
随机返回一个元素
随机返回并且出栈一个元素。出来一个集合中就少一个
把一个元素从一个集合移到另一个集合中去。
返回两个集合的差集。 集合的顺序很关键
返回两个集合的交集。 交集返回公共的
这个类似于 sdiff ,不同的是,计算出来的结果会保存在一个新的集合中。
类似于 sinter,只是将计算出来的交集保存到一个新的集合中。
求并集。
求并集并且将结果保存到新的集合中。
在 hash 结构中,key 是一个字符串,value 则是一个 key/value 键值对。
添加值。
获取值
批量设置
批量获取
删除一个指定的 field
默认情况下,如果 key 和 field 相同,hset会覆盖掉已有的 value,hsetnx 则不会。
获取所有的 value
获取所有的 key
同时获取所有的 key 和 value
返回 field 是否存在
给指定的 value 自增
可以自增一个浮点数
返回 某一个 key 中 value 的数量
返回某一个 key 中的某一个 field 的value字符串长度
将指定的元素添加到有序集合中。
返回 member 值对应 的 score 值
返回集合中的一组元素。
返回一组元素,但是是倒序。
返回集合元素总个数
返回 score 在某一个区间内的元素个数。
按照 score 的范围返回元素。
返回元素的排名(从小到大
返回元素排名(从大到小
score 自增
给两个集合求交集。
弹出一个元素
计算有序集合中成员数量
返回指定区间内的成员。
针对key的操作
删除一个 key/value
序列化给定的 key,并返回序列化后的值
判断一个 key 是否存在
查看一个 key 的有效期 -1表示永不过期 -2表示已经过期了
给一个 key 设置有效期, 如果 key 在过期之前被重新 set 了,则过期时间会失效。
移除一个 key 的过期时间
查看所有的 key
和 ttl 一样,只不过这里返回的是毫秒
Redis 默认是不支持远程连接的,需要手动开启。
一共修改两个地方:
改完之后,保存退出,启动 Redis。
安装redis时将配置文件放到了/etc/redis/6379.conf
Jedis 的 GitHub 地址:https://github.com/xetorthio/jedis
首先创建一个普通的 Maven 项目。
项目创建成功后,添加 Jedis 依赖:
<dependency>
<groupId>redis.clients</groupId>
<artifactId>jedis</artifactId>
<version>3.2.0</version>
<type>jar</type>
<scope>compile</scope>
</dependency>
然后创建一个测试方法。
对于 Jedis 而言,一旦连接上 Redis 服务端,剩下的操作都很容易了。
在 Jedis 中,由于方法的 API 和 Redis 的命令高度一致,所以,Jedis 中的方法见名知意,直接使用即可。
在实际应用中,Jedis 实例我们一般都是通过连接池来获取,由于 Jedis 对象不是线程安全的,所以,当我们使用 Jedis 对象时,从连接池获取 Jedis,使用完成之后,再还给连接池。
如果第三步抛出异常的话,会导致第四步无法执行,所以,我们要对代码进行改进,确保第四步能够执行。通过 finally 我们可以确保 jedis 一定被关闭。利用 JDK1.7 中的 try-with-resource 特性,可以对上面的代码进行改造:这段代码的作用和上面的是一致的。但是,上面这段代码无法实现强约束。我们可以做进一步的改进:
public class JedisPoolTest {
public static void main(String[] args) {
//1.构造一个jedis连接池
JedisPool pool = new JedisPool("39.97.244.45", 6379);
//2.从连接池中获取一个Jedis连接
Jedis jedis = pool.getResource();
jedis.auth("lihai520");
//3.jedis操作
String ping = jedis.ping();
System.out.println(ping);
//4.归还连接
jedis.close();
}
}
改进之后
public class JedisPoolTest {
public static void main(String[] args) {
Jedis jedis = null;
//1.构造一个jedis连接池
JedisPool pool = new JedisPool("39.97.244.45", 6379);
//2.从连接池中获取一个Jedis连接
jedis = pool.getResource();
jedis.auth("lihai520");
try {
//3.jedis操作
String ping = jedis.ping();
System.out.println(ping);
} catch (Exception e) {
e.printStackTrace();
} finally {
if (jedis != null) {
//4.归还连接
jedis.close();
}
}
}
}
简化写法
public class JedisPoolTest {
public static void main(String[] args) {
//1.构造一个jedis连接池
JedisPool pool = new JedisPool("39.97.244.45", 6379);
try (Jedis jedis = pool.getResource()) {
jedis.auth("lihai520");
String ping = jedis.ping();
System.out.println(ping);
}
}
}
继续封装
public interface CallWithJedis {
void call(Jedis jedis);
}
public class Redis {
private JedisPool pool;
public Redis() {
GenericObjectPoolConfig<Object> config = new GenericObjectPoolConfig<>();
//连接池最大空闲数
config.setMaxIdle(300);
//连接池最大连接数
config.setMaxTotal(1000);
//连接最大等待时间 -1表示没有限制
config.setMaxWaitMillis(30000);
//在空闲时检查有效性
config.setTestOnBorrow(true);
/**
* 1.Redis地址
* 2.Redis端口
* 3.连接超时时间
* 4.连接密码
*/
pool = new JedisPool(config,"39.97.244.45",6379,3000,"lihai520");
}
public void execute(CallWithJedis callWithJedis) {
try(Jedis jedis = pool.getResource()) {
callWithJedis.call(jedis);
}
}
}
public class JedisPoolTest {
public static void main(String[] args) {
//1.构造一个jedis连接池
// JedisPool pool = new JedisPool("39.97.244.45", 6379);
//
// try (Jedis jedis = pool.getResource()) {
// jedis.auth("lihai520");
// String ping = jedis.ping();
// System.out.println(ping);
// }
Redis redis = new Redis();
redis.execute(jedis -> {
System.out.println(jedis.ping());
});
}
}
GitHub:https://github.com/lettuce-io/lettuce-core
Lettuce 和 Jedis 的一个比较:
使用 Lettuce,首先创建一个普通的 Maven 项目,添加 Lettuce 依赖:
<dependency>
<groupId>io.lettuce</groupId>
<artifactId>lettuce-core</artifactId>
<version>5.2.2.RELEASE</version>
</dependency>
然后来一个简单的测试案例:注意这里的密码传递方式,密码直接写在连接地址里边。
分布式锁也算是 Redis 比较常见的使用场景。
问题场景:
例如一个简单的用户操作,一个线程去修改用户的状态,首先从数据库中读出用户的状态,然后在内存中进行修改,修改完成后,再存回去。在单线程中,这个操作没有问题,但是在多线程中,由于读取、修改、存 这是三个操作,不是原子操作,所以在多线程中,这样会出问题。
对于这种问题,我们可以使用分布式锁来限制程序的并发执行。
分布式锁实现的思路很简单,就是进来一个线程先占位,当别的线程进来操作时,发现已经有人占位了,就会放弃或者稍后再试。在 Redis 中,占位一般使用 setnx 指令,先进来的线程先占位,线程的操作执行完成后,再调用 del 指令释放锁。
根据上面的思路,我们写出的代码如下:
public class LockTest {
public static void main(String[] args) {
Redis redis = new Redis();
redis.execute(jedis->{
Long setnx = jedis.setnx("k1", "v1");
if (setnx == 1) {
//没人占位
jedis.set("name", "lihai");
String name = jedis.get("name");
System.out.println(name);
jedis.del("k1");//释放资源
}else{
//有人占位,停止/暂缓 操作
}
});
}
}
上面的代码存在一个小小问题:如果代码业务执行的过程中抛异常或者挂了,这样会导致 del 指令没有被调用,这样,k1 无法释放,后面来的请求全部堵塞在这里,锁也永远得不到释放。要解决这个问题,我们可以给锁添加一个过期时间,确保锁在一定的时间之后,能够得到释放。改进后的代码如下:
public class LockTest {
public static void main(String[] args) {
Redis redis = new Redis();
redis.execute(jedis-> {
Long setnx = jedis.setnx("k1", "v1");
if (setnx == 1) {
//给锁添加一个过期时间,防止应用在运行过程中抛出异常导致锁无法及时得到释放
jedis.expire("k1", 5);
//没人占位
jedis.set("name", "lihai");
String name = jedis.get("name");
System.out.println(name);
jedis.del("k1");//释放资源
}
}
}
}
这样改造之后,还有一个问题,就是在获取锁和设置过期时间之间如果如果服务器突然挂掉了,这个时候锁被占用,无法及时得到释放,也会造成死锁,因为获取锁和设置过期时间是两个操作,不具备原子性。为了解决这个问题,从 Redis2.8 开始,setnx 和 expire 可以通过一个命令一起来执行了,我们对上述代码再做改进:
public class LockTest {
public static void main(String[] args) {
Redis redis = new Redis();
redis.execute(jedis -> {
String setnx = jedis.set("k1", "v1", new SetParams().nx().ex(5));
if (setnx != null) {
//没人占位
jedis.set("name", "lihai");
String name = jedis.get("name");
System.out.println(name);
jedis.del("k1");//释放资源
} else {
//有人占位,停止/暂缓 操作
}
});
}
}
为了防止业务代码在执行的时候抛出异常,我们给每一个锁添加了一个超时时间,超时之后,锁会被自动释放,但是这也带来了一个新的问题:如果要执行的业务非常耗时,可能会出现紊乱。举个例子:第一个线程首先获取到锁,然后开始执行业务代码,但是业务代码比较耗时,执行了 8 秒,这样,会在第一个线程的任务还未执行成功锁就会被释放了,此时第二个线程会获取到锁开始执行,在第二个线程刚执行了 3 秒,第一个线程也执行完了,此时第一个线程会释放锁,但是注意,第一个线程它自己的锁才就已经超时释放了 那么它释放第二个线程的锁,释放之后,第三个线程进来。对于这个问题,我们可以从两个角度入手:尽量避免在获取锁之后,执行耗时作。
可以在锁上面做文章,将锁的 value 设置为一个随机字符串,每次释放锁的时候,都去比较随机字符串是否一致,如果一致,再去释放,否则,不释放。
对于第这种方案,由于释放锁的时候,首先要去查看锁的 value,其次比较 value 的值是否正确,接着释放锁,一共有三个步骤,很明显三个步骤不具备原子性,为了解决这个问题,我们要引入 Lua 脚本。
Lua 脚本的优势:
在 Redis 中,使用 Lua 脚本,大致上两种思路:
在/usr/local/redis/redis-5.0.12新建一个lua目录来放置lua脚本文件
首先在 Redis 服务端创建 Lua 脚本,内容如下:
releasewherevalueequal.lua
if redis.call("get",KEYS[1])==ARGV[1] then
return redis.call("del",KEYS[1])
else
return 0
end
接下来,可以给 Lua 脚本求一个 SHA1 和,命令如下:
cat releasewherevalueequal.lua | redis-cli -a lihai520 script load --piple
script load 这个命令会在 Redis 服务器中缓存 Lua 脚本,并返回脚本内容的 SHA1 校验和,然后在Java 端调用时,传入 SHA1 校验和作为参数,这样 Redis 服务端就知道执行哪个脚本了。
接下来,在 Java 端调用这个脚本。
public class LuaTest {
public static void main(String[] args) {
Redis redis = new Redis();
for (int i = 0; i < 2; i++) {
redis.execute(jedis -> {
//1.先获取一个随机字符串
String value = UUID.randomUUID().toString();
//2.获取锁
String k1 = jedis.set("k1", value, new SetParams().nx().ex(5));
//3.判断是否成功拿到锁
if (k1 != null && "OK".equals(k1)) {
//4. 具体的业务操作
jedis.set("site", "www.taobao.com");
String site = jedis.get("site");
System.out.println(site);
//5.释放锁
jedis.evalsha("d321999fc6cf4f4f8717d4bfc5c389cfafcd1d91",
Arrays.asList("k1"), Arrays.asList(value));
} else {
System.out.println("没拿到锁");
}
});
}
}
}
输出结果如下:
我们平时说到消息队列,一般都是指 RabbitMQ、RocketMQ、ActiveMQ 以及大数据里边的 Kafka,这些是我们比较常见的消息中间件,也是非常专业的消息中间件,作为专业的中间件,它里边提供了许多功能。但是,当我们需要使用消息中间件的时候,并非每次都需要非常专业的消息中间件,假如我们有一个消息队列,只有一个消费者,那就没有必要去使用上面这些专业的消息中间件,这种情况我们可以直接使用 Redis 来做消息队列。Redis 的消息队列不是特别专业,他没有很多高级特性,适用简单的场景,如果对于消息可靠性有着极高的追求,那么不适合使用 Redis 做消息队列。
Redis 做消息队列,使用它里边的 List 数据结构就可以实现,我们可以使用 lpush/rpush 操作来实现入队,然后使用 lpop/rpop 来实现出队。
回顾一下:
在客户端(例如 Java 端),我们会维护一个死循环来不停的从队列中读取消息,并处理,如果队列中有消息,则直接获取到,如果没有消息,就会陷入死循环,直到下一次有消息进入。这种死循环会造成大量的资源浪费,这个时候,我们可以使用之前讲的 blpop/brpop 。
延迟队列可以通过 zset 来实现,因为 zset 中有一个 score,我们可以把时间作为 score,将 value 存到redis 中,然后通过轮询的方式,去不断的读取消息出来。首先,如果消息是一个字符串,直接发送即可,如果是一个对象,则需要将对象进行序列化,这里我们使用 JSON 来实现序列化和反序列化。所以,首先在项目中,添加 JSON 依赖:
接下来,构造一个消息对象:
<dependency>
<groupId>com.fasterxml.jackson.coregroupId>
<artifactId>jackson-databindartifactId>
<version>2.10.3version>
dependency>
接下来封装一个消息队列:
public class JavaboyMessage {
private String id;
private Object data;
@Override
public String toString() {
return "JavaboyMessage{" +
"id='" + id + '\'' +
", data=" + data +
'}';
}
public String getId() {
return id;
}
public void setId(String id) {
this.id = id;
}
public Object getData() {
return data;
}
public void setData(Object data) {
this.data = data;
}
}
public class DelayMsgQueue {
private Jedis jedis;
private String queue;
public DelayMsgQueue(Jedis jedis, String queue) {
this.jedis = jedis;
this.queue = queue;
}
/**
* 消息入队
* @param data 要发送的消息
*/
public void queue(Object data) {
//构造一个 JavaboyMessage
JavaboyMessage msg = new JavaboyMessage();
msg.setId(UUID.randomUUID().toString());
msg.setData(data);
//序列化
try {
String s = new ObjectMapper().writeValueAsString(msg);
System.out.println("msg publish:" + new Date());
//消息发送,score 延迟 5 秒 score member
jedis.zadd(queue, System.currentTimeMillis() + 5000, s);
} catch (JsonProcessingException e) {
e.printStackTrace();
}
}
/**
* 消息消费
*/
public void loop() {
//只要当前线程没有被打断
while (!Thread.interrupted()) {
//读取 score 在 0 到当前时间戳之间的消息
//zrangeByScore k1 0 2 limit 0 1 一条一条的读取score 从 0到2的member
Set<String> zrange = jedis.zrangeByScore(queue, 0,System.currentTimeMillis(), 0, 1);
if (zrange.isEmpty()) {
//如果消息是空的,则休息 500 毫秒然后继续
try {
Thread.sleep(500);
} catch (InterruptedException e) {
break;
}
continue;
}
//如果读取到了消息,则直接读取消息出来
String next = zrange.iterator().next();
//zrem移除对应key的member就相当于是消费消息了!
if (jedis.zrem(queue, next) > 0) {
//抢到了,接下来处理业务
try {
//反序列化
JavaboyMessage msg = new ObjectMapper().readValue(next, JavaboyMessage.class);
System.out.println("receive msg:"+ new Date() + msg);
} catch (JsonProcessingException e) {
e.printStackTrace();
}
}
}
}
}
测试:
public class DelayMsgTest {
public static void main(String[] args) {
Redis redis = new Redis();
redis.execute(jedis -> {
//构造一个消息队列
DelayMsgQueue queue = new DelayMsgQueue(jedis, "delayQueue");
//构造消息生产者
Thread producer = new Thread() {
@Override
public void run() {
for (int i = 0; i < 5; i++) {
queue.queue("www.vip.com >>>>" + i);
}
}
};
//构造一个消息消费者
Thread consumer = new Thread() {
@Override
public void run() {
queue.loop();
}
};
//启动
producer.start();
consumer.start();
//休息 7 秒后,停止程序
try {
Thread.sleep(7000);
consumer.interrupt();
} catch (InterruptedException e) {
e.printStackTrace();
}
});
}
}
用户一年的签到记录,如果你用 string 类型来存储,那你需要 365 个 key/value,操作起来麻烦。通过位图可以有效的简化这个操作。
它的统计很简单:
01111000111
每天的记录占一个位, 365 天就是 365 个位,大概 46 个字节,这样可以有效的节省存储空间,如果有一天想要统计用户一共签到了多少天,统计 1 的个数即可。对于位图的操作,可以直接操作对应的字符串(get/set),可以直接操作位(getbit/setbit).
Redis 的基本操作可以归为两大类:
例如存储一个 Java 字符串:
接下来去存储:
存一个字符串进去,但是通过位操作获取字符串。
例如签到记录:
01111000111
1 表示签到的天, 0 表示没签到,统计总的签到天数:
可以使用 bitcount。bitcount 中,可以统计的起始位置,但是注意,这个起始位置是指字符的起始位置而不是 bit 的起始位
置。除了 bitcount 之外,还有一个 bitpos。bitpos 可以用来统计在指定范围内出现的第一个 1 或者 0 的位置,这个命令中的起始和结束位置都是字符索引,不是 bit 索引,一定要注意。
比如说下面这个例子 bitcount name 0 0 就时字符j中二进制位 1 的个数
在 Redis 3.2 之后,新加了一个功能叫做 bitfiled ,可以对 bit 进行批量操作。
例如:
BITFIELD name get u4 0
表示获取 name 中的位,从 0 开始获取,获取 4 个位,返回一个无符号数字。
bitfiled 也可以一次执行多个操作。
SET:
用无符号的 98 转成的 8 位二进制数字,代替从第 8 位开始接下来的 8 位数字。
INCRBY:
对指定范围进行自增操作,自增操作可能会出现溢出,既可能是向上溢出,也可能是向下溢出。Redis中对于溢出的处理方案是折返。 8 位无符号数 255 加 1 溢出变为 0 ; 8 位有符号数 127 ,加 1 变为 -128 也可以修改默认的溢出策略,可以改为 fail ,表示执行失败。sat 表示留在在最大/最小值。
一般我们评估一个网站的访问量,有几个主要的参数:
一般来说,pv 或者 uv 的统计,可以自己来做,也可以借助一些第三方的工具,比如 cnzz,友盟 等。如果自己实现,pv 比较简单,可以直接通过 Redis 计数器就能实现。但是 uv 就不一样,uv 涉及到另外一个问题,去重。我们首先需要在前端给每一个用户生成一个唯一 id,无论是登录用户还是未登录用户,都要有一个唯一id,这个 id 伴随着请求一起到达后端,在后端我们通过 set 集合中的 sadd 命令来存储这个 id,最后通过 scard 统计集合大小,进而得出 uv 数据。
如果是千万级别的 UV,需要的存储空间就非常惊人。而且,像 UV 统计这种,一般也不需要特别精确,800w 的 uv 和 803w 的 uv,其实差别不大。所以,我们要介绍今天的主角—HyperLogLog Redis 中提供的 HyperLogLog 就是专门用来解决这个问题的,HyperLogLog 提供了一套不怎么精确但是够用的去重方案,会有误差,官方给出的误差数据是 0.81%,这个精确度,统计 UV 够用了。
HyperLogLog 主要提供了两个命令:pfadd 和 pfcount。
pfadd 用来添加记录,类似于 sadd ,添加过程中,重复的记录会自动去重。
pfcount 则用来统计数据。
数据量少的时候看不出来误差。
在 Java 中,我们多添加几个元素:
public class HyperLogLog {
public static void main(String[] args) {
Redis redis = new Redis();
redis.execute(jedis -> {
for (int i = 0; i < 1000; i++) {
jedis.pfadd("uv", "u" + i, "u" + (i + 1)); //主要是演示一下去重!
}
long uv = jedis.pfcount("uv");
System.out.println(uv);//理论值是 1001
});
}
}
理论值是 1001 ,实际打印出来 994 ,有误差,但是在可以接受的范围内。
除了 pfadd 和 pfcount 之外,还有一个命令 pfmerge ,合并多个统计结果,在合并的过程中,会自动
去重多个集合中重复的元素。
我们用 HyperLogLog 来估计一个数,有偏差但是也够用。HyperLogLog 主要提供两个方法:
但是 HyperLogLog 没有判断是否包含的方法,例如 pfexists 、pfcontains 等。没有这样的方法存在,但是我们有这样的业务需求。例如刷今日头条,推送的内容有相似的,但是没有重复的。这就涉及到如何在推送的时候去重?解决方案很多,例如将用户的浏览历史记录下来,然后每次推送时去比较该条消息是否已经给用户推送了。但是这种方式效率极低,不推荐。
解决这个问题,就要靠我们今天要说的布隆过滤器。
Bloom Filter 专门用来解决我们上面所说的去重问题的,使用 Bloom Filter 不会像使用缓存那么浪费空间。当然,他也存在一个小小问题,就是不太精确。Bloom Filter 相当于是一个不太精确的 set 集合,我们可以利用它里边的 contains 方法去判断某一个对象是否存在,但是需要注意,这个判断不是特别精确。一般来说,通过 contains 判断某个值不存在,那就一定不存在,但是判断某个值存在的话,则他可能不存在。以今日头条为例,假设我们将用户的浏览记录用 B 表示,A 表示用户没有浏览的新闻,现在要给用户推送消息,先去 B 里边判断这条消息是否已经推送过,如果判断结果说没推送过(B 里边没有这条记录),那就一定没有推送过。如果判断结果说有推送过(B 里边也有可能没有这条消息),这个时候该条消息就不会推送给用户,导致用户错过该条消息,当然这是概率极低的。
每一个布隆过滤器,在 Redis 中都对应了一个 大型的位数组 以及几个不同的 hash 函数。
所谓的 add 操作是这样的:
首先根据几个不同的 hash 函数给元素进行 hash 运算一个整数索引值,拿到这个索引值之后,对位数组的长度进行取模运算,得到一个位置,每一个 hash 函数都会得到一个位置,将位数组中对应的位置设置为 1 ,这样就完成了添加操作。
当判断元素是否存在时,依然先对元素进行 hash 运算,将运算的结果和位数组取模,然后去对应的位置查看是否有相应的数据,如果有,表示元素可能存在(因为这个有数据的地方也可能是其他元素存进来的),如果没有表示元素一定不存在。Bloom Filter 中,误判的概率和位数组的大小有很大关系,位数组越大,误判概率越小,当然占用的存储空间越大;位数组越小,误判概率越大,当然占用的存储空间就小。
https://oss.redislabs.com/redisbloom/Quick_Start/
这里给大家介绍两种安装方式:
Docker:
docker run -p 6379:6379 --name redis-redisbloom redislabs/rebloom:latest
自己编译安装:
git clone https://github.com/RedisBloom/RedisBloom.git
cd RedisBloom/
make
cd ..
redis-server redis.conf --loadmodule ./RedisBloom-x.x.x/redisbloom.so
在github上下载了RedisBloom的tar.gz文件放在 redis的安装目录下
安装完成后,执行 bf.add 命令,测试安装是否成功。
每次启动时都输入 redis-server redis.conf --loadmodule ./RedisBloom/redisbloom.so 比较麻烦,我们可以将要加载的模块在 redis.conf 中提前配置好。最下面这一句,配置完成后,以后只需要 redis-server redis.conf 来启动 Redis 即可。
主要是两类命令,添加和判断是否存在。
使用 Jedis 操作布隆过滤器,首先添加依赖:
<dependency>
<groupId>com.redislabsgroupId>
<artifactId>jrebloomartifactId>
<version>1.2.0version>
dependency>
然后进行测试:
public class BloomFilter {
public static void main(String[] args) {
GenericObjectPoolConfig<Object> config = new GenericObjectPoolConfig<>();
//连接池最大空闲数
config.setMaxIdle(300);
//连接池最大连接数
config.setMaxTotal(1000);
//连接最大等待时间 -1表示没有限制
config.setMaxWaitMillis(30000);
//在空闲时检查有效性
config.setTestOnBorrow(true);
JedisPool pool = new JedisPool(config, "39.97.244.45", 6379, 30000, "lihai520");
//注意不要倒错Client的包 package io.rebloom.client
Client client = new Client(pool);
for (int i = 0; i < 1000; i++) {
client.add("name","javaboy-" + i);
}
boolean exists = client.exists("name", "javaboy-9");
System.out.println(exists);
}
}
默认情况下,我们使用的布隆过滤器它的错误率是 0.01 ,默认的元素大小是 100 。但是这两个参数也是可以配置的。我们可以调用 bf.reserve 方法进行配置。
BF.RESERVE k1 0.0001 1000000
第一个参数是 key,第二个参数是错误率,错误率越低,占用的空间越大,第三个参数预计存储的数量,当实际数量超出预计数量时,错误率会上升。
前面所说的新闻推送过滤算是一个应用场景。解决 Redis 穿透或者又叫缓存击穿问题。假设我有 1 亿 条用户数据,现在查询用户要去数据库中查,效率低而且数据库压力大,所以我们会把请求首先在 Redis 中处理(活跃用户存在 Redis 中),Redis 中没有的用户,再去数据库中查询。现在可能会存在一种恶意请求,这个请求携带上了很多不存在的用户,这个时候 Redis 无法拦截下来请求,所以请求会直接跑到数据库里去。这个时候,这些恶意请求会击穿我们的缓存,甚至数据库,进而引起“雪崩效应”。为了解决这个问题,我们就可以使用布隆过滤器。将 1 亿条用户数据存在 Redis 中不现实,但是可以存在布隆过滤器中,请求来了,首先去判断数据是否存在,如果存在,再去数据库中查询,否则就不去数据库中查询。
Pipeline(管道)本质上是由客户端提供的一种操作。Pipeline 通过调整指令列表的读写顺序,可以大幅度的节省 IO 时间,提高效率。
public class RateLimiter {
private Jedis jedis;
public RateLimiter(Jedis jedis) {
this.jedis = jedis;
}
/**
* 限流方法
* @param user 操作的用户,相当于是限流的对象
* @param action 具体的操作
* @param period 时间窗,限流的周期
* @param maxCount 限流的次数
* @return
*/
public boolean isAllowed(String user,String action,int period,int maxCount) {
//1.数据用 zset 保存,首先生成一个 key
String key = user + "----" + action;
//2.获取当前时间戳
long nowTime = System.currentTimeMillis();
System.out.println(nowTime);
//3.建立管道
Pipeline pipelined = jedis.pipelined();
pipelined.multi();
//4.将当前的操作先存储下来
pipelined.zadd(key, nowTime,String.valueOf(nowTime));
//5.移除时间窗之外的数据
pipelined.zremrangeByScore(key, 0, nowTime - period * 1000);
//6.统计剩下的 key
Response<Long> response = pipelined.zcard(key);
//7.将当前 key 设置一个过期时间,过期时间就是时间窗
pipelined.expire(key, period + 1);
//关闭管道
pipelined.exec();
pipelined.close();
//8.比较时间窗内的操作数
return response.get() <= maxCount;
}
public static void main(String[] args) {
Redis redis = new Redis();
redis.execute(j -> {
RateLimiter rateLimiter = new RateLimiter(j);
for (int i = 0; i < 20; i++) {
System.out.println(rateLimiter.isAllowed("javaboy", "publish", 5, 3));
}
});
}
}
Redis4.0 开始提供了一个 Redis-Cell 模块,这个模块使用 漏斗算法 ,提供了一个非常好用的限流指令。漏斗算法就像名字一样,是一个漏斗,请求从漏斗的大口进,然后从小口出进入到系统中,这样,无论是多大的访问量,最终进入到系统中的请求,都是固定的。使用漏斗算法,需要我们首先安装 Redis-Cell 模块:
https://github.com/brandur/redis-cell
安装步骤:
首先在redis的安装目录新建一个redis-cell 目录
mkdir redis-cell
cd redis-cell
wget https://github.com/brandur/redis-cell/releases/download/v0.2.5/redis-cell-v0.2.5-x86_64-unknown-linux-gnu.tar.gz
tar -zxvf redis-cell-v0.2.5-x86_64-unknown-linux-gnu.tar.gz
先登陆redis 执行shutdown命令
然后进入redis.conf找到loadmodule添加
loadmodule /usr/local/redis/redis-5.0.5/redis-celllibredis_cell.so
redis-server redis.conf
redis-cli -a xxxx
CL.THROTTLE 看是否有命令提示 如果有就说明安装成功了
CL.THROTTLE 命令一共有五个参数
执行完成后,返回值也有五个:
首先自定义一个命令接口:
public interface RedisCommandInterface extends Commands {
@Command("CL.THROTTLE ?0 ?1 ?2 ?3 ?4")
List<Object> throttle(String key, Long init, Long count, Long period, Long quota);
}
定义完成后,接下来,直接调用即可:
public class ThrottleTest {
public static void main(String[] args) {
RedisClient redisClient = RedisClient.create("redis://[email protected]");
StatefulRedisConnection<String, String> connect = redisClient.connect();
RedisCommandFactory factory = new RedisCommandFactory(connect);
RedisCommandInterface commands = factory.getCommands(RedisCommandInterface.class);
List<Object> list = commands.throttle("java-publish", 10L, 10L, 60L, 1L);
System.out.println(list);
}
}
/**
1. 第一个参数是 key
2. 第二个参数是漏斗的容量
3. 时间窗内可以操作的次数
4. 时间窗
5. 每次漏出数量
*/
1. 第一个 0 表示允许, 1 表示拒绝
2. 第二个参数是漏斗的容量
3. 第三个参数是漏斗的剩余空间
4. 如果拒绝了,多长时间后,可以再试
5. 多长时间后,漏斗会完全空出来
Redis3.2 开始提供了 GEO 模块。该模块也使用了 GeoHash 算法。
核心思想:GeoHash 是一种地址编码方法,使用这种方式,能够将二维的空间经纬度数据编码成一个一维字符串。
地球上经纬度的划分:
以经过伦敦格林尼治天文台旧址的经线为 0 度经线,向东就是东经,向西就是西经。如果我们将西经定义负,经度的范围就是 [-180,180]。纬度北纬 90 度到南纬 90 度,如果我们将南纬定义负,则纬度的范围就是 [-90,90]。接下来,以本初子午线和赤道为界,我们可以将地球上的点分配到一个二维坐标中:
GeoHash 算法就是基于这样的思想,划分的次数越多,区域越多,每个区域中的面积就更小了,精确
度就会提高。
GeoHash 具体算法:
以北京天安门广场为例(39.9053908600,116.3980007200):
这样,我们得到的纬度二进制是 101
按照同样的步骤,我们可以算出来经度的二进制是 110
接下来将经纬度合并(经度占偶数位,纬度占奇数位):
111001
按照 Base32 (0-9,b-z,去掉 a i l o)对合并后的二进制数据进行编码,编码的时候,先将二进制转换为十进制,然后进行编码。
将编码得到的字符串,可以拿去 geohash.org 网站上解析。
GeoHash 有哪些特点:
添加地址:
GEOADD city 116.3980007200 39.9053908600 beijing
GEOADD city 114.0592002900 22.5536230800 shenzhen
查看两个地址之间的距离:
127.0.0.1:6379> GEODIST city beijing shenzhen km
"1942.5435"
获取元素的位置:
127.0.0.1:6379> GEOPOS city beijing
1) "116.39800339937210083"
2) "39.90539144357683909"
获取元素 hash 值:
127.0.0.1:6379> GEOHASH city beijing
1) "wx4g08w3y00"
通过 hash 值可以查看定位。http://geohash.org/wx4g08w3y00
查看附近的人:
以北京为中心,方圆 200km 以内的城市找出来 3 个,按照远近顺序排列,这个命令不会排除 北京。
127.0.0.1:6379> GEORADIUSBYMEMBER city beijing 200 km count 3 asc
1) "beijing"
当然,也可以根据经纬度来查询(将 member 换成对应的经纬度):
127.0.0.1:6379> GEORADIUS city 116.3980007200 39.9053908600 2000 km withdist
1) 1) "shenzhen"
2) "1942.5434"
2) 1) "beijing"
2) "0.0002"
**scan 实际上是 keys 的一个升级版。**可以用 keys 来查询 key,在查询的过程中,可以使用通配符。keys 虽然用着还算方便,但是没有分页功能。同时因为 Redis 是单线程,所以 key 的执行会比较消耗时间,特别是当数据量大的时候,影响整个程序的运行。为了解决 keys 存在的问题,从 Redis2.8 中开始,引入了 scan。scan 具备 keys 的功能,但是不会阻塞线程,而且可以控制每次返回的结果数。
首先准备 10000 条测试数据:
public class ScanTest {
public static void main(String[] args) {
Redis redis = new Redis();
redis.execute(jedis -> {
for (int i = 0; i < 10000; i++) {
jedis.set("k" + i, "v" + i);
}
});
}
}
scan 命令一共提供了三个参数,第一个 cursor,第二个参数是 key,第三个参数是 limit。
cursor 实际上是指一维数组的位置索引,limit 则是遍历的一维数组个数(所以每次返回的数据大小可能不确定)。
scan 0 match k8* count 1000
SCAN 的遍历顺序。
假设目有三条数据:
在遍历的过程中,大家发现游标的顺序是 0 2 1 3,从十进制来看好像没有规律,但是从转为二进制,
则是有规律的:
00 - >10->01->11
这种规律就是高位进 1 ,传统的二进制加法,是从右往左加,这里是从左往右加。
实际上,在 Redis 中,它的具体计算流程给是这样:
将要计算的数字反转
给反转后的数字加 1
再反转
那么为什么不是按照 0 、 1 、 2 、 3 、4…这样的顺序遍历呢?因为主要考虑到两个问题:
字典扩容
字典缩容
假如我们将要访问 110 时,发生了扩容,此时 scan 就会从 0110 开始遍历,之前已经被遍历过的元素
就不会被重复遍历了。
假如我们将要访问 110 时,发生缩容,此时 scan 就会从 10 开始遍历,这个时候,也会遍历到 010 ,
但是 010 之前的不会再被遍历了。所以,在发生缩容的时候,可能返回重复的元素。
scan 是一系列的指令,除了遍历所有的 key 之外,也可以遍历某一个类型的 key,对应的命令有:
zscan–>zset
hscan–>hash
sscan–>set
Java 在 JDK1.4 中引入 NIO,但是也有很多人在使用阻塞 IO,这两种 IO 有什么区别?
在阻塞模式下,如果你从数据流中读取不到指定大小的数据量,IO 就会阻塞。比如已知会有 10 个字节发送过来,但是我目前只收到 4 个,还剩六个,此时就会发生阻塞。如果是非阻塞模式,虽然此时只收到 4 个字节,但是读到 4 个字节就会立即返回,不会傻傻等着,等另外 6 个字节来的时候,再去继续读取。所以阻塞 IO 性能低于 非阻塞 IO。如果有一个 Web 服务器,使用阻塞 IO 来处理请求,那么每一个请求都需要开启一个新的线程;但是如果使用了非阻塞 IO,基本上一个小小线程池就够用了,因为不会发生阻塞,每一个线程都能够高效利用。
首先一点,Redis 是单线程。单线程如何解决高并发问题的?
实际上,能够处理高并发的单线程应用不仅仅是 Redis,除了 Redis 之外,还有 NodeJS、Nginx 等等也是单线程。
Redis 虽然是单线程,但是运行很快,主要有如下几方面原因:
在使用非阻塞 IO 时,有一个问题,就是线程如何知道剩下的数据来了?
这里就涉及到一个新的概念叫做 多路复用 ,本质上就是一个事件轮询 API。
Redis 通信使用了文本协议,文本协议比较费流量,但是 Redis 作者认为数据库的瓶颈不在于网络流量,而在于内部逻辑,所以采用了这样一个费流量的文本协议。这个文本协议叫做 Redis Serialization Protocol,简称 RESP。
Redis 协议将传输的数据结构分为 5 种最小单元,单元结束时,加上回车换行符 \r\n。
单行字符串以 + 开始,
例如 +javaboy.org\r\n
多行字符串以 $开始,后面加上字符串长度\r\n字符串\r\n
例如 $ 11\r\njavaboy.org\r\n
整数值以 : 开始,
例如 :1024\r\n
错误消息以 - 开始
数组以 * 开始,后面加上数组长度。
需要注意的是,如果是客户端连接服务端,只能使用第 5 种。
做两件事情:
为了方便客户端连接 Redis,我们关闭 Redis 中 的保护模式(在 redis.conf 文件中)
protected no
同时关闭密码:
#requirepass xxxx
配置完成后,重启 Redis。
接下来,我们通过 Socket+RESP 来定义两个最最常见的命令 set 和 get。
public class JavaboyRedisClient {
private Socket socket;
public JavaboyRedisClient() {
try {
//ip地址 + 端口号
socket = new Socket("39.97.244.45", 6379);
} catch (IOException e) {
e.printStackTrace();
System.out.println("Redis 连接失败");
}
}
/**
* 执行 Redis 中的 set 命令 [set,key,value]
* @param key
* @param value
* @return
*/
public String set(String key, String value) throws IOException {
StringBuilder sb = new StringBuilder();
sb.append("*3")//客户端给服务端只能用数组的形式
.append("\r\n")
.append("$")//多行字符串以$开头
.append("set".length())//后面加上字符串长度
.append("\r\n")
.append("set")//具体的命令
.append("\r\n")
.append("$")
.append(key.getBytes().length)
.append("\r\n")
.append(key)
.append("\r\n")
.append("$")
.append(value.getBytes().length)
.append("\r\n")
.append(value)
.append("\r\n");
System.out.println(sb.toString());
socket.getOutputStream().write(sb.toString().getBytes());
byte[] buf = new byte[1024];
socket.getInputStream().read(buf);
return new String(buf);
}
/**
* 执行 Redis 中的 get 命令 [get,key]
* @param key
* @return
*/
public String get(String key) throws IOException {
StringBuilder sb = new StringBuilder();
sb.append("*2")
.append("\r\n")
.append("$")
.append("get".length())
.append("\r\n")
.append("get")
.append("\r\n")
.append("$")
.append(key.getBytes().length)
.append("\r\n")
.append(key)
.append("\r\n");
socket.getOutputStream().write(sb.toString().getBytes());
byte[] buf = new byte[1024];
socket.getInputStream().read(buf);
return new String(buf);
}
public static void main(String[] args) throws IOException {
String set = new JavaboyRedisClient().set("k1", "liHai");
System.out.println(set);
String k1 = new JavaboyRedisClient().get("k1");
System.out.println(k1);
}
}
测试如下:
Redis 是一个缓存工具,也叫做 NoSQL 数据库,既然是数据库,必然支持数据的持久化操作。在 Redis中,数据库持久化一共有两种方案:
Redis 使用操作系统的多进程机制来实现快照持久化:Redis 在持久化时,会调用 glibc 函数 fork 一个子进程,然后将快照持久化操作完全交给子进程去处理,而父进程则继续处理客户端请求。在这个过程中,子进程能够看到的内存中的数据在子进程产生的一瞬间就固定下来了,再也不会改变,也就是为什么 Redis 持久化叫做 快照。
在 Redis 中,默认情况下,快照持久化的方式就是开启的。默认情况下会产生一个 dump.rdb 文件,这个文件就是备份下来的文件。当 Redis 启动时,会自动的去加载这个 rdb 文件,从该文件中恢复数据。具体的配置,在 redis.conf 中:
# 表示快照的频率,第一个表示 900 秒内如果有一个键被修改,则进行快照
save 900 1
save 300 10
save 60 10000
# 快照执行出错后,是否继续处理客户端的写命令
stop-writes-on-bgsave-error yes
# 是否对快照文件进行压缩
rdbcompression yes
# 表示生成的快照文件名
dbfilename dump.rdb
# 表示生成的快照文件位置
dir ./
与快照持久化不同,AOF 持久化是将被执行的命令追加到 aof 文件末尾,在恢复时,只需要把记录下来的命令从头到尾执行一遍即可。默认情况下,AOF 是没有开启的。我们需要手动开启:
# 开启 aof 配置
appendonly yes
# AOF 文件名
appendfilename "appendonly.aof"
# 备份的时机,下面的配置表示每秒钟备份一次
appendfsync everysec
# 表示 aof 文件在压缩时,是否还继续进行同步操作
no-appendfsync-on-rewrite no
# 表示当目前 aof 文件大小超过上一次重写时的 aof 文件大小的百分之多少的时候,再次进行重写
auto-aof-rewrite-percentage 100
# 如果之前没有重写过,则以启动时的 aof 大小为依据,同时要求 aof 文件至少要大于 64M
auto-aof-rewrite-min-size 64mb
同时为了避免快照备份的影响,记得将快照备份关闭:
save ""
#save 900 1
#save 300 10
#save 60 10000
正常来说,一个可以商用的数据库往往都有比较完善的事务支持,Redis 当然也不例外。相对于 关系型数据库中的事务模型,Redis 中的事务要简单很多。因为简单,所以 Redis 中的事务模型不太严格,所以我们不能像使用关系型数据库中的事务那样来使用 Redis。在关系型数据库中,和事务相关的三个指令分别是:
begin
commit
rollback
在 Redis 中,当然也有对应的指令:
multi
exec
discard
注意, Redis 中的事务并不能算作原子性。它仅仅具备隔离性,也就是说当前的事务可以不被其他事务打断。由于每一次事务操作涉及到的指令还是比较多的,为了提高执行效率,我们在使用客户端的时候,可以通过 pipeline 来优化指令的执行。Redis 中还有一个 watch 指令,watch 可以用来监控一个 key,通过这种监控,我们可以确保在 exec执行之前,watch 监控的键没有被修改过。
使用watch来监控key
public class TransactionTest {
public static void main(String[] args) {
new Redis().execute(jedis -> {
new TransactionTest().saveMoney(jedis, "lihai", 1000);
});
}
public Integer saveMoney(Jedis jedis, String userId, Integer money) {
while (true) {
jedis.watch(userId);
int v = Integer.parseInt(jedis.get(userId)) + money;
Transaction tx = jedis.multi();
tx.set(userId, String.valueOf(v));
List<Object> exec = tx.exec();
if (exec != null) {
break;
}
}
//把最新的钱数返回来
return Integer.parseInt(jedis.get(userId));
}
}
1.先在数据库中添加一条数据 set lihai 1000
2.执行代码
在分布式环境下,CAP 原理是一个非常基础的东西,所有的分布式存储系统,都只能在 CAP 中选择两项实现。
c:consistent 一致性
a:availability 可用性
p:partition tolerance 分布式容忍性
在一个分布式系统中,这三个只能满足两个:在一个分布式系统中,P 肯定是要实现的,c 和 a 只能选择其中一个。大部分情况下,大多数网站架构选择了 ap。在 Redis 中,实际上就是保证最终一致。Redis 中,当搭建了主从服务之后,如果主从之间的连接断开了,Redis 依然是可以操作的,相当于它满足可用性,但是此时主从两个节点中的数据会有差异,相当于牺牲了一致性。但是 Redis 保证最终一致,就是说当网络恢复的时候,从机会追赶主机,尽量保持数据一致。
主从复制可以在一定程度上扩展 redis 性能,redis 的主从复制和关系型数据库的主从复制类似,从机能够精确的复制主机上的内容。实现了主从复制之后,一方面能够实现数据的读写分离,降低master的压力,另一方面也能实现数据的备份。
假设我有两个redis实例,分别放在我的两台虚拟机中:
192.168.80.129 192.168.80.130
在从机的配置文件中做如下的设置
保存退出启动从机的redis服务 然后用info replication查看主从信息
主机查看主从信息
如果主机已经运行了一段时间了,并且了已经存储了一些数据了,此时从机连上来,那么从机会将主机上所有的数据进行备份,而不是从连接的那个时间点开始备份。
配置了主从复制之后,主机上可读可写,但是从机只能读取不能写入(可以通过修改redis.conf中 slave-read-only 的值让从机也可以执行写操作)。
在整个主从结构运行过程中,如果主机不幸挂掉,重启之后,他依然是主机,主从复制操作也能够继续进行。
每一个 master 都有一个 replication ID,这是一个较大的伪随机字符串,标记了一个给定的数据集。每个 master 也持有一个偏移量,master 将自己产生的复制流发送给 slave 时,发送多少个字节的数据,自身的偏移量就会增加多少,目的是当有新的操作修改自己的数据集时,它可以以此更新 slave 的状态。复制偏移量即使在没有一个 slave 连接到 master 时,也会自增,所以基本上每一对给定的Replication ID, offset 都会标识一个 master 数据集的确切版本。当 slave 连接到 master 时,它们使用PSYNC 命令来发送它们记录的旧的 master replication ID 和它们至今为止处理的偏移量。通过这种方式,master 能够仅发送 slave 所需的增量部分。但是如果 master 的缓冲区中没有足够的命令积压缓冲记录,或者如果 slave 引用了不再知道的历史记录(replication ID),则会转而进行一个全量重同步:在这种情况下,slave 会得到一个完整的数据集副本,从头开始(参考redis官网)。
简单来说,就是以下几个步骤:
可以让192.168.80.130这台虚拟机作为另一台机器的主机
那么在192.168.80.129这个虚拟机中增加数据时,后面的机器上也会有相应的数据!
我们一共介绍了两种主从模式了,但是这两种,不管是哪一种,都会存在这样一个问题,那就是当主机宕机时,就会发生群龙无首的情况,如果在主机宕机时,能够从从机中选出一个来充当主机,那么就不用我们每次去手动重启主机了,这就涉及到一个新的话题,那就是哨兵模式。所谓的哨兵模式,其实并不复杂,我们还是在我们前面的基础上来搭建哨兵模式。假设现在我的master 是192.168.80.129 从机是192.168.80.130先按照上文的步骤,我们配置好一主一仆,然后在主机 redis 目录下打开 sentinel.conf 文件,做如下配置:
其中 mymaster 是给要监控的主机取的名字,随意取,后面是主机地址,最后面的 1 表示有多少个sentinel 认为主机挂掉了,就进行切换(我这里只有一个,因此设置为 1 )。好了,配置完成后,输入如下命令启动哨兵:
然后启动我们的一主一仆架构,启动成功后,关闭 master,观察哨兵窗口输出的日志,如下:
小伙伴们可以看到, 129 挂掉之后,redis 内部重新举行了选举, 130 重新上位。此时,如果 6379重启,也不再是扛把子了,只能屈身做一个 slave 了
由于所有的写操作都是先在 Master 上操作,然后同步更新到 Slave 上,所以从 Master 同步到 Slave机器有一定的延迟,当系统很繁忙的时候,延迟问题会更加严重,Slave 机器数量的增加也会使这个问题更加严重。因此我们还需要集群来进一步提升 redis 性能,这个问题我们将在后面说到。
准备工作:
从机的配置如下:
主机的配置如下:
另外,哨兵配置的时候,监控的 master 也不要直接写 127.0.0.1,按如下方式写:
sentinel monitor mymaster 192.168.80.130 6379 1 #此时经过上面哨兵的重新选取主机,130这台机器是主机!!
此时的主从配置信息
做好准备工作,然后启动两个 redis 实例,同时启动哨兵。
测试代码:
public class Sentinel {
public static void main(String[] args) {
JedisPoolConfig config = new JedisPoolConfig();
config.setMaxTotal(10);
config.setMaxWaitMillis(1000);
String master = "mymaster";
Set<String> sentinels = new HashSet<>();
//注意还要开启虚拟机的26379端口
sentinels.add("192.168.80.130:26379");
JedisSentinelPool sentinelPool = new JedisSentinelPool(master, sentinels, config, "lihai520");
Jedis jedis = null;
while (true) {
try {
jedis = sentinelPool.getResource();
String k1 = jedis.get("name");
System.out.println(k1);
} catch (Exception e) {
e.printStackTrace();
} finally {
if (jedis != null) {
jedis.close();
}
try {
Thread.sleep(5000);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
}
}
现在来测试将主机给停掉让哨兵选取新的主机
停掉主机在哨兵还没有选出新的主机这段时间会抛出异常
当哨兵选出新的主机时
此时的主从信息
原来的主机重新启动变为了从机
Spring Boot 操作哨兵模式
添加 Spring Boot 依赖:
<dependency>
<groupId>org.springframework.bootgroupId>
<artifactId>spring-boot-starter-data-redisartifactId>
dependency>
<dependency>
<groupId>org.springframework.bootgroupId>
<artifactId>spring-boot-starter-webartifactId>
dependency>
<dependency>
<groupId>org.springframework.bootgroupId>
<artifactId>spring-boot-starter-testartifactId>
<scope>testscope>
<exclusions>
<exclusion>
<groupId>org.junit.vintagegroupId>
<artifactId>junit-vintage-engineartifactId>
exclusion>
exclusions>
dependency>
配置 Redis 连接:
spring:
redis:
password: lihai520
timeout: 5000
sentinel:
master: mymaster
# 如果有多个从机的话在后面加上逗号继续写就行了!!
nodes: 192.168.80.130:26379
测试代码:
@SpringBootTest
class SentinelApplicationTests {
@Autowired
StringRedisTemplate stringRedisTemplate;
@Test
void contextLoads() {
while (true) {
try {
String name = stringRedisTemplate.opsForValue().get("name");
System.out.println(name);
} catch (Exception e) {
} finally {
try {
Thread.sleep(5000);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
}
}
启动测试 此时没有停掉当前的主机
停掉当前的主机后,哨兵正在选取新的主机
选取成功又能查出数据
Redis 集群架构如下图:
Redis 集群运行原理如下:
所有的 Redis 节点彼此互联(PING-PONG机制),内部使用二进制协议优化传输速度和带宽
节点的 fail 是通过集群中超过半数的节点检测失效时才生效
客户端与 Redis 节点直连,不需要中间 proxy 层,客户端不需要连接集群所有节点,连接集群中任何一个可用节点即可
Redis-cluster 把所有的物理节点映射到 [0-16383]共16384个slot 上,cluster (簇)负责维护 node<->slot<-
Redis 集群中内置了 16384 个哈希槽,当需要在 Redis 集群中放置一个key-value 时,Redis 先对 key 使用 crc16 算法算出一个结果,然后把结果对 16384 求余数,这样每个 key 都会对应一个编号在 0-16383 之间的哈希槽,Redis 会根据节点数量大致均等的将哈希槽映射到不同的节点
怎么样投票
投票过程是集群中所有 master 参与,如果半数以上 master 节点与 master 节点通信超过 cluster-node-timeout 设置的时间,认为当前 master 节点挂掉。
怎么样判定节点不可用
Redis 集群管理工具 redis-trib.rb 依赖 ruby 环境,首先需要安装 ruby 环境:
安装 ruby:
yum install ruby
yum install rubygems
redis版本4才需要
首先我们对集群做一个简单规划,假设我的集群中一共有三个节点,每个节点一个主机一个从机,这样我一共需要 6 个 Redis 实例。首先创建 redis-cluster 文件夹,在该文件夹下分别创建 7001 、 7002 、7003 、 7004 、 7005 、 7006 文件夹,用来存放我的 Redis 配置文件,如下:
将 Redis 也在 redis-cluster 目录下安装一份,然后将 redis.conf 配置文件向 7001-7006 这 6 个文件夹中分别拷贝一份,拷贝完成后,分别修改如下参数:
daemonize yes
cluster-enabled yes
cluster-config-file nodes-7001.conf #集群配置文件,重新搭建集群时需要删除这种文件才行!!
cluster-node-timeout 15000
port 7001
appendonly yes
bind 192.168.80.129
requirepass lihai520
masterauth lihai520
这是 7001 目录下的配置,其他的文件夹将 7001 改为对应的数字即可。修改完成后,进入到 redis 安装目录中,分别启动各个 redis,使用刚刚修改过的配置文件,如下:
启动成功后,我们可以查看 redis 进程,如下:
ps -aux | grep redis
执行如下命令:
–cluster-replicas 1 这个配置的意思是创建一个副本 6个节点就会有3个主机3个从机
redis-cli --cluster create 192.168.80.129:7001 192.168.80.129:7002 192.168.80.129:7003 192.168.80.129:7004 192.168.80.129:7005 192.168.80.129:7006 --cluster-replicas 1 -a lihai520
集群创建成功后,我们可以登录到 Redis 控制台查看集群信息,注意登录时要添加 - c 参数,表示以集群方式连接,如下:
首先我们准备一个端口为 7007 的主节点并启动,准备方式和前面步骤一样,启动成功后,通过如下命令添加主节点:
redis-cli --cluster add-node 192.168.80.129:7007 192.168.80.129:7006 -a lihai520
主节点添加之后,我们可以通过 cluster nodes 命令查看主节点是否添加成功,此时我们发现新添加的节点没有分配到 slot,如下:
没有分配到 slot 将不能存储数据,此时我们需要手动分配 slot,分配命令如下:
redis-cli --cluster reshard 192.168.80.129:7001 --cluster-from e61ebb003bee4dd3bea9fccde8f1deb1bf04fb44 --cluster-to e6e1cfd6d36be90d18bc73f9f360b40088001e78 --cluster-slots 1024 -a lihai520
将7001的哈希槽分1024个给7007。
再准备一个7008端口的节点启动
启动
那么此时我们就要把7008节点加入进集群中并且 把它作为7007的从机 设置如下
redis-cli --cluster add-node 192.168.80.129:7008 192.168.80.129:7007 -a lihai520 --cluster-slave --cluster-master-id e6e1cfd6d36be90d18bc73f9f360b40088001e78
# e6e1cfd6d36be90d18bc73f9f360b40088001e78很明显是7007的id
删除节点也比较简单,如下:
redis-cli --cluster del-node 192.168.80.129:7007 e6e1cfd6d36be90d18bc73f9f360b40088001e78 -a lihai520
注意 e6e1cfd6d36be90d18bc73f9f360b40088001e78是要删除节点的编号。
再注意:删除已经占有 hash 槽的结点会失败,报错如下:
需要将该结点占用的 hash 槽分配出去(分配方式与上文一致,不赘述)。
public class RedisCluster {
public static void main(String[] args) {
Set<HostAndPort> nodes = new HashSet<>();
nodes.add(new HostAndPort("192.168.80.129", 7001));
nodes.add(new HostAndPort("192.168.80.129", 7002));
nodes.add(new HostAndPort("192.168.80.129", 7003));
nodes.add(new HostAndPort("192.168.80.129", 7004));
nodes.add(new HostAndPort("192.168.80.129", 7005));
nodes.add(new HostAndPort("192.168.80.129", 7006));
nodes.add(new HostAndPort("192.168.80.129", 7007));
nodes.add(new HostAndPort("192.168.80.129", 7008));
JedisPoolConfig config = new JedisPoolConfig();
//连接池最大空闲数
config.setMaxIdle(300);
//最大连接数
config.setMaxTotal(1000);
//连接最大等待时间,如果是 -1 表示没有限制
config.setMaxWaitMillis(30000);
//在空闲时检查有效性
config.setTestOnBorrow(true);
JedisCluster cluster = new JedisCluster(nodes, 15000, 15000, 5, "lihai520", config);
String set = cluster.set("shfjfahsfghj", "asffhsgfhdsgwhj");
System.out.println(set);
String k1 = cluster.get("shfjfahsfghj");
System.out.println(k1);
}
从Redis 5开始,推出了Stream。
在Stream中,有一个消息列表,所有加入链表中的消息都会被串起来。每一条消息都有一个唯一的ID,还有对应的消息内容,所谓消息内容就是键值对。
一个Stream上可以有多个消费者,每一个消费者都有一个游标,这个游标根据消息的消费情况在链表上移动。多个消费者之间互相独立互不影响。
xadd 添加消息
xdel 删除消息
xrange 获取消息列表
del 删除 Stream
1.从头部消费
2.阻塞地从尾部消费
消费组
Redis中所有地key都可以设置过期时间。
所有被设置了过期时间地key都会存放在一个独立地字典中,删除这些key有两种不同地策略:
LRU
因为Redi是基于内存的,当Redis所使用的内存超过物理内存限制之后,内存中的数据会和磁盘产生频繁的交换,这种交换会使Redis性能急剧下降,所以在实际开发中我们是不允许Redis出现交换行为的。
当Redis实际内存超过系统可用内存之后,Redis提供了几种策略 :
1.noeviction:这是默认的策略此时写操作将停止,删除和读取可以进行。
2.volatile-lru:淘汰设置了过期时间的key,最近最少使用的key会被淘汰,如果一个key没有设置过期时间,则不会被淘汰。
3.volatile-ttl:淘汰设置了过期时间的key,根据key的ttl值,ttl值越小越先被淘汰,如果一个key没有设置过期时间,则不会被淘汰。
4.volatile-random:淘汰设置了过期时间的key,随意移除设置了过期时间的key,如果一个key没有设置过期时间,则不会被淘汰。
5.allkeys-lru:淘汰所有的key也包括没有设置过期时间的key,最近最少使用的key会被淘汰。
6.allkeys-random:淘汰所有的key随机淘汰。
1.spiped
下载地址:https://github.com/Tarsnap/spiped/releases
编译安装:make && make install
生成随机的密钥文件:
dd if =/dev/urandom bs=32 count=1 of=redis.key
spiped -d -s ‘[39.97.244.45]:6479’ -t ‘[39.97.244.45]:6379’ -k redis.key