Redis是一个开源的key-value存储系统
和Memcached类似,它支持存储的value类型相对更多,包括String(字符串)、list(链表)、set(集合)、zset(sorted set—有序集合)和hash(哈希类型)
这些数据类型都支持puesh\pop、add\remove及时取交集并集和差集及更丰富的操作,而且这些操作都是原子性的
在此基础上,redis支持各种不同方式的排序
为保证效率,数据都是缓存在内存中
redis会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件
并且再次基础上实现了master-slave(主从)同步
高频次,热门访问的数据,降低数据库IO
分布式架构,做session共享
情景 | 方式 |
---|---|
最新N个数据 | 通过List实现按自然时间排序 |
排行榜,TopN | 利用zset(有序集合) |
时效性的数据,比如手机验证码 | Expire过期 |
计数器,秒杀 | 原子性,自增方法incr,decr |
去除大量数据中的重复数据 | 利用Set集合 |
构建队列 | 利用list集合 |
发布订阅消息系统 | pub\sub模式 |
Redis是单线程+多路IO复用技术
多路复用是指使用一个线程来检查多个文件描述符的就绪状态,比如调用select和poll函数,传入多个文件描述符,如果有一个文件描述符就绪,则返回,否则阻塞直到超时。得到就绪状态后进行真正的操作可以在同一线程里执行,也可以启动线程执行(比如使用线程池)
命令 | 作用 |
---|---|
select | 命令切换数据库 |
dbsize | 查看当前数据库的key的数量 |
flushdb | 清空当前库 |
flushall | 通杀当前库 |
keys * | 查看当前数据库所有的key |
exists key | 判断某个key是否存在 |
type key | 查看你的key 是什么类型 |
del key | 删除指定的key数据 |
unlink key | 根据value选择非阻塞删除,仅将keys从keyspace元数据中删除,真正的删除会在后续异步操作 |
expire key 10 | 为给定的ket设置过期时间10s |
ttl key | 查看还有多少秒过期 -1表示永不过期 -2表示已过期 |
String是redis最基本的类型,一个key对应一个value
String类型是二进制安全的。意味着redis的string可以包含任何数据。比如jpg图片或者序列化的对象
string类型是redis最基本的数据类型,一个redis中字符串value最多可以使512M
常用命令
命令 | 作用 |
---|---|
set | 添加键值对 |
*NX | 当数据库中key不存在时,可以将key-value添加数据库 |
*XX | 当数据库中key存在时,可以将key-value添加数据库,与NX参数互斥 |
*EX | key的超时秒数 |
*PX | key的超时秒数 |
get | 查询对应键值 |
append | 将给定的追加到原值的末尾 |
strlen | 获取值的长度 |
setnx | 只有在key不存在时,设置key的值 |
incr | 将key中存储的数字增1,只能对数字值操作,如果为空,新增值为1 |
decr | 将key中存储的数字值减1,只能对数字值操作,如果为空,新增值为-1 |
incrby/decrby <步长> | 将key中存储的数字值增减。自定义步长 |
所谓原子操作是指不会被线程调度机制打断的操作
这种做一旦开始,就一直运行到结束,中间不会有任何context switch(切换到另一个线程)
1)在单线程中,能够在单条指令中完成的操作都可以认为是“原子操作”,因为中断只能发生于指令之间
2)在多线程中,不能被其他进程(线程)打断的操作就叫原子操作
Redis单命令的原子性主要得益于Redis的单线程
原子性,有一个失败则都失败
String的数据结构为简单动态字符串。是可以修改的字符串,内部结构上类似于java的ArrayList,采用预分配冗余空间的方式来减少内存的频繁分配
当字符串长度小于1M时,扩容都是加倍现有的空间,如果超过1M,扩容时一次只会多扩容1M的空间。
简介
单键多值
Redis列表是简单地字符串列表,按照插入顺序排序。它底层实际上是个双向链表,对两端的操作性能很高,通过索引下标的操作中间的节点性能会较差。
常用命令
命令 | 作用 |
---|---|
Ipush/rpush… | 从左边/右边插入一个或多个值 |
Ipop/rpop | 从左边/右边吐出一个值。值在键在,值光键亡 |
rpoplpush | 从key1列表右边吐出一个值,插到key2列表左边 |
lrange | 按照索引下标获得元素 |
Irange mylist 0 -1 | 0左边第一个 -1 右边第一个 (0 -1)表示获取所有 |
llen | 获取列表长度 |
lremn | 从左边删除n个value(从左到右) |
lset | 将列表key下标为index 的值替换成value |
数据结构
list的数据结构为快速链表quickList
首先在列表元素较少的情况下会使用一块连续的内存存储,这个结构是ziplist,也即是压缩列表
它将所有的元素紧挨着一起存储,分配的是一块连续的内存
当数据量比较多的时候才会变成quicklist
Redis将链表和ziplist结合起来组成了quicklist。也就是将多个ziplist使用双向指针串起来使用。这样即满足了快速的插入删除性能,又不会出现太大的空间冗余
简介
Redis set对外提供的功能与list类似是一个列表的功能,特殊之处在于set是可以自动排重的,当你需要存储一个列表数据,又不希望出现重复数据时,set是一个很好的选择,并且set提供了判断某个成员是否在一个set集合内的重要接口,这个也是list所不能提供的。
Redis的Set是String类型的无序集合。它底层其实是一个value为null的hash表,所以添加,删除,查找的复杂度都是O(1)
常用命令
命令 | 作用 |
---|---|
sadd | 将一个或多个member元素添加到key,已经存在的member元素将被忽略 |
smembers | 取出该集合的所有值 |
sismember | 判断集合是否为含有该值, 有1 没有0 |
scard | 返回该集合的元素个数 |
srem | 删除集合中的某个元素 |
spop | 随机从该集合中吐出一个值 |
srandmember | 随机从该集合中取出n个值,不会从集合中删除 |
sinter | 返回两个集合的交集元素 |
sunion | 返回两个集合的并集元素 |
数据结构
Set数据结构是dict字典,字典是哈希表实现的
Java中hashset的内部实现使用的是hashmap,只不过所有的value都指向同一个对象。Redis的set结构也是样,它内部也是用hash结构,所有的value都指向同一个内部值
哈希Hash
Redis hash是一个键值对集合,是一个string类型的field和value的映射表,hash特别适合用于存储对象。类似java里面的Map
命令 | 作用 |
---|---|
hset | 给key集合中的filed键赋值value |
hmset | 批量设置hash的值 |
hexists | 查看哈希表key中,给定域field是否存在 |
hkeys | 列出该hash集合中的所有field |
hvals | 列出该hash集合中的所有value |
数据结构
Hash类型对应的数据结构应该是两种:ziplist,hashtable。当field-value长度较短且个数较少时,使用ziplist,否则使用hashtable
有序集合Zset
简介
Redis有序集合zset与普通集合set非常相似,是一个没有重复元素的字符串集合,不同之处是有序集合的每个成员都关联了一个评分(score),这个评分备用按照从最低分到最高分的港式排序集合中的成员。集合的成员是唯一的,但是评分可以是重复的。因为元素是有序的,所以你也可以很快的根据评分或者次序来获取一个范围的元素
访问有序集合中的中间元素也是非常快的,因此你能够使用有序集合作为一个没有重复成员的智能列表
常用命令
命令 | 作用 |
---|---|
zadd | 将一个或多个member元素及其score值加入到有序集key当中 |
zrange | 返回有续集key中,下标在start和stop之间的元素 |
zrangebyscore key minmax[withscores][limit offset count] | 返回有序集key中,所有score值介于min和max之间(包含)的成员,有序集成员按score值递增次序排列 |
zrerangebyscore key maxmin[withscores][limit offset count] | 同上,改为从大到小排序 |
zincrby | 为元素的score加上增量 |
zrem | 删除该集合下,指定值的元素 |
zcount | 统计该集合,分数区间内的元素个数 |
zrank | 返回该值在集合中的排名,从0开始 |
数据结构
zset是Redis提供的一个非常特别的数据结构,一方面它等价于java的数据结构Map
zet底层使用了两个数据结构
hash,作用是关联元素value和权重score,保障元素的唯一性,它可以通过元素value找到相应的score值
跳跃表,目的在于给元素value排序,根据score的范围来获取元素列表
有序集合在生活中比较常见,例如可以根据成绩对学生排名,根据得分对玩家排名等。对于有序集合的底层实现可以用数组,平衡术,链表等。数组不方便元素的插入,删除;平衡树或红黑树虽然效率高但是结构复杂;链表查询需要遍历所有效率低。Redis采用的是跳跃表效率堪比红黑树,实现远比红黑树简单
Redis总共支持四个日志记录级别:dubug,verbose,notie,waming。默认为notice
Redis提供了Bitmaps这个数据类型可以实现对位的操作
1)Bitmaps本身不是一种数据类型,实际上他就是字符串(key-value),但是它可以对字符串的为进行操作
2)Bitmaps单独提供了一套命令,所以在Redis中使用Bitmaps和使用字符串的方法不太相同,可以把Bitmaps想象成一个以位位单位的数组,数组的每个单元只能存储0和1,数组的下标在Bitmaps中叫做偏移量。
1、setbit
setbit设置Bitmaps中某个偏移量的值(0或1)
实例:每个独立用户是否访问过放在存放在Bitmaps中,将访问的用户记作1,没有访问的用户记作0,用偏移量作为用户的id
2、getbit
getbit获取Bitmaps中某个偏移量的值
实例:获取id=8的用户是否在2020–11-06这天访问过,返回0说明没有访问过
3、bitcount
统计字符串被设置为1的bit数,给定的整个字符串都会被进行计数,通过指定额外的start和end参数,可以上计数只在特定的位上进行。start和end参数的设置,都可以使用负数值:比如-1表示最后一个位,而-2表示倒数第二个位,start、end是指bit组的字节的下标数,二者皆包含
bitcount[start end]统计字符串从start字节到end字节比特值为1 的数量
实例:计算2020-11-06这天的独立访问用户数量
4、bitop
bitop and (or/not/xor)[key…]
bitop是一个复合操作,它可以做多个Bitmaps的and,or,not,xor操作并将结果保存在destkey中
在网站用户1亿,如独立访问的用户5千万的情况下,存储活跃用户 Bitmaps更合适 节省内存
但 假如该网站每天的独立访问用户很少,例如只有10万,那么 使用Bitmaps就不太合适,因为基本上大部分位都是0
求集合中不重复元素个数的问题称为基数问题
解决基数问题的方案
1)数据存储在MySQL表中,使用distinct count计算不重复个数
2)使用redis提供的hash、set、bitmaps等数据结构来处理
以上的方案结果精准正确,但随着数据不断增加,导致占用空间越来越大,对于非常大的数据集是不切实际的
Redis HyperLogLog是用来做基数统计的算法,优点是在传入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定的、并且是很小的。
在Redis里面,每个HyperLogLog键只需要话费12KB内存,就可以计算接近2^64个不同元素的基数。但是,因为Redis HyperLogLog只会根据输入元素来计算基数,而不会存储输入元素本身,所以HyperLogLog不能像集合那样,返回输入的各个元素
1、pfadd
pfadd[element] 添加指定元素到HyperLogLog
2、pfcount
pfcount[key…]计算HLL的祭祀基数,可以计算多个HLL,比如HLL存储每天的uv,计算一周的UV可以使用7天的UV合并计算
3、pfmerge
pfmerge[sourcekey…]将一个或多个HLL合并后的结果存储在另一个HLL中,比如每月活跃用户可以使用每天的活跃用户来合并计算可得