redis自身是一个Map类型的存储方式,其中所有的数据都是采用key:value的形式存储,本次讨论的数据类型指的是存储的数据的类型,也就是value部分的类型,key部分永远都是字符串
redis中文文档:http://shouce.jb51.net/redis-chinese-doc/
redis 命令手册:https://www.redis.com.cn/commands.html
Redis的字符串是动态字符串,是可以修改的字符串,它的内部表示就是一个字符数组,
它的内部结构是一个带长度信息的字节数组
可以包含任何数据,比如jpg图片或者序列化的对象,规定字符串的长度不得超过512MB。Redis的字符串有两种存储方式,在长度特别短时,使用 embstr形势存储,而长度超过44字节时候,使用 raw形势存储
List的结构底层实现不是一个简单的LinkedList,而是快速链表(quicklist), 首先在列表元素较少的情况下,会使用一块连续的内存存储,这个结构是ziplist,即压缩列表,它将所有的元素彼此紧挨着一起存储,分配的是一块连续的内存;当数据量比较多的时候才会改成quicklist
增删快,提供了操作某一段元素的API
普通的链表需要的附加指针空间太大,会浪费空间,加重内存的碎片化。Redis将链表和ziplist结合起来组成了quicklist,也就是将多个ziplist使用双向指针串联起来使用,既满足了快速的插入删除性能,又不会出现太大的空间冗余
字典结构内部包含了两个Hashtable,通常情况下只有一个Hashtable是有值的,
但是在字典扩容缩容时候,需要重新分配新的Hashtable,然后进行渐进式搬迁,这时候两个Hashtable存储的分别是旧的Hashtable和新的Hashtable;待搬迁结束后,旧的Hashtable被删除,新的Hashtable取而代之
适合存储对象,并且可以像数据库中update一个属性一样只修改某一项属性值(Memcached中需要取出整个字符串反序列化成对象修改完再序列化存回去)。
大字典的扩容是比较耗时的,需要重新申请新的数组,然后将旧字典所有链表中的元素重新挂接到新的数组下面,这是一个O(n)级别的操作,作为单线程的Redis很难承受这样耗时的过程,所以Redis使用 渐进式rehash 小步搬迁虽然慢一点,但是肯定可以搬完
Redis的集合,内部的键值对是无须的、唯一的, Set的结构底层实现是字典,只不过所有的value都是NULL,其他的特性和字典一摸一样
添加、删除、查找的复杂度都是O(1)
为集合提供了求交集、并集、差集等操作
当set集合容纳的元素都是整数并且元素个数较少时,Redis会使用intset来存储集合元素。intset是紧凑的数组结构,同时支持16位,32位和64位整数
Redis有序列表类似go的结合体,一方面是一个set,保证内部value的唯一性,另一方面可以给每个value赋予一个score,代表这个value的排序权重, 它的内部实现是一个Hash字典 + 一个跳表
数据插入集合时,已经进行天然排序
Redis的跳表共有64层,能容纳2的64次方个元素
Redis之所以用跳表来实现有序集合,是因为:
1. 插入、删除、查找以及迭代输出有序序列这几个操作,红黑树都能完成,时间复杂度跟跳表是一样的。但是按照区间来查找数据,红黑树的效率就没有跳表高
2. 跳表更容易代码实现,比起红黑树来说还是好懂、好写很多,可读性好,不容易出错
3. 跳表更加灵活,可以通过改变索引构建策略,有效平衡执行效率和内存消耗
存储的数据:单个数据,最简单的数据存储类型,也是最常用的数据存储类型
存储数据的格式:一个存储空间保存一个数据
存储内容:通常使用字符串,如果字符串以整数的形式展示,可以作为数字操作使用(但是仍是字符串)
set key value
get key
mset key1 valueq key2 value2 …
mget key1 key2 …
strlen key
append key value
大型企业级应用中,分表操作是基本操作,使用多张表存储同类型数据,但是对应的主键id必须保证统一性,不能重复。
Oracle数据库具有sequence设定,可以解决该问题,但是MySQL数据库并不具有类似的机制,那么如何解决?
设置数值数据增加指定范围的值
设置数值数据减少指定范围的值
string在redis内部存储默认就是一个字符串,当遇到增减类操作incr,decr时会转成数值型进行计算
redis所有的操作都是原子性的,采用单线程处理所有业务,命令是一个一个执行的,因此无需考虑并发带来的数据影响。
按数值进行操作的数据,如果原始数据不能转成数值,或超过了redis数值上线范围,将会报错。9223372036854775807
场景一:“某某综艺”,启动海选投票,只能通过微信投票,每个微信号每4个小时只能投1票
场景二:电商商家开启热门商品推荐,热门商品不能一直处于热门期,每种商品热门期维持3天,3天后自动取消热门
场景三:新闻网站会出现热点新闻,热点新闻最大的特征是对时效性,如何自动控制热点新闻的时效性
给用户设置一个唯一的id,并为其设置一个有效时长,当时间已经超过设定时间后将id删除
设置数据具有指定的声明周期,redis 控制数据的生命周期,通过数据是否失效控制业务行为,适用于所有具有时效性限定控制的操作
setex key seconds value //增加、修改键值对并为其设定生命周期
psetex key milliseconds value //功能与上面一直,秒的单位不同
数据操作成功与否的反馈
(integer)0 –> false 失败
(integer)1 –> true 成功
(integer)3 –> 3 3个
(integer)1 –> 1 1个
数据未获取到
(nil)等同于null
主页高频访问信息显示控制,例如微博大V主页显示粉丝数与微博数量,这些数据就是热度数据,不断发生变化,这些数据如何放入Redis?
user: id :5765898790:focuss:3050
user: id :5765898790:fans:117492300
user: id :5765898790:blogs:117744
set user: id :5765898790 {id:5765898790,focuss:3050,fans:117492300,blogs:117744}
数据库中的热点数据key命名惯例:
String类型存储的困惑:对象类数据的存储如果具有较为频繁的更新需求,操作会显得笨重,存容易,改麻烦;故引入hash,为了区别与Redis中的键值对的称呼,hash中的键成为field,而key为Redis的键名;
新的存储需求:对一系列存储的数据进行编组,方便管理,典型应用存储对象信息
需要的内存结构:一个存储空间保存多少个键值对数据
hash类型:底层使用哈希表结构实现数据存储
所有hash命令都是以H开头
hset key field value
hget key field
hgetall key
hmset key field1 value1 field2 calue2
hmget key field1 field2 …
hlen key
hkeys key //字段名
hvals key //字段值
hincrby key field increment //指定数值增长指定的数
hincrbyfloat key field increment
user1年龄增加2岁,再增加0.5岁:
(1).hash类型下的value只能存储字符串,不允许存储其他类型数据,不存在嵌套现象。如果数据未获取到,对应的值为(nil)
(2).每个hash可以存储232-1个键值对
(3).hash类型十分贴近对象的数据存储形式,并且可以灵活添加删除对象属性。但hash设计不是为了存储大量对象的,切记不可滥用,更不可以将hash作为对象列表使用
(4).hgetall操作可以获取全部属性,如果内部fiekd过多,遍历整体数据效率就会很低,有可能成为数据访问瓶颈
例如创建一个购物车:
当前仅仅是将数据存储到redis中,并没有起到加速的所用,因为我们仅仅查询到了用户的id和商品的id,显示的时候显示的用户名和商品的名称,商品信息还需要二次查询数据库
每条购物车中的商品记录保存成两条field
field1 专用于保存购买数量
(1).命名格式:商品id:nums
(2).保存数据:数值
field2 专用于保存购物车中显示的信息,包含文字描述,图片地址,所属商家信息等等
(1).命名格式:商品id:info
(2).保存数据:json
但是出现很多用户都将同一个商品加入购物车,就会出现大量的重复信息,例如商品信息重复:
因此我们可以将商品的信息单独的保存成一个哈希
创建数据,如果有则不再创建,如果没有则创建
hsetnx key field value
步骤:
(1).以商家id作为key
(2).将参与抢购的商品id作为field
(3).将参与抢购的商品数量作为对应的value
(4).抢购时使用降值的方式控制产品数量
数据存储需求:存储多个数据,并对数据进入存储空间的顺序进行区分
需要的存储数据:一个存储空间保存多个数据,且通过数据可以体现进入顺序
list类型:保存多个数据,底层使用双向链表存储结构实现
lpush key value1 [value2] …
rpush key value1 [value2] …
lrange key start stop //获取从左数第start到stop个元素,从0开始
lindex key index //查询第i个元素
llen key //list的长度
lpop key //获取并删除左边第一个元素
rpop key //获取并删除右边第一个元素
blpop key1 [key2] timeout
brpop key1 [key2] timeout
阻塞式获取,在规定时间内获取这个值,规定时间内如果还没有的时候可以等,直到有值就可以获取到获取超时获取为空。
开两个客户端,一个设置15s内获取list1中的值,此时list1位空一直等待(阻塞),在15秒内另一个客户端存入到list1中数据,此时就被获取到。
(1).list 中保存的数据都是string类型的,数据总容量式是有限的,最多232-1个元素(4294967295)
(2).list具有索引的概念,但是操作数据时候通常以队列的形式进行入队出队操作,或以栈的形式进入栈出栈的操作
(3).获取全部数据操作结束索引设置为-1
(4).list 可以对数据进行分页操作,通过第一页的信息来自list,第2页及更多的信息通过数据库的形式加载
微信朋友圈点赞,要求按照点赞顺序显示点赞好友信息,如果取消点赞,移除对应好友信息
lrem key count value //count为移除的数量,value为移除哪个值
twitter、新浪微博、腾讯微博中个人用于的关注列表需要按照用户的关注顺序进行展示,粉丝列表需要将最近关注的粉丝列在前面
新闻、资讯类网站如何将最新的新闻或资讯按照发生的事件顺序展示
企业运营过程中,系统将产生出大量的运营数据,如何保障堕胎服务器操作日志的统一顺序输出?
(1).依赖list的数据具有顺序的特征对信息进行管理
(2).使用队列模型解决多路信息汇总合并的问题
(3).使用栈模型解决最新消息的问题
新的存储需求:存储大量的数据,在查询方面提供更高的效率
需要的存储结构:能够保存大量的数据,搞笑的内部存储机制,便于查询
set类型:与hash存储结构完全相同,仅存储键,不存储值(nil),并且值式不允许重复的。也就是只有键没有值的hash
sadd key menber1 [member2]
smembers key
srem key member1 [member2]
scard key
sismember key member
srandmember key [count]
spop key
sinter key1 [key2] //交集
sunion key1 [key2] //并集
sdiff key1 [key2] //差集(key1有但是key2没有的)
sinterstore destination key1 [key2]
sunionstore destination key1 [key2]
sdiffstore destination key1 [key2]
smove source destination member
(1).set类型不允许数据重复,如果添加的数据在set中已经存在,将只保留一份
(2).set虽然与hash的存储结构相同,但是无法启用hash中存储值的空间
每位用户首次使用进入头条时候会设置3项爱好的内容,但是后期为了增加用户的活跃度,兴趣点,必须让用户对其他信息类别逐渐产生兴趣,增加客户留存度,如何实现?
系统分析出各个分类的最新或最热点信息条目并组织成set集合
随机挑选其中部分信息
配合用户关注信息分类中的热点信息组织展示的全信息集合
srandmember key [count]
spop key
redis应用于随机推荐类信息检索,例如热点歌单推荐,热点新闻推荐,热点旅游线路,应用APP推荐,大V推荐等
sinter key1 [key2] //交集
sunion key1 [key2] //并集
sdiff key1 [key2] //差集(key1有但是key2没有的)
sinterstore destination key1 [key2]
sunionstore destination key1 [key2]
sdiffstore destination key1 [key2]
smove source destination member
redis应用于同类信息的关联搜索,二度关联搜索,深度关联搜索
显示共同关注(一度)
显示共同好友(一度)
由用户A出发,获取到好友用户B的好友信息列表(一度)
由用户A出发,获取到好友用户B的购物清单列表(二度)
由用户A出发,获取到好友用户B的游戏充值列表(二度)
依赖set集合数据不重复的特征,依赖set集合hash存储结构特征完成数据过滤与快速查询
根据用户id获取用户所有角色
根据用户所有角色获取用户所有操作权限放入set集合
根据用户所有觉得获取用户所有数据全选放入set集合
两种方法,其中第二种耦合度太高
针对不同的统计类型有不同的数据存储方式:
利用set集合的数据去重特征,记录各种访问数据
建立string类型数据,利用incr统计日访问量(PV)
建立set模型,记录不同cookie数量(UV)
建立set模型,记录不用IP数量(IP)
基于经营战略设定问题用户发现、鉴别规则
周期性更行满足规则的用户黑名单,加入set集合
用户行为信息达到后与黑名单进行比比对,确认行为去向
黑名单过滤IP地址:应用于开放游客访问权限的信息源
黑名单过滤设备信息:应用于限定访问设备的信息源
黑名单过滤用户:应用于基于访问权限的信息源
新的存储需求:根据排序有利于数据的有效显示,需要提供一种可以根据自身特征进行排序的方式
需要的存储结构:新的存储模型,可以保存可排序的数据
sorted_set类型:在set的存储结构基础上添加可排序字段
score只存储其顺序
zadd key score1 member1 [score2 member2]
zrange key start stop [WITHSCORES]//按照从小到大的顺序,加上WITHSCORES,就会带上scores一起显示
zrevrange key start stop [WITHSCORES]//按照从大到小的顺序
zrem key member [member …]
//查询scores在某个范围内的值
zrangebyscore key min max [WITHSCORES] [LIMIT]
//查询key某个索引范围内的值
zrevrangebyscore key max min [WITHSCORES]
zremrangebyrank key start stop
zremrangebyscore key min max
注意:
min与max用于限定搜索查询的条件
start与stop用于限定查询范围,作用于索引,表示开始和结束索引
offset与count用于限定查询范围,作用于查询结果,表示开始位置和数据总量
zcard key //获取总量
zcount key min max //获取某一个范围的总量
zinterstore destination numkeys key [key …] //求和
zunionstore destination numkeys key [key …]
(1).score 保存的数据存储空间是64位
(1).score保存的数据也可以是一个双精度的double值,基于双精度浮点数的特征,可能会丢失精度,使用时侯要慎重
(1).sorted_set底层存储还是基于set结构的,因此数据不能重复,如果重复添加相同的数据,score值将被反复覆盖,保留最后一次修改的结果
zrank key member //正数第几位
zrevrank key member //倒数第几位
zscore key member //获取
zincrby key increment member //score递增 increment
对于基于时间线限定的任务处理,将处理时间记录为score值,利用排序功能区分处理的先后顺序记录下一个要处理的事件,当对比系统时间发现当然仍后到期后移除redis中的记录,并记录下一个要处理的时间,当新任务加入时,判定并更新当前下一个要处理的任务时间,为提升sorted_set的性能,通常将任务根据特征存储成若干个sorted_set.例如1小时内,1天内,年度等,操作时逐渐提升,将即将操作的若干个任务纳入到1小时内处理队列中
time命令获取当前系统时间
数据类型实践案例
如何实现这个每分钟只能调用10次呢?
设计计数器,记录调用次数,用于控制业务执行次数。以用户id作为key,使用此时作为value,在调用前获取次数,判断是否超过限定次数,不超过次数的情况下,每次调用计数+1,业务调用失败,不递增,为了计数器设置生命周期为指定周期,例如10次/分钟,自动清空周期内使用次数
利用可以存储的最大值是9223372036854775807,超过这个值就会抛出异常的特性。假如一分钟只能访问5次,可以将初始值设置为9223372036854775802,每次访问都加1,访问5次后这个数就会溢出异常
依赖list的数据具有顺序的特征对消息进行管理,将list结构作为栈使用
对指定与普通会话分别创建独立的list分别管理
当某个list中接收到用户消息后,将消息发送方的id从list的一侧加入list(此处设定左侧)
多个相同id发出的消息反复入栈会出现问题,在入栈之前无论是否具有当前id对应得消息,先删除对应id
推送消息时先推送顶置会话list,再推送普通会话list,推送完成的list清除所有数据
消息的数量,也就是微信用户对话数量采用计数器的思想另行记录,伴随list操作同步更新