注:setbit 是按照 bit 的位置来设置1的,从左开始,第一位offset为0,第二位为1,
而bitcount 的start 和 end 是 基于byte的,所以setbit的 offset和bitcount命令的 start/end 有相差8的倍数
即 bitcount xx 0 2 的话,计算的是bit offset从0到15的2个byte中bit为1的数量
setbit 可以理解是一个位数组,至于这个数组有多大,redis中bit映射被限制在512MB之内,所以最大是2^32。也就是在这样一个位数组上存0或者是1 ,可以结合bloomFilter的应用场景理解位数组的用法,将字符串使用一种合适哈希函数映射到不同的bit位上(2^32足够的大,可以满足需求)
1.SETBIT key offset value
对 key 所储存的字符串值,设置或清除指定偏移量上的位(bit)。
在redis中,存储的字符串都是以二级制的进行存在的。
举例:
设置一个 key-value ,键的名字叫“andy” 值为字符'a'
我们知道 'a' 的ASCII码是 97。转换为二进制是:01100001。offset的学名叫做“偏移” 。二进制中的每一位就是offset值啦,比如在这里 offset 0 等于 ‘0’ ,offset 1等于'1' ,offset2等于'1',offset 6 等于'1' ,没错,offset是从左往右计数的,也就是从高位往低位。
我们通过SETBIT 命令将 andy中的 'a' 变成 'b' 应该怎么变呢?
也就是将 01100001 变成 01100010 (b的ASCII码是98),这个很简单啦,也就是将'a'中的offset 6从0变成1,将offset 7 从1变成0 。
果然,就从'a' 变成 'b'了。
这就是redis 中 “SETBIT” 的基本用法。
2. BITCOUNT 就是统计字符串的二级制码中,有多少个'1'。
所以在这里,BITCOUNT andy 得到的结果就是 3 啦。
3.1 BITCOUNT key [start end]
从左向右从0开始,从右向左从-1开始,注意start和end是字节
BITCOUNT testkey 0 0 表示从索引0个字节到索引0个字节,就是第一个字节的统计
BITCOUNT testkey 0 -1 等同于BITCOUNT testkey
最常用的就是BITCOUNT testkey
3.3 实例解析
3. Getbit 命令用于对 key 所储存的字符串值,获取指定偏移量上的位(bit)。
4、BITOP
4.1对一个或多个保存二进制位的字符串key进行位元操作,并将结果保存到destkey上。
operation可以是AND、OR、NOT、XOR这四种操作中的任意一种。
BITOP AND destkey key [key ...] ,对一个或多个key求逻辑并,并将结果保存到destkey
BITOP OR destkey key [key ...] ,对一个或多个key求逻辑或,并将结果保存到destkey
BITOP XOR destkey key [key ...] ,对一个或多个key求逻辑异或,并将结果保存到destkey
BITOP NOT destkey key ,对给定key求逻辑非,并将结果保存到destkey
除了NOT操作外,其他操作都可以接受一个或多个key作为输入
当BITOP处理不同长度的字符串时,较短的那个字符串所缺少的部分会被看做0
空的key也被看作是包含0的字符串序列
bitset的使用场景
假设这样一个场景,假如每个网站有1亿的用户,那么我们怎么来统计这个网站的日登陆数或者说有哪些用户登录过这个网站。
最常见的做法就是设计一张用户登录表:
user_login:
user_uid login_date
0 2017-7-1
1 2017-7-1
0 2017-7-2
如果平均一个人一天登录1次,那么1亿个用户一个星期就会产生1 * 1 * 7 = 7亿条数据,一个月就会产生30亿条数据,这对数据库的压力是很大的,只是统计一下用户登录,没必要花费这么多的资源。
这个时候我们就可以用reids 的bitmap来解决。
用户是否登录可以用0/1来表示,0代表用户不登陆,1表示登录,那么1bit 就可以表示用户是否登录。
1亿个用户一天的数据量也就 1 0000 0000bit = 11.92m,也就是说用户一天的登录信息也就产生11.92m的数据量。一个月也就357.63m的数据量。
具体实现过程(为了实验方便,我们就假设4个用户0,1,2,3,统计两天的登录量):
mon: 1010 (用户0未登录,用户1登录,用户2未登录,用户3登录)
tue: 1101 (用户0登录,用户1未登录,用户2登录,用户3登录)
如果要统计这两天都登陆的用户:
可以看到mon 和 tue做and运算,得到结果result 为 :1000,则表示用户3连续两天都登陆,其他用户两天中只有一天登录。