redis bitmaps(译文)

Bitmaps

原文链接请猛戳这里

bitmaps不是一种实际的数据类型,本质上说,它是定义在字符串类型上的一组位操作方法。单个bitmaps的最大长度是512MB,即2^32个比特位。

有两种类型的位操作:一类是对特定bit位的操作,比如设置/获取某个特定比特位的值。另一类是批量bit位操作,例如在给定范围内统计为1的比特位个数。

bitmaps的最大优势是节省存储空间。例如,在一个以自增id代表不同用户的系统中,我们只需要512MB空间就可以记录40亿用户的某个单一信息(比如,用户是否希望接收新闻邮件)。

可以通过setbit和getbit命令对bitmaps进行设置和读取:

> setbit key 10 1
(integer) 1
> getbit key 10
(integer) 1
> getbit key 11
(integer) 0

setbit命令接收两个参数,第一个参数表示你要操作的是第几个bit位,第二个参数表示你要将这个位设为何值,可选值只有0,1两个。如果所操作的bit位超过了当前字串的长度,reids会自动增大字串长度。

getbit只是返回特定bit位的值。如果试图获取的bit位在当前字串长度范围外,该命令返回0。

有三个命令可以操作成组的bit位:
- 1.bitop:对两个不同字串进行位运算。可进行的运算有AND, OR, XOR以及NOT。
- 2.bitcount: 给出被设置为1的bit位的个数
- 3.bitpos: 查找第一个值为0/1的比特位的位置

我们可以为bitpos和bitcount指定查找范围。下面是一个bitcount的例子:

> setbit key 0 1
(integer) 0
> setbit key 100 1
(integer) 0
> bitcount key
(integer) 2

通常你可能在这些地方用到bitmaps:
- 各种实时统计分析
- 与id相关的bool信息,要求高效操作且节省存储空间。

例如你想知道自己网站用户的最长连续访问天数。从0开始计数,每当有用户访问时,使用setbit设置一个bit位,bit位的index可以这样生成:(当前unix时间戳-计数开时时的时间戳)/(3600*24)。

通过这种方法,你可以获取每个用户的每日来访记录。使用bitcount可以很容易的统计出某个特定用户的来访天数。使用几个bitpos命令,或者直接获取并分析对应的位图,就可以很容易的算出最长连续访问天数。

bitmaps通常被分割成多个key,以免单个key中存放的数据过大。有一个分割key的小技巧:每个key存放M个bit位,key以”比特数(bit-number)/M”命名。第N个bit位,对应key中的位置用”比特数(bit-number)模M”获得。

例:(译者增加)

假设我们每个key只存储100位,现在有一个id为8303的用户来访问。那么这个用户对应的key应该是83(8303/100),在key:83中,与之对应的位置应该是3(8303 mod 100)。使用如下命令记录该用户访问:

setbit 83 3 1

你可能感兴趣的:(nosql)