前言
在工作中我们经常遇到这样的需求,要对某个在线网站的活跃用户数量进行统计。这里我们以redis为例,说明一下其实现的过程。
实现方法
在Redis中存在bitmap这种数据类型,这种数据类型是建立在string数据类型之上的。这里,我们主要用到setbit、bitcount这2个命令,而使用的客户端为python的redis库。
import redis r = redis.StrictRedis(host="127.0.0.1",port=6379,db=0)
这里我们引入redis库,然后实例化了1个StrictRedis类。由于这里使用的默认的选项,我们可以在StrictRedis不传入任何参数。
r = redis.StrictRedis()
这里我们定义3个方法storeDailyVisit,removeDailyVisit和countVisits,分别用于用户上线时进行记录、用户下线时进行记录以及查看指定日期活跃的用户总数。
下面我们来看storeDailyVisit函数:
def storeDailyVisit(date,userId,verbose=False): key = "visits:daily:"+date r.setbit(key,userId,1) if verbose: print("User",userId,"visited on",date)
该函数接收2个参数date和userId,分别为指定的日期和用户的ID,第3个参数用于指定是否输出内容。在这里我们输出用户访问的信息,当然我们可以将其记录在日志中等其他操作。
当某个用户登录后,我们调用该函数,传入今天的日期及用户的ID。removeDailyVisit函数与storeDailyVisit函数类似,它主要负责当用户退出当前网站时将其从bitmap表中移除。
def removeDailyVisit(date,userId,verbose=False): key = "visits:daily:"+date r.setbit(key,userId,0) if verbose: print("User",userId,"leave on",date)
下面我们通过countVisits函数得到当前活跃的用户的数量:
def countVisits(date): key = "visits:daily:"+date return r.bitcount(key)
这里,countVisits函数接收1个日期的参数,它通过调用bitmaps数据类型的bitcount函数得到当前数字为1的个数。这里我们将它返回给调用者。
由于bitmaps是1种按位进行操作的数据类型,其是1串连续的二进制数字(0或1)。我们通过对其某个位上的数值进行设置为1,然后通过bitcount函数统计这串二进制数字上为1的总数,从而得到当前活跃的用户总数。
另外,我们还可以使用redis的set数据类型来实现同样的操作,我们可以通过下表来查看这二者的差别:
| 数据类型 | 每个消耗的位 | 存储用户 | 消耗的内存 | |―――-|―――――|――――|――――――| | bitmap | 1bit | 500000000 |1*500000000B=59.6Mb| | set | 32bit | 500000000 |32*500000000B=1.91Tb|
我们可以清楚的看到,当存储的用户为5个亿的时候,需要消耗的内存bitmap为59.6MB,而set为1.91TB,整整32倍。因此,在实际的在线网站中,我们更多使用的是bitmaps统计在线用户的数量。
参考文章:http://redis.io/topics/data-types-intro#bitmaps
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流。