40亿的QQ账号上线下线,怎么找到一天内上线两次及以上的QQ号码?

腾讯某次面试题。

如题,解决方案1:

简单思路:在linux下利用命令进行查询,首先将上线QQ号码进行排序(sort),然后再去重(uniq -c),加-c选项是将重复次数输出到第一列中,然后再按重复次数进行选择,重复次数大于等于2次的,就是一天内上线两次的QQ号码。

缺点:方案1中效率太差,40亿用户进行排序,时间空间耗费太大。不建议采纳。

 

解决方案2:

利用bitmap的思想,给每一个QQ分配两位bit,即四种状态:00(没出现过),01(出现了一次),10(出现两次),11(出现两次以上)。  只需要三种状态即可。

遍历每个号码,当此号码没出现时,使其对应的两个bit位置成01,;当此号码出现,并且对应的次数是01时,此号码的次数+1,两个比特位变成10,;当此号码出现,并且对应次数是10时,不再加1。 

然后遍历所有号码对应的比特位,次数等于2次的就是要找的QQ号码。

你可能感兴趣的:(数据结构与算法)