蓄水池抽样算法

题目:在一个源源不断的数据流中,会吐出带有编号的球,现在问你 在不知道具体有多少个球的情况下,如何等概率的抽出10个球?

例题:leetcode 382题

应用场景:比如在某个游戏的抽奖活动中,游戏官方并不知道有多少用户会参与抽奖活动,而抽奖活动又在晚上12点结束时,并同时发布所有的中奖用户(也就是没时间去一个个计算用户数量并抽奖),请设计一个合理的算法实现这个场景。

算法实现:假设要等概率抽10个球,那么 1~10号球,百分之百能被选中,假设现在 来到了 第 i号球(i>10),那么第i号球被选中的概率就是 10 / i,而对于 已经被选择的10个球中,每一个球都有1 / 10的概率被 第i号球替换掉,所以已经被选中的10个球,在第i号球到来的时候,都有 1 / i 的概率被替换掉,那么也就是有 10 / i 的概率存活下来。如下图:

你可能感兴趣的:(数据结构与算法,算法)