等概率随机函数的实现

我们知道在C语言中有rand()函数可以提供随机数,rand()函数的范围为0到32727。我们假定认为rand()产生的随机数在0到32727范围内是等概率的。如果我们需要得到一个小范围内的随机数,比如0到55之间的随机数,那我们可以采用rand()%55。但是对于我们要得到一个更大范围内的随机数,rand()便满足不了我们的要求。

1、用大的随机函数生成小的随机函数

利用等概率Rand5产生等概率Rand3
问题描述:现在有一个叫做Rand5的函数,可以生成等概率的[0, 5)范围内的随机整数,要求利用此函数写一个Rand3函数(除此之外,不能再使用任何能产生随机数的函数或数据源),生成等概率的[0, 3)范围内的随机整数。
int Rand3()
{
    int x;
    do
    {
        x = Rand5();
    } while (x >= 3);
    return x;
}
我们来证明一下:
以输出0为例,看看概率是多少。x的第一个有效数值是通过Rand5得到的。Rand5返回0的概率是1/5,如果这事儿发生了,我们就得到了0,否则只有当Rand5返回3或4的时候,我们才有机会再次调用它来得到新的数据。第二次调用Rand5之后,又是有1/5的概率得到0,2/5的概率得到3或4导致循环继续执行下去,如此反复。因此概率的计算公式为:
等概率随机函数的实现_第1张图片
计算表明,Rand3输出0的概率确实是1/3,对于另外两个数字也是一样的。计算表明,Rand3输出0的概率确实是1/3,对于另外两个数字也是一样的。

2、用小的随机函数生成大的随机函数
题目:已知有个rand7()的函数,可以生成等概率的[0,7)范围内的随机整数,让利用这个rand7()构造rand10()函数,生成等概率的[0,10)范围内的随机整数。
分析:要保证rand10()在整数0-9的均匀分布,可以构造一个0-9*n的均匀分布的随机整数区间(n为任何正整数)。假设x是这个0-9*n区间上的一个随机整数,那么x%10就是均匀分布在0-9区间上的整数。由于rand7()*7+rand7()可以构造出均匀分布在0-48的随机数(原因见下面的说明),可以将41~48这样的随机数剔除掉,得到的数0-40仍然是均匀分布在0-40的,这是因为每个数都可以看成一个独立事件。
为什么rand7()*7+rand7()可以构造出均匀分布在0-48的随机数呢?
首先rand7()得到一个离散整数集合{0,1,2,3,4,5,6},其中每个整数的出现概率都是1/7。那么rand7()*7得到一个离散整数集合A={0,7,14,21,28,35,42},其中每个整数的出现概率也都是1/7。而rand7()得到的集合B={0,1,2,3,4,5,6}中每个整数出现的概率也是1/7。显然集合A和B中任何两个元素组合可以与0-48之间的一个整数一一对应,也就是说0-48之间的任何一个数,可以唯一确定A和B中两个元素的一种组合方式,反过来也成立。由于A和B中元素可以看成是独立事件,根据独立事件的概率公式P(AB)=P(A)P(B),得到每个组合的概率是1/7*1/7=1/49。因此rand7()*7+rand7()生成的整数均匀分布在0-48之间,每个数的概率都是1/49。
然后下面的问题就是用0-48的随机数生成0-9的随机数了,前面已讲过。
int Rand10()
{
    int x;
    do
    {
        x = Rand7() * 7 + Rand7();
    } while (x >= 40);
    return x % 10;
}
归纳总结:将这个问题进一步抽象,已知random_m()随机数生成器的范围是[0, m)求random_n()生成[0, n)范围的函数,m < n && n <= m *m
int random_n()    
{    
    int val = 0;    
    int t;   //t为n的最大倍数,且满足t<m*m      
    do    
    {    
        val = m * random_m() + random_m();    
    }while(val >= t);    
    return val % n;    
}
3,不等概率生成等概率
题目:已知随机函数rand(),以p的概率产生0,以1-p的概率产生1,现在要求设计一个新的随机函数newRand(),使其以1/n的等概率产生1~n之间的任意一个数。
解决思路:可以通过已知随机函数rand()产生等概率产生0和1的新随机函数Rand(),然后调用k(k为整数n的二进制表示的位数)次Rand()函数,得到一个长度为k的0和1序列,以此序列所形成的整数即为1--n之间的数字。注意:从产生序列得到的整数有可能大于n,如果大于n的话,则重新产生直至得到的整数不大于n。
第一步:由rand()函数产生Rand()函数,Rand()函数等概率产生0和1
第二步:计算整数n的二进制表示所拥有的位数k,k = 1 +log2n(log以2为底n)
第三步:调用k次Rand()产生随机数,产生的k个01序列表示1-n之间的数
int Rand()    
{    
    int i1 = rand();    
    int i2 = rand();    
    if(i1==0 && i2==1)    
        return 1;    
    else if(i1==1 && i2==0)    
        return 0;    
    else    
        return Rand();    
    return -1;    
}  
int newRand()    
{    
    int result = 0;    
    for(int i = 0 ; i < k ; ++i)    
    {    
        if(Rand() == 1)    
            result |= (1<<i);    
    }    
    if(result > n)    
        return newRand();    
    return result;    
}
4、如何产生如下概率的随机数?0出1次,1出现2次,2出现3次,n-1出现n次?
我们注意到有如下规律:
n - 1 = (n - 1) + 0 = (n - 2) + 1 = (n - 3) + 2 = ... = 2 + (n - 3) = 1 + (n - 2) = 0 + (n - 1)
同理n-2
可以发现,满足a + b = n - i的(a, b)数对的个数为n - i + 1个。
所以我们得到如下代码:
int Rand(int n) {
   while (1) {
    int tmp1 = rand() % n;
    int tmp2 = rand() % n;
    if (tmp1 + tmp2 < n) {
      return tmp1 + tmp2; 
    }   
  }
}
5、用rand产生特别大的随机数
要求:
(1)产生一个比较大的随机数。
(2)产生的随机数在随机范围内等概率。
思路:
1>两个rand相乘
假设我们要产生一个10亿内的随机数,想到rand()可以产生0到32727,那么我们可以采用rand()*rand(),刚好能达到10亿的范围。
可是我们不难发现rand()*rand()会有问题,最大的问题是在规定范围内产生的随机数概率不等,比如一个大于32727的素数,就永远产生不了。而对于很多合数,出现的频率会非常高。
2>按位组合
首先我们找到上限数字的位数,然后对每一位产生一个0到9的随机数,并将产生的一系列0到9的数字组合起来。假设我们要产生一个10亿内的随机数,也就是我们需要产生0到999999999之间的随机数,我们首先求得999999999的位数是9位,然后我们产生9个数字,并将他们组合成一个9位数。比如:872345671,023478652。
看上去没有什么问题,我们很好地解决了一个特别的随即范围,即10亿内。假如我们现在要产生一个60000内的随机数,也就是需要产生一个0到59999之间的数。如果我们按照上述办法,如果产生的数字大于59999,同时也是5位数,比如97863,我们该怎么办?
3>求余法
我们最先想到的是,如果产生的数字(98763)对范围(60000)求余,对一个数字求余,所得到的结果肯定是落在该数字的范围内。
不难发现,我们这里同样有概率问题。对于40000到60000之间的数字,出现的概率为1/100000,对于0到40000之间的数字,出现的概率为2/100000,因此概率不等。
4>逐位检验法
我们将上限数字的逐位取出来,我们逐个产生0到该数字的随机数。对于产生0到59999只的随机数,我们先取第一位:5,我们产生一个0到5之间的随机数,第二位:9,我们产生0到9之间的随机数,最终组合出的5位则是0到59999之间。
我们发现,这也只能解决特殊的数字范围。如果我们要产生一个0到51782之间的随数,这个方法就失效了。比如33216这个数字就产生不了,因为33216第二位3比范围(51782)第二位1大,永远产生不了。
5>丢弃法
同样地,我们首先依然采用组合法产生一个规定位数的数据,如果我们发现我们产生的数字在我们的范围之外,那我们选择丢弃该数据,继续产生随机数,一直到我们产生我们在范围内的随机数。不难证明,丢弃一个不正确的数字本身并不影响产生正确数字的概率。
因此,采用组法+丢弃法能满足我们的要求。
这里只讨论了随机数的上线,对于随机数的下限同理
//产生一个0到9的随机数
static __inline int min_rand()
{
return rand()%10;
}
/*************************************************************/
/* 函数作用:产生一个range范围内的随机数 */
/* 参数1,range:取随机数的范围 */
/* 返回:返回取得的数据 */
/*************************************************************/
int my_rand(const int range)
{
short bit = 0; //纪录位数
int tempt = range;
int rand_data = 0;
while ( tempt > 0 )
{
bit++;
tempt = tempt/10;
}
while (bit–)
rand_data = 10*rand_data + min_rand();//组合随机数
if (rand_data >= range)
return my_rand(range);//产生随机数不符合范围,继续
return rand_data;
}








参考文章:
http://www.cnblogs.com/luxiaoxun/archive/2012/09/10/2678315.html
http://www.cppblog.com/myjfm/archive/2012/09/10/190092.html
http://www.gocalf.com/blog/build-rank3-from-rand5.html
http://hp.dewen.org/?p=469

你可能感兴趣的:(随机函数,等概率)