解题笔记(3)——随机数选择

       问题: 从0, 1 ,2 ... n-1中随机选择m个数,每个数选中的概率要求一样,而且不允许重复。选中的数按顺序输出。比如,0, 1, 2, 3, 4, 5中随机选3个数,如果选的是1,4, 5,那么输出的顺序也应该是1, 4, 5。下面实现中,用的随机函数都是C的库函数,这个函数产生的随机数的范围是限定的,[0, 32767],如果要产生更大的随机数,需另外实现随机函数,将rand() 替换掉。比如下面这个函数。

int bigrand()
{
	return RAND_MAX*rand()+rand();
}

《编程珠玑》上的解法一

void random1(int n,int m)
{
	for(int i=0;i<n;i++)
	{
		if(rand()%(n-i)<m)
		{
			cout<<i<<' ';
			m--;
		}
	}
}

        简单说明一下每个数选中的概率是一样的。计算公式为 p(i) =  (m - (m/n)*i)/ (n-i) = m/n,其中m - (m/n)*i 为剩余可选数的个数。

        如果n很大,m相对比较小,解法1的时间复杂度有点大。

《编程珠玑》上的解法二

void random2(int n,int m)
{
	set<int> s;
	while(s.size()<m)
		s.insert(rand()%n);

	set<int>::iterator iter=s.begin();
	for(;iter!=s.end();iter++)
		cout<<*iter<<' ';
}

        set 的底层是红黑树,插入一个元素的时间复杂度为O(logn),因此解法二的时间复杂度为 O(m logm)。但是set消耗的空间比较大。如果对于空间比较敏感,则不适合用这种方法。

        解法3需要换种思路,弄乱n个数组元素,然后将前m个元素排序,输出即可。

《编程珠玑》上的解法三

void random3(int n,int m)
{
	int i;
	int *x=new int[n];
	for(i=0;i<n;i++)
		x[i]=i;
	for(i=0;i<m;i++)
	{
		int j=i+rand()%(n-i); //随机产生 i 到 n-1 的数
		if(i!=j)
		{
			int t=x[i];
			x[i]=x[j];
			x[j]=t;
		}
	}
	sort(&x[0],&x[m]);
	for(i=0;i<m;i++)
	     cout<<x[i]<<' ';
}

       该算法使用O(n)的空间,以及O(n+mlogm)时间复杂度,如果能消除初始化的时间,那么时间复杂度可以降到O(mlogm)。

       如果n很大,m也很大。可以这样解决。随机产生n-m个数,然后输出n中其他的数。


       本人享有博客文章的版权,转载请标明出处 http://blog.csdn.net/wuzhekai1985



 


你可能感兴趣的:(编程,c,算法,Random,iterator,ini)