等概率随机排列数组(洗牌算法)

又是一道跟概率相关的简单问题。话说我的概率学的太差了,趁这个机会也从头开始补习一下。

问题描述:假设有一个数组,包含n个元素。现在要重新排列这些元素,要求每个元素被放到任何一个位置的概率都相等(即1/n),并且直接在数组上重排(in place),不要生成新的数组。用 O(n) 时间、O(1) 辅助空间。

算法是非常简单了,当然在给出算法的同时,我们也要证明概率满足题目要求。

先想想如果可以开辟另外一块长度为n的辅助空间时该怎么处理,显然只要对n个元素做n次(不放回的)随机抽取就可以了。先从n个元素中任选一个,放入新空间的第一个位置,然后再从剩下的n-1个元素中任选一个,放入第二个位置,依此类推。

按照同样的方法,但这次不开辟新的存储空间。第一次被选中的元素就要放入这个数组的第一个位置,但这个位置原来已经有别的(也可能就是这个)元素了,这时候只要把原来的元素跟被选中的元素互换一下就可以了。很容易就避免了辅助空间。

用Python来写一段简单的程序描述这个算法:

 
  
1
2
3
4
5
6
7
from  random  import Random

def Shuffle (li ):
  rand  = Random ( )
   for x  in  xrange ( len (li ) -  1 ,  0 , - 1 ):   # 逆序遍历li
    y  = rand. randint ( 0 , x )               # 从剩余数据中随机选取一个
    li [x ] , li [y ]  = li [y ] , li [x ]          # 将随机选取的元素与当前位置元素互换

主要的代码仅仅三行而已,浅显易懂。

来计算一下概率。如果某个元素被放入第i(1in)个位置,就必须是在前 i - 1 次选取中都没有选到它,并且第 i 次选取是恰好选中它。其概率为:

pi=n1n×n2n1××ni+1ni+2×1ni+1=1n

可见任何元素出现在任何位置的概率都是相等的。

实际上Python用户一定知道,在Random类中就有现成的shuffle方法,处理方法与我上面的程序是一样的。顺便也贴在这里学习一下。以下代码来自于 Python 2.5 Lib\random.py:

 
  
250
251
252
253
254
255
256
257
258
259
260
261
262
def shuffle ( self , x ,  random = None ,  int = int ):
   """x, random=random.random -> shuffle list x in place; return None.

  Optional arg random is a 0-argument function returning a random
  float in [0.0, 1.0); by default, the standard random.random.
  """


   if  random  is  None:
     random  =  self. random
   for i  in  reversed ( xrange ( 1 ,  len (x ) ) ):
     # pick an element in x[:i+1] with which to exchange x[i]
    j  =  int ( random ( ) *  (i+ 1 ) )
    x [i ] , x [j ]  = x [j ] , x [i ]

你可能感兴趣的:(有趣的题目,算法,random,returning,python,exchange,function)