numpy中的random.choice()函数

介绍
random.choice()函数:从给定的1维数组中随机采样的函数。

参数
numpy.random.choice(a, size=None, replace=True, p=None)

a : 如果是一维数组,就表示从这个一维数组中随机采样;如果是int型,就表示从0到a-1这个序列中随机采样。
size : 采样结果的数量,默认为1.可以是整数,表示要采样的数量;也可以为tuple,如(m, n, k),则要采样的数量为m * n * k,size为(m, n, k)。
replace : boolean型,采样的样本是否要更换?这个地方我不太理解,测了一下发现replace指定为True时,采样的元素会有重复;当replace指定为False时,采样不会重复。
p : 一个一维数组,制定了a中每个元素采样的概率,若为默认的None,则a中每个元素被采样的概率相同。

例子
从大小为3的np.arange(5)生成一个均匀的随机样本:

>>> np.random.choice(5, 3)
array([0, 3, 4])
>>> #This is equivalent to np.random.randint(0,5,3)

从大小为3的np.arange(5)生成一个非均匀的随机样本:

>>> np.random.choice(5, 3, p=[0.1, 0, 0.3, 0.6, 0])
array([3, 3, 0])

从大小为3的np.arange(5)生成一个均匀的随机样本,没有替换(重复):

>>> np.random.choice(5, 3, replace=False)
array([3,1,0])
>>> #This is equivalent to np.random.permutation(np.arange(5))[:3]

从大小为3的np.arange(5)生成一个非均匀的随机样本,没有替换(重复):

>>> np.random.choice(5, 3, replace=False, p=[0.1, 0, 0.3, 0.6, 0])
array([2, 3, 0])

上面例子中第一个参数都可以用一个任意的数组来代替,而不仅仅是整数。 例如:

>>> aa_milne_arr = ['pooh', 'rabbit', 'piglet', 'Christopher']
>>> np.random.choice(aa_milne_arr, 5, p=[0.5, 0.1, 0.1, 0.3])
array(['pooh', 'pooh', 'pooh', 'Christopher', 'piglet'],
          dtype='|S11')

参考:官方文档

你可能感兴趣的:(numpy)