设置seed()里的数字就相当于设置了一个盛有随机数的“聚宝盆”,一个数字代表一个“聚宝盆”,当我们在seed()的括号里设置相同的seed,“聚宝盆”就是一样的,那当然每次拿出的随机数就会相同(不要觉得就是从里面随机取数字,只要设置的seed相同取出地随机数就一样)。如果不设置seed,则每次会生成不同的随机数。(注:seed括号里的数值基本可以随便设置哦)
但是有时候你明明设置了seed()没有变,但生成的随机数组还是不同,这是怎么回事呢?请看:
import numpy as np
np.random.seed(0)
np.random.rand(10)
Out[357]:
array([0.5488135 , 0.71518937, 0.60276338, 0.54488318, 0.4236548 ,
0.64589411, 0.43758721, 0.891773 , 0.96366276, 0.38344152])
np.random.rand(10)
Out[358]:
array([0.79172504, 0.52889492, 0.56804456, 0.92559664, 0.07103606,
0.0871293 , 0.0202184 , 0.83261985, 0.77815675, 0.87001215])
大家一定会奇怪,咦?为什么会不一样,我不是已经设置了seed没变么?
其实,第二遍的np.random.rand(10)已经不是在你设置的np.random.seed(0)下了,所以第二遍的随机数组只是在默认random下随机挑选的样本数值。
那我们该怎么让两次随机数组一样呢?
我们只需要再输入一遍np.random.seed(0)就好了,请看:
np.random.seed(0)
np.random.rand(4,3)
Out[362]:
array([[0.5488135 , 0.71518937, 0.60276338],
[0.54488318, 0.4236548 , 0.64589411],
[0.43758721, 0.891773 , 0.96366276],
[0.38344152, 0.79172504, 0.52889492]])
np.random.seed(0)
np.random.rand(4,3)
Out[364]:
array([[0.5488135 , 0.71518937, 0.60276338],
[0.54488318, 0.4236548 , 0.64589411],
[0.43758721, 0.891773 , 0.96366276],
[0.38344152, 0.79172504, 0.52889492]])
看!是不是成功了呢。
下面再给大家看个例子,以供大家更好地理解:
def rng():
for i in range(5):
np.random.seed(123)
print(np.random.rand(4))
rng()
>>>[0.69646919 0.28613933 0.22685145 0.55131477]
[0.69646919 0.28613933 0.22685145 0.55131477]
[0.69646919 0.28613933 0.22685145 0.55131477]
[0.69646919 0.28613933 0.22685145 0.55131477]
[0.69646919 0.28613933 0.22685145 0.55131477]
def rng_n():
np.random.seed(123)
for i in range(5):
print(np.random.rand(4))
rng_n()
>>>[0.69646919 0.28613933 0.22685145 0.55131477]
[0.71946897 0.42310646 0.9807642 0.68482974]
[0.4809319 0.39211752 0.34317802 0.72904971]
[0.43857224 0.0596779 0.39804426 0.73799541]
[0.18249173 0.17545176 0.53155137 0.53182759]
numpy.random.RandomState()是一个伪随机数生成器。那么伪随机数是什么呢?
伪随机数是用确定性的算法计算出来的似来自[0,1]均匀分布的随机数序列。并不真正的随机,但具有类似于随机数的统计特征,如均匀性、独立性等。
下面我们来看看它的用法:
import numpy as np
rng = np.random.RandomState(0)
rng.rand(4)
Out[377]: array([0.5488135 , 0.71518937, 0.60276338, 0.54488318])
rng = np.random.RandomState(0)
rng.rand(4)
Out[379]: array([0.5488135 , 0.71518937, 0.60276338, 0.54488318])
看,是不是生成了一样的随机数组呢,这点和numpy.random.seed()还是很一样的,
因为是伪随机数,所以必须在rng这个变量下使用,如果不这样做,那么就得不到相同的随机数组了,即便你再次输入了numpy.random.RandomState():
np.random.RandomState(0)
Out[397]:
np.random.rand(4)
Out[398]: array([0.62395295, 0.1156184 , 0.31728548, 0.41482621])
np.random.RandomState(0)
Out[399]:
np.random.rand(4)
Out[400]: array([0.86630916, 0.25045537, 0.48303426, 0.98555979])
这是因为np.random.rand()在默认状态下,是从默认随机数组里挑出的随机样本。
rng = np.random.RandomState(0)
x = rng.randn(4)
y = rng.randn(4)
x
Out[393]: array([1.76405235, 0.40015721, 0.97873798, 2.2408932 ])
y
Out[394]: array([ 1.86755799, -0.97727788, 0.95008842, -0.15135721])
下面给出两个自定义函数来帮助更好地理解:
def rng1():
for i in range(4):
rng = np.random.RandomState(0)
print("i = ",i)
print(rng.rand(3,2))
rng1()
i = 0
[[0.5488135 0.71518937]
[0.60276338 0.54488318]
[0.4236548 0.64589411]]
i = 1
[[0.5488135 0.71518937]
[0.60276338 0.54488318]
[0.4236548 0.64589411]]
i = 2
[[0.5488135 0.71518937]
[0.60276338 0.54488318]
[0.4236548 0.64589411]]
i = 3
[[0.5488135 0.71518937]
[0.60276338 0.54488318]
[0.4236548 0.64589411]]
def rng2():
rng = np.random.RandomState(0)
for i in range(4):
print("i = ",i)
print(rng.rand(3,2))
rng2()
i = 0
[[0.5488135 0.71518937]
[0.60276338 0.54488318]
[0.4236548 0.64589411]]
i = 1
[[0.43758721 0.891773 ]
[0.96366276 0.38344152]
[0.79172504 0.52889492]]
i = 2
[[0.56804456 0.92559664]
[0.07103606 0.0871293 ]
[0.0202184 0.83261985]]
i = 3
[[0.77815675 0.87001215]
[0.97861834 0.79915856]
[0.46147936 0.78052918]]