python数据分析与展示(随机函数与统计函数)

随机函数篇

NumPy的random子库 np.random.*

函数 说明
rand(d0,d1,..,dn) 根据d0‐dn创建随机数数组,浮点数,[0,1),均匀分布
randn(d0,d1,..,dn) 根据d0‐dn创建随机数数组,标准正态分布
randint(low[,high,shape]) 根据shape创建随机整数或整数数组,范围是[low, high)
seed(s) 随机数种子,s是给定的种子值,设置相同的种子生成的数组相同
shuffle(a) 根据数组a的第1轴进行随排列,改变数组x
permutation(a) 根据数组a的第1轴产生一个新的乱序数组,不改变数组x
choice(a[,size,replace,p]) 一维数组a中以概率p抽取元素,形成size形状新数组
replace 表示是否可以重用元素,默认为True
uniform(low,high,size) 产生具有均匀分布的数组,low起始值,high结束值,size形状
normal(loc,scale,size) 产生具有正态分布的数组,loc均值,scale标准差,size形状
poisson(lam,size) 产生具有泊松分布的数组,lam随机事件发生率,size形状

例子走起:

In [36]: a=np.random.rand(2,3)

In [37]: a
Out[37]:
array([[ 0.24309732,  0.55631254,  0.93629272],
      [ 0.84170898,  0.45479003,  0.79710209]])

In [38]: a=np.random.randn(2,3)

In [39]: a
Out[39]:
array([[-0.25459031,  1.20052619, -3.03859346],
      [ 0.27442959,  0.52884329,  0.78020833]])

In [40]: a=np.random.randint(10,20,(2,3))

In [41]: a
Out[41]:
array([[17, 11, 18],
      [10, 19, 19]])

In [42]: np.random.seed(100)

In [43]: a=np.random.randint(10,20,(2,3))

In [44]: a
Out[44]:
array([[18, 18, 13],
      [17, 17, 10]])

In [45]: np.random.seed(100)

In [46]: a=np.random.randint(10,20,(2,3))

In [47]: a
Out[47]:
array([[18, 18, 13],
      [17, 17, 10]])

In [48]: a=np.random.randint(10,20,(2,3))

In [49]: a
Out[49]:
array([[14, 12, 15],
      [12, 12, 12]])

In [54]: a=np.random.randint(10,20,(3,2,2))

In [55]: a
Out[55]:
array([[[10, 18],
       [14, 10]],

      [[19, 16],
       [12, 14]],

      [[11, 15],
       [13, 14]]])

In [56]: np.random.shuffle(a)

In [57]: a
Out[57]:
array([[[11, 15],
       [13, 14]],

      [[19, 16],
       [12, 14]],

      [[10, 18],
       [14, 10]]])

In [58]: np.random.permutation(a)
Out[58]:
array([[[11, 15],
       [13, 14]],

      [[10, 18],
       [14, 10]],

      [[19, 16],
       [12, 14]]])

In [59]: a
Out[59]:
array([[[11, 15],
       [13, 14]],

      [[19, 16],
       [12, 14]],

      [[10, 18],
       [14, 10]]])

In [100]: b=np.random.randint(10,20,(8,))

In [101]: b
Out[101]: array([11, 15, 19, 13, 10, 16, 12, 13])

In [102]: np.random.choice(b,(3,2))
Out[102]:
array([[10, 13],
      [10, 19],
      [11, 15]])

In [103]: np.random.choice(b,(3,2),replace=False)
Out[103]:
array([[13, 16],
      [13, 15],
      [19, 10]])

np.random.choice(b,(3,2),p=b/np.sum(b))
Out[108]:
array([[12, 10],
      [19, 16],
      [12, 16]])


统计函数篇

函数 说明
sum(a, axis=None) 根据给定轴axis计算数组a相关元素之和,axis整数或元组
mean(a, axis=None) 根据给定轴axis计算数组a相关元素的期望,axis整数或元组
average(a,axis=None,weights=None) 根据给定轴axis计算数组a相关元素的加权平均值
std(a, axis=None) 根据给定轴axis计算数组a相关元素的标准差
var(a, axis=None) 根据给定轴axis计算数组a相关元素的方差
min(a) max(a) 计算数组a中元素的最小值、最大值
argmin(a) argmax(a) 计算数组a中元素最小值、最大值的降一维后下标
unravel_index(index, shape) 根据shape将一维下标index转换成多维下标
ptp(a) 计算数组a中元素最大值与最小值的差
median(a) 计算数组a中元素的中位数(中值)

注:

  1. average函数里面weights数组维数应与axis对应a中的维数相同
  2. np.unravel_index(np.argmin(a),a.shape)可输出最小值的下标

梯度函数

np.gradient(f) 计算数组f中元素的梯度,当f为多维时,返回每个维度梯度,梯度计算

In [10]: a=np.random.randint(10,20,(2,4))

In [11]: a
Out[11]:
array([[14, 19, 14, 19],
       [16, 13, 19, 17]])

In [12]: b=np.gradient(a)

In [13]: b
Out[13]:
[array([[ 2., -6.,  5., -2.],
        [ 2., -6.,  5., -2.]]), array([[ 5. ,  0. ,  0. ,  5. ],
        [-3. ,  1.5,  2. , -2. ]])]

数组的边界元素的梯度值为它与相邻元素(下标大的减去下标小的)的差值,非边界元素为左右两个值差值的一半,一般是在某梯度由下标小到下标大计算。

你可能感兴趣的:(python数据分析与展示(随机函数与统计函数))