概率统计篇:概率基础(随机变量,期望值,概率分布)[第一天]

概率分布:统计的采样次数越多,越趋近于我们理论上的情况。因此,从这个统计实验我们可以看出,概率分布描述的其实就是随机变量的概率规律。

离散分布:常用的离散分布有伯努利分布(抛硬币的概率分布就属于伯努利分布)、分类分布、二项分布、泊松分布等等;

import random
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt 

def flip_coin(times):
    data_array = np.empty(times)
    wights_array = np.empty(times)
    wights_array.fill(1/times)
    for i in range(0,times):
        data_array[i] = random.randint(0,1)
    data_frame = pd.DataFrame(data_array)
    wights_frame = pd.DataFrame(wights_array)
    data_frame.plot(kind = 'hist', legend = False)  
    data_frame.plot(kind = 'hist', legend = False, weights = wights_array).set_ylabel("Probability") 
    plt.show()
flip_coin(10)

      离散型随机变量的状态数量是有限的,所以可以通过伯努利和分类分布来描述。可是对于连续型随机变量来说,状态是无穷多的,这时我们就需要

你可能感兴趣的:(数据分析-数学基础,概率统计)