机器学习数学基础(二):概率论与统计量、大数定律、似然估计

机器学习数学基础(二)

  • 概率论
    • 概率论基础
      • 初步认识
      • 概率公式
      • 常见概率分布
        • 两点分布
        • 二项分布 Bernoulli distribution
        • 泊松分布
        • 均匀分布
        • 指数分布
        • 正态分布
        • Beta分布
        • 总结 参数、期望、方差
      • sigmoid/logistic函数
    • 统计量
      • 期望/方差/协方差/相关系数
        • 期望
        • 方差
        • 协方差
        • 相关系数
      • 独立和不相关
    • 大数定律
      • 切比雪夫
      • 大数定律
      • 伯努利定理
      • 中心极限定理
    • 最大似然估计
      • 什么是最大似然估计
      • 怎么求最大似然估计
      • 二项分布的最大似然估计
        • 正态分布的最大似然估计
      • 过拟合
    • code
      • 公交堵车模型

概率论

复习概率论知识,了解Beta分布,sigmoid/logistic函数,重点看最大似然估计

概率论基础

初步认识

  • 基础概念
    机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第1张图片
  • 古典概型
    例:将n个不同球放入N(N>=n)个盒子中,假设盒子容量无限,求事件A={每个盒子至多有1个球}的概率

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第2张图片

  • 与组合数关系
    机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第3张图片
    机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第4张图片

概率公式

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第5张图片

  • 贝叶斯公式
    先验后验似然函数需记牢
    机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第6张图片

常见概率分布

  • 两点分布

0—1分布

  • 二项分布 Bernoulli distribution

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第7张图片
机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第8张图片
机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第9张图片

  • 泊松分布

在这里插入图片描述
期望和方差都等于
期望和方差都等于

  • 均匀分布

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第10张图片

  • 指数分布

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第11张图片
重要特征是无记忆性

  • 正态分布

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第12张图片

Beta分布

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第13张图片

总结 参数、期望、方差

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第14张图片
机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第15张图片

sigmoid/logistic函数

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第16张图片
sigmoid导数
机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第17张图片
机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第18张图片

统计量

期望/方差/协方差/相关系数

期望

  • 类型
    机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第19张图片
  • 性质

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第20张图片

方差

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第21张图片

协方差

  • 定义
    在这里插入图片描述
  • 性质
    机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第22张图片
  • 意义
    机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第23张图片
  • 上界

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第24张图片
证明
机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第25张图片
机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第26张图片

相关系数

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第27张图片

独立和不相关

  • 独立
    A和B是两个事件,如果P(AB)= P(A)P(B),则事件A和B相互独立
    A和B独立,则P(A|B)= P(A),E(AB)= E(A)E(B)
  • 不相关
    Cov(X,Y)= 0 ,X和Y不相关
    X和Y不相关,X和Y之间没有线性关系

不相关不等于独立,但对于二维正态随机变量,不相关等价于相互独立

大数定律

切比雪夫

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第28张图片

大数定律

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第29张图片
意义:
当n很大时,随机变量X1,X2…Xn的平均值Yn在概率意义下无限接近期望

伯努利定理

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第30张图片
定理表明事件A发生的频率nA/n 以概率收敛于事件A的概率p,表达了频率稳定性

中心极限定理

  • 定理内容
    机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第31张图片
  • 例题
    机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第32张图片
    机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第33张图片
  • 意义
    随机现象可以看作许多因素的独立影响的综合反应,往往近似服从正态分布

最大似然估计

什么是最大似然估计

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第34张图片

怎么求最大似然估计

取对数,得到对数似然函数;若对数似然函数可导,可通过求导的方式,解方程,得到驻点,驻点是极大值点

二项分布的最大似然估计

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第35张图片

正态分布的最大似然估计

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第36张图片

过拟合

code

公交堵车模型

机器学习数学基础(二):概率论与统计量、大数定律、似然估计_第37张图片

import numpy as np
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties

font = FontProperties(fname=r'C:\Windows\Fonts\SIMSUN.ttc', size=15)

def clip(x,path):
    for i in range(len(x)):
        if x[i] >= path:
            x[i] %= path

## 变量
path = 5000
n = 100
v0 = 5
p = 0.3
Times = 3000

## 尾随 seed=(seed*a+b)% c
np.random.seed(0)
x = np.random.rand(n) * path
x.sort()
v = np.tile([v0],n).astype(np.float)

plt.figure(figsize=(10,8),facecolor='w')
for t in range (Times):
    plt.scatter(x,[t]*n,s=1,c='k',alpha=0.5)
    for i in range(n):
        if x[(i+1)%n] > x[i]:
            d = x[(i+1)%n] - x[i]  #前车距离
        else:
            d = path - x[i] + x[(i+1)%n]
        if v[i] < d:
            if np.random.rand() > p:
                v[i] += 1
            else:
                v[i] -= 1
        else:
            v[i] = d-1
    v = v.clip(0,150)
    x += v
    clip(x, path)

plt.xlim(0,path)
plt.ylim(0,Times)
plt.xlabel(u'车辆位置',fontproperties=font)
plt.ylabel(u'模拟时间',fontproperties=font)
plt.title(u'公路堵车模型',fontproperties=font)
plt.tight_layout(pad=2)
plt.show()

你可能感兴趣的:(机器学习基础,机器学习,概率论,python,人工智能)