2.机器学习相关数学基础

3.作业要求:

1)贴上视频学习笔记,要求真实,不要抄袭,可以手写拍照。

1)P2 概率论与贝叶斯先验

一、概率论与贝叶斯先验

2.机器学习相关数学基础_第1张图片

2.机器学习相关数学基础_第2张图片

 

 不管n取值多少,首位数字的分布趋势总是一致。

 当1到n!中n=100时,从1~9,出现的各个数字的频率分布折线图:

2.机器学习相关数学基础_第3张图片

 当1到n!中n=1000时,从1~9,出现的各个数字的频率分布折线图:

2.机器学习相关数学基础_第4张图片

当1到n!中n=10000时,从1~9,出现的各个数字的频率分布折线图:

2.机器学习相关数学基础_第5张图片

由以上的实验截图说明,在实际生活中得出的一组数据中,以1为首位数字出现的概率约为总数的三成;是直观想象1/9的三倍。

此定律即为“本福特定律”,又称第一数字定律。 

2.机器学习相关数学基础_第6张图片

举例: 

  • 商品推荐(阿里笔试题)

  • 公路堵车概率模型(Nagel-Schreckenberg交通流模型)

2.机器学习相关数学基础_第7张图片

 2.机器学习相关数学基础_第8张图片

 2.机器学习相关数学基础_第9张图片

 分布:

  • 两点分布

  • 二项分布(Bernoulli distribution)

  • 泊松分布(Poisson distribution)

  • 均匀分布

  • 指数分布(无记忆性)

  • 正态分布(二元正态分布)

  • Beta分布
  • 指数簇分布
    • 伯努利分布(Bernoulli distribution)
    • 高斯分布(Gaussian distrubution)

 2.机器学习相关数学基础_第10张图片

 2.机器学习相关数学基础_第11张图片

 2.机器学习相关数学基础_第12张图片

 2.机器学习相关数学基础_第13张图片

 

 2.机器学习相关数学基础_第14张图片                2.机器学习相关数学基础_第15张图片

 协方差为0定义为不相关。

 不相关,说明线性独立。

 2.机器学习相关数学基础_第16张图片                   2.机器学习相关数学基础_第17张图片

 

 2.机器学习相关数学基础_第18张图片

 2)P3 矩阵和线性代数

 二、矩阵和线性代数

 2.机器学习相关数学基础_第19张图片

了解SVD

 

 

 2.机器学习相关数学基础_第20张图片

 2.机器学习相关数学基础_第21张图片

 线性代数

  • 方阵的行列式
  • 代数余子式
  • 伴随矩阵
  • 方针的逆
  • 范德蒙行列式(数学归纳法)
  • 矩阵的乘法
  • 矩阵模型
  • 概率转移矩阵
  • 平稳分布
  • 矩阵和向量的乘法应用
  • 矩阵的秩
  1.  nXn的可逆矩阵,秩为n
  2. 可逆矩阵又称满秩矩阵
  3. 矩阵的秩等于它行(列)向量组的秩
  • 秩与线性方程组的解的关系
  • 向量组等价
  • 系数矩阵
  • 正交阵

  2.机器学习相关数学基础_第22张图片

  • 特征值和特征向量

  2.机器学习相关数学基础_第23张图片

  • 特征值的性质

  2.机器学习相关数学基础_第24张图片

  • 不同特征值对应的特征向量

  2.机器学习相关数学基础_第25张图片

  • 实对称阵不同特征值的特征向量正交(★)

  2.机器学习相关数学基础_第26张图片

   2.机器学习相关数学基础_第27张图片

 白化/漂白whitening

  2.机器学习相关数学基础_第28张图片

 

   2.机器学习相关数学基础_第29张图片

 

   2.机器学习相关数学基础_第30张图片

  •  正定阵(类似还有负定阵,半负定阵)

  正定阵的判定:

  1. 对称阵A为正定阵
  2. A的特征值都为正
  3. A的顺序主子式大于0
  4. 以上三个命题等价

 2.机器学习相关数学基础_第31张图片

 QR分解

2.机器学习相关数学基础_第32张图片

 2.机器学习相关数学基础_第33张图片

 2.机器学习相关数学基础_第34张图片

 2.机器学习相关数学基础_第35张图片

 2.机器学习相关数学基础_第36张图片

  •  向量的导数

   2.机器学习相关数学基础_第37张图片

   2.机器学习相关数学基础_第38张图片

   2.机器学习相关数学基础_第39张图片

  •  标量对向量导数

  2.机器学习相关数学基础_第40张图片

  •  标量对方阵的导数

2)用自己的话总结“梯度”,“梯度下降”和“贝叶斯定理”,可以word编辑,可做思维导图,可以手写拍照,要求言简意赅、排版整洁。

一元函数:

 2.机器学习相关数学基础_第41张图片

y = x 在点 x = 2 处的梯度就是2.机器学习相关数学基础_第42张图片

 

二元函数:

2.机器学习相关数学基础_第43张图片

二元函数求梯度如上图所示。

结论:对多元函数的各个自变量求偏导数,并把求得的这些偏导数写成向量的形式,就是梯度。

  • 梯度是一个向量
  • 梯度的方向是函数增长最快的方向,梯度的反方向是函数降低最快的方向

 梯度下降

  假如攀登一座山峰,从山脚到达顶峰的路径必定有许多条可以选择,如果我想要以最快的方式到达顶峰,我就必须清楚的规划路线,这个时候,我可以利用梯度下降算法来让自己爬到顶峰。具体做法就是我需要根据我当前的所处的位置为基准,寻找这个位置最陡峭的地方,然后朝着最陡峭的方向往上走,同理,下山也如此,只要一直重复这个过程,那么我到达顶峰以及下山的路径,将会是最优路径。

  以数学的角度来说,梯度下降算法实际上是一种寻找函数极小值的方法,普遍的做法就是,在已知参数当前值的情况下,按照当前点对应的梯度向量的反方向及事先给定的步长大小,对参数进行调整。

  

 贝叶斯定理

  假设有一种疾病的患病率是千分之一,医院一项诊断技术有5%的误诊率(也就是说这5%里面的人没有病但是可能被诊断为有病。。)。

  场景:现在有一个人到医院看病,诊断结果也说他有病,那他真的有病是多大的概率?

  解题思路是这样子的:

    我们普遍人认为的概率:
      P(有病)=0.001
      P(没病)=0.999
    根据贝叶斯定理,实行的条件概率:
      P(准确率)=1.00;准确率(患病者100%被检出)。
      P(误诊率)=0.05;误诊率(正常人有5%被误检)。
  综上,这个人确实患病的概率为:
  P(有病 | 阳性) = P(有病) × P(准确率) / [(P(有病) × P(准确率) + P(没病) × P(误诊率)]
  = 0.001 × 1.00 / (0.001 × 1.00 + 0.999 × 0.05)
  = 0.0198
  = 2%

  根据结果来看,实际上这个人患病的可能性只有2%,如果体检有问题,还是再去检查一遍看看吧,说不定真没病,嘻嘻。

 

 

参考资料:https://www.bilibili.com/video/BV1Tb411H7uC?p=2

     https://www.bilibili.com/video/BV1Tb411H7uC?p=3

你可能感兴趣的:(2.机器学习相关数学基础)