概率论与数理统计---分布函数

#前言#
前言部分讲了为什么使用CSDN记录数学笔记和为什么要学《概率论与数理统计》的原因,和实际学习内容没有关系。

之前学线性代数的时候写的笔记都在纸质的笔记本上,在纸质上面想查询比较麻烦,只能一页一页翻。现在想记在电脑上,后续如果想看纸质的还可以打印出来,所以后来在word上记过一段时间,word里的数学公式编辑器虽然好用,但是使用鼠标点起来太累。后来想用Latex,Latex编辑公式的确好用,但它不支持中文,后来又想到了CSDN的Markdown,感觉比较好的结合了中文和Latex的数学编辑功能,但其缺点是只能在线写,不过还好,可以导出到本地,并从本地导入。所以选择了在CSDN使用Markdown记录数学学习的笔记。

至于为什么要 学习《概率论与数理统计》,那是因为在学机器学习时,在看完吴恩达老师的第三课“过拟合和欠拟合”后,发现需要用到最大似然估计,根本听不懂,所以开始学习概率论与数理统计。

数学知识用自己的语言去描述真的好难,而且还要理解的非常透彻后才可能表达出来,所以相关概念只能按部就班先记下来,供后续学习参考使用。

由于我是学到“第3章随机变量及基分布”时才发现自己学不下去了,好多概念还没有理解,所以从这章的分布函数开始记笔记,如果分布函数之前的章节的内容后续有必要的话再补充

基本概念

  • 随机试验
    具体有如下特点的实验称为随机试验,简称为试验,以字母 E E E表示。
  1. 试验可以在相同条件下重复进行;
  2. 试验的所有可能的结果不止一个,而且是事先已知的;
  3. 每次试验总是恰好出现这些可能结果中的一个,但空间出现哪一个结果,试验前不能确切预言。
  • 基本事件 样本点 样本空间
    随机试验的每一个可能结果称为基本事件,也称为样本点 ,用 e e e表示。全体基本事件的集合称为样本空间,记为 S S S
  • 随机事件
    在试验中可能发生也可能不发生的事情称为随机事件,简称事件,以字母 A , B , C , … A,B,C,\dots A,B,C,表示。
  • 随机变量
    E E E是随机试验,它的样本空间是 S S S。如果对 S S S中的每个基本事件 e e e,都有唯一的实数值 X ( e ) X(e) X(e)与之对应,则称 X ( e ) X(e) X(e)随机变量,简记为 X X X.
  • 离散型随机变量
    只能取有限个值或可列无穷多个值的随机变量 X X X称为离散型随机变量
    #分布函数#
    对于任意实数 x 1 < x 2 x_1x1<x2 P ( x 1 < X ≤ x 2 ) = P ( X ≤ x 2 ) − P ( X ≤ x 1 ) (1) P(x_1P(x1<Xx2)=P(Xx2)P(Xx1)(1)
    给定一个随机变量 X X X,称定义域为 ( − ∞ , + ∞ ) (-\infty,+\infty) (,+)实值函数 F ( x ) = P ( X ≤ x ) (2) F(x)=P(X\le x) \tag 2 F(x)=P(Xx)(2)
    为随机变量 X X X分布函数。也记为 F X ( x ) F_X(x) FX(x)
    其 实 这 里 只 要 明 白 了 分 布 函 数 其 实 就 是 随 机 变 量 X 小 于 等 于 某 个 值 的 概 率 就 可 以 了 。 \color{red}{其实这里只要明白了分布函数其实就是随机变量X小于等于某个值的概率就可以了。} X

事件 x 1 < X ≤ x 2 x_1x1<Xx2的概率可写成 P ( x 1 < X ≤ x 2 ) = F ( x 2 ) − F ( x 1 ) (3) P(x_1P(x1<Xx2)=F(x2)F(x1)(3)
可 画 坐 标 图 理 解 3 式 。 \color{red}{可画坐标图理解3式。} 3
这样概率就可以和分布函数对应上了,而分布函数是一个普通的函数,可以使用数学分析工具(比如微积分)来研究随机变量。

分布函数具有如下性质:

  1. 0 ≤ F ( x ) ≤ 1 ( − ∞ < x < + ∞ ) 0\le F(x) \le 1(-\infty0F(x)1(<x<+)
  2.   F ( x 1 ) ≤ F ( x 2 ) , x 1 < x 2 , 即 F ( x ) 是 单 调 非 减 的 \ F(x_1)\le F(x_2),x_1 F(x1)F(x2),x1<x2,F(x)
  3. F ( − ∞ ) = lim ⁡ x → − ∞ F ( x ) = 0 F ( + ∞ ) = lim ⁡ x → + ∞ F ( x ) = 1 F(-\infty)=\lim_{x \to -\infty}F(x)=0 \\ F(+\infty)=\lim_{x \to +\infty}F(x)=1 F()=limxF(x)=0F(+)=limx+F(x)=1
  4. $F(x^+)=F(x),即F(x)是右连续的 $

第1条性质很好理解,分布函数即是随机变量 X X X小于等于 x x x的概率,而概率肯定是在 0 0 0 1 1 1之前的。
第2条性质,理解分布函数的性质就能理解了,因为分布函数是小于等于 x x x的概率,所以如果 x 1 < x 2 x_1x1<x2,那么 x 2 x_2 x2的概率肯定不会比 x 1 x_1 x1的概率小,等于是可能的,因为如果落在 x 1 x_1 x1 x 2 x_2 x2之间的概率如果为 0 0 0的话,那么 P ( X ≤ x 2 ) = P ( X ≤ x 1 ) P(X\le x_2)=P(X\le x_1) P(Xx2)=P(Xx1),而 F ( x 1 ) = P ( X ≤ x 1 ) , F ( x 2 ) = P ( X ≤ x 2 ) F(x_1)=P(X\le x_1),F(x_2)=P(X\le x_2) F(x1)=P(Xx1),F(x2)=P(Xx2),所以 F ( x 1 ) ≤ F ( x 2 ) F(x_1)\le F(x_2) F(x1)F(x2)
第3条性质好理解。
第4条可以看书上 P 56 P_{56} P56的例3.3.1,如图上所示其实只要观注跳跃点即可,而跳跃点的概率是落在右边区域范围内的,所以是右连续。

可以看书本 P 56 ∼ P 57 P_{56}\sim P_{57} P56P57三个例子加深对分布函数及其性质的理解。

#本文所需的其它知识#
高等数学中的正无穷、负无穷、连续和极限概念。

参考书籍#

《概率论与数理统计(第二版)》哈尔滨工业大学数学系 王勇 主编

如有疑问之处欢迎加我微信交流,共同进步!请备注“CSDN博客”
概率论与数理统计---分布函数_第1张图片

你可能感兴趣的:(机器学习数学基础,机器学习入门,概率论与数理统计,分布函数,机器学习数学,随机变量及其分布,离散型随机变量)