概率论基础

1. 样本

  • 样本总体:
    考察的对象的全体。
  • 样本个体:
    总体中的每一个考察的对象。
  • 样本:
    总体中所抽取的一部分个体。
  • 样本容量:
    样本中个体的数目。
  • 样本空间:
    也称事件空间,随机事件E的所有基本结果组成的集合为E的样本空间。样本空间的元素 称为样本点或基本事件。例如:设[随机试验]E为“抛一颗骰子,观察出现的点数”。那么E的样本空间 S:{1,2,3,4,5,6,}。

2. 概率

  • 条件概率
    概率是对随机事件发生的可能性的度量。P(A)表示样本空间中事件A发生的概率。
    条件概率公式

上式为条件概率公式,表示事件B发生的情况下事件A发生的概率,也称后验概率。

  • 全概率公式
    全概率公式

公式描述:公式表示若事件A1,A2,…,An构成一个完备事件组且都有正概率,则对任意一个事件B都有公式成立。

  • 贝叶斯定理
    贝叶斯公式

3. 随机变量

  • 随机变量定义
    随机变量是指变量的值无法预先确定仅以一定的可能性(概率)取值的量。它是由于随机而获得的非确定值,是概率中的一个基本概念。
  • 随机变量的类型
    1. 离散型随机变量:在一定区间内变量取值为有限个,或数值可以一一列举出来。例如某地区某年人口的出生数、死亡数等。
    2. 连续型随机变量:在一定区间内变量取值有无限个,或数值无法一一列举出来。例如某地区男性健康成人的身高、体重等。

4. 离散随机变量概率分布

  • 0—1分布

    表格直观表示:

X 0 1
P 1-p p
  • 二项分布
    二项分布是指统计变量中只有性质不同的两项群体的概率分布。所谓两项群体是按两种不同性质划分的统计变量,是二项试验的结果。即各个变量都可归为两个不同性质中的一个,两个观测值是对立的。

    二项分布

    上式表示在n次试验中有k次成功,每次成功的概率为p。也可表示为b(k; n, p)。其期望与方差分别为np和np(1-p)。值得一提的是,上面的0-1分布是n=1时的二项分布。

  • 泊松分布
    泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。 泊松分布适合于描述单位时间内随机事件发生的次数。

    泊松分布

    当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np。通常当n≧10,p≦0.1时,就可以用泊松公式近似得计算。泊松分布的期望和方差都为λ。

5. 连续随机变量概率密度函数

  • 均匀分布
    设连续型随机变量X的概率密度函数为

    均匀分布

    则称随机变量X服从(a, b)上的均匀分布,记为X~U(a, b)。易知,f(x) >= 0,且其期望值为(a+b)/2,方差为(b-a)^2/12。

  • 指数分布
    ****指数分布****是指如果一个随机变量呈指数分布,当s,t≥0时有P(T>s+t|T>t)=P(T>s)。指数函数的一个重要特征是无记忆性。例如,T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时的概率相等。期望为1/λ,方差为(1/λ)^2。

指数分布
  • 正态分布
    若随机变量X服从一个位置参数为μ 、尺度参数为σ的概率分布,且其概率密度函数为
正态分布

则这个随机变量就称为正态随机变量,正态随机变量服从的分布就 称为正态分布

你可能感兴趣的:(概率论基础)