#期望, 方差, 协方差,标准差
概率论中描述一个随机事件中的随机变量的平均值的大小可以用数学期望这个概念,数学期望的定义是实验中可能的结果的概率乘以其结果的总和。
设P(x) 是一个离散概率分布,自变量的取值范围为{ x 1 , x 2 , . . . , x n x_1, x_2,..., x_n x1,x2,...,xn}。其期望被定义为:
E ( x ) = ∑ k = 1 n x k P ( x k ) E(x) = \sum_{k=1}^{n}{x_kP(x_k)} E(x)=k=1∑nxkP(xk)
设P(x) 是一个连续概率密度函数,其期望为:
E ( x ) = ∫ − ∞ + ∞ x p ( x ) d x E(x) = \int_{-\infty}^{+\infty}{xp(x) \,{\rm d}x} E(x)=∫−∞+∞xp(x)dx
###性质
期望服从线性性质,因此线性运算的期望等于期望的线性运算。
E ( a x + b y + c ) = a E ( x ) + b E ( y ) + c E(ax + by +c) = aE(x) + bE(y) + c E(ax+by+c)=aE(x)+bE(y)+c
这个性质可以推广:
E ( ∑ k = 1 n a i x i + c ) = ∑ k = 1 n a i E ( x i ) + c E(\sum_{k=1}^{n}{a_ix_i +c})= \sum_{k=1}^n{a_iE(x_i)}+c E(k=1∑naixi+c)=k=1∑naiE(xi)+c
函数的期望:
离散
E ( f ( x ) ) = ∑ k = 1 n f ( x k ) P ( x k ) E(f(x)) = \sum_{k=1}^n{f(x_k)P(x_k)} E(f(x))=k=1∑nf(xk)P(xk)
连续
E ( f ( x ) ) = ∫ − ∞ + ∞ f ( x ) p ( x ) d x E(f(x))= \int_{-\infty}^{+\infty}{f(x)p(x){\rm d}x} E(f(x))=∫−∞+∞f(x)p(x)dx
但是,函数的期望不等于期望的函数,即E(f(x))≠f(E(x)) 。
设C为常数: E©=C
设C为常数: E(CX)=CE(X)
加法:E(X+Y)=E(X)+E(Y)
当X和Y相互独立时,E(XY)=E(X)E(Y)
(注意,X和Y的相互独立性可以通过下面的“协方差”描述)
数学期望可以用于预测一个随机事件的平均预期情况。
方差是在概率论和统计方差衡量随机变量或一组数据时的离散程度的度量,换句化说如果想知道一组数据之间的分散程度的话就可以使用方差来表示。
定义: 在统计描述中,方差用来计算每一个变量与总体均值之间的差异。为避免出现离均差总和为0, 离均差平均和受样本含量的影响。统计学采用平均离均差平方来描述变量的变异程度。意思应该就是为了避免有的数据和均值的差值是正数,有的是负数,他们相加会相互抵消,所以用平方的形式来衡量。
###公式
σ 2 = ∑ i = 1 N ( X − μ ) 2 N \sigma^2 = \frac{\sum_{i=1}^N{(X-\mu)^2}}{N} σ2=N∑i=1N(X−μ)2
其中 σ 2 \sigma^2 σ2为总体方差, X X X为变量, μ \mu μ为整体均值, N N N为总体例数。
由于在实际环境中没有办法穷举所有例子, 所以只能找出部分样本数据,基于这部分样本进行测算。可以把公式转换为:
S 2 = ∑ i = 1 n ( X i − μ ) 2 n − 1 S^2 = \frac{\sum_{i=1}^n{(X_i-\mu)^2}}{n-1} S2=n−1∑i=1n(Xi−μ)2
其中 S 2 S^2 S2为样本的方差, μ \mu μ为采集样本的均值, n n n为样本的个数.
###概率论方差
在概率论中, 设X是一个离散型随机变量。
又叫均方差, 是离均差平方的算数平方根。标准差能体现一个数据集的离散程度,平均数相同的两组数,标准差未必相同。
σ = 方 差 = ∑ i = 1 N ( X − μ ) 2 N \sigma = \sqrt{方差}=\sqrt{\frac{\sum_{i=1}^N(X-\mu)^2}{N}} σ=方差=N∑i=1N(X−μ)2
###标准差的意义
标准差和方差都是用来衡量样本离散程度的量,那么为什么要有标准差呢? 因为方差和样本的量纲不一样。换句话说不在一个层次,怎么理解这个层次,从公式来看方差是样本和均值的平方和的平均。这里有一个平方运算,这是导致量纲不在一个层次的原因。而标准差和均值的量纲(单位)是一致的,在描述一个波动范围时标准差比方差更方便。
##协方差(Covariance)
方差/ 标准差描述的是一维数据集合的离散程度, 但世界上现象普遍是多维数据描述的,那么很自然就会想到现象和数据的相关程度,以及各维度间相关程度。
比如,一个产品卖的好不好有很多因素构成,比如产品质量,价格等。那么价格质量之间是否由相关性呢?这个问题就可以用协方差来解决。
###公式
期望值分别为E(X), E(Y)的两个变量X,Y的协方差
C o n v ( X , Y ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] Conv(X, Y)=E[(X-E(X))(Y-E(Y))] Conv(X,Y)=E[(X−E(X))(Y−E(Y))]
= E ( X Y ) − 2 E ( X ) E ( Y ) + E ( X ) E ( Y ) =E(XY)-2E(X)E(Y)+E(X)E(Y) =E(XY)−2E(X)E(Y)+E(X)E(Y)
= E ( X 协 方 差 表 示 两 个 变 量 的 总 体 的 误 差 。 这 和 只 表 示 一 个 变 量 误 差 的 方 差 不 同 。 如 果 两 个 变 量 变 化 的 趋 势 一 致 , 也 就 是 说 如 果 其 中 一 个 大 于 自 身 的 期 望 值 , 另 外 一 个 也 大 于 自 身 期 望 值 。 那 么 两 个 变 量 之 间 的 协 方 差 就 是 正 。 如 果 两 个 变 量 的 变 化 趋 势 相 反 , 即 其 中 一 个 大 于 自 身 的 期 望 值 , 另 外 一 个 小 于 自 身 期 望 值 , 那 么 这 两 个 变 量 之 间 的 协 方 差 就 是 负 值 。 如 果 X , Y 之 间 是 独 立 的 , 那 么 两 者 的 协 方 差 就 是 0 。 Y ) − E ( X ) E ( Y ) =E(X协方差表示两个变量的总体的误差。这和只表示一个变量误差的方差不同。如果两个变量变化的趋势一致, 也就是说如果其中一个大于自身的期望值,另外一个也大于自身期望值。那么两个变量之间的协方差就是正。如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个小于自身期望值,那么这两个变量之间的协方差就是负值。 如果X, Y之间是独立的,那么两者的协方差就是0。Y)-E(X)E(Y) =E(X协方差表示两个变量的总体的误差。这和只表示一个变量误差的方差不同。如果两个变量变化的趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身期望值。那么两个变量之间的协方差就是正。如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个小于自身期望值,那么这两个变量之间的协方差就是负值。如果X,Y之间是独立的,那么两者的协方差就是0。Y)−E(X)E(Y)
###协方差性质