数模原理精解【8】

文章目录

  • 协方差
    • 概述
      • 协方差的定义
    • 协方差的计算
    • 协方差的例子
    • 协方差矩阵
      • 协方差矩阵定义
      • 协方差矩阵的性质
      • 协方差矩阵的计算
      • 协方差矩阵的例子
      • 协方差矩阵的例题
  • 多元正态分布
    • 基础
      • 多元正态分布密度函数
      • 多元正态分布密度函数
      • Julia实现
    • 详细解释
      • 定义
      • 计算
      • 例子
      • 例题
  • 参考文献

协方差

概述

协方差是一种统计度量,用于描述两个变量之间的线性相关程度以及它们变化的趋势是否一致。具体来说,协方差计算的是两个变量同时偏离其均值的程度。如果两个变量的变化趋势一致,即一个变量增加时,另一个变量也增加,那么它们的协方差就是正值。相反,如果一个变量增加时,另一个变量减少,那么它们的协方差就是负值。如果协方差为0,则意味着两个变量之间没有线性关系。

协方差的计算公式为:

Cov ( X , Y ) = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) ( Y i − Y ˉ ) \text{Cov}(X, Y) = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y}) Cov(X,Y)=n11i=1n(XiXˉ)(YiYˉ)

其中,(X) 和 (Y) 是两个变量,( \bar{X} ) 和 ( \bar{Y} ) 分别是它们的均值,(n) 是观测值的数量,(X_i) 和 (Y_i) 分别是第 (i) 个观测值。

协方差的值取决于两个变量的单位,因此它通常用于进一步计算相关系数,如皮尔逊相关系数,该系数将协方差标准化,使得其值介于-1和1之间,从而更容易解释两个变量之间的线性关系强度和方向。

总的来说,协方差是一个重要的统计工具,用于分析两个变量之间的线性关系,并帮助我们理解它们是如何一起变化的。

协方差的定义

协方差是一种用于衡量两个随机变量联合变化趋势的统计指标。它描述了两个变量在变化过程中是否同向变化以及变化的紧密程度。如果两个变量同时增加或减少,那么它们的协方差就是正值,表明它们之间存在正相关关系;如果一个变量增加时另一个变量减少,那么它们的协方差就是负值,表明它们之间存在负相关关系;如果协方差为零,则意味着两个变量之间没有线性相关关系。

协方差的计算

协方差的计算公式为:

Cov ( X , Y ) = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) ( Y i − Y ˉ ) \text{Cov}(X, Y) = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y}) Cov(X,Y)=n11i=1n(XiXˉ)(YiYˉ)

其中, X X X Y Y Y是两个随机变量, X ˉ \bar{X} Xˉ Y ˉ \bar{Y} Yˉ分别是它们的样本均值, n n n是样本数量, X i X_i Xi Y i Y_i Yi 分别是第 i i i个样本观测值。

计算步骤可以归纳为:

  1. 计算每个变量的样本均值。
  2. 对于每个样本观测值,计算其与均值的偏差(即观测值减去均值)。
  3. 计算两个变量偏差的乘积。
  4. 对所有样本的偏差乘积求平均,得到协方差。

协方差的例子

假设我们有两个随机变量 (X) 和 (Y),它们的样本观测值如下:

观测值 (X) (Y)
1 2.1 3.5
2 2.5 3.9
3 3.6 4.8
4 4.0 5.2

首先,我们计算 X X X Y Y Y 的样本均值:

X ˉ = 2.1 + 2.5 + 3.6 + 4.0 4 = 3.05 \bar{X} = \frac{2.1 + 2.5 + 3.6 + 4.0}{4} = 3.05 Xˉ=42.1+2.5+3.6+4.0=3.05
Y ˉ = 3.5 + 3.9 + 4.8 + 5.2 4 = 4.35 \bar{Y} = \frac{3.5 + 3.9 + 4.8 + 5.2}{4} = 4.35 Yˉ=43.5+3.9+4.8+5.2=4.35

然后,我们计算协方差:

Cov ( X , Y ) = 1 4 − 1 [ ( 2.1 − 3.05 ) ( 3.5 − 4.35 ) + ( 2.5 − 3.05 ) ( 3.9 − 4.35 ) + ( 3.6 − 3.05 ) ( 4.8 − 4.35 ) + ( 4.0 − 3.05 ) ( 5.2 − 4.35 ) ] \text{Cov}(X, Y) = \frac{1}{4-1} \left[ (2.1-3.05)(3.5-4.35) \\+ (2.5-3.05)(3.9-4.35) + (3.6-3.05)(4.8-4.35) \\+ (4.0-3.05)(5.2-4.35) \right] Cov(X,Y)=411[(2.13.05)(3.54.35)+(2.53.05)(3.94.35)+(3.63.05)(4.84.35)+(4.03.05)(5.24.35)]

= 1 3 [ ( − 0.95 ) ( − 0.85 ) + ( − 0.55 ) ( − 0.45 ) + ( 0.55 ) ( 0.45 ) + ( 0.95 ) ( 0.85 ) ] = \frac{1}{3} \left[ (-0.95)(-0.85) + (-0.55)(-0.45) + (0.55)(0.45) + (0.95)(0.85) \right] =31[(0.95)(0.85)+(0.55)(0.45)+(0.55)(0.45)+(0.95)(0.85)]

= 1 3 [ 0.8075 + 0.2475 + 0.2475 + 0.8075 ] = \frac{1}{3} \left[ 0.8075 + 0.2475 + 0.2475 + 0.8075 \right] =31[0.8075+0.2475+0.2475+0.8075]

= 1 3 × 2.11 = 0.7033 = \frac{1}{3} \times 2.11 = 0.7033 =31×2.11=0.7033 (结果保留四位小数)

因此,随机变量 X X X Y Y Y 的协方差为 0.7033,表明它们之间存在正相关关系。这意味着当 X X X 增加时, Y Y Y 也倾向于增加,反之亦然。

协方差矩阵

协方差矩阵定义

协方差矩阵是一个用于描述多个随机变量之间关系的矩阵,它包含了这些随机变量两两之间的协方差。在数学和统计学中,协方差矩阵是一个非常重要的工具,尤其在多元统计分析、机器学习和图像处理等领域。对于一个包含n个随机变量的系统,其协方差矩阵是一个n×n的矩阵,其中第i行第j列的元素表示第i个随机变量和第j个随机变量之间的协方差。对角线上的元素是各个随机变量的方差,因为方差可以看作是随机变量与其自身之间的协方差。

协方差矩阵的性质

协方差矩阵具有以下几个重要性质:

  1. 实对称矩阵:协方差矩阵是一个实对称矩阵,即它的转置等于它本身,并且所有元素都是实数。
  2. 非负对角线元素:协方差矩阵的对角线元素(即方差)都是非负的。
  3. 特征分解:协方差矩阵可以进行特征分解,得到一组特征向量和对应的特征值,这些特征向量和特征值在多元统计分析中有重要的应用。

协方差矩阵的计算

协方差矩阵的计算基于协方差的定义,即两个随机变量之间联合变化的一种度量。对于一个包含n个随机变量的数据集,其协方差矩阵的计算步骤如下:

  1. 计算均值:对每个随机变量,计算其所有观测值的均值。
  2. 计算偏差:对每个观测值和每个随机变量,计算其观测值与均值的偏差。
  3. 计算协方差:对于每对随机变量,计算其偏差乘积的平均值,即得到这两个随机变量之间的协方差。
  4. 构建矩阵:将所有随机变量之间的协方差按照随机变量顺序排列,构成一个n×n的矩阵。

协方差矩阵的计算公式可以表示为Cov(xi,xj) = E(xi−E(xi))(xj−E(xj)),其中E表示期望。在实际应用中,通常使用样本协方差来估计总体协方差,计算公式为cov(xi,xj) = ∑(xi−x¯)(xj−x¯)/(n−1),其中n是样本数量,x¯是xi的样本均值。

协方差矩阵的例子

假设我们有两个随机变量X和Y,它们的观测值如下表所示:

观测值 X Y
1 1 2
2 3 6
3 4 2
4 5 2

首先,我们计算X和Y的均值:

  • X的均值:x¯ = (1+3+4+5)/4 = 3.25
  • Y的均值:y¯ = (2+6+2+2)/4 = 3

然后,我们计算协方差矩阵的每个元素:

  • Cov(X,X) = [(1−3.25)^2 + (3−3.25)^2 + (4−3.25)^2 + (5−3.25)^2] / (4−1) = 2.9167
  • Cov(X,Y) = [(1−3.25)(2−3) + (3−3.25)(6−3) + (4−3.25)(2−3) + (5−3.25)(2−3)] / (4−1) = −0.3333
  • Cov(Y,X) 由于协方差矩阵的对称性,等于Cov(X,Y)
  • Cov(Y,Y) = [(2−3)^2 + (6−3)^2 + (2−3)^2 + (2−3)^2] / (4−1) = 4

因此,协方差矩阵为:

( 2.9167 − 0.3333 − 0.3333 4.0000 ) \begin{pmatrix} 2.9167 & -0.3333 \\ -0.3333 & 4.0000 \\ \end{pmatrix} (2.91670.33330.33334.0000)

协方差矩阵的例题

例题:给定一个包含三个随机变量A、B、C的数据集,其观测值如下表所示,请计算该数据集的协方差矩阵。

观测值 A B C
1 1 2 3
2 4 5 6
3 7 8 9

首先,计算每个随机变量的均值:

  • A的均值:a¯ = (1+4+7)/3 = 4
  • B的均值:b¯ = (2+5+8)/3 = 5
  • C的均值:c¯ = (3+6+9)/3 = 6

然后,按照协方差矩阵的计算公式,计算每对随机变量之间的协方差,并构建协方差矩阵。由于计算过程涉及多个步骤和数值计算,这里省略具体计算过程,直接给出协方差矩阵的结果(假设结果已精确计算):

( s A A s A B s A C s B A s B B s B C s C A s C B s C C ) \begin{pmatrix} s_{AA} & s_{AB} & s_{AC} \\ s_{BA} & s_{BB} & s_{BC} \\ s_{CA} & s_{CB} & s_{CC} \\ \end{pmatrix} sAAsBAsCAsABsBBsCBsACsBCsCC

其中, s i j s_{ij} sij表示第i个随机变量和第j个随机变量之间的协方差。注意,由于协方差矩阵的对称性, s i j = s j i s_{ij} = s_{ji} sij=sji

这个例题展示了如何在实际应用中计算一个包含多个随机变量的数据集的协方差矩阵。需要注意的是,在实际应用中,协方差矩阵的计算可能会更加复杂,特别是当数据集包含大量随机变量和观测值时。此外,为了得到更准确的协方差估计,可能还需要考虑数据的预处理、异常值的处理等因素。

多元正态分布

描述多个随机变量联合分布的一种重要模型

基础

多元正态分布密度函数是描述多个随机变量联合分布的一种常见模型,其概率密度函数(PDF)在形式上较为复杂,但具有明确的数学表达式。在Julia中实现多元正态分布密度函数的计算,可以借助Julia强大的数值计算能力和丰富的统计库。

多元正态分布密度函数

多元正态分布密度函数是描述多个随机变量联合分布的一种重要模型,它给出了多维随机向量在每个可能取值上的概率密度。以下是多元正态分布密度函数的详细解释,以及如何使用Python进行计算。

多元正态分布密度函数

假设有一个 n n n 维随机向量 X = ( X 1 , X 2 , … , X n ) T \mathbf{X} = (X_1, X_2, \ldots, X_n)^T X=(X1,X2,,Xn)T,它服从均值为 μ = ( μ 1 , μ 2 , … , μ n ) T \mathbf{\mu} = (\mu_1, \mu_2, \ldots, \mu_n)^T μ=(μ1,μ2,,μn)T 和协方差矩阵为 Σ \mathbf{\Sigma} Σ 的多元正态分布,那么它的概率密度函数(PDF)为:

f X ( x ) = 1 ( 2 π ) n / 2 ∣ Σ ∣ 1 / 2 exp ⁡ ( − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) ) f_{\mathbf{X}}(\mathbf{x}) = \frac{1}{(2\pi)^{n/2} |\mathbf{\Sigma}|^{1/2}} \exp\left( -\frac{1}{2} (\mathbf{x} - \mathbf{\mu})^T \mathbf{\Sigma}^{-1} (\mathbf{x} - \mathbf{\mu}) \right) fX(x)=(2π)n/2Σ1/21exp(21(xμ)TΣ1(xμ))

其中:

  • x = ( x 1 , x 2 , … , x n ) T \mathbf{x} = (x_1, x_2, \ldots, x_n)^T x=(x1,x2,,xn)T 是随机向量 X \mathbf{X} X 的一个实现。
  • μ \mathbf{\mu} μ 是均值向量。
  • Σ \mathbf{\Sigma} Σ n × n n \times n n×n 的协方差矩阵,它必须是正定的(即所有特征值都是正的)。
  • ∣ Σ ∣ |\mathbf{\Sigma}| Σ 是协方差矩阵 Σ \mathbf{\Sigma} Σ 的行列式。
  • Σ − 1 \mathbf{\Sigma}^{-1} Σ1 是协方差矩阵 Σ \mathbf{\Sigma} Σ 的逆矩阵。

Julia实现

在Julia中,我们可以使用LinearAlgebra包来处理矩阵运算,并使用Distributions包中的MultivariateNormal分布对象来简化多元正态分布的处理。不过,为了展示如何手动计算密度函数,我们将直接实现该公式。

以下是一个Julia函数,用于计算多元正态分布密度函数的值:

using LinearAlgebra

function multivariate_normal_pdf(x, mu, sigma)
    n = length(x)
    x_minus_mu = x - mu
    inv_sigma = inv(sigma)
    quad_form = x_minus_mu' * inv_sigma * x_minus_mu
    norm_factor = 1 / ((2*pi)^(n/2) * sqrt(det(sigma)))
    return norm_factor * exp(-0.5 * quad_form)
end

# 示例
mu = [0.0, 0.0]
sigma = [1.0 0.5; 0.5 1.0]
x = [0.5, 0.5]
pdf_value = multivariate_normal_pdf(x, mu, sigma)
println("PDF value at x: ", pdf_value)

在这个函数中,我们首先计算了 x − μ \mathbf{x} - \mathbf{\mu} xμ,然后计算了协方差矩阵的逆 Σ − 1 \mathbf{\Sigma}^{-1} Σ1。接着,我们计算了二次型 ( x − μ ) T Σ − 1 ( x − μ ) (\mathbf{x} - \mathbf{\mu})^T \mathbf{\Sigma}^{-1} (\mathbf{x} - \mathbf{\mu}) (xμ)TΣ1(xμ),并计算了归一化因子。最后,我们将这些值代入密度函数的公式中,得到密度函数的值。

请注意,对于大型协方差矩阵,计算逆矩阵和行列式可能会变得不稳定或计算成本高昂。在实际应用中,可以考虑使用更稳定的数值方法或库函数来处理这些问题。

此外,Julia的Distributions包提供了MultivariateNormal分布对象,它可以直接用于生成多元正态分布的样本、计算概率密度等。如果只需要简单地计算密度函数值,可以使用该包中的函数,而无需手动实现上述公式。

详细解释

定义

假设有一个 n n n 维随机向量 X = ( X 1 , X 2 , … , X n ) T \mathbf{X} = (X_1, X_2, \ldots, X_n)^T X=(X1,X2,,Xn)T,它服从均值为 μ = ( μ 1 , μ 2 , … , μ n ) T \mathbf{\mu} = (\mu_1, \mu_2, \ldots, \mu_n)^T μ=(μ1,μ2,,μn)T 和协方差矩阵为 Σ \mathbf{\Sigma} Σ 的多元正态分布,那么它的概率密度函数(PDF)为:

f X ( x ) = 1 ( 2 π ) n / 2 ∣ Σ ∣ 1 / 2 exp ⁡ ( − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) ) f_{\mathbf{X}}(\mathbf{x}) = \frac{1}{(2\pi)^{n/2} |\mathbf{\Sigma}|^{1/2}} \exp\left( -\frac{1}{2} (\mathbf{x} - \mathbf{\mu})^T \mathbf{\Sigma}^{-1} (\mathbf{x} - \mathbf{\mu}) \right) fX(x)=(2π)n/2Σ1/21exp(21(xμ)TΣ1(xμ))

其中:

  • x = ( x 1 , x 2 , … , x n ) T \mathbf{x} = (x_1, x_2, \ldots, x_n)^T x=(x1,x2,,xn)T 是随机向量 X \mathbf{X} X 的一个实现。
  • μ \mathbf{\mu} μ 是均值向量。
  • Σ \mathbf{\Sigma} Σ n × n n \times n n×n 的协方差矩阵,描述了各个变量之间的方差和协方差。
  • ∣ Σ ∣ |\mathbf{\Sigma}| Σ 是协方差矩阵 Σ \mathbf{\Sigma} Σ 的行列式。
  • Σ − 1 \mathbf{\Sigma}^{-1} Σ1 是协方差矩阵 Σ \mathbf{\Sigma} Σ 的逆矩阵。

计算

要计算多元正态分布的密度函数值,需要知道均值向量 μ \mathbf{\mu} μ 和协方差矩阵 Σ \mathbf{\Sigma} Σ。然后,按照密度函数的公式,将给定的 x \mathbf{x} x 值代入,计算出对应的密度值。

在实际计算中,由于协方差矩阵的逆和行列式的计算可能较为复杂,通常使用数值计算方法来求解。

例子

假设有一个二维随机向量 X = ( X 1 , X 2 ) T \mathbf{X} = (X_1, X_2)^T X=(X1,X2)T,它服从均值为 μ = ( 0 , 0 ) T \mathbf{\mu} = (0, 0)^T μ=(0,0)T 和协方差矩阵为 Σ = ( 1 0.5 0.5 1 ) \mathbf{\Sigma} = \begin{pmatrix} 1 & 0.5 \\ 0.5 & 1 \end{pmatrix} Σ=(10.50.51) 的多元正态分布。

要计算点 x = ( 0.5 , 0.5 ) T \mathbf{x} = (0.5, 0.5)^T x=(0.5,0.5)T 处的密度函数值,可以按照以下步骤进行:

  1. 计算 x − μ = ( 0.5 , 0.5 ) T − ( 0 , 0 ) T = ( 0.5 , 0.5 ) T \mathbf{x} - \mathbf{\mu} = (0.5, 0.5)^T - (0, 0)^T = (0.5, 0.5)^T xμ=(0.5,0.5)T(0,0)T=(0.5,0.5)T
  2. 计算 Σ − 1 \mathbf{\Sigma}^{-1} Σ1,这里可以使用数值计算方法得到 Σ − 1 = ( 2 − 1 − 1 2 ) \mathbf{\Sigma}^{-1} = \begin{pmatrix} 2 & -1 \\ -1 & 2 \end{pmatrix} Σ1=(2112)(注意:这是通过计算得到的,实际计算中应使用数值方法)。
  3. 计算 ( x − μ ) T Σ − 1 ( x − μ ) = ( 0.5 , 0.5 ) T ( 2 − 1 − 1 2 ) ( 0.5 , 0.5 ) T = 0.5 (\mathbf{x} - \mathbf{\mu})^T \mathbf{\Sigma}^{-1} (\mathbf{x} - \mathbf{\mu}) = (0.5, 0.5)^T \begin{pmatrix} 2 & -1 \\ -1 & 2 \end{pmatrix} (0.5, 0.5)^T = 0.5 (xμ)TΣ1(xμ)=(0.5,0.5)T(2112)(0.5,0.5)T=0.5
  4. 计算 ∣ Σ ∣ 1 / 2 = 1 × 1 − 0.5 × 0.5 = 0.75 |\mathbf{\Sigma}|^{1/2} = \sqrt{1 \times 1 - 0.5 \times 0.5} = \sqrt{0.75} Σ1/2=1×10.5×0.5 =0.75 (注意:这里计算的是行列式的平方根)。
  5. 最后,将以上结果代入密度函数公式,得到密度函数值为 1 ( 2 π ) 1 0.75 exp ⁡ ( − 1 2 × 0.5 ) ≈ 0.3183 \frac{1}{(2\pi)^{1} \sqrt{0.75}} \exp\left( -\frac{1}{2} \times 0.5 \right) \approx 0.3183 (2π)10.75 1exp(21×0.5)0.3183

例题

例题1:设随机向量 X = ( X 1 , X 2 ) T \mathbf{X} = (X_1, X_2)^T X=(X1,X2)T 服从二维正态分布 N ( μ , Σ ) N(\mathbf{\mu}, \mathbf{\Sigma}) N(μ,Σ),其中 μ = ( 1 , 2 ) T \mathbf{\mu} = (1, 2)^T μ=(1,2)T Σ = ( 4 2 2 3 ) \mathbf{\Sigma} = \begin{pmatrix} 4 & 2 \\ 2 & 3 \end{pmatrix} Σ=(4223)。求 P ( X 1 < 2 , X 2 < 3 ) P(X_1 < 2, X_2 < 3) P(X1<2,X2<3)

解答:要求 P ( X 1 < 2 , X 2 < 3 ) P(X_1 < 2, X_2 < 3) P(X1<2,X2<3),需要计算二维正态分布函数在区域 ( − ∞ , 2 ) × ( − ∞ , 3 ) (-\infty, 2) \times (-\infty, 3) (,2)×(,3) 上的积分。这通常通过数值方法或查表来实现,因为直接计算二维积分的解析解较为复杂。在实际应用中,可以使用统计软件或编程语言(如Python的SciPy库)来计算这类概率。

注意:例题中的解答只是指出了求解的一般方向,并没有给出具体的数值结果。在实际计算中,需要使用数值方法或查表来得到具体的概率值。

综上所述,多元正态分布密度函数是描述多个随机变量联合分布的重要工具。在实际应用中,需要根据具体的均值向量和协方差矩阵来计算密度函数值或求解相关的概率问题。

参考文献

  1. 文心一言
  2. 《多元统计分析》

你可能感兴趣的:(基础数学与应用数学,人工智能,统计分析,概率论,数学建模)