f μ , Σ ( x ) = 1 ( 2 π ) D / 2 1 ∣ Σ ∣ 1 / 2 e x p { − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) } f_{\mu, \Sigma}(x)=\frac{1}{(2 \pi)^{D/2}} \frac{1}{|\Sigma|^{1/2}} exp\{-\frac{1}{2}(x-\mu)^T \Sigma ^{-1}(x-\mu)\} fμ,Σ(x)=(2π)D/21∣Σ∣1/21exp{−21(x−μ)TΣ−1(x−μ)}
这是多维高斯分布(多元正态分布)的概率密度函数。让我逐步解释这个公式的各个部分:
公式的含义:
这个公式描述了 D 维多维高斯分布的概率密度。它告诉我们在给定均值 μ \mu μ 和协方差矩阵 Σ \Sigma Σ 的情况下,随机变量 x x x 出现在空间中的概率密度。
多维高斯分布的概率密度函数用于描述多维数据的分布,通常在统计、模式识别、机器学习等领域中广泛应用。不同的协方差矩阵 Σ \Sigma Σ 和均值向量 μ \mu μ 可以产生不同形状的多维高斯分布,从而用于建模不同类型的数据分布。
L ( μ , Σ ) = f μ , Σ ( x 1 ) f μ , Σ ( x 2 ) f μ , Σ ( x 3 ) . . . . . . f μ , Σ ( x 7 9 ) L(\mu,\Sigma)=f_{\mu,\Sigma}(x^1) f_{\mu,\Sigma}(x^2) f_{\mu,\Sigma}(x^3)......f_{\mu,\Sigma}(x^79) L(μ,Σ)=fμ,Σ(x1)fμ,Σ(x2)fμ,Σ(x3)......fμ,Σ(x79)
μ ∗ , Σ ∗ = a r g max μ , Σ L ( μ , Σ ) \mu^*,\Sigma^*=arg \max\limits_{\mu,\Sigma}L(\mu,\Sigma) μ∗,Σ∗=argμ,ΣmaxL(μ,Σ)
这个问题是要通过最大似然估计(MLE)来估计多元高斯分布的参数 μ ∗ \mu^* μ∗ 和 Σ ∗ \Sigma^* Σ∗,以使给定数据集的似然 L ( μ , Σ ) L(\mu, \Sigma) L(μ,Σ) 最大化。
在这个上下文中, L ( μ , Σ ) L(\mu, \Sigma) L(μ,Σ) 表示似然函数,它是一个关于参数 μ \mu μ 和 Σ \Sigma Σ 的函数,用于描述观测数据 x 1 , x 2 , x 3 , . . . , x 79 x^1, x^2, x^3, ..., x^{79} x1,x2,x3,...,x79 在给定参数下的概率。似然函数通常假设数据是根据多元高斯分布生成的,公式如下:
L ( μ , Σ ) = f μ , Σ ( x 1 ) ⋅ f μ , Σ ( x 2 ) ⋅ f μ , Σ ( x 3 ) ⋅ . . . ⋅ f μ , Σ ( x 79 ) L(\mu, \Sigma) = f_{\mu, \Sigma}(x^1) \cdot f_{\mu, \Sigma}(x^2) \cdot f_{\mu, \Sigma}(x^3) \cdot ... \cdot f_{\mu, \Sigma}(x^{79}) L(μ,Σ)=fμ,Σ(x1)⋅fμ,Σ(x2)⋅fμ,Σ(x3)⋅...⋅fμ,Σ(x79)
其中, f μ , Σ ( x ) f_{\mu, \Sigma}(x) fμ,Σ(x) 是多元高斯分布的概率密度函数,参数为 μ \mu μ 和 Σ \Sigma Σ。这个似然函数表示了给定参数下观测数据集中每个数据点的出现概率,然后将它们的概率连乘得到整个数据集的似然。
你的目标是找到最大化似然函数的参数 μ ∗ \mu^* μ∗ 和 Σ ∗ \Sigma^* Σ∗,即:
μ ∗ , Σ ∗ = arg max μ , Σ L ( μ , Σ ) \mu^*, \Sigma^* = \arg\max_{\mu, \Sigma} L(\mu, \Sigma) μ∗,Σ∗=argμ,ΣmaxL(μ,Σ)
这通常涉及到通过数值方法(如梯度上升法或牛顿法)来找到似然函数的极大值点,从而找到最可能的参数值 μ ∗ \mu^* μ∗ 和 Σ ∗ \Sigma^* Σ∗,以使数据集的生成概率最大化。这是多元高斯分布的最大似然估计过程。
其中
μ = [ 75.0 71.3 ] \mu=\begin{bmatrix} 75.0\\ 71.3\\ \end{bmatrix} μ=[75.071.3]
Σ = [ 874 327 327 929 ] \Sigma=\begin{bmatrix} 874&327\\ 327&929\\ \end{bmatrix} Σ=[874327327929]
根据提供的信息,我们知道概率密度函数 P ( x ∣ C 1 ) P(x|C_1) P(x∣C1) 符合多元高斯分布,其中参数如下:
均值向量 μ \mu μ:
μ = [ 75.0 71.3 ] \mu=\begin{bmatrix} 75.0\\ 71.3\\ \end{bmatrix} μ=[75.071.3]
协方差矩阵 Σ \Sigma Σ:
Σ = [ 874 327 327 929 ] \Sigma=\begin{bmatrix} 874&327\\ 327&929\\ \end{bmatrix} Σ=[874327327929]
现在,如果你想计算在给定条件 C 1 C_1 C1 下,随机变量 x x x 落在某个区域 [ a , b ] [a, b] [a,b] 内的概率,你可以使用概率密度函数来计算。具体来说,你可以计算 P ( x ∣ C 1 ) P(x|C_1) P(x∣C1) 的积分,从 a a a 到 b b b,如下:
P ( a ≤ x ≤ b ∣ C 1 ) = ∫ a b 1 ( 2 π ) D / 2 ∣ Σ ∣ 1 / 2 exp ( − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) ) d x P(a \leq x \leq b | C_1) = \int_{a}^{b} \frac{1}{(2 \pi)^{D/2} |\Sigma|^{1/2}} \exp\left(-\frac{1}{2}(x-\mu)^T \Sigma^{-1} (x-\mu)\right) dx P(a≤x≤b∣C1)=∫ab(2π)D/2∣Σ∣1/21exp(−21(x−μ)TΣ−1(x−μ))dx
在这个公式中,你可以将 a a a 和 b b b 设置为你感兴趣的区间的上下限。通过计算上述积分,你可以获得随机变量 x x x 落在该区间内的条件概率。
这是一个连续分布的概率计算示例,根据具体的区间和需要计算的概率,你可以替换 a a a 和 b b b 来计算不同区域内的条件概率。