三、 似然函数

在 朴素贝叶斯分类器 和 最大似然估计和贝叶斯参数估计 中,我们都提到了 似然 这个词,那么这里就来详细讲一讲什么是似然。

似然(likelihood)和概率(probability)从字面上看非常相似,但是在统计中,似然与概率是不同的东西。

1 定义

似然函数是一种关于统计模型中的参数的函数,表示模型参数的似然性。似然函数是给定联合样本值 x x x 下关于(未知)参数 θ \theta θ 的函数:
L ( θ ∣ x ) = f ( x ∣ θ ) L(\theta|x)=f(x|\theta) L(θx)=f(xθ)
f ( x ∣ θ ) f(x|\theta) f(xθ) 是一个密度函数,表示 θ \theta θ 下关于联合样本值 x x x 的联合密度函数。

似然函数与概率密度的对比

对于函数 P ( x ∣ θ ) P(x|\theta) P(xθ),从不同的观测角度来看可以分为以下两种情况:

  • θ \theta θ 已知且保持不变, x x x 是变量,则 P ( x ∣ θ ) P(x|\theta) P(xθ) 称为概率密度,表示不同 x x x 出现的概率
  • x x x 已知且保持不变, θ \theta θ 是变量,则 P ( x ∣ θ ) P(x|\theta) P(xθ) 称为似然函数,表示不同 θ \theta θ x x x 出现的概率,也写作 L ( θ ∣ x ) L(\theta|x) L(θx),或 f ( x ∣ θ ) f(x|\theta) f(xθ)

2 似然函数的求法

2.1 离散型随机变量的似然函数

假如离散型随机变量 x x x 的分布率为 P ( x ∣ θ ) P(x|\theta) P(xθ),样本集 D D D 上有 m m m 个样本,则 D D D 上的似然函数为
L ( θ ∣ D ) = ∏ i m P ( x i ∣ θ ) L(\theta|D)=\prod_i^m P(x_i|\theta) L(θD)=imP(xiθ)

2.2 连续型随机变量的似然函数

假如连续型随机变量 x x x 的概率密度函数为 f ( x ∣ θ ) f(x|\theta) f(xθ),样本集 D D D 上有 m m m 个样本,则 D D D 上的似然函数为
L ( θ ∣ D ) = ∏ i m f ( x i ∣ θ ) L(\theta|D)=\prod_i^m f(x_i|\theta) L(θD)=imf(xiθ)

你可能感兴趣的:(机器学习)