ML—高斯判别分析

华电北风吹
天津大学认知计算与应用重点实验室
日期:2015/12/11

高斯判别分析属于生成模型,模型最终学习一个特征-类别的联合概率。

0 多维正态分布
确定一个多维正态分布只需要知道分布的均值向量 μRn×1 和一个协方差矩阵 ΣRn×n .
其概率密度函数如下:
p(x;μ,Σ)=1(2π)n/2|Σ|1/2exp(12(xμ)T|Σ|1(xμ))(0)

一、高斯判别分析
适用范围:输入特征是连续
模型表述:
yBernoulli(ϕ)(1-1)
x|y=0N(μ0,Σ)()
x|y=1N(μ1,Σ)()
结合公式0可以将公式1-1写为:
p(y)=ϕy(1ϕ)1y(1-2)
p(x|y=0)=1(2π)n/2|Σ|1/2exp(12(xμ0)T|Σ|1(xμ0))()
p(x|y=1)=1(2π)n/2|Σ|1/2exp(12(xμ1)T|Σ|1(xμ1))()
可以看到对于二分类高斯判别分析,模型的参数是 ϕ,μ0,μ1,Σ ,注意到这里的两个n维正态分布公用了一个协方差矩阵。
对于m个输入样本,有
p(x(i),y(i);ϕ,μ0,μ1,Σ)=p(y(i);ϕ)p(x(i)|y(i);μ0,μ1,Σ)(1-3)
容易得到对数似然函数如下
l(ϕ,μ0,μ1,Σ)=logmi=1p(x(i),y(i);ϕ,μ0,μ1,Σ)(1-4)
求解似然函数最大化得到高斯判别分析的模型参数解形式如下:
ϕ=1mmi=11{y(i)=1}(1-5)
μ0=mi=11{y(i)=0}x(i)mi=11{y(i)=0}()
μ1=mi=11{y(i)=1}x(i)mi=11{y(i)=1}()
Σ=1mmi=1(x(i)μy(i))(x(i)μy(i))T()

二、高斯判别分析与逻辑回归
可以容易写出高斯判别分析的预测函数。由于是生成模型,模型存在两种输出 p(y=1|xϕ,μ0,μ1,Σ) p(y=0|xϕ,μ0,μ1,Σ) 。在这里重点关注第一个。
p(y=1|xϕ,μ0,μ1,Σ)=p(y=1|x)p(y=1|x)+p(y=0|x)(2-1)
经过变换,分解组合等变换操作可以得到如下形式:
p(y=1|xϕ,μ0,μ1,Σ)=11+eθTx(2-2)
注:分子分母同除以分子,消除同类项,系数转化为指数上的指数,矩阵展开相减消除等简单操作即可得到。
虽然可以得到类似的格式,但是高斯判别分析与逻辑回归仍然存在很大区别:
1、模型性质:高斯判别分析属于生成模型,逻辑回归属于判别模型
2、p(y=1|x)和p(y=0|x)在逻辑回归中和为1,在高斯判别分析中不存在这个性质。
3、模型假设:高斯判别分析假设样本特征在每个类别下分别服从于各异的高维正态分布,逻辑回归只需要假设样本特征之间对于分类器存在线性影响。所以逻辑回归鲁棒性更好。

你可能感兴趣的:(ML—高斯判别分析)