Logistic回归(理论篇)

Logistic回归

Logistic回归是一种经典的统计学分类方法,被广泛应用于生产环境中。本文主要介绍Logistic回归模型的原理以及参数估计、公式推导方法。

Sigmoid函数(Logistic函数)

Sigmoid函数的数学形式是:

f(x)=11+ex f ( x ) = 1 1 + e − x

其函数图像如下:
Logistic回归(理论篇)_第1张图片
其图形是一个S型曲线,关于 (0,12) ( 0 , 1 2 ) 对称,取值在[0,1],因此可以作为一个概率分布。
Sigmoid函数的导数为:

f(x)=ex(1+ex)2=1(1+ex)2(111+ex)=f(x)(1f(x)) f ( x ) ′ = − e − x ( 1 + e − x ) 2 = 1 ( 1 + e − x ) 2 ( 1 − 1 1 + e − x ) = f ( x ) ( 1 − f ( x ) )

Logistic模型

将线性函数的结果映射到Sigmoid函数中,得到Logistic模型。它是一种二分类模型,由条件概率 P(Y|X) P ( Y | X ) 表示。随机变量 X X 的取值为实数, Y Y 的取值为{0,1}。Logistic模型如下:

P(Y=1|x)=11+eθx P ( Y = 1 | x ) = 1 1 + e − θ x

P(Y=0|x)=111+eθx=eθx1+eθx P ( Y = 0 | x ) = 1 − 1 1 + e − θ x = e − θ x 1 + e − θ x

极大似然估计

设:

h(θ)=11+eθx h ( θ ) = 1 1 + e − θ x

则Logistic模型可表示为:
P(Y=y|x)=hθ(x)y(1hθ(x))(1y)) P ( Y = y | x ) = h θ ( x ) y ( 1 − h θ ( x ) ) ( 1 − y ) )

似然函数为:
L(θ)=hθ(x(i))y(i)(1hθ(x(i))1y(i)) L ( θ ) = ∏ h θ ( x ( i ) ) y ( i ) ( 1 − h θ ( x ( i ) ) 1 − y ( i ) )

对数似然函数为:
l(θ)=(y(i)loghθ(x(i))+(1y(i))(1loghθ(x(i)))) l ( θ ) = ∑ ( y ( i ) l o g h θ ( x ( i ) ) + ( 1 − y ( i ) ) ( 1 − l o g h θ ( x ( i ) ) ) )

l(θ) l ( θ ) 的极大值,得到 θ θ 的估计。
为了和线性回归保持一致,两边同时乘以 1 − 1 得到目标函数:
J(θ)=(y(i)loghθ(x(i))+(1y(i))(1loghθ(x(i)))) J ( θ ) = − ∑ ( y ( i ) l o g h θ ( x ( i ) ) + ( 1 − y ( i ) ) ( 1 − l o g h θ ( x ( i ) ) ) )

求得 J(θ) J ( θ ) 的极小值

随机梯度下降法求解参数

θ θ 求偏导得:

J(θ)θj=(y(i)1hθ(x(i))(1y(i))11hθ(x(i)))θjhθ(x(i))=(y(i)1hθ(x(i))(1y(i))11hθ(x(i)))hθ(x(i)(1hθ(x(i))θjθx=(hθ(x(i))y(i))x(i)j ∂ J ( θ ) ∂ θ j = − ∑ ( y ( i ) 1 h θ ( x ( i ) ) − ( 1 − y ( i ) ) 1 1 − h θ ( x ( i ) ) ) ∂ ∂ θ j h θ ( x ( i ) ) = − ∑ ( y ( i ) 1 h θ ( x ( i ) ) − ( 1 − y ( i ) ) 1 1 − h θ ( x ( i ) ) ) h θ ( x ( i ) ( 1 − h θ ( x ( i ) ) ∂ θ j θ x = ∑ ( h θ ( x ( i ) ) − y ( i ) ) x j ( i )

采用随机梯度下降法求参数的更新公式为:
θ:=θα(hθ(x(i))y(i))x(i)j θ := θ − α ( h θ ( x ( i ) ) − y ( i ) ) x j ( i )

你可能感兴趣的:(机器学习)