广义线性模型与逻辑回归(为什么逻辑回归要用Sigmoid函数)

广义线性模型与逻辑回归

广义线性模型的原理

首先,广义线性模型是基于指数分布族的,而指数分布族的原型如下

其中 为自然参数,它可能是一个向量,而 叫做充分统计量,也可能是一个向量,通常来说 。

广义线性模型就是把自变量 的线性预测函数 当作因变量 的估计值。

根据指数分布族来构建广义线性模型的三个假设

  • 给定特征属性 和参数 后, 的条件概率 服从指数分布族,即 。
  • 预测 的期望,即计算 ,通常来说 。
  • 与 之间是线性的,即 。

逻辑回归

  • 伯努利分布又叫做两点分布或者0-1分布,是一个离散型概率分布,若伯努利实验成功,则伯努利随机变量取值为1,如果失败,则伯努利随机变量取值为0。并记成功的概率为 ,那么失败的概率就是
  • 伯努利分布的概率密度函数
    如果把伯努利分布写成指数分布族,形式如下
    \begin{split} P(y; \phi) &= \phi^y (1- \phi) ^ {1- y}\\ &= \exp (\ln ( \phi^y (1- \phi)^ {1- y}))\\ &= \exp (y \ln \phi + (1-y) \ln (1- \phi))\\ &= \exp (\ln \frac{\phi}{1-\phi} \cdot y + \ln (1- \phi)) \end{split}对比指数分布族,有
  • Logistic回归是基于伯努利分布的,推导可得Sigmoid函数,如下
    其中 , 即为预测为正样本的概率。
    这也解释了为什么逻辑回归要用Sigmoid函数

Sigmoid 函数的性质

  • sigmoid 函数连续,单调递增
  • sigmiod 函数关于 中心对称
  • 对sigmoid函数求导 ,计算sigmoid函数的导数简单快速

你可能感兴趣的:(广义线性模型与逻辑回归(为什么逻辑回归要用Sigmoid函数))