如何解释逻辑回归?

前提

虽然名字叫回归,但逻辑回归其实是一个分类模型,适用于标签 取值离散的情况,如:1 0 0 1。

应用场景

逻辑回归(Logistic Regression)主要解决二分类问题,用来表示某件事情发生的可能性,输出值永远在0-1之间
比如:
一封邮件是垃圾邮件的肯能性(是、不是)
你购买一件商品的可能性(买、不买)
广告被点击的可能性(点、不点)

公式及其原理

公式:在这里插入图片描述

其作用是,对于给定的输入变量,根据选择的参数计算输出变量=1的可能性(estimated probablity)即
例如,如果对于给定的 ,通过已经确定的参数计算得出 ,则表示有70%的几率 为正向类,相应地 为负向类的几率为1-0.7=0.3。

代价函数

如何解释逻辑回归?_第1张图片

逻辑回归的优缺点

优点:

实现简单,广泛的应用于工业问题上;
分类时计算量非常小,速度很快,存储资源低;
便利的观测样本概率分数;
对逻辑回归而言,多重共线性并不是问题,它可以结合L2正则化来解决该问题;
计算代价不高,易于理解和实现;

缺点:

当特征空间很大时,逻辑回归的性能不是很好;
容易欠拟合,一般准确度不太高
不能很好地处理大量多类特征或变量;
只能处理两分类问题(在此基础上衍生出来的softmax可以用于多分类),且必须线性可分;
对于非线性特征,需要进行转换;

你可能感兴趣的:(向面试官,女朋友讲解,-,系列文章,概念集合,NLP)