Python机器学习初探

本文内容来自《Python大数据分析与机器学习商业案例实战》一书,作者是王宇韬、钱妍竹。本文纯属个人学习记录,如有侵权,告知即可删除。

线性回归模型

  • 概念:

利用线性拟合的方式探寻数据背后的规律。

1.一元线性回归

  1. 如何衡量实际值与预测值的接近程度?

在数学上通过两者差值的平方和来进行衡量。差值越小就越接近。

逻辑回归模型

  • 概念

属于分类模型。对离散变量进行预测,其预测的变量并不是连续的,而是离散的一些类别。比如:预测一个人是否会违约、客户是否会流失。

决策树模型

  • 概念

基本原理是通过对一系列问题的if/else的推导,最终实现相关的决策。比如:预测员工是否会离职。

朴素贝叶斯模型

  • 概念

概逆问题的分析,主要依赖贝叶斯公式。

K近邻算法

  • 概念

能解决新加入的数据进行分类问题,在已有的数据中寻找与它最相似的K个数据,如果这K个数据大多数属于某个类别,那么该样本也属于这个类别。

集成学习模型

  • 概念

集成学习模型使用一系列的若学习器(也称基础模型或者基模型)进行学习,并将各个弱学习器的结果进行整合,从而获得比单个学习器更好的学习效果。

  • 集成学习模型常见的算法有Bagging算法和Bootsing算法。
    • Bagging算法。类似于投票,所有学习器把自己的预测结果拿出来投票,服从“少数服从多数”的原则集中形成最终的模型,预测最终的结果。
    • Bootsing算法。本质是将弱学习器提升为强学习器,与Bagging算法的区别在于:Bagging算法将所有的弱学习器一视同仁;而Bootsing算法则会对弱学习器“区别对待”,通俗来讲就是“培养精英”和“重视错误”。“培养精英”就是每一轮训练后对预测结果较为准确的弱学习器给予比较大的权重,对表现不好的弱学习器则降低其权重。这样在最终预测时,“优秀模型”的权重是大的,相当于它能够一次投多票,而“一般模型”只能一次投出一票或者不能投票。

你可能感兴趣的:(Python,机器学习,python,人工智能)