机器学习基础之《分类算法(9)—分类算法小结》

一、转换器与预估器
转换器-做特征工程
预估器-封装了机器学习算法

二、KNN算法
根据你的邻居来确定类别
谁是邻居
  距离公式
    欧式距离
    曼哈顿距离
    闵可夫斯基距离
K的取值
  找到最近的几个邻居
  K过小,容易受到异常值的影响
  K过大,容易受到样本不均衡的影响
应用场景
  少量的数据

三、朴素贝叶斯算法
朴素:假定了特征与特征之间相互独立
贝叶斯:贝叶斯公式
拉普拉斯平滑系数
应用场景
  文本分类

四、决策树
找到最高效的决策顺序
  信息增益
  基尼系数
信息增益
  等于=信息熵 - 条件熵
可视化,可解释能力强

五、随机森林
随机
  训练集随机
  特征随机
森林
  多个决策树
应用场景
  高纬度特征,大数据
 

你可能感兴趣的:(机器学习,机器学习)