美赛python学习d10机器学习——分类算法

朴素贝叶斯算法

贝叶斯定理美赛python学习d10机器学习——分类算法_第1张图片

用朴素贝叶斯算法进行分类

e.g:已知用户开车(步行)上班随薪水和年龄的分布,预测一个新用户是开车还是步行上班

美赛python学习d10机器学习——分类算法_第2张图片
步骤:

  1. 求已知新用户特征,其步行上班的概率
  • 求先验概率:用户步行上班的概率
    美赛python学习d10机器学习——分类算法_第3张图片
  • 求特征概率:在新用户周围画一个圈,圈内的用户的年龄与薪水和新用户很相近,
    用圈内的老用户数除以总的老用户数,代表新用户特征(年龄和薪水)的概率
    美赛python学习d10机器学习——分类算法_第4张图片
  • 求条件的似然(已知用户是步行上班,求其满足新用户特征的概率):
    美赛python学习d10机器学习——分类算法_第5张图片
    美赛python学习d10机器学习——分类算法_第6张图片
  1. 利用同样的方式计算已知新用户特征,其开车上班的概率
    美赛python学习d10机器学习——分类算法_第7张图片
  2. 比较两个后验概率的值,将用户分到概率大的那一类

一些注意事项

  1. 为什么叫“朴素”
    假设:数据的所有特征都是独立不相关的
  2. 如何巧妙地避开特征概率的计算
    美赛python学习d10机器学习——分类算法_第8张图片
    因为最后是两个后验概率的比较,所以直接比较分子就行了
  3. 将分类不止两类,有多类怎么办
    算出所有种类的后验概率再进行比较

你可能感兴趣的:(数模美赛,机器学习,python,分类,朴素贝叶斯算法)