人工智能算法一&朴素贝叶斯模型

简介

朴素贝叶斯模型主要是解决逻辑回归多维不能解耦的情况。

前提描述

在讲解朴素贝叶斯模型的时候先回归下逻辑回归的函数。

人工智能算法一&朴素贝叶斯模型_第1张图片

如果计算多维的时候比如在婚恋网的预测的时候,根据x1身高,x2体重,x3收入,预测你是否受欢迎,如果有数据数据丢失的情况,比如体重的数据有些没有,那么预测就不是很准。

人工智能算法一&朴素贝叶斯模型_第2张图片

 人工智能算法一&朴素贝叶斯模型_第3张图片

朴素贝叶斯模型引入

我们假设多维概率之间独立可拆分。

但是可能性在实际生活中不太大,因为打个比方,身高180cm的体重也是45kg的可能性不太大,所以有时候解耦不一定合理。 朴素贝叶斯模型假设是可以的。那么逻辑如下。下图是求y等于一的概率。

人工智能算法一&朴素贝叶斯模型_第4张图片

 下图是求y=0的概率。

人工智能算法一&朴素贝叶斯模型_第5张图片

也就是说,只要y=1的概率大于y=0的概率,那么我们就说属于1类,否则就是属于0类。那么我们就可以通过一个例子进行计算。下面把x1=1为富,x2=1为高,x3=1为高收入 。

人工智能算法一&朴素贝叶斯模型_第6张图片

那么我们就可以用评论求概率,下面是x1=1,y等于1的频率,也就是上面的x1出现了2次,y同时也会对应的出现两次那么2/2=1。那么表示x1=1有钱,那么对于的y=1表示受欢迎为必然事件。

人工智能算法一&朴素贝叶斯模型_第7张图片

那么我们就可以通过朴素贝叶斯模型训练的方式训练出到底属于什么分类。也就是说,按上面的计算方式,如果x1=1,y=1的概率要比x1=1,y=0的概率要大的时候,那么就是属于一类,否则就是二类

人工智能算法一&朴素贝叶斯模型_第8张图片

那么上面有一个缺点就是如果数据量比较少的话,那么估算就不会太准。那么我们就可以认为的自我给一个概率。比如下面,硬币的正反。按主观意识给一个半分之50的概率,然后在根据这个百分之50进行概率统计。下面也就是x1=2,y=2,500和1000是主观假设,就是怕数据量太小模型预估不准确。

人工智能算法一&朴素贝叶斯模型_第9张图片

先验概率的例子

比如,在用户画像的时候,新的用户不知道行为,那么我们就可以把热门的推荐给用户。

人工智能算法一&朴素贝叶斯模型_第10张图片

 

你可能感兴趣的:(智能算法,人工智能,算法,python)