Python实现机器学习算法——朴素贝叶斯

一、NaiveBayes简介

  1. 贝叶斯分类器是基于统计学方法的分类算法
  2. 例如:你在大街上,迎面走过来一个黑人,在我们猜他来自哪里。我们十有八九都会说来自非洲。为什么呢?因为黑人在非洲人的比率最高,在没有其它可用信息下,我们选择条件概率最大的类别,这就是朴素贝叶斯的思想基础。
  3. 公式:

Python实现机器学习算法——朴素贝叶斯_第1张图片

 

二、Python代码实现

案例:

  1. 根据天气情况决策是否打球 如果给出新一天的气象指标数据: sunny , cool , high , TRUE, 判断一下会不会去打球?

Python实现机器学习算法——朴素贝叶斯_第2张图片

 

1.导入package:

import pandas as pd
import numpy as np

2.创建实例数据集:

outlook=['sunny','sunny','overcast','rainy','rainy','rainy','overcast','sunny','sunny','rainy','sunny','overcast','overcast','rainy']
temperature=['hot','hot','hot','mild','cool','cool','cool','mild','cool','mild','mild','mild','hot','mild']
humdity=['high','high','high','high','normal','normal','normal','high','normal','normal','normal','high','normal','high']
windy=['FALSE','TRUE','FALSE','FALSE','FALSE','TRUE','TRUE','FALSE','FALSE','FALSE','TRUE','TRUE','FALSE','TRUE']
play=['no','no','yes','yes','yes','no','yes','no','yes','yes','yes','yes','yes','no']
data=pd.DataFrame({'outlook':outlook,'temperature':temperature,'humdity':humdity,'windy':windy,'play':play})
data.head()

Python实现机器学习算法——朴素贝叶斯_第3张图片

3. 取出特征和标签:

X=data.drop(['play'],axis=1)
y=data['play']

4.定义朴素贝叶斯训练过程:

def nb_fit(X,y):
    classes=y.unique()
    class_count=y.value_counts()
    class_prior=class_count/len(y)
    prior=dict()
    for col in X.columns:
        for j in classes:
            p_x_y=X[(y==j).values][col].value_counts()
            for i in p_x_y.index:
                prior[(col,i,j)]=p_x_y[i]/class_count[j]
    return classes,class_prior,prior

拟合示例如下:

nb_fit(X,y)

 Python实现机器学习算法——朴素贝叶斯_第4张图片

 5.定义预测函数:

def predict(X_test):
    result=dict()
    for c in classes:
        p_y=class_prior[c]
        p_x_y=1
        for i in X_test.items():
            p_x_y*=prior[tuple(list(i)+[c])]
        result[c]=p_y*p_x_y
    return result

 6.给定测试实例并进行预测:

X_test={'outlook':'sunny','temperature':'cool','humdity':'high','windy':'TRUE'}

X_test.items()
result=predict(X_test)
result

结果如下:

Python实现机器学习算法——朴素贝叶斯_第5张图片

你可能感兴趣的:(数据挖掘,算法,机器学习,python)