id | 刮北风 | 闷热 | 多云 | 预报有雨 | 真下雨? |
---|---|---|---|---|---|
1 | 0 | 1 | 0 | 1 | 0 |
2 | 1 | 1 | 1 | 0 | 1 |
3 | 0 | 1 | 1 | 0 | 1 |
4 | 0 | 0 | 0 | 1 | 0 |
5 | 0 | 1 | 1 | 0 | 1 |
6 | 0 | 1 | 0 | 1 | 0 |
7 | 1 | 0 | 0 | 1 | 0 |
注意:0代表否,1代表是。
我们可以使用上述公式依次计算出真下雨的概率,这里不再计算。我们可以通过代码使用贝努利、高斯、多项式来完成计算。
为了方便继续使用上述数据进行预测,数据截图如下:
代码实现:
from sklearn.model_selection import train_test_split
import pandas as pd
from sklearn.naive_bayes import BernoulliNB
def naviebayes():
# 读取数据
data = pd.read_csv("train_2.csv")
# 取出数据当中的特征值和目标值
y = data['真下雨?'] #目标值
x = data[['刮北风', '闷热','多云','天气预报有雨']] #特征值
# 进行数据分割
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)
#贝努力朴素贝叶斯
clf = BernoulliNB()
clf.fit(x_train, y_train)
y_predict = clf.predict(x_test)
print(x_test)
print(y_predict)
print("预测的概率为",clf.score(x_test, y_test))
print("--------------------")
Next_Day = [[0, 0, 1, 0]]
pre = clf.predict(Next_Day)
pre2 = clf.predict_proba(Next_Day)
print("预测结果为:", pre)
# 输出模型预测的分类概率
print("预测的概率为:", pre2)
if __name__ == '__main__':
naviebayes()
代码实现:
from sklearn.model_selection import train_test_split
import pandas as pd
from sklearn.naive_bayes import GaussianNB
def naviebayes():
# 读取数据
data = pd.read_csv("train_2.csv")
# 取出数据当中的特征值和目标值
y = data['真下雨?'] #目标值
x = data[['刮北风', '闷热','多云','天气预报有雨']] #特征值
# 进行数据分割
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)
#高斯朴素贝叶斯
gnb = GaussianNB()
gnb.fit(x_train, y_train)
y_predict = gnb.predict(x_test)
print(x_test)
print(y_predict)
print("预测的概率为",gnb.score(x_test, y_test))
print("--------------------")
Next_Day = [[0, 0, 1, 0]]
pre = gnb.predict(Next_Day)
pre2 = gnb.predict_proba(Next_Day)
print("预测结果为:", pre)
# 输出模型预测的分类概率
print("预测的概率为:", pre2)
if __name__ == '__main__':
naviebayes()
代码如下:
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import MultinomialNB
import pandas as pd
def naviebayes():
# 读取数据
data = pd.read_csv("train_2.csv")
# 取出数据当中的特征值和目标值
y = data['真下雨?'] #目标值
x = data[['刮北风', '闷热','多云','天气预报有雨']] #特征值
# 进行数据分割
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)
# 多项式朴素贝叶斯
mlt = MultinomialNB(alpha=1.0)
mlt.fit(x_train, y_train)
y_predict = mlt.predict(x_test)
print(x_test)
print(y_predict)
print("准确率为:", mlt.score(x_test, y_test))
print("--------------------")
Next_Day = [[0, 0, 1, 0]]
pre = mlt.predict(Next_Day)
pre2 = mlt.predict_proba(Next_Day)
print("预测结果为:", pre)
# 输出模型预测的分类概率
print("预测的概率为:", pre2)
if __name__ == '__main__':
naviebayes()
通过对比贝努力、高斯、多项式的结果,预测的准确率不一样,所以我们在开发使用的时候,一定要注意区分这几类。