scikit-learn机器学习——第九章 复习题

1.什么是贝叶斯定理?

条件概率公式:P(A|B)=\frac{P(A)P(B|A)}{P(B)}

2.朴素贝叶斯分类法的数学原理是什么?其中朴素二字意味着什么?

数学原理:

朴素意味着:条件独立假设

3.什么是二项式分布?

二次项分布是指把符合伯努利分布的实验做了n次,结果出现0次,1次,2次。。。n次的概率分别是多少。

4.多项式分布有什么特点?

满足类别分布实验

5.高斯分布的概率密度函数在二维坐标轴上的形状是什么样的?

钟行

6.使用朴素贝叶斯分类法时,使用概率分布函数来计算概率,与从数据集里直接统计出概率相比,有什么优点?

 

7.运行本章实例的随书代码ch09.02.ipynb,请画出alpha=0.0001的学习曲线。

scikit-learn机器学习——第九章 复习题_第1张图片

8.使用sklearn.model_selection.GridSearchCV类,给算法参数alpha选择一个最合适的值。提示:读者可参阅第7章的相关内容。

from sklearn.model_selection import GridSearchCV
import numpy as np

alpha_thresholds = np.linspace(0, 0.001, 50)

# Set the parameters by cross-validation
param_grid = [{'alpha': alpha_thresholds}]

clf = GridSearchCV(MultinomialNB(), param_grid, cv=5)
clf.fit(X_train, y_train)
print("best param: {0}\nbest score: {1}".format(clf.best_params_, 
                                                clf.best_score_))

 

你可能感兴趣的:(机器学习,python)