山东大学机器学习(实验四内容)——朴素贝叶斯

1. 描述

在这个练习中,您将使用朴素贝叶斯来做出录取推荐。你的数据集是斯洛文尼亚卢布尔雅那一家托儿所的一系列录取决定。我们从http://archive.ics.uci.edu/ml/datasets/Nursery下载了此数据,如果你感兴趣,可以查看其中的详细信息。
  数据库对于每个录取决策包含一个元组。特征或属性包括父母的经济状况、家中孩子其它数量等。数据集中三个元组如下
    usual,proper,complete,1,convenient,convenient,nonprob,recommended,recommend
    smallusual,proper,complete,1,convenient,convenient,nonprob,priority,priority
    usual,proper,complete,1,convenient,convenient,nonprob,not recom,not recom
前八个值是特征或属性,第9个值是指定的类(即录取决定推荐信)。
  你的工作是建立一个朴实贝叶斯分类器,将作出录取建议。训练集已经重新格式化。详细请参阅convdata.m。特别是,我们使用数字(而不是字符串)来表示特性和类。我们还将数据集分为两个子集:一个用于训练朴实贝叶斯模型,另一个用于测试。

2. 问题

问题1: 利用训练数据的极大似然估计朴实贝叶斯模型,并预测测试数据的类别。报告分类器的准确性。
问题2: 尝试较小的数据集进行训练。使用不同大小数据集来训练朴实贝叶斯模型、具体来说,从给定的训练集中随机抽取较小的子集。说明训练数据的大小是如何影响朴实贝叶斯模型的准确性,并给出相应的分析。

你可能感兴趣的:(机器学习,机器学习,朴实贝叶斯,山东大学机器学习实验)