机器学习与模式识别作业1----吸烟者分类

目录

一.题目内容展示

二.如果以吸烟/不吸烟为两个类别

Q2.1的求解分析

Q2.2的求解分析

Q2.3的求解分析

三.如果以本科生/研究生为两个类别

Q3.1的求解分析

Q3.2的求解分析

四.题目方法总结

一.题目内容展示

   为了解校园内吸烟群体的组成,某高校在校园内随机抽取了10000个大学生(8000个本科生+2000个研究生),并对他们的吸烟情况进行了一个调查。调查结果显示,吸烟的本科生有1200人,吸烟的研究生有400人。(以下填空内容精确到小数点后两位)


二.如果以吸烟/不吸烟为两个类别

Q1: 吸烟者类别的先验概率?不吸烟者类别的先验概率?

Q2: 吸烟者是本科生的类条件概率?不吸烟者是研究生的类条件概率为?

Q3: 已知某学生是本科生,他吸烟的后验概率?

解答:

  我们把不吸烟的人设置为\omega _{1},将吸烟的人设置为\omega _{2},将本科生设为x_{1},研究生设为x_{2}

以下题目的答案如下所示:

Q2.1的求解分析

计算两类样本的先验概率,就是取样本在总样本中的占比,如下所示:

p(\omega_{1})=\frac{1600}{10000} =0.16

p(\omega_{2})=1-p(\omega_{1}) =0.84

Q2.2的求解分析

第一个问题中,已知是吸烟者,求是本科生的类条件概率,如下所示:

p(x_{1}|\omega_{1}) =\frac{1200}{1600} =0.75

第二个问题中,已知不是吸烟者,求是研究生的类条件概率,如下所示:

p(x_{2}|\omega_{1}) =\frac{2000-400}{8400} =0.19

Q2.3的求解分析

根据贝叶斯公式,我们能够很快的求解出某学生是本科生,他吸烟的后验概率:

p(\omega_{2}|x_{1}) =\frac{p(x_{1}|\omega_{2})*p(w_{2})}{p(x_{1})} =\frac{0.75*0.16}{0.8} =0.15

三.如果以本科生/研究生为两个类别

Q1:    已知某学生吸烟,他是本科生的后验概率?

Q2:    已知某学生不吸烟,他是研究生的后验概率为

  我们把本科生设置为\omega _{1},将研究生设置为\omega _{2},将不吸烟者设为x_{1},吸烟者设为x_{2}

以下题目的答案如下所示:

Q3.1的求解分析

第一个问题中,已知是吸烟者,求是本科生的后验概率,如下所示:

p(\omega_{1}|x_{2}) =\frac{p(x_{2}|\omega_{1})*p(w_{1})}{p(x_{2})} =\frac{\frac{1200 }{8000}*\frac{8000}{10000} }{\frac{1600}{10000} } =0.75

Q3.2的求解分析

第二个问题中,已知是不吸烟者,求是研究生的后验概率,如下所示:

p(\omega_{2}|x_{1}) =\frac{p(x_{1}|\omega_{2})*p(w_{2})}{p(x_{1})} =\frac{\frac{1600}{2000}*\frac{2000}{10000} }{\frac{8400}{10000} } =0.19

四.题目方法总结

  本题旨在熟练使用贝叶斯公式,充分了解类条件概率,先验概率和后验概率的定义,结合题目的数据就能简答快速的求解出来。


你可能感兴趣的:(机器学习与模式识别,python,机器学习)