山东大学软件学院机器学习(考试)——期末考试回忆版

2020-2021年度山东大学软件学院AI班机器学习考试(大三)
(与软工和数媒题不一样,但可以参考一下)
考试时间:2020年12月31日 14:00-16:00
考试形式:开卷,允许带计算器
先说一下感受,开卷考相比之前的“贝多芬(背多分)”好了很多,主要靠理解,这也正是我喜欢的形式。除了两个计算贝叶斯和决策树以及最后一个简答题之外,其余所有的题都可以在西瓜书和自己带的资料中找到答案。贝叶斯计算极简单,并且也是PPT最后几页中的homework,决策树计算被我们“3人机器学习小组”的大神直接压中,最后一个简答题竟然是论文汇报的内容(每组一篇论文并在课上汇报),这题挺佩服老师的。复习的时候最慌的是“特征选择与提取”这一部分,结果没考,我笑了。一共印了129页的资料,没这资料我可能就…。计算器落在了寝室,在决策树计算时就有些小难受,虽然卷中给出了所有要用到的对数值,但一堆小数乘法以及验算还是花了很多时间,决策树这个计算题是经典的例子。最后,一如既往,考前一罐红牛。
小组中一位大神的CSDN博客:https://blog.csdn.net/weixin_43756517。

一、名词解释(每个5分,共20分)

  1. 监督学习
  2. KNN
  3. 线性可分
  4. 多层感知器

二、简答题(每个10分,共60分)

  1. 两个一模一样的碗,一号碗有30颗水果糖和10颗巧克力糖,二号碗有水果糖和巧克力糖各20颗。现在随机选择一个碗,从中摸出一颗糖,发现是水果糖。请问这颗水果糖来自一号碗的概率有多大?
  2. 简述一下k均值聚类的基本思想,并说明如何初始化k
  3. 简述一下SVM的基本思想,针对线性不可分问题,SVM有哪些方法
  4. 简述一下什么是bagging算法,并比较bagging与AdaBoost的异同
  5. 简述一下线性回归,并比较岭回归和lasso回归的区别
  6. 从Graph embedding、word embedding、Graph CNN 中选择一个你熟悉的并进行介绍

三、综合分析题(20分)

(个人说明:卷中是10个样本,这里只是一个例子)
山东大学软件学院机器学习(考试)——期末考试回忆版_第1张图片
(1)从信息增益的角度考虑,Outlook和Humidity哪个作为划分属性,给出具体计算过程
(个人说明:这里给出了可能用到的对数值)
(2)决策树存在过拟合问题,采用什么方法可以减少过拟合风险

你可能感兴趣的:(人工智能,考试,机器学习,山东大学,软件学院,2020,期末考试回忆版)