2021年秋 中科大统计学习(刘东老师) 期末考试题回忆

其实考完试在校车上就怀着悲愤的心情写下考题回忆了,但直到今天才发布是因为出成绩实在是有点晚。考完试大家都哀号遍野,我甚至以为我要挂科了(我考的很惨),但出成绩后发现老师给分还是相当手下留情了,我居然考到了80分以上;周围的同学也都做的很差,但都是80多分。

总分 = 期末考试 50% + 大作业 30% +平时作业 20%

题目回忆

一、判断20题,20分,基本都是问卷上的。

二、大题

1、给出伯努利分布,证明伯努利分布属于指数族分布,用累计函数求伯努利分布的方差。(8分)

2、软间隔svm(8分)
(1)给出10个ai系数,其中6个0,3个1,一个5,问哪个是支持向量。对应支持向量的支持向量机的误差如何。
(2)问惩罚系数C变大时,间隔怎么变。

3、信息增益(8分)
给出6组(x1,x2,y)的数据,其中x1和x2为±1 y为true或false,求x1和x2的信息增益。

4、最大熵分布(8分)
给出x={1、2、3、4、5} 已知P(1)+P(2)=0.34 ,求满足最大熵条件的P(x)
答案是均匀分布,李航的《统计学习方法》有原题。

5、问如何确定 knn 的合理的k值,用伪代码写出过程。(8分) 注意不是kmeans

6、一个题目长达两页的师生长对话,16个小问,40分。(生平第一次见到这么多问的题目)

题目涉及到贝叶斯网络,马尔科夫随机场,神经网络的激活函数,正则化,过拟合等。大概是一个二值图像里面的像素的相关性问题,以及像素值服从伯努利分布。

假设只有行或列相邻的像素相关。问3*3的图像有多少个自由参数,应该是2的9次方减1。

要求画出3*3图像的马尔科夫随机场,假设最大团为一个变量,问随机场里面有多少自由参数。

画出3*3图像的贝叶斯网络,并转为马尔科夫随机场,问以最大团为变量,有多少个自由参数。

然后是用卷积神经网络对图像进行处理,分别对图像随机增加方差为0.1、0.2 、0.3的噪声,如果验证集只选添加了方差为0.1的噪声的图像,在验证集上的精度比训练集低,问原因是什么。

改正之后发现验证集上的精度还是比训练集低,问这是什么现象?如何避免?

网络输出的数据类型是浮点数,但图像像素的真实值是整数,要求给出三种方法将浮点数转为整数。

还有一些问题不记得了 ~~

题目总结

1、考题很偏,老师在课上花很多时间讲的都没怎么考,考的大多都是没怎么讲过的和几句带过的内容。比如信息增益上课压根没提过,SVM倒是花时间讲了,但是考的这个题也比较偏。

2、考试是半开卷,允许带一张A4纸,如第一条所言,我写了几天完成的A4纸基本都没用到,题目真的太偏了。。。 周围的同学很多也是这种情况。

3、平时作业要认真做,要搞懂错题,考试题目多多少少会和平时作业的解题思想相关。

我在考前推导了一遍神经网络的梯度反向传播算法,统计学习没考,但两天后的《数字图像分析》最后一题竟然考的是这个,不小心就做出来了(据说很多同学都无从下笔),真是福祸相依啊。

课程总结

1、参考书:教务系统给的参考书是周志华的《机器学习》(西瓜书),但老师讲的内容大多在李航的《统计学习方法》这本书上,不过西瓜书的SVM的部分讲的不错,两本书可以一起看。

2、课程内容:讲的很广很全面,一些内容上面两本书上没有,也讲了一些深度学习方面的内容。
刘东老师讲的很好,解决了我以前自学时候的不少困惑。应该有不少同学上这门课以前自己就学过机器学习和深度学习了,但建议上课时候还是认真听,能学到不少东西。

你可能感兴趣的:(学习)