1、机器学习期末复习试卷_zhouyan2000的博客-CSDN博客_机器学习期末考试}
2、[机器学习笔试题]((4条消息) 机器学习笔试题目_北冥有小鱼-CSDN博客_机器学习题目)
3、机器学习面试题
4、一天1个机器学习知识点(一)_猫猫玩机器学习的博客-CSDN博客
5、山东大学软件学院机器学习(考试)——期末考试回忆版_ALTLI的博客-CSDN博客_机器学习期末
6、机器学习试题_AI_盲的博客-CSDN博客_机器学习试卷
7、机器学习题 【含答案和解析】_52learn-CSDN博客
8、机器学习与数据挖掘期末考试复习重点整理 - 库妍 - 博客园 (cnblogs.com)
9、机器学习期末试题 (renrendoc.com)
10、机器学习期末试题.doc (book118.com)
(1)什么是互信息
(2)用互信息(信息增益)选择的目的是什么,能带来什么效果
(3)怎么防止过拟合?
(1) 对于样本x,其标签为0/1,若x真实标签为0,错误划分为1的损失为a, 若x真实标签为1,错误划分为0的损失为b, 求最优决策方法
(2)结合图画出来。
(1)线性可分时的优化目标,约束条件
(2)线性不可分咋整
(3)支持向量的意义
(1)机器学习估计参数模型的方法
(2)这些方法有什么不同
(3)这些方法什么时候趋于一致
(1)逻辑回归为什么优化函数使用条件分布log(Y|x)而不是联合分布log(x,Y)
(2)逻辑回归的推导
(1)从信号重构角度推导pca
(2)怎么实现信号压缩
(1)k-means流程
(2)k-means目标函数
(3)k-means和em算法的不同
实验一是非线性回归,怎么将非线性回归变成线性回归
一、名词解释
聚类
似然
剪枝
K最近邻
二、简答题
1号碗中装有30个水果味糖和10个巧克力味糖,2号碗中装有20个水果糖和20个巧克力糖。现摸出一个水果糖求是从1号碗中摸出的 概率。
简述KNN的基本思想和优缺点
简述集成思想和bagging和adaboost异同
简述ID3的优缺点,以及决策树中如何防止过拟合
三、综合题
SVM的定义
SVM解决线性不可分问题的方法和基本思想
对偶形式的推导
四、综合题
比较神经网络和SVM
如果激活函数为线性函数的缺陷
简述学习率的影响
举例生活中应用神经网络的例子,并简述其影响
在网上找的一些试题及延伸的一些问题,以选择题为主,主要是关于基础理论知识,同时给出自己联想到的一些问题。当然基础问题应当包含算法本身的过程和某些推导过程。比如:LR、SVM的推导。
试题1: 已知坐标轴中两点A(2,−2)B(−1,2),求这两点的曼哈顿距离(L1距离)。
答案:7 。向量AB(-3,4),L1 是向量中非零元素的绝对值和。
问题延伸:机器学习算法中哪些应用了L1,哪些应用了L2.
参考链接正则化技术
试题2:SVM中的核技巧(Kernal trick)的作用包括以下哪项?
A. 特征升维
B. 特征降维
C. 防止过拟合
答案:C
核技巧使用核函数将样本从原特征空间映射到更高维的空间,使得样本在更高维的空间中线性可分。
问题延伸:SVM的核函数本质及推导过程。
试题3: 在数据预处理阶段,我们常常对数值特征进行归一化或标准化(standardization, normalization)处理。这种处理方式理论上不会对下列哪个模型产生很大影响?
A. k-Means
B. k-NN
C. 决策树
答案:C
k-Means和k-NN都需要使用距离。而决策树对于数值特征,只在乎其大小排序,而非绝对大小。不管是标准化或者归一化,都不会影响数值之间的相对大小。关于决策树如何对数值特征进行划分
问题延伸:机器学习那些算法是进行归一化处理或标准化。
试题4:下面哪个情形不适合作为K-Means迭代终止的条件?
A. 前后两次迭代中,每个聚类中的成员不变
B. 前后两次迭代中,每个聚类中样本的个数不变
C. 前后两次迭代中,每个聚类的中心点不变
答案:B
A和C是等价的,因为中心点是聚类中成员各坐标的均值
问题延伸:K-means的k值选择及更新,迭代终止的两个条件。
试题5:关于欠拟合(under-fitting),下面哪个说法是正确的?
A. 训练误差较大,测试误差较小
B. 训练误差较小,测试误差较大
C. 训练误差较大,测试误差较大
答案:C
当欠拟合发生时,模型还没有充分学习训练集中基本有效信息,导致训练误差太大。测试误差也会较大,因为测试集中的基本信息(分布)是
与训练集相一致的。
延伸问题:模型状态?怎样判定?工具是什么?
1、[HITML]哈工大2020秋机器学习Lab3实验报告_北言栾生的博客-CSDN博客
2、[HITML]哈工大2020秋机器学习Lab2实验报告_北言栾生的博客-CSDN博客
1、机器学习面试题库:1-10题(1day)_cui1004的博客-CSDN博客
2、机器学习面试题库:11-20题(2day)_cui1004的博客-CSDN博客
3、机器学习面试题库:21-30题(3day)_cui1004的博客-CSDN博客
4、机器学习面试题库:31-40题(4day)_cui1004的博客-CSDN博客
5、机器学习面试题库:41-50题(5day)_cui1004的博客-CSDN博客
建议关注博客cui1004的博客_空城不空99_CSDN博客-算法,java,Tensorflow学习领域博主
期末考试题型:
判断题:共8题,16分
填空题 :共12题,24分
简答题:共5题,30分
演算题:共2题,30分
同学们在准备期末考试时,对学习过的算法,首先要掌握算法的思想,并且能理解算法的数学表达。
考试重点:决策树,支持向量机,集成学习,朴素贝叶斯,逻辑斯蒂回归,线性判别分析,模型性能度量
其中演算题是决策树信息增益计算、朴素贝叶斯分类器!!
SVM很重要,群文件中有机器学习SVM习题集,大家可以参考学习!!
《机器学习》期末考试范围
一、试题范围:
课后习题及学习通作业(80%)+课本内容理解(20%,该部分题目不在课后习题范围内)
二、教材内容及课后习题(具体章节范围放在群文件中)
第1章:绪论
第2章:模型评估与选择
第3章:线性模型
第4章:决策树
第6章:支持向量机
第7章:贝叶斯分类器
第8章 集成学习
三、成绩评定方式
总评成绩=期末考试(70%)+平时成绩(30%,包括学习通作业20%与考勤10%)
四、考试时间与地点:
时间:6月10日(第15周星期四)5-6节
地点:计算机学院(环安楼),8-410