机器学习R复习提纲-TYUT

注:本提纲针对课本内容,PPT需要全看。

考试题型:

选择10道 填空10道 判断10道 简答4/5道 计算4/5道

计算:线性回归/逻辑回归/决策树/梯度下降策略/BP神经网络计算输出值

选择:都是原题。PPT中98道选择+Edu选择

第一章

1.机器学习的定义。

2.什么是版本空间。

3.“没有免费的午餐“定理

4.人工智能,机器学习,深度学习三者间的关系。

5.机器学习方法的分类:一类是有监督学习,一类是无监督学习。

第二章

1.什么是过拟合和欠拟合?过拟合是由什么导致的?如何缓解过拟合?

2.常见的评估方法:留出法,交叉验证法,自助法。

3.什么是调参

4.性能度量:查准率,查全率,F1分数的计算(2章PDF第84页例题)

5.ROC与P-R的区别

6.偏差与方差的计算

第三章

1.对离散属性,有序关系,通过连续化转化为连续值;对无序关系,进行哑变量化。

2.哑变量化的优点好处有哪些?

3.Sigmoid函数

4.线性判别分析的基本原理是?

5.多分类学习中,经典的拆分策略。三个过程都要掌握。

6.类别划分通过编码矩阵制定,编码矩阵常见的形式。

7.“再缩放”的三类做法:欠采样,过采样,阈值移动的定义、过程。

8.损失函数 

第四章

1.K近邻算法优缺点,k值的选取对结果的影响,kd树 

2.根据训练集生成CART决策树。

3.剪枝处理的基本策略

第五章

1.BP神经网络计算输出值

2.bp神经网络过程

第六章

1.样本空间中任一点到超平面的距离计算

2.正则化

3.软间隔支持向量机和硬间隔支持向量机的区别

你可能感兴趣的:(机器学习,机器学习,r语言,人工智能)