1、下面哪一项可以作为模型好的标准?
2、我们希望模型在未见样本上表现好,这一能力通常被称作模型的什么能力?
3、在评价模型性能时,我们更希望它____(泛化能力强/训练误差为0)
泛化能力强
1、模型在“未来”样本上的误差被称作
2、有的情况下,模型学习到了训练数据满足的特有性质,但这些性质不是一般规律,这种现象被称之为
3、在训练模型时,只需要保证模型的训练误差最小即可。____(是/否)
否
1、模型选择有哪些关键问题?
2、为了说明模型在统计意义上表现好,我们最需要考虑
3、在没有“未来数据”的情况下,我们____(能/不能)通过训练集对泛化误差进行估计。
能
1、下列什么方法可以用来获得从原始数据集中划分出“测试集”?
2、下面哪一项不是留出法的注意事项?
3、训练集与测试集____(应该互斥/可以不互斥)
应该互斥
1、调参以什么集合上的性能作为评价标准?
2、当我们使用一个多项式函数去逼近数据集时,下面哪一个说法是正确的?
3、超参数一般由____(人工/学习)确定
人工
1、“好”模型取决于下列哪些因素?
2、收购西瓜的公司希望把瓜摊的好瓜都尽量收走,请问他的评价标准是?
3、回归任务的性能度量之一均方误差 E ( f , D ) = 1 m ∑ i = 1 m ( f ( x i ) − y i ) 2 E(f, D)=\frac{1}{m} \sum_{i=1}^m (f(x_i)-y_i)^2 E(f,D)=m1∑i=1m(f(xi)−yi)2 添加系数后 c E ( f , D ) ( c > 0 ) cE(f,D) (c>0) cE(f,D)(c>0) 会影响判断那个模型是最好的。___(是/否)
否
1、以下什么检验是基于列联表的?
2、下面关于交叉验证t检验错误的是?
3、两种算法在某种度量下取得评估结果后,可以直接比较以评价优劣。____(是/否)
否
1、在训练集上的误差被称作
2、当学习任务对数据分布的轻微变化比较鲁棒且数据量较少时,适合使用什么样的数据集划分方式?
3、我们通常将数据集划分为训练集,验证集和测试集进行模型的训练,参数的验证需要在____上进行,参数确定后____重新训练模型。
4、当西瓜收购公司去瓜摊收购西瓜时既希望把好瓜都收走又保证收到的瓜中坏瓜尽可能的少,请问他应该考虑什么评价指标?
5、两种算法在某种度量下取得评估结果后不能直接比较以评判优劣的原因中,正确的是
6、训练模型时,选择经验误差最小的模型会存在什么风险。____(过拟合/欠拟合)
过拟合
7、对于从数据 ( 0 , 1 ) , ( 1 , 0 ) , ( 1 , 2 ) , ( 2 , 1 ) (0,1),(1,0),(1,2),(2,1) (0,1),(1,0),(1,2),(2,1) 通过最小二乘拟合的不带偏置项的线性模型 y = x y=x y=x ,其训练误差(均方误差)为____ (保留三位小数)
1.000
8、使用留出法对数据集进行划分时,为了保持数据分布的一致性,可以考虑什么采样。____(分层采样/随机采样/有放回采样)
分层采样
9、当我们使用留出法对数据集进行划分后,在训练集上通过两个不同的算法训练出2个模型,并通过测试集上的性能评估得到表现最好的模型,这一模型可以直接推荐给用户。 ____(是/否)
否
10、考虑一个三分类数据集,其由30个西瓜,30个苹果,30个香蕉构成。先有一个学习策略为预测新样本为训练集中样本数目最多类别的分类器(存在多个类别样本数量一样多时则随机选择一个类别预测),请问通过什么评估方式会导致其平均准确率为0。____(留出法/交叉验证,每一折样本数大于1/留一法)
留一法
11、当我们使用留一法进行评估时会出现什么问题。____(训练模型与使用整个数据集训练的模型差异大/经验误差与泛化误差偏差大)
经验误差与泛化误差偏差大
12、考虑如下分类结果混淆矩阵,其F1度量为____(保留3位小数)
0.364
查准率: P = T P T P + F P P=\frac{TP}{TP+FP} P=TP+FPTP
查全率: R = T P T P + F N R=\frac{TP}{TP+FN} R=TP+FNTP
F1: F 1 = 2 × P × R P + R = 2 × T P 样例总数 + T P − T N F1=\frac{2\times P \times R}{P+R}=\frac{2 \times TP}{样例总数+TP-TN} F1=P+R2×P×R=样例总数+TP−TN2×TP
13、McNemar检验基于____(成对t检验/卡方检验)
卡方检验
14、假设我们已经建立好了一个二分类模型, 输出是0或1, 初始阈值设置为0.5, 超过0.5概率估计就判别为1, 否则就判别为0 ; 如果我们现在用另一个大于0.5的阈值, 一般来说,下列说法正确的是
15、对于留出法,下列说法正确的是