机器学习机试题及解析(一)

1.随机数列要多长才能使数字7出现的概率至少为9/10?

答案:22.

解析:

初步分析,出现7的概率,包括1次 或者 2次 或者 3次 .,所以无法直接一步计算,我们利用对立事件转换,计算不出现7的概率来分析,有
随机数每一位出现数字7的概率为0.1,不出现数字7的概率为0.9 
设随机数要x位才能使数字7出现的概率 至少0.9
1-0.9^x≥0.9
0.9^x≤0.1
xlg0.9≤-1
x*(2*lg3-1)≤-1
x*(2*0.4771-1)≤-1
-0.0458x≤-1
x≥21.83
故随机数至少要22位才能使数字7出现的概率至少0/10.

 

2.神经网络,非线性激活函数包括sigmoid/tanh/ReLu等

    A.只有在最后输出层才会用到

    B.总是输出0/1

    C.其他说法都不正确

    D.加速反向传播时的梯度计算

答案:C

 

3.一下哪个模型属于生成模型:

A.DNN

B.朴素贝叶斯

C.支持向量机

D.逻辑回归

答案:B

解析:

    判别式模型(Discriminative Model)是直接对条件概率p(y|x;θ)建模。常见的判别式模型有 线性回归模型、线性判别分析、支持向量机SVM、神经网络等。

    生成式模型(Generative Model)则会对x和y的联合分布p(x,y)建模,然后通过贝叶斯公式来求得p(yi|x),然后选取使得p(yi|x)最大的yi,即:

机器学习机试题及解析(一)_第1张图片

常见的生成式模型有:隐马尔可夫模型HMM、朴素贝叶斯模型、高斯混合模型GMM、LDA等。

    详细分析可见https://www.cnblogs.com/fanyabo/p/4067295.html

 

4.关于ensemble learning,下面说法正确的是:

A.单个模型都是使用同一算法

B.在集成学习中,使用“平均权重”会好于使用“投票”

C.单个模型之间有低相关性

答案:C

 

5.以下说法哪些是正确的?

A.在使用KNN算法时,k通常取奇数

B.KNN是有监督学习算法

C.在使用KNN算法时,k取值越大,模型越容易过拟合

D.KNN和k-means都是无监督学习算法

答案:B

解析:

    A选项,k是可以取偶数的,而且可以给临近样本赋予不用的权值(如1/d)来进行分类。

    C选项,K值较小,则模型复杂度较高,容易发生过拟合,学习的估计误差会增大,预测结果对近邻的实例点非常敏感。K值较大可以减少学习的估计误差,但是学习的近似误差会增大,与输入实例较远的训练实例也会对预测起作用,使预测发生错误,k值增大模型的复杂度会下降。

    D选项,KNN是监督学习算法。

你可能感兴趣的:(机试题小解,machine,learning)