机器学习-机器学习概论

1.【单选题】以下有关机器学习理解不正确的是 ( )。

A、查询大量的操作数据去发现新的信息

B、从大量的业务数据中分析有兴趣的新颖知识辅助决策的过程

C、机器学习的结果不一定能辅助决策

D、需要借助统计学或机器学习的一些算法

解:A

机器学习并不是查询大量的操作数据去发现新的信息,而是寻找已有数据中存在的规律。

2.【单选题】移动运营商对客户进行细分,设计套餐和营销活动可以使用下面哪种机器学习方法( )。

A、贝叶斯分类器

B、关联方法

C、聚类算法

D、多层前馈网络

解:C

移动运营商对客户进行细分,设计套餐和营销活动。首先客户是没有标签,我们需要对于没有标签的数据划分成不同的分类,这种机器学习方法属于聚类算法。

3.【单选题】移动运营商对客户的流失进行预测,可以使用下面哪种机器学习方法比较合适 ( )。

A、一元线性回归分析

B、关联方法

C、聚类方法

D、多层前馈网络

解:D

移动运营商对客户的流失进行预测,我们可以将其看成一个分类问题。根据客户的已有信息,例如年龄、收入等等,然后判断他属于流失人员还是不属于流失人员。

一元线性回归分析错在数据特征往往不会是一种。

关联方法是用于发现数据特征之间的联系,通常用于减低数据维度,不能用于分类问题。

聚类方法不能用于解决分类问题。

多层前馈神经网络可以用于解决分类问题。

4.【单选题】数据预处理对机器学习是很重要的,下面说法正确的是( )。

A、数据预处理的效果直接决定了机器学习的结果质量

B、数据噪声对神经网络的训练没什么影响

C、对于有问题的数据都直接删除即可

D、预处理不需要花费大量的时间

解:A

数据预处理的效果直接决定了机器学习的结果质量,正确。因为数据的好坏直接决定了我们从数据中学习到的规则,因此对数据进行预处理是十分必要的。

数据噪声对神经网络的训练具有影响。神经网络中噪声的注入可以有很多种,如输入层,隐层,权重,输出层等。1.输入层注入噪声,其实可以看作是数据集增强的一种手段,本质是一种正则化。原因是神经网络对于噪声并不健壮,只好混入噪声再进行训练,提高鲁棒性。2.输出层注入噪声,其实是对标签噪声建模。

对于有问题的数据,除了直接删除还可以进行平滑处理等操作使其有效。

预处理是机器学习最为关键的一步,数据是机器学习的灵魂。如果数据足够精确,可以尽可能地降低训练难度。

5.【单选题】以下哪个步骤不是机器学习所需的预处理工作( )。

A、数值属性的标准化

B、变量相关性分析

C、异常值分析

D、与用户讨论分析需求

解:D

与用户讨论分析需求不是对数据的预处理,而是明确我们需要完成的任务。

6.【多选题】对于机器学习中的原始数据,存在的问题可能有( )。

A、错误值

B、重复

C、异常值

D、不完整

我的答案:ABCD

数据可能存在错误、重复、异常值、不完整等问题。

你可能感兴趣的:(机器学习,Python,机器学习,数据分析)