这系列的题目来源于周晓飞老师期末发的题库,自留做复习用的 加油加油!
目录
- 计算题13
- 简答题3
- 单选题82
- 单选题58
- 多选题19
- 简答题22
知识点可以参考这篇博客:【一起入门MachineLearning】中科院机器学习第*课-聚类算法:K均值(K-means)
计算题13
![【一起入门MachineLearning】中科院机器学习-期末题库-【计算题13+简答题3,22+单选题58,82+多选题19】_第1张图片](http://img.e-com-net.com/image/info8/81f696182e594a2f9748ae5c6044bf29.jpg)
![【一起入门MachineLearning】中科院机器学习-期末题库-【计算题13+简答题3,22+单选题58,82+多选题19】_第2张图片](http://img.e-com-net.com/image/info8/6cc018ba71ea468b9e03e6ac3c5c6c5b.jpg)
不想计算距离的话直接画图会更加快。
![【一起入门MachineLearning】中科院机器学习-期末题库-【计算题13+简答题3,22+单选题58,82+多选题19】_第3张图片](http://img.e-com-net.com/image/info8/e391e75b00354f06bdc711ceb94b8200.jpg)
![【一起入门MachineLearning】中科院机器学习-期末题库-【计算题13+简答题3,22+单选题58,82+多选题19】_第4张图片](http://img.e-com-net.com/image/info8/2f94d0720af44e67bf8aa3b2d78e68c8.jpg)
简答题3
![【一起入门MachineLearning】中科院机器学习-期末题库-【计算题13+简答题3,22+单选题58,82+多选题19】_第5张图片](http://img.e-com-net.com/image/info8/492550de408d44bb89ae82f7d80f3e0a.jpg)
![【一起入门MachineLearning】中科院机器学习-期末题库-【计算题13+简答题3,22+单选题58,82+多选题19】_第6张图片](http://img.e-com-net.com/image/info8/98d65eed70b341a0993f332b914ff1bf.jpg)
单选题82
![【一起入门MachineLearning】中科院机器学习-期末题库-【计算题13+简答题3,22+单选题58,82+多选题19】_第7张图片](http://img.e-com-net.com/image/info8/9ba01e325ad6467098ce7533c917151a.jpg)
这个题目的计算方法和上两个题一样,不再赘述。
单选题58
![【一起入门MachineLearning】中科院机器学习-期末题库-【计算题13+简答题3,22+单选题58,82+多选题19】_第8张图片](http://img.e-com-net.com/image/info8/5af6488e04b7403aae4e5c58b9302532.jpg)
- k均值会受到初始值和离群点的影响,导致每次的分类结果不稳定,B正确。
- k均值比较高效,时间复杂度接近线性,C错误。
- 可以采用核函数的方法对k均值算法进行调优,D错误。
多选题19
![【一起入门MachineLearning】中科院机器学习-期末题库-【计算题13+简答题3,22+单选题58,82+多选题19】_第9张图片](http://img.e-com-net.com/image/info8/d8ef6b87e48d4155bae6058485982aa8.jpg)
- 相似性度量也就是计算距离的方式。相似性度量,初始聚类,离群点都会影响分类结果,答案选择BC
简答题22
22.K均值算法的优缺点是什么,如何对其调优。
缺点:
- 受初值和离群点的影响每次的结果不稳定
- 结果通常不是全局最优而是局部最优解
- 无法很好地解决数据簇分布差别比较大的情况
- 不太适用于离散分类
优点:
- 对于大数据集,相对高效 ,计算复杂度是 O(NKt) 接近于线性,其中N是数据对象的数目,K是聚类的簇数,t
是迭代的轮数。
调优方法:
- 数据归一化
- 离群点预处理
- 采用核函数
- 合理选择K值。