DD机器学习岗面试总结

(1)自我介绍

(2)分类和回归的区别?

1.从预测的角度分析,回归模型输出是连续性线性输出,可以用一条直线较好的拟合,分类的输出是离散化的。分类模型是将回归模型的输出离散化。

2.从训练的角度来看,分类模型和回归模型的目标函数不同,分类常见的是log loss,hinge loss,而回归是square loss。

首先解释一下回归问题,分类问题的不同点。回归问题预测的结果是连续的值,而分类问题的预测结果是离散的。拿支持向量机举个例子,分类问题和回归问题都要根据训练样本找到一个实值函数g(x). 回归问题的要求是:给定一个新的模式,根据训练集推断它所对应的输出y(实数)是多少。也就是使用y=g(x)来推断任一输入x所对应的输出值。分类问题是:给定一个新的模式,根据训练集推断它所对应的类别(如:+1,-1)。也就是使用y=sign(g(x))来推断任一输入x所对应的类别。综上,回归问题和分类问题的本质一样,不同仅在于他们的输出的取值范围不同。分类问题中,输出只允许取两个值;而在回归问题中,输出可取任意实数。

注意:分类模型和回归模型的本质是一样的,分类本质上是一个线性模型,因为除去sign()、sigmoid()映射函数关系,其他步骤、算法都是线性回归的。可以说,分类都是以线性回归为理论支撑的。回归模型,无法做到sigmoid()的非线性形式,sigmoid()可以轻松处理0/1分类问题。分类问题其实仅在回归的基础上,套用了一个逻辑函数,但也就是由于这个逻辑函数,逻辑回归成为机器学习领域一颗耀眼的明星,更是计算广告学的核心。

Refercnce:

http://blog.csdn.net/wspba/article/details/61927105

http://blog.csdn.net/omenglishuixiang1234/article/details/50247143

(3)模型训练的方法有哪些么?

最小二乘法、最大似然估计

(3)你最熟悉的分类算法有?

逻辑回归、支持向量机、神经网络、决策树、AdaBoost

(4)那你简单说一下AdaBoost算法?

(5)在AdaBoost算法中,你提到了集成学习,那你能简单说一下集成学习么?

(6)集成学习中,你提到了随机森林,那你能简单介绍一下随机森林么?

(7)如何解决过拟合现象?先解释一下过拟合吧!如何解决?

(7)决策树是怎么进行预测的?

我的回答剪枝。

能说的更具体一些么?

你了解决策树的ID3、C4.5、CART算法么?

(8)你一直在说支持向量机,那你能说一下核函数的作用吗?

(9)你了解的聚类算法有哪些?

k-means算法

(10)还有其他的聚类算法么?

比如说:层次聚类、密度聚类、神经网络聚类、统计学聚类等

(11)详细介绍一下k-means算法的原理?

答案在我写的另一篇文章中:http://blog.csdn.net/program_developer/article/details/79509355

(12)k-means是如何调整中心的?

答案在我写的另一篇文章中:http://blog.csdn.net/program_developer/article/details/79509355

(13)噪点对k-means的影响大么?

答案在我写的另一篇文章中:http://blog.csdn.net/program_developer/article/details/79509355

(14)简答说一下神经网络

大概就这些,想起来在补吧!

先把问题记录一下,一道一道慢慢解决吧!

 

你可能感兴趣的:(面试+笔试)