机器学习基础+算法+实战,不走弯路

 

如果要把机器学习的掌握程度划分成三种境界:

第一层  拥有必要的数学与编程基础,了解算法的使用;

数学基础:

|线性代数

|多元微积分

|概率论与数理统计

|复杂性优化

编程基础:python|numpy和pandas库等

核心算法:

|分类相关的算法:K-近邻、决策树、朴素贝叶斯、逻辑回归、支持向量机等

|回归相关的算法:线性回归、树回归等

|聚类相关的算法:K-均值、层次聚类、密度聚类等

 

第二层  能把算法运用到项目实践中,能真正的利用机器学习来解决一些问题,包括但不限于以下问题:

模式识别:

l 真实场景中的物体

l 人脸识别或者表情识别

l 语音识别

本质提取:

l 自由格式的文本,语音或者视频

l 鉴别垃圾邮件

在如下情景中发现异常:

l 金融交易异常

l 传感器读取异常

在如下情景中做预测:

l 未来股价或者货币汇率

l 哪个电影这个人会喜欢?

 

第三层  对算法的推导,模型的训练融会贯通

这一步要求对数学公式推导了如指掌,各种模型的优化也深谙其道。除了数学知识、编程基础、算法实现,还需要一些辅助技能来构成完整的机器学习体系:

|“统计学习”既是机器学习的理论基础也是工具之一。但对于机器学习方向的统计学知识,又不仅仅包括经典的统计学理论,还有在此基础上的新的统计学理论和方法。这部分学习可以加深对算法原理的理解和推导。

|“特征工程”非常重要。“数据与特征决定了机器学习的上限,而算法和模型只是逼近这个上限而已。”特征对于模型的效果起大了极大的作用。实际开发中,大部分的时间都在减少数据存储和输入的代价,降低数据的维度 ,发现更多深入的特征,提升准确率。

|“集成学习”——提升的秘密。当你掌握单个模型的训练之后,“集成学习”将帮助你把多个偏好的模型完美融合。

|“深度学习“。从中掌握动态规划的方法以及各种神经网络模型的训练,实现更多的智能应用。

 

这些内功,才是你形成核心竞争力的关键。

 

在此分享我学习路上帮助良多的学习资源:

一个是斯坦福的免费公开课——机器学习,由Andrew Ng主讲。英文授课,配中文字幕,如果你有毅力和决心,那么啃这个课程是很不错的选择。网址:斯坦福大学公开课 :机器学习课程

另一个是DC学院的《机器学习(入门)》课程,这门课真的受益匪浅,可能主要还是我英文不够好,斯坦福的课没有啃下来。这门课基本一站试的解决了我入门的问题,包括从编程基础+数学知识+算法实现+项目实践,也附上学习地址吧,比较适合小白去入门的课程:DC学院:《机器学习(入门)》     对了,够课的时候填我的邀请码:AFAJ9I    ,应该会有优惠的(能省则省吧)。

你可能感兴趣的:(机器学习基础+算法+实战,不走弯路)