统计学习与机器学习有什么不同呢?其实统计学习也叫统计机器学习,从名字就可以看出,统计学习是从统计学科的角度、利用机器(编程算法)来对数据进行预测分析,机器学习差不多等于统计学习,机器学习可不可以不依赖统计方法?目前没找到资料证实。我个人的理解是,统计学习这种叫法更适用于学科理论,机器学习则偏于工程实践。
数学过关以后,还得懂编程语言、系统架构、数据库、异构平台上的高性能计算,要成为一个优秀的 AI 工程师,这些都得通。吴恩达就说过,深度学习的前沿是高性能计算。因为数学的进展是可遇而不可求的,而软硬件的进步是线性的甚至指数的,是一趟快车。你想冲在前沿,得搭上这趟快车。如果你只是数学好,编程和工程化能力不行,所能做的事情就比较有限,需要一个强有力的工程团队来支持你。实际上,我AI菌就了解到一些学院派的 AI 人士,他们的数学背景很好,但是编程玩得不溜,下面的学生又不给力,只能封闭在“数学—Matlab—论文” 这个三角里,对他们来说,编程成了一个障碍。
课程与书籍推荐
有一个非常非常简单的入门课——国立台湾大学叶丙成的概率课:
http://mooc.guokr.com/course/461/%E6%A9%9F%E7%8E%87/
但是上面这个课属于扫盲课,如果你觉得深度还不够,那么我还是推荐你从下面这些书籍中找一本来作为参考,因为概率论方面的书特别特别多,我推荐几本各具特色的:
1)首先是由Sheldon M. Ross编写的《概率论基础教程(第9版)》,这是一本在世界范围内被广泛使用的教材,内容严谨而且全面。鉴于概率论是大学本科阶段的必修内容,如果你不是忘掉太多,其实并不用重头开始学,所以备这样一本书,偶尔翻查一下也是不错的选择。
2) 统计思维——程序员数学之概率统计;相对而言这本就不那么学术化,更侧重概念的通俗解读,而非严格的数学推导。因为概率和统计常常是纠缠不在一起的,所以这本书里面也涉及到了部分统计学的内容。
像概率里面的期望、方差、概率密度函数、边缘分布、贝叶斯定理、全概率公式、矩母函数、二项分布、高斯分布、贝塔分布等等在机器学习中都非常非常重要。最后这本算是概率学习里面比较深的一本(也非常经典),供有深入学习需求的人研读。
3)概率与计算——随机算法与概率分析,Michael M. & Eli Upfal 著
注意统计和概率是不一样的,尽管它们的关系实在太紧密,所以讲概率的书里往往也会插入一些统计方面的知识。但还是专门讲统计的书更专注一些。统计的书挺多,但是非统计专业,也不必学得太深。
1)统计学(第四版),贾俊平等编著。这是国内高校普遍使用的一本教材,我觉得条例是比较清晰的,讲解也比较到位,如果你要系统地学,那么它是一个不错的选择。
2)还有李航老师的统计学方法也非常受到机器学习入门者的喜爱,这本书主要对监督学习的统计方法进行了细致的讲解
3)R语言实战——机器学习与数据分析,不要被名字遮住眺望的眼睛,这里的“数据分析”主要是指统计数据分析,所以这本书里有1/3在讲解统计知识,而且是剥掉冗余只留干活地收录了几乎所有你该知道的统计知识(甚至包括非参数检验的内容),R语言是辅助统计计算的工具,便于向你演示一些统计方法的具体细节。
4)统计推断是统计学的核心。统计推断一般包括参数估计和假设检验两个部分。其中假设检验包括参数假设检验和非参数检验两类。参数估计又包括点估计和区间估计两种,而点估计的方法主要有矩方法和极大似然法。如果你觉得希望在统计推断方面有跟深入的研究,那么下面这本书就是一个比较经典的读物。
概率论知识总结
统计学博大精深,AI菌表示没有办法总结。但是概率论知识的速成,可以看下面这篇文章
统计学习与机器学习有什么不同呢?其实统计学习也叫统计机器学习,从名字就可以看出,统计学习是从统计学科的角度、利用机器(编程算法)来对数据进行预测分析,机器学习差不多等于统计学习,机器学习可不可以不依赖统计方法?目前没找到资料证实。我个人的理解是,统计学习这种叫法更适用于学科理论,机器学习则偏于工程实践。
数学过关以后,还得懂编程语言、系统架构、数据库、异构平台上的高性能计算,要成为一个优秀的 AI 工程师,这些都得通。吴恩达就说过,深度学习的前沿是高性能计算。因为数学的进展是可遇而不可求的,而软硬件的进步是线性的甚至指数的,是一趟快车。你想冲在前沿,得搭上这趟快车。如果你只是数学好,编程和工程化能力不行,所能做的事情就比较有限,需要一个强有力的工程团队来支持你。实际上,我AI菌就了解到一些学院派的 AI 人士,他们的数学背景很好,但是编程玩得不溜,下面的学生又不给力,只能封闭在“数学—Matlab—论文” 这个三角里,对他们来说,编程成了一个障碍。
课程与书籍推荐
有一个非常非常简单的入门课——国立台湾大学叶丙成的概率课:
http://mooc.guokr.com/course/461/%E6%A9%9F%E7%8E%87/
但是上面这个课属于扫盲课,如果你觉得深度还不够,那么我还是推荐你从下面这些书籍中找一本来作为参考,因为概率论方面的书特别特别多,我推荐几本各具特色的:
1)首先是由Sheldon M. Ross编写的《概率论基础教程(第9版)》,这是一本在世界范围内被广泛使用的教材,内容严谨而且全面。鉴于概率论是大学本科阶段的必修内容,如果你不是忘掉太多,其实并不用重头开始学,所以备这样一本书,偶尔翻查一下也是不错的选择。
2) 统计思维——程序员数学之概率统计;相对而言这本就不那么学术化,更侧重概念的通俗解读,而非严格的数学推导。因为概率和统计常常是纠缠不在一起的,所以这本书里面也涉及到了部分统计学的内容。
像概率里面的期望、方差、概率密度函数、边缘分布、贝叶斯定理、全概率公式、矩母函数、二项分布、高斯分布、贝塔分布等等在机器学习中都非常非常重要。最后这本算是概率学习里面比较深的一本(也非常经典),供有深入学习需求的人研读。
3)概率与计算——随机算法与概率分析,Michael M. & Eli Upfal 著
注意统计和概率是不一样的,尽管它们的关系实在太紧密,所以讲概率的书里往往也会插入一些统计方面的知识。但还是专门讲统计的书更专注一些。统计的书挺多,但是非统计专业,也不必学得太深。
1)统计学(第四版),贾俊平等编著。这是国内高校普遍使用的一本教材,我觉得条例是比较清晰的,讲解也比较到位,如果你要系统地学,那么它是一个不错的选择。
2)还有李航老师的统计学方法也非常受到机器学习入门者的喜爱,这本书主要对监督学习的统计方法进行了细致的讲解
3)R语言实战——机器学习与数据分析,不要被名字遮住眺望的眼睛,这里的“数据分析”主要是指统计数据分析,所以这本书里有1/3在讲解统计知识,而且是剥掉冗余只留干活地收录了几乎所有你该知道的统计知识(甚至包括非参数检验的内容),R语言是辅助统计计算的工具,便于向你演示一些统计方法的具体细节。
4)统计推断是统计学的核心。统计推断一般包括参数估计和假设检验两个部分。其中假设检验包括参数假设检验和非参数检验两类。参数估计又包括点估计和区间估计两种,而点估计的方法主要有矩方法和极大似然法。如果你觉得希望在统计推断方面有跟深入的研究,那么下面这本书就是一个比较经典的读物。
概率论知识总结
统计学博大精深,AI菌表示没有办法总结。但是概率论知识的速成,可以看下面这篇文章