机器学习
https://www.coursera.org/learn/machine-learning#
授课:Andrew Ng
制作:斯坦福大学
开课时间:10月31日
这是本列表中最受欢迎的课程。该课程将广泛介绍机器学习、数据挖掘和统计模式识别。
相关主题包括:
•监督式学习(参数和非参数算法、支持向量机、核函数和神经网络)。
•无监督学习(集群、降维、推荐系统和深度学习)。
•机器学习实例(偏见/方差理论;机器学习和AI领域的创新)。
课程将引用很多案例和应用,你还需要学习如何在不同领域应用学习算法,例如智能机器人(感知和控制)、文本理解(网络搜索和垃圾邮件过滤)、计算机视觉、医学信息学、音频、数据库挖掘等领域。
本课程持续11周,用户评分平均4.9/5.0分。课程免费,你也可以在完成课程后花79美元获得证书。
https://www.coursera.org/learn/ml-foundations
授课:Carlos Guestrin, Emily Fox
制作:华盛顿大学
开课时间:10月24日
本课程将让你从一系列案例研究中获得机器学习的实践经验。学完本课程,你将学会如何根据房屋特征预测房价,分析用户评论的情绪,检索感兴趣的文档,推荐产品,以及搜索图片。通过这些实用案例,你将能够在各种领域中应用机器学习方法。
学完本课程,你将能够:
•发掘机器学习的潜在应用
•描述回归、分类和聚类的核心区别
•为潜在的应用选择合适的机器学习任务
•应用回归、分类、聚类、数据检索、推荐系统,以及深度学习
•把数据表示为机器学习模型输入的特征
•根据每个任务的相关误差度量评估模型质量
•使用数据集来拟合模型以分析新数据
•构建一个核心使用机器学习的端到端的应用程序
•用Python实现这些技术
本课程将持续6周,每周要求5-8小时的投入。用户评分平均4.6/5.0分。课程免费,你也可以在完成课程后花59美元获得证书。
https://www.edx.org/course/learning-data-introductory-machine-caltechx-cs1156x#!
授课:Yaser S. Abu-Mostafa
制作:加州理工学院
本课程是机器学习的入门课程,将涵盖基本理论,算法和应用程序。本课程平衡理论和实践,并覆盖数学和启发式算法。讲座的以故事性的风格进行:
•什么是学习?
•机器能学习吗?
•怎样使机器学习?
•怎样使机器好好学习?
•拓展讲座
你将:
•了解机器学习的基本理论原则、算法和应用
•了解机器学习理论与实践之间的联系
•掌握机器学习的数学和启发式算法及其在现实世界中的应用
本课程持续10周,每周要求10-20小时的投入。课程免费,你也可以在完成课程后花49美元获得证书。
4.统计学习
http://online.stanford.edu/course/statistical-learning-Winter-16
授课:Trevor Hastie, Rob Tibshirani
机构:斯坦福大学
这是一个介绍性的有监督学习课程,重点是回归和分类方法。
教学大纲如下:
•线性回归和多项式回归,逻辑回归和线性判别分析
•交叉验证和自举,模型选择和正则化方法(ridge和lasso)
•非线性模型,样条和广义可加模型
•基于树的方法,随机森林和boosting;支持向量机
此外,课程还会讨论一些无监督学习方法,例如主成分和聚类
本课程不是数学课程,所有的计算都用R语言。如果你不熟悉R语言也没关系,会有专门讨论R语言的课程。每一章会有循序渐进的更详细的分节以实现每一章讨论的技术。
课程免费,每周要求3-5小时学习课程材料。
5.机器学习:回归
https://www.coursera.org/learn/ml-regression
授课:Carlos Guestrin, Emily Fox
制作:华盛顿大学
开课时间:10月24日
本课程中,你将探索用于预测任务和特征选择的线性回归的正则化。你将能够处理非常大的特征集,并在各种复杂的模型中进行选择。你还将分析数据方面(例如异常值)对所选模型和预测的影响。为了适应这些模型,你需要实现扩大到大型数据集的优化算法。
完成本课程,你将能够:
•描述一个回归模型的输入和输出
•数据建模时对比比较偏差和方差
•使用优化算法预估模型参数
•使用交叉验证调整参数
•分析模型性能
•理解稀疏概念以及LASSO如何导致稀疏
•选择模型的方法
•利用模型形成预测
•使用房屋数据集构建预测房价的回归模型
•用Python实现这些技术
本课程持续6周,每周要求5-8小时的投入。当前用户评分是4.8/5.0。课程免费,你也可以在完成课程后花59美元获得证书。
6.机器学习:分类
https://www.coursera.org/learn/ml-classification
授课:Carlos Guestrin, Emily Fox
制作:华盛顿大学
开课时间:10月24日
本课程中,你将创建能为各种任务提供最高性能的分类器。你将熟悉逻辑回归、决策树、boosting等技术。此外,你将能够使用随机梯度上升设计并实现大规模学习这些模型的基础算法。你将在真实世界的、大规模的机器学习任务上实现这些技术。你还将解决在现实世界中应用ML时将面临的重要任务,包括处理丢失的数据和测量准确率和召回率以评估分类器。
完成本课程,你将能够:
•描述分类模型的输入和输出
•解决二元分类和多类分类问题
•实现大规模分类的逻辑回归模型
•使用决策树创建非线性模型
•使用boosting提高任何模型的性能
•使用随机梯度上升扩展方法
•描述决策边界
•构建预测产品评论数据集中的情绪的分类模型
•分析财务数据以预测贷款违约
•使用处理丢失数据的技术
•使用准确率-召回率度量评估模型
•用Python(或其他语言,但强烈建议Python)实现这些技术
本课程持续7周,当前用户评分是4.6/5.0。课程免费,你也可以在完成课程后花59美元获得证书。
7.机器学习:聚类与检索
https://www.coursera.org/learn/ml-clustering-and-retrieval
授课:Carlos Guestrin, Emily Fox
制作:华盛顿大学
开课时间:10月24日
本课程结束时,你将能够:
•使用“k-最近邻居”原则创建一个文件检索系统。
•识别文本数据的各种相似度。
•描述如何将“k-最近邻居”扩展应用于回归和分类。
•使用“K-均值”按主题划分文件的聚类。
•使用潜狄利克雷分配(LDA)创建混合成员模型。
•描述如何使用MapReduce达到k-均值的并行。
•研究高斯(Gaussians)混合模型,估计密度。
•使用期望最大化(EM)原则拟合高斯混合模型。
•比较和对比初始化技术,实现非凸优化目标。
•在Python中实现上述技术。
本课程持续6周,当前用户评分是4.9/5.0。课程免费,你也可以在完成课程后花59美元获得证书。
https://www.udemy.com/unsupervised-machine-learning-hidden-markov-models-in-python/
授课:Justin C
虽然深度学习中当前流行的是使用循环神经网络为序列建模,本课程将介绍已有几十年历史的机器学习算法——隐马尔可夫模型。
在本课程中,你将学习:
•如何使用梯度下降发来解决HMM的最优参数,作为流行的EM算法的替代。
•如何在Theano库中处理序列
•如何观察疾病和健康的模型,并计算加入你生病了,如何预测生病持续的时间。
•如何使用马尔可夫模型来分析人们与你的网站的互动行为,并解决可能影响你的SEO的高跳出率等问题。
•马尔可夫模型的实际应用,包括生成图像等。
该课程包含35个教学视频,总时间为4小时。目前的用户评分是4.7/ 5。不过该课程不是免费的,价格是50美元。
https://www.udemy.com/data-science-and-machine-learning-with-python-hands-on/
授课:Frank Kane
如果你已有一些编程或脚本经验,本课程将教给你科技行业中数据科学家真正使用的技术,为你进入这个热门的职业做好准备。这个全面的课程包括68个讲座,近9个小时的视频,大多数主题包含有动手做的Python代码示例,可以用作实践的参考。
本课程的主题来自对大型科技公司的数据科学家的真实工作技能的分析,它涵盖了企业需求的机器学习和数据挖掘技术,包括:
•回归分析
•K均值聚类
•主成分分析
•训练/测试和交叉验证
•贝叶斯方法
•决策树和随机森林
•多元回归
•多层次模型
•支持向量机
•增强学习
•协同过滤
•K-最近邻算法
•偏差/方差权衡
•集成学习
•TF/IDF
该课程费用为35美元,目前的平均用户评分是4.6/5.0分。
10.数据科学家和分析学的机器学习
https://www.edx.org/course/machine-learning-data-science-analytics-columbiax-ds102x-0
授课:Ansaf Salleb-Aouissi, Cliff Stein, DavidBlei, Itsik Peer, Mihalis Yannakakis, Peter Orbanz
本课程是机器学习和算法的介绍性课程。你将对机器学习的原理有一个基本的了解,并使用预测分析获得实用的解决方案。你还将理解为什么算法在大数据分析中发挥着重要作用。
在本课程中,你将学习:
•什么是机器学习,以及机器学习与统计和数据分析的关系。
•机器学习如何使用算法搜索数据中的模式。
•如何使用数据模式为现实世界中的问题做决策和预测,例如基因组学和早产等医疗问题。
•如何使用主题建模发现大型文档集中的隐藏主题。
•如何准备数据、处理缺失的数据并为不同行业创建自定义数据分析解决方案
•基础、常用的算法,包括排序,搜索,贪婪算法以及动态规划。
本课程持续5周,每周要求7-10小时的投入。课程免费,你也可以在完成课程后花99美元获得证书。
转自:http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2651988872&idx=5&sn=1a721c05ccfc1a8c5d05a820461e9655&chksm=f1215779c656de6fe6e3ebc56d3d72bcb382c5928bd41d73c06fe99e1e0504f0349170c08185&mpshare=1&scene=2&srcid=1028ccm3hGEvWFJEU39YNdqM&from=timeline&isappinstalled=0#wechat_redirect