第一章-机器学习简介 深度之眼_吴恩达机器学习作业训练营

目录

专栏简介:

一,机器学习简介

1.1 机器学习定义

1.1 机器学习的重要性

1.2 应用领域

二、监督学习

三、无监督学习

四、总结


专栏简介:

本栏主要内容为吴恩达机器学习公开课的学习笔记,以及深度之眼的吴恩达机器学习作业训练营,辅助材料有黄海广博士的<<机器学习个人笔记>>。

因为是新手入门,所以有所错误的地方还请指正,有好的参考资料也请互相交流学习。

一口气报了两个训练营,希望都能努力学下去,两个内完成任务,入门机器学习!

一,机器学习简介

1.1 机器学习定义

第一章-机器学习简介 深度之眼_吴恩达机器学习作业训练营_第1张图片 图片1-1 欢迎学习机器学习

机器学习是人工智能领域中的一个子领域,有很多人对其有所定义,课程中提及和一些资料补充有:

  • Arthur Samuel(1958):一个研究不进行显示编程而赋予计算机学习能力的领域。

  • Tom Mitchell(1998):对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序在从经验E中学习(吴恩达老师吐槽说T,P,E是为了押韵)。

  • 统计学习方法(李航):统计机器学习是关于计算机基于数据构建统计模型并运用模型对数据进行预测和分析的一门学科。

  • 动手学深度学习(李沐):通俗来说,机器学习是一门讨论各式各样适用于不同问题的函数形式,以及如何使用数据来有效获取函数参数具体值的学科。

  • 机器学习(周志华):机器学习正是这样的一门学科,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。在计算机系统中,“经验”通常以“数据”形式存在,因此机器学习所研究的主要内容,是关于在计算机上从数据中产生“模型”的算法,即“学习算法”。

在我个人看来,机器学习是一个提出适当前提假设,设立算法模型,用数据拟合出模型对客观规律的最优近似的人工智能方向,其背后有大量的统计学,计算机科学等学科作为理论支撑。

机器学习大致可分为三个三个子领域: 监督学习(Supervised Learning)无监督学习(Unsupervise Learning)以及强化学习(Reinforcement Learning)

本课程主要涉及监督学习和无监督学习的内容,同时课程中还重点介绍了一些有关机器学习的使用技巧。

1.1 机器学习的重要性

作为信息处理的一个重要的手段,机器学习已经在我们生活的方方面面中得以运用,如搜索网站的结果排序,购物网站的商品推荐,语言翻译以及图像识别等等。

其重要性主要在于:

  • 其是人工智能领域中很有潜力的部分。

  • 能赋予计算机自我学习的能力。

1.2 应用领域

机器学习以及在许多领域中获得了成功,包括但不限于:

  • 数据挖掘:分析用户在web上的点击数据,为用户提供更好的服务;分析医疗数据,更好的了解疾病;计算生物学,分析人类基因组;工程方面等等。
  • 计算机自编程:使得计算机能自己编程出人类难以编写的程序,例如自动驾驶,手写识别,自然语言处理(NLP)以及计算机视觉(CV)等等。
  • 私人定制程序:针对每个用户自身的喜好进行特殊推荐等。如购物网站的商品推荐,以及视频网站的视频推荐等等。

二、监督学习

监督学习是一种很重要的机器学习子领域,其特点在于给定一组有标签的数据,学习数据与标签之间的关系,按照标签类型的不同,问题大致可分为两种类型:回归问题以及分类问题。

第一章-机器学习简介 深度之眼_吴恩达机器学习作业训练营_第2张图片 图1-2 分类与回归问题样例

其中回归问题是指预测的数据标签取值可以是连续的数值,分类问题则是指数据的标签由离散的类别组成,一般用-1,0,1等整数编码。

本课程中会学习4种监督学习算法,分别是:

  • 多元线性回归模型(回归)

  • 逻辑回归模型(分类)

  • 神经网络模型(分类与回归)

  • 支持向量机模型(分类与回归)

三、无监督学习

同样是机器学习的子领域,与监督学习不同的是,在无监督学习中,数据样本是没有标签的。所以无监督学习的目标就在于分析数据样本本身的一些共性和特性,按照目的不同,大致可将问题分为降维问题和聚类问题。

第一章-机器学习简介 深度之眼_吴恩达机器学习作业训练营_第3张图片 图1-3 无监督学习

其中降维问题是指以特定的方式利用样本数据的特性,减少数据样本的维度,从而达到减少数据量且尽可能不丢失信息的目的。聚类问题是指通过分析数据样本中的共性,将数据划分为不同类聚簇。

第一章-机器学习简介 深度之眼_吴恩达机器学习作业训练营_第4张图片 图1-4 无监督学习应用

  无监督学习的应用也十分广泛,如图1-3所示有:

  • 计算机集群管理(Organize computing clusters) ,根据计算机集群的运行状态,组织计算机协同工作,重新分配资源,布局网络。

  • 市斜体样式场分割(Market of clustering),根据客户信息将客户划分为不同的群体,可以进行精准的推荐产品和提供服务。
  • 社交网络分析(Social network analysis),根据社交信息划分关系密切的人群。
  • 天文数据分析(Astronomical data analysis),根据天文数据划分星系群。

本课程中将会涉及到的无监督学习算法有:

  • K-means算法(聚类)

  • 主成分分析法(降维)

  • 异常检测算法(特殊的聚类)

四、总结

本章作为吴恩达机器学习的开篇,目的在于介绍机器学习,主要内容有:

  • 介绍了机器学习的不同定义,其重要性以及应用场景。

  • 介绍了监督学习以及课程中会涉及到的算法。

  • 介绍了无监督学习以及课程中会涉及到的算法。

(本章中所用到的图片均来自吴恩达机器学习公开课,如果侵权立即删除。)

 

你可能感兴趣的:(吴恩达机器学习,人工智能,机器学习)