机器学习之基本了解篇

机器学习推荐教程:

1.最好的入门教程,就是吴恩达讲授的机器学习。吴恩达这套课程发布很久了,虽然有些地方稍微过时,但我觉得,现在没有任何公开的课程,能比吴恩达讲得更好。

这套课程可以前往Coursera学习,传送门:

https://www.coursera.org/learn/machine-learning

也可以上网易公开课收看,传送门:

http://open.163.com/special/opencourse/machinelearning.html

2. B站真心是个好东西,可以自行去搜索自己感兴趣的机器学习原理或者实战教程(偷偷bb:好多在某些网站上需要付费的教学视频在B站你基本都可以找到免费版)

人工智能、机器学习、深化学习的关系:

机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习的技术。我们就用最简单的方法——同心圆,可视化地展现出它们三者的关系。

什么是机器学习?

 机器学习最基本的做法:使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。

机器学习权威定义:

Arthur samuel: 在不直接针对问题进行编程的情况下,赋予计算机学习能力的一个研究领域。

Tom Mitchell: 对于某类任务T和性能度量P,如果计算机程序在T上以P衡量的性能随着经验E而自我完善,那么就称这个计算机程序从经验E学习。

机器学习直接来源于早期的人工智能领域,传统的算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等等。从学习方法上来分,机器学习算法可以分为监督学习(如分类问题)、无监督学习(如聚类问题)、半监督学习、集成学习、深度学习和强化学习。传统的机器学习算法在指纹识别、基于Haar的人脸检测、基于HoG特征的物体检测等领域的应用基本达到了商业化的要求或者特定场景的商业化水平,但每前进一步都异常艰难,直到深度学习算法的出现

机器学习的一些相关概念:

1.监督学习和无监督学习:

监督学习:对于训练数据集的每一个样本,被清楚的告知了,什么是正确答案。即有标记信息。

                回归问题:回归是指我们的目标是预测一个连续值输出。

                分类问题:目的是预测离散值输出(0,1,...)。

无监督学习:(聚类算法是无监督学习的一种):训练数据集无标记信息。给算法大量的数据,要求它自己找出数据的类型结构。

2.特征向量:一个示例在每个属性上的取值可以考虑为一个向量

3.机器学习算法:由输入数据集到输入标记的一个函数映射y=f(x)

4.训练集train set、训练标签train label:已有y(train label)的x(train set)用于训练我们的f

测试集test set、测试标签test label:用于检测模型的泛化能力

验证集:没有标记的样本集合,用于实际使用模型

5.泛化能力generalization:机器学习的目标是使学得的模型能很好的适用于新样本(未知类别标记的样本),而不仅仅是在训练样本上工作做得很好,学得模型适用于新样本的能力称为泛化能力

6.训练模型fit:我们把算法学习过程看作一个在所有假设hypothesis组成的空间进行搜索的过程,搜索目标是找到与训练集匹配的假设

其他一些概念会在以后更新的关于机器学习的文章中逐渐提出,接下来进入机器学习算法的学习,欢迎大家跟我分享机器学习和深化学习的学习方法。

你可能感兴趣的:(机器学习之基本了解篇)