机器学习笔记(1):Introduction

目录

1)welcome

2)What is Machine Learning

3)Supervised Learning 

4)Unsupervised Learning


1)welcome

第一个视频主要介绍了机器学习目前的案例,主要有:数据库挖掘、医疗记录、生物工程、无人直升机、手写识别、NLP、计算机视觉等。

机器学习笔记(1):Introduction_第1张图片

2)What is Machine Learning

下面是机器学习的两个定义,分别来自于Arthur Samuel Tom Mitchell

机器学习笔记(1):Introduction_第2张图片

第一个定义是:在未进行特定编程的情况下,给予计算机学习能力的领域。

第二个定义是:一个程序被认为能从经验 E 中学习,解决任务 T,达到性能度量值P,当且仅当,有了经验 E 后,经过 P 评判,程序在处理 T 时的性能有所提升。

目前存在几种不同类型的学习算法,主要的两种类型为监督学习和无监督学习。此外还有强化学习和推荐系统等。但更重要的还有了解应用学习算法的建议。我们不仅要知道工具,更要知道如何使用好工具。

机器学习笔记(1):Introduction_第3张图片

3)Supervised Learning 

先看一个例子,这是有一张数据图,横轴表示面积,纵轴表示房价。基于这组数据,假如你有一个朋友,他有一套750平方英尺的房子,能卖多少钱?从图中可以看出,红色和蓝色曲线代表两种拟合方式,显然蓝色曲线拟合的效果更好。这是一个回归问题,回归的意思是,我们在试着推测出一个连续值的结果。

机器学习笔记(1):Introduction_第4张图片

这里有一份关于乳腺癌的数据,横轴表示肿瘤大小,纵轴表示肿瘤是否为恶性。恶性则为1,良性记为0。这是一个分类的问题,分类指的是,我们推测出离散的输出值。

机器学习笔记(1):Introduction_第5张图片

在其它机器学习问题中,可能会遇到不止一种特征,我们不仅知道肿瘤的尺寸,还知道患者的年龄。肿块密度、肿瘤细胞尺寸等等。

机器学习笔记(1):Introduction_第6张图片

现在我们来总结一下,监督学习基本思想是:我们数据集中的每个样本都有相应的“正确答案”。回归可以推出一个连续的输出,分类目标是一组离散的结果。

4)Unsupervised Learning

现在我们来介绍无监督学习。在监督学习中,数据集已经有了正确的标记。而在无监督学习中,数据集没有任何的标签。下图中,我们把数据分成了两个簇,这是聚类算法

机器学习笔记(1):Introduction_第7张图片机器学习笔记(1):Introduction_第8张图片

下图也是一个聚类算法的应用,输入一组不同个体的基因,我们把个体聚类到不同的类或不同类型的组。

机器学习笔记(1):Introduction_第9张图片

下面是无监督学习的应用,如组织大型计算机群、社交网络分析,市场分割,天文学数据分析。

机器学习笔记(1):Introduction_第10张图片

 

你可能感兴趣的:(Machine,Learning,机器学习)