清华MOOC_大数据机器学习_笔记_第一章 概述

第一章 概述

  • 1.机器学习定义
  • 2.机器学习的相关概念
  • 3.人工智能的三种学习方法或系统
  • 4.机器学习与数据挖掘和统计学习的关系
  • 5.机器学习的发展历程
  • 6.大数据机器学习的特点
  • 7.推荐书目

1.机器学习定义

维基百科机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多推论问题属于无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。

2.机器学习的相关概念

·人工智能{//是一门科学,目标是为机器赋予视觉/听觉/触觉/推理等智能
		 //专家系统(其中一个重要方法):专门知识和经验的计算机智能程序系统
		·机器学习{//人工智能的计算方法
				 //Logistic回归,SVM,决策树,贝叶斯方法等
				·表示学习{//机器学习中研究如何得到一个好的表示,从而使后模型学习任务更容易
						 //浅层自编码机就是其中的一种方法
						·深度学习MLP//目前进行大数据机器学习的主要方法
								   //多层感知机,深度循环网络,深度Q网络等
				}
		}
}

3.人工智能的三种学习方法或系统

人工智能可大致分为三种学习方法或系统{
	·基于规则的方法或系统//没有可学习的模块
					  //输入的数据通过手工设计的程序直接获取特征然后输出
	·经典的机器学习方法或系统//输入数据通过手工设计获得特征->经过特征映射获得输出
	·表示学习方法或系统{
		非深度学习方法//通过学习获得特征->通过特征映射输出
		深度学习方法//首先学习得到简单的特征->通过附加层学习得到更多抽象特征->通过特征映射输出
	}
}

4.机器学习与数据挖掘和统计学习的关系

·数据挖掘{//可认为是机器学习和数据库技术的交叉学科
	机器学习_数据分析技术;//分析海量数据
	数据库_数据管理技术;//管理海量数据
}
·机器学习{//倒入数据->模型学习->在一些假设条件下->获得对数据的预测输出
	数据学习;//常用在数据挖掘上
	强化学习等其他方法;
}
·机器学习 = 统计学习 - 模型和假设的检验
·统计学//关注自身,例如生存分析,空间分析,多测试
·机器学习//关注在线学习,流行学习,主动学习等

5.机器学习的发展历程

1955.人工智能的诞生//麦肯锡和明斯基建议在达特茅斯召开人工智能会议
1958-1969.罗森布莱特提出感知机
1980.机器学习诞生//在CMU召开第一次国际机器学习学术会议
1986.Quinlan提出决策树方法ID3
1995.Wapnik提出支持向量机模型->高效准确被广泛使用->机器学习又成为热门研究领域
1995-2005.随机森林,Adaboost,大尺度感知机等新的方法和模型
//在神经网络寒冬期依然坚持研究的科学家们:Hinton,Bengio,Lecun,Andrew Ng等
//向他们致敬
2005- .机器学习迈入新时代//深度学习的大数据机器学习时代

6.大数据机器学习的特点

1.与日俱增的数量、实验数据量、神经网络模型规模
2.模型性能不断提升
3.GPU的出现//TeslaP100,TPU//张量处理单元技术
4.深度学习的技术研发必须依赖于某个特定的深度学习框架//Tensorflow,pytorch,caffe等

7.推荐书目

1.《统计学习方法》李航//小蓝书//对机器学习的基本原理方法有更深入的有更深入的理论解释
2.《机器学习实战》Peter Harrington//用Python实现机器学习的各种传统方法
3.《深度学习》Bengio//花书//对深度学习有非常深入的介绍
4.《模式识别和机器学习》Bishop//国外高校教材,非常好的工具书
5.《机器学习》周志华//西瓜书//对机器学习方法有全面的介绍

MOOC传送门 学堂在线_清华_大数据机器学习

你可能感兴趣的:(机器学习初探)