大数据挖掘与机器学习笔记

目录

 

机器学习(周志华)

第一章 绪论

第二章 模型评估和选择


机器学习(周志华)

 

第一章 绪论

1.1 什么是机器学习

使用以往的数据(经验),去训练某种模型,然后利用此模型预测未来。

Tom Mitchell 给出更形式化的定义:

1998年Tom Mitchell对机器学习给出了一个更加正式的定义:A computer program is said to learn from experience E with respect to some task T and some performance measure P,if its performance on T,as measured by P,improves with experience E.

计算机程序从经验E中(已有的数据或者经验)进行学习,然后解决一些任务T,并进行度量通过P。即:T的表现情况通过P进行衡量,通过E进行提高。

1.2 基本术语

示例(样本)(特征向量)

属性(特征)

属性值(特征值)

维数

训练集、测试集、标记(label)、标记空间

样例

分类(预测值是离散的)和回归(预测的值是连续的)

二分类(正类和负类)和多分类

聚类

监督学习和无监督学习(训练数据是否拥有标记信息)

泛化能力(模型适用于新样本的能力)

 

 

 

 

 

 

 

 

 

 

 

 

第二章 模型评估和选择

你可能感兴趣的:(数据挖掘,机器学习,数据挖掘,机器学习)