1、机器学习入门

1、机器学习入门

1.1什么是机器学习

旧的定义:在没有明确设置的情况下,使计算机具有学习能力的领域

新的定义:经验E,任务T,性能度量P(完成T成功概率)
计算机不断积累经验E,完成任务T的性能度量P随之提高

学习算法中两个主要算法:
监督学习(我教会计算机)
无监督学习(计算机自己学会)

学会正确应用学习算法

1.2监督学习

监督学习定义:给计算机一个数据(数据集里面包含多个正确答案),期望计算机给出更多的答案(跳出数据集外)

回归算法——>基于历史数据,利用离散数据预测出连续数据
例如:有前一年某种货物的每月的出售量,预测下一年的出售量(出售量数据延长<=>连续输出)

分类算法——>基于历史数据,对离散数据进行分类
例如:给出一些良性肿瘤和恶性肿瘤(数据标签)的肿瘤大小(数据特征、属性),给出其他肿瘤大小数据,判断哪些时良性,哪些是恶性
在分类问题中,可以有多种甚至无穷多的特征数据

1.3无监督学习

无监督学习定义:给计算机一个数据集(数据集里只有数据,没有分类,没有特征),期望计算机找出该数据集中存在
的类型结构

聚类算法——>对于大量未知标签的数据集,根据数据的特征属性该数据集划分为不同的类别(簇),类别内数据相似度
(区别于监督学习中的分类算法)
例如:给浏览器一堆不同类新闻,浏览器能将新闻划分为体育类、政治类等等

你可能感兴趣的:(机器学习笔记,人工智能,python)