《机器学习实战》第一章——机器学习基础——笔记

1.机器学习的一个主要任务就是分类

2.学习如何分类需要做算法训练,为算法输入大量已分类数据作为算法的训练集

3.分类问题中的目标向量称为类别,并假定分类问题只存在有限个数的类别。

4.训练数据测试数据

5.假定某一个算法,经过测试满足精确度要求,已经学会了如何分类,这部分工作称之为知识表示

6.机器学习的另一个主要任务就是回归,主要用于预测数值型数据。

7.分类和回归属于监督学习,之所以称为监督学习,是因为这类算法必须知道预测什么,即目标的分类信息。

8.与监督学习对应的是无监督学习,在无监督学习中,将数据集合分成由类似的对象组成的多个类的过程被称为聚类;将寻找描述数据统计值的过程称之为密度估计

9.分类:k-近邻算法、朴素贝叶斯算法、支持向量机、决策树

回归:线性回归、局部加权线性回归、Ridge回归、Lasso最小回归系数估计

聚类和密度估计:K-均值、最大期望算法、DBSCAN、Parzen窗设计

10.选择实际可用的算法必须考虑:1)使用机器学习算法的目的,想要算法完成何种任务;2)需要分析或收集的数据是什么。

11.学习和使用机器学习算法开发应用程序步骤:1)收集数据;2)准备输入数据;3)分析输入数据;4)训练算法;5)测试算法;6)使用算法。

12.Python语言的优势:易于理解,丰富的函数库(尤其是矩阵操作)、活跃的开发者社区等。

13.Python适用于机器学习算法:1)Python的语法清晰;2)易于操作纯文本文件;3)使用广泛,存在大量的开发文档。

Python不足:性能问题。

你可能感兴趣的:(机器学习实战)